Açıklamalı URL kaldırma, 2. bölüm: Sayfadan hassas metni kaldırma
Koleksiyonlar ile düzeninizi koruyun
İçeriği tercihlerinize göre kaydedin ve kategorilere ayırın.
6 Ağustos 2010, Cuma
URL kaldırma ile ilgili önceki yayınımızda gördüğümüz gibi bazen değişiklikler yaşanır ve sitenizdeki bir sayfayı tamamen engelleyebilir veya kaldırabilirsiniz. Diğer zamanlarda ise yalnızca sayfanın bazı bölümlerini değiştirebilir ya da metinden bazı bölümleri çıkarabilirsiniz. Sayfanın ne sıklıkla tarandığına bağlı olarak bu değişikliklerin arama sonuçlarımıza yansıması biraz zaman alabilir. Bu blog yayınında, arama sonuçlarımızda eski ve kaldırılmış içerikleri göstermemiz halinde izleyebileceğiniz adımları işleyeceğiz. Bu eski içerikler "snippet" biçiminde ya da arama sonucundan bağlantı verilen sayfanın önbellekteki sürümünde gösteriliyor olabilir. Hassas bilgiler içerdiği için hızla kaldırılması gereken eski içerikler için bu adımların kullanılması uygundur ancak normal şekilde güncellediğiniz web siteleri için bunu yapmanız gerekmez.
Örnek olarak aşağıdaki hayali arama sonucuna bakalım:
Walter E. Coyote |
< Başlık |
Acme Corp 1948-2003, Gelişim Direktörü : Son derece gizli veloitus incalculii cihazı üzerinde çalıştı... |
< Snippet |
www.example.com/about/waltercoyote - Önbelleğe alınan |
< URL + önbelleğe alınan sayfanın bağlantısı |
Snippet'te (veya bağlantı verilen önbelleğe alınmış sayfada) gösterilen içeriği değiştirmek için ilk olarak içeriğin gerçek (yayındaki) sayfasındaki içeriği değiştirmeniz gerekir. Bir sayfanın herkese açık içeriği değiştirilmedikçe, Google'ın otomatik işlemleri arama sonuçlarımızda orijinal içerikten parçalar göstermeye devam eder.
Sayfanın içeriği değiştirildikten sonra bu değişiklikleri arama sonuçlarımızda görünür hale getirmek için
kullanabileceğiniz çeşitli seçenekler mevcuttur:
-
Googlebot'un sayfayı yeniden taramasını ve yeniden dizine eklemesini bekleyin: Çoğu içerik Google'da doğal olarak bu yöntemle güncellenir. Googlebot'un halihazırda söz konusu sayfayı ne sıklıkta taradığına bağlı olarak bazen bu süre oldukça uzun olabilir. Sayfayı yeniden tarayıp dizine ekledikten sonra, mevcut içerikle değiştirileceği için eski içerik genellikle görünmez. Googlebot'un söz konusu sayfayı taraması engellenmemişse (robots.txt veya sunucuya düzgün bir şekilde erişememesi nedeniyle) bu durumu sağlamak için özel bir şey yapmanız gerekmez. Bu süreçler tamamen otomatik ve birçok harici faktöre bağlı olduğundan tarama ve dizine ekleme işlemini hızlandırmak genellikle mümkün değildir.
-
Başka
birinin web sayfasından kaldırılan içeriğin
kaldırılmasını istemek için Google'ın herkese açık URL kaldırma aracını kullanın. Bu aracı
kullanarak, değiştirilen sayfanın
tam URL'sini girip "İçerik sayfadan
kaldırılmış" seçeneğini kullanmanız ve ardından, söz konusu sayfadan tamamen kaldırılmış bir veya daha
fazla kelimeyi belirtmeniz gerekir.
Girdiğiniz kelimelerin hiçbirinin sayfada görünmemesi gerektiğini unutmayın. Sayfanın
bir bölümünden kaldırılmış olsa bile, söz konusu kelime sayfanın başka bir yerinde görünmeye devam
ediyorsa isteğiniz reddedilir. Artık sayfanın hiçbir yerinde görünmeyen bir kelimeyi
veya kelimeleri seçtiğinizden emin olun. Yukarıdaki örnekte "top secret velocitus incalculii capturing device" ifadesini
kaldırdıysanız "projem"
gibi bir şey değil, ilgili kelimeleri göndermeniz gerekir. Bununla birlikte, sayfanın
herhangi bir yerinde "top" veya
"device" ifadeleri hâlâ mevcutsa istek reddedilir. Başarı şansınızı en üst düzeye çıkarmak için çoğunlukla en kolay yöntem, artık sayfanın hiçbir yerinde görünmediğinden emin olduğunuz tek bir kelimeyi girmektir.
İsteğiniz işlendiğinde ve gönderilen kelimelerin artık sayfada görünmediği belirlendiğinde, arama sonucunda artık snippet görüntülenmeyecek ve önbelleğe alınan sayfa kullanılmayacaktır. Sayfanın başlığı ve URL'si yine de görünmeye devam eder. Sayfadan kaldırılan kelimeler artık snippet'te görüntülenmeyecek olsa da giriş, kaldırılan içerikle alakalı yapılan aramalar için (örneğin velocitus incalculii gibi) arama sonuçlarında hâlâ görünüyor olabilir. Ancak, sayfa yeniden tarandığında ve yeniden dizine eklendiğinde, yeni snippet ve önbelleğe alınmış sayfa, arama sonuçlarımızda görünebilir.
Sayfayı görüntüleyerek kelimelerin kaldırılmış olduğunu onaylamamız gerekeceğini unutmayın. Sayfa artık mevcut değilse ve sunucu uygun bir 404
veya 410
HTTP sonuç kodu döndürerek sayfayı görüntülememize imkan vermiyorsa sayfanın tamamen kaldırılmasını istemeniz daha iyi olabilir.
-
Web sitenizdeki bir sayfada yer alan bilgilerin
kaldırılmasını istemek için Google Web Yöneticisi Araçları URL kaldırma aracını kullanın. Söz konusu web sitesine
erişiminiz varsa ve Google Web Yöneticisi Araçları'nda
web sitesinin sahibi olduğunuzu doğruladıysanız
buradaki URL kaldırma aracını (Site
Yapılandırma > Tarayıcı erişimi bölümünde)
kullanarak, ilgili sayfa yeniden taranana kadar snippet'in ve önbelleğe alınan sayfanın kaldırılmasını isteyebilirsiniz. Bu aracı kullanmak
için yalnızca sayfanın tam
URL'sini göndermeniz gerekir
(kaldırılan kelimeleri belirtmeniz gerekmez). İsteğiniz işlendikten sonra snippet'i ve önbelleğe
alınan sayfayı arama sonuçlarından kaldırırız. Sayfanın başlığı ve URL'si yine de
görünmeye devam eder. Sayfa da kaldırılan içerikle ilgili sorgular için arama sonuçlarında
yer almaya devam edebilir. Sayfa yeniden tarandıktan ve yeniden dizine eklendikten
sonra, yeni içeriğe göre güncellenmiş snippet'in ve önbelleğe alınan sayfanın yer aldığı arama sonucu
görülebilir.
Google, öğeleri dizine ekleyip sıralarken yalnızca sayfanın içeriğini değil, aynı zamanda bu URL'ye gelen bağlantılar gibi diğer harici faktörleri de dikkate alır. Bu nedenle, sayfa yeniden taranıp yeniden dizine eklenmiş olsa bile artık sayfada bulunmayan içerikler için URL'nin arama sonuçlarında görünmeye devam etmesi mümkündür. URL kaldırma aracı, snippet'i ve önbelleğe alınan sayfayı bir arama sonucundan kaldırabilir ancak arama sonucunun başlığını değiştirmez, kaldırmaz, gösterilen URL'yi değiştirmez veya mevcut ya da önceki içeriklere göre yapılan aramalar için sayfanın görünmesini engellemez. Bu konu sizin için önemliyse URL'nin arama sonuçlarımızdan tamamen kaldırması için gereken şartları karşıladığından emin olun.
HTML olmayan içerikleri kaldırma
Değiştirilen içerik HTML değilse (örneğin, resim, Flash dosyası veya PDF dosyası değiştiyse) önbellek kaldırma aracını kullanamazsınız. Dolayısıyla eski içeriğin artık arama sonuçlarında görünmemesi önemliyse en hızlı çözüm, dosyanın URL'sini değiştirip eski URL'nin 404
HTTP sonuç kodu döndürmesini sağlamak ve eski URL'yi kaldırmak için URL kaldırma aracını kullanmaktır. Aksi takdirde, Google'ın bilgilerinizi doğal yoldan yenilemesini bekleyecekseniz HTML olmayan içerik önizlemelerinin (PDF dosyaları için Hızlı Görünüm bağlantıları gibi) yeniden tarandıktan sonra güncellenmesi, normal HTML sayfalarına göre daha uzun sürer.
Snippet'lerin veya önbelleğe alınan sürümlerin gösterilmesini proaktif olarak engelleme
Web yöneticisi olarak, kaldırma araçlarımızı kullanmadan snippet'lerin veya önbelleğe alınan sürümlerin gösterilmesini proaktif olarak engellemek için robots meta
etiketlerini kullanabilirsiniz. Bunu varsayılan bir yaklaşım olarak önermesek de (snippet, kullanıcıların alakalı bir arama sonucunu daha hızlı tanımasına yardımcı olabilir ve önbelleğe alınan bir sayfa, sunucunuzun kullanılamaması gibi beklenmedik
bir durumda bile içeriğinizi görüntüleme imkanı verir) bir snippet'in gösterilmesini engellemek için "nosnippet" robots meta
etiketini veya bir sayfanın önbelleğe alınmasını devre dışı bırakmak için "noarchive" robots meta
etiketini kullanabilirsiniz. Bu değişikliğin mevcut ve bilinen
sayfalarda yapılması durumunda, söz konusu değişikliğin arama sonuçlarında görünür hale gelmesi için
Googlebot'un ilgili sayfaları yeniden tarayıp dizine eklemesi gerektiğini unutmayın.
Bu blog yayınının, güncellenen sayfalar için kullanılan URL kaldırma aracının arka planındaki bazı işlemlere açıklık getireceğini umuyoruz. Bir sonraki blog yayınımızda, sahip olmadığınız içeriklerin kaldırılmasını istemenin yollarını inceleyeceğiz. Bizi takip etmeye devam edin.
Her zaman olduğu gibi Web Yöneticisi Yardım Forumumuzda
geri bildirimlerinizi göndermekten ve soru sormaktan çekinmeyin.
Bu dizideki diğer yayınlar
Son olarak, sizinle ilgili internette bulunan bilgileri yönetme hakkında bilgi edinmek isteyebilirsiniz.
Yayınlayan: John Mueller, Webmaster Trends Analyst, Google İsviçre
Aksi belirtilmediği sürece bu sayfanın içeriği Creative Commons Atıf 4.0 Lisansı altında ve kod örnekleri Apache 2.0 Lisansı altında lisanslanmıştır. Ayrıntılı bilgi için Google Developers Site Politikaları'na göz atın. Java, Oracle ve/veya satış ortaklarının tescilli ticari markasıdır.
[null,null,[],[[["\u003cp\u003eGoogle's search results may display outdated content even after a webpage has been updated.\u003c/p\u003e\n"],["\u003cp\u003eTo update Google's search results, you can wait for Google to recrawl the page, or request removal of the outdated content through Google's URL removal tool.\u003c/p\u003e\n"],["\u003cp\u003eIf you own the website, use Google Webmaster Tools to remove the snippet and cached page until Google recrawls the updated page.\u003c/p\u003e\n"],["\u003cp\u003eGoogle's URL removal tool does not prevent a page from ranking based on previous content, so for complete removal, consider the requirements for removal from search results altogether.\u003c/p\u003e\n"],["\u003cp\u003eTo prevent snippets or cached versions from appearing, use robots meta tags, but it's generally recommended to keep them for user experience.\u003c/p\u003e\n"]]],["To update outdated content in Google search results, first modify the live page. Then, either wait for Googlebot to re-crawl and re-index or use Google's URL removal tools. There are two options for URL removals: removing content from others' pages by specifying removed words or removing information from your own page via Google Webmaster Tools, without specifying removed words. For non-HTML content, change the file's URL. Lastly, webmasters can proactively prevent snippets and cached versions using robots meta tags.\n"],null,["# URL removals explained, part II: Removing sensitive text from a page\n\nFriday, August 06, 2010\n\n\nChange can happen---sometimes, as we saw in our\n[previous post on URL removals](/search/blog/2010/03/url-removal-explained-part-i-urls),\nyou may completely block or remove a page from your site. Other times you might only change parts\nof a page, or remove certain pieces of text. Depending on how frequently a page is being crawled,\nit can take some time before these changes get reflected in our search results. In this blog post\nwe'll look at the steps you can take if we're still showing old, removed content in our search\nresults, either in the form of a \"snippet\" or on the cached page that's linked to from the search\nresult. Doing this makes sense when the old content contains sensitive information that needs to\nbe removed quickly---it's not necessary to do this when you just update a website normally.\n\nAs an example, let's look at the following fictitious search result:\n\n|---------------------------------------------------------------------------------------------------------------------------------------------------|------------------------------|\n| **Walter** E. **Coyote** | \\\u003c Title |\n| Chief Development Officer at Acme Corp 1948-2003: worked on the top secret velocitus incalculii capturing device which has shown potential**...** | \\\u003c Snippet |\n| www.example.com/about/**waltercoyote** - Cached | \\\u003c URL + link to cached page |\n\n\nTo change the content shown in the snippet (or on the linked cached page),\n**you'll first need to change the content on the actual (live) page**. Unless a page's publicly\nvisible content is changed, Google's automatic processes will continue to show parts of the\noriginal content in our search results.\n\n\nOnce the page's content has been changed, there are several options available to make those\nchanges visible in our search results:\n\n1.\n **Wait for Googlebot to re-crawl and re-index the page**: This is the natural method for\n how most content is updated at Google. Sometimes it can take a fairly long time, depending on\n how frequently Googlebot currently crawls the page in question. Once we've re-crawled and\n re-indexed the page, the old content will usually not be visible as it'll be replaced by the\n current content. Provided Googlebot is not blocked from crawling the page in question (either\n by robots.txt or by not being able to access the server properly), you don't have to do\n anything special for this to take place. It's generally not possible to speed up crawling and\n indexing, as these processes are fully automated and depend on many external factors.\n\n2.\n Use\n [Google's public URL removal tool](https://www.google.com/webmasters/tools/removals)\n to **request removal of content that has been removed from someone else's webpage** . Using\n this tool, it's necessary to enter the\n [exact URL of the page](https://www.google.com/support/webmasters/bin/answer.py?answer=63758)\n that has been modified, select the \"Content has been removed from the page\" option, and then\n specify one or more words that have been completely removed from that page.\n\n\n Note that *none* of the words you enter can appear on the page; even if a word has been\n removed from one part of the page, your request will be denied if that word still appears on\n another part of the page. Be sure to choose a word (or words) that no longer appear\n *anywhere* on the page. If, in the above example, you removed\n \"top secret velocitus incalculii capturing device\", you should\n submit those words and not something like \"my project.\" However, if the word\n \"top\" or \"device\" still exists\n anywhere on the page, the request would be denied. To maximize your chances of success, it's\n often easiest to just enter one word that you're sure no longer appears anywhere on the page.\n\n\n Once your request has been processed and it's found that the submitted word(s) no longer\n appear on the page, the search result will no longer show a snippet, nor will the cached page\n be available. The title and the URL of the page will still be visible, and the entry may still\n appear in search results for searches related to the content that has been removed (such as\n searches for\n [velocitus incalculii](https://www.google.com/search?q=velocitus+incalculii)),\n even if those words no longer appear in the snippet. However, once the page has been\n re-crawled and re-indexed, the new snippet and cached page can be visible in our search\n results.\n\n\n Keep in mind that we will need to verify removal of the word(s) by viewing the page. If the\n page no longer exists and the server is returning a proper\n [`404` or `410` HTTP result code](https://en.wikipedia.org/wiki/List_of_HTTP_status_codes),\n making us unable to view the page, you may be better off\n [requesting removal of the page](/search/blog/2010/03/url-removal-explained-part-i-urls)\n altogether.\n3. Use Google Webmaster Tools URL removal tool to **request removal of information on a page from your website** . If you have access to the website in question and have verified ownership of it in [Google Webmaster Tools](https://search.google.com/search-console), you can use the URL removal tool there (under *Site Configuration \\\u003e Crawler access* ) to request that the snippet and the cached page be removed until the page has been re-crawled. To use this tool, you only need to submit the [exact URL of the page](https://www.google.com/support/webmasters/bin/answer.py?answer=63758) (you won't need to specify any removed words). Once your request has been processed, we'll remove the snippet and the cached page from search results. The title and the URL of the page will still be visible, and the page may also continue to rank in search results for queries related to content that has been removed. After the page has been re-crawled and re-indexed, the search result with an updated snippet and cached page (based on the new content) can be visible.\n\n\nGoogle indexes and ranks items based not only on the content of a page, but also on other external\nfactors, such as the inbound links to the URL. Because of this, it's possible for a URL to\ncontinue to appear in search results for content that no longer exists on the page, even after\nthe page has been re-crawled and re-indexed. While the URL removal tool can remove the snippet\nand the cached page from a search result, it will not change or remove the title of the search\nresult, change the URL that is shown, or prevent the page from being shown for searches based on\nany current or previous content. If this is important to you, you should make sure that the URL\nfulfills the requirements for a\n[complete removal from our search results](/search/blog/2010/03/url-removal-explained-part-i-urls).\n\nRemoving non-HTML content\n-------------------------\n\n\nIf the changed content is not in (X)HTML (for example if an image, a Flash file or a PDF file has\nbeen changed), you won't be able to use the cache removal tool. So if it's important that the old\ncontent no longer be visible in search results, the fastest solution would be to change the URL\nof the file so that the old URL returns a `404` HTTP result code and use the URL\nremoval tool to remove the old URL. Otherwise, if you chose to allow Google to naturally refresh\nyour information, know that previews of non-HTML content (such as\n[Quick View links for PDF files](https://googleblog.blogspot.com/2009/10/quickly-view-formatted-pdfs-in-your.html))\ncan take longer to update after recrawling than normal HTML pages would.\n\nProactively preventing the appearance of snippets or cached versions\n--------------------------------------------------------------------\n\n\nAs a webmaster, you have the option to use robots\n[`meta` tags](/search/docs/advanced/crawling/special-tags)\nto proactively prevent the appearance of snippets or cached versions without using our removal\ntools. While we don't recommend this as a default approach (the snippet can help users recognize a\nrelevant search result faster, and a cached page gives them the ability to view your content even\nin the unexpected event of your server not being available), you can use the \"nosnippet\" robots\n`meta` tag to\n[prevent showing of a snippet](/search/docs/crawling-indexing/robots-meta-tag#nosnippet),\nor the \"noarchive\" robots `meta` tag to disable caching of a page. Note that if this is changed on\nexisting and known pages, Googlebot will need to re-crawl and re-index those pages before this\nchange becomes visible in search results.\n\n\nWe hope this blog post helps to make some of the processes behind the URL removal tool for updated\npages a bit clearer. In our next blog post we'll look at ways to request removal of content that\nyou don't own; stay tuned!\n\n\nAs always, we welcome your feedback and questions in our\n[Webmaster Help Forum](https://support.google.com/webmasters/community/label?lid=5489e59697a233d7).\n\nOther posts of this series\n--------------------------\n\n- [Part I: Removing URLs and directories](/search/blog/2010/03/url-removal-explained-part-i-urls)\n- [Part II: Removing and updating cached content](/search/blog/2010/04/url-removals-explained-part-ii-removing)\n- [Part III: Removing content you don't own](/search/blog/2010/04/url-removal-explained-part-iii-removing)\n- [Part IV: Tracking requests, what not to remove](/search/blog/2010/05/url-removal-explained-part-iv-tracking)\n\n\nFinally, you might be also interested to read about\n[managing what information is available about you online](/search/blog/2009/10/managing-your-reputation-through-search).\n\n\nPosted by\n[John Mueller](https://twitter.com/JohnMu),\nWebmaster Trends Analyst, Google Switzerland"]]