نحن الآن على LinkedIn:
تابِعنا على LinkedIn للحصول على أخبار وموارد من "بحث Google" تساعدك في تسهيل العثور على موقعك الإلكتروني.
شرح عمليات إزالة عناوين URL، الجزء الثاني: إزالة النص الحساس من الصفحة
تنظيم صفحاتك في مجموعات
يمكنك حفظ المحتوى وتصنيفه حسب إعداداتك المفضّلة.
الجمعة 6 آب (أغسطس) 2010
كما رأينا في مشاركتنا السابقة حول إزالة عناوين URL، قد تتغير مجريات الأمور أحيانًا وتقرر حظر صفحة على موقعك الإلكتروني أو إزالتها تمامًا. وقد تكتفي أحيانًا بتغيير أجزاء من الصفحة، أو إزالة أجزاء معيّنة من نصها. بناءً على معدّل تكرار الزحف إلى الصفحة، قد يستغرق الأمر بعض الوقت كي تظهر هذه التغييرات في نتائج البحث لدينا. نتناول في مشاركة المدوّنة هذه الخطوات التي يمكنك اتخاذها إذا كان محرّك بحث Google لا يزال يعرض المحتوى القديم الذي أزلته، سواء كان يعرضه في شكل "مقتطف" أم على الصفحة المخزّنة مؤقتًا والتي يظهر رابط يؤدي إليها ضمن نتيجة البحث. تُعتبر هذه الخطوات مهمة إذا كان المحتوى القديم يتضمّن معلومات حساسة يجب التخلص منها سريعًا، لكنّها ليست ضرورية عند إضافة تعديلات عادية إلى موقعك الإلكتروني.
كمثال، دعنا نلقي نظرة على نتيجة البحث الوهمية التالية:
والتر إي كويوت |
< العنوان |
مدير التطوير في شركة Acme Corp 1948-2003: عمل على ابتكار
جهاز تسجيل velocitus incalculii الذي أظهر قدرات هائلة... |
< المقتطف |
www.example.com/about/waltercoyote - نسخة مخزّنة مؤقتًا |
< عنوان URL + رابط يؤدي إلى صفحة مخزّنة مؤقتًا |
لتغيير المحتوى المعروض في المقتطف (أو في الصفحة المخزّنة مؤقتًا التي تمت إضافة رابط يؤدي إليها)، ستحتاج أولاً إلى تغيير المحتوى في الصفحة الفعلية (المنشورة). ما لم يتم تغيير محتوى الصفحة المرئي للجمهور، ستواصل عمليات Google التلقائية عرض أجزاء من المحتوى الأصلي في نتائج البحث لدينا.
بعد تغيير محتوى الصفحة، نوفّر لك العديد من الخيارات لإظهار هذه التغييرات في نتائج البحث لدينا:
-
الانتظار حتى يعيد برنامج Googlebot الزحف إلى الصفحة ويعيد فهرستها: إنّها الطريقة الاعتيادية لتعديل معظم المحتوى في Google. في بعض الأحيان، قد يستغرق الأمر وقتًا طويلاً إلى حد ما، بناءً على معدّل زحف Googlebot إلى الصفحة المعنية في الوقت الحالي. بعد إعادة الزحف إلى الصفحة وإعادة فهرستها، لن يكون عادةً المحتوى القديم مرئيًا، إذ سيتم استبداله بالمحتوى الحالي. بشرط ألا يتم حظر Googlebot من الزحف إلى الصفحة المعنيّة (إما باستخدام ملف robots.txt أو بسبب عدم القدرة على الوصول إلى الخادم بشكل صحيح)، لن تضطر إلى اتخاذ أي إجراء محدّد كي يتم الزحف إلى الصفحة. بشكل عام لا يمكن تسريع عمليتَي الزحف والفهرسة، لأنّ هاتين العمليتَين مبرمَجتان تمامًا وتعتمدان على العديد من العوامل الخارجية.
-
استخدام أداة إزالة عناوين URL من Google المتاحة للجميع لطلب إزالة المحتوى الذي تمت إزالته من صفحة ويب لا تملكها: عند استخدام هذه الأداة، من الضروري إدخال عنوان URL الدقيق للصفحة التي تم تعديلها، وتحديد الخيار "تمت إزالة المحتوى من الصفحة"، ثم تحديد كلمة أو أكثر تمت إزالتها تمامًا من تلك الصفحة.
يُرجى العِلم أنّه لا يمكن أن تظهر أيّ من الكلمات التي تدخلها على الصفحة، وحتى إذا تمت إزالة كلمة من جزء واحد من الصفحة، سيتم رفض طلبك إذا استمرت هذه الكلمة في الظهور في جزء آخر من الصفحة. تأكَّد من اختيار كلمة (أو كلمات) لم تعُد تظهر في أي موضع بالصفحة. في المثال أعلاه، إذا أزلت "top secret velocitus incalculii capturing device"، يجب إرسال هذه الكلمات وليس شيئًا مثل "مشروعي". ومع ذلك، إذا كانت كلمة "top" أو "device" لا تزال تظهر في أي جزء على الصفحة، سيتم رفض الطلب. لزيادة فرص النجاح، غالبًا ما تكون أسهل طريقة هي إدخال كلمة واثق من أنّها لم تعُد تظهر في أي مكان في الصفحة.
بعد معالجة طلبك والتأكد من عدم ظهور الكلمات المرسلة في الصفحة، لن تعرض نتيجة البحث مقتطفًا، ولن تتوفر الصفحة المخزّنة مؤقتًا. سيظل عنوان الصفحة وعنوان URL الخاص بها مرئيَّين، وقد يستمر ظهور الإدخال في نتائج البحث لعمليات البحث ذات الصلة بالمحتوى الذي تمت إزالته (مثل عمليات البحث عن velocitus incalculii)، حتى إذا كانت هذه الكلمات لم تعُد تظهر في المقتطف. ومع ذلك، بعد إعادة الزحف إلى الصفحة وإعادة فهرستها، يمكن أن يظهر المقتطف الجديد والصفحة المخزّنة مؤقتًا في نتائج البحث لدينا.
يُرجى العِلم أنّنا سنحتاج إلى التأكد من إزالة الكلمات عن طريق عرض الصفحة. إذا لم تعُد الصفحة متوفرة وكان الخادم يعرض رمز نتيجة HTTP مناسبًا، سواء 404
أم 410
، ما يجعلنا غير قادرين على عرض الصفحة، قد يكون من الأفضل لك طلب إزالة الصفحة تمامًا.
-
استخدام أداة إزالة عناوين URL الخاصة بأدوات مشرفي المواقع من Google لطلب إزالة المعلومات التي تظهر على إحدى صفحات موقعك الإلكتروني: إذا كانت لديك إمكانية الوصول إلى الموقع الإلكتروني المعنيّ وأكّدت ملكيتك له في أدوات مشرفي المواقع من Google، يمكنك استخدام أداة إزالة عناوين URL المتوفرة ضمن تلك الأدوات (بالانتقال إلى تصميم الموقع الإلكتروني > وصول الزاحف إلى صفحات الموقع) لطلب إزالة المقتطف والصفحة المخزّنة مؤقتًا حتى تتم إعادة الزحف إلى الصفحة. لاستخدام هذه الأداة، ما عليك سوى إرسال عنوان URL الدقيق للصفحة (لن تحتاج إلى تحديد أي كلمات تمت إزالتها). بعد معالجة طلبك، سنزيل المقتطف والصفحة المخزّنة مؤقتًا من نتائج البحث. سيظل عنوان الصفحة وعنوان URL الخاص بها مرئيَّين، وقد يتواصل ترتيب الصفحة أيضًا ضمن نتائج البحث عن العبارات المتعلقة بالمحتوى الذي تمت إزالته. بعد إعادة الزحف إلى الصفحة وإعادة فهرستها، يمكن أن تظهر نتيجة البحث مع مقتطف معدَّل وصفحة مخزّنة مؤقتًا (بناءً على المحتوى الجديد).
يعمل محرّك بحث Google على فهرسة العناصر وترتيبها ليس فقط بناءً على محتوى الصفحة، ولكن أيضًا استنادًا إلى عوامل خارجية أخرى، مثل الروابط الواردة إلى عنوان URL. لهذا السبب، من الممكن أن يستمر عنوان URL في الظهور ضمن نتائج البحث عن المحتوى الذي لم يعُد متاحًا على الصفحة، حتى بعد إعادة الزحف إلى الصفحة وإعادة فهرستها. يمكن لأداة إزالة عناوين URL إزالة المقتطف والصفحة المخزّنة مؤقتًا من نتيجة البحث، لكنّها لن تغيّر عنوان نتيجة البحث أو تزيله، أو تغيّر عنوان URL المعروض، أو تمنع الصفحة من الظهور لعمليات البحث المستندة إلى أي محتوى حالي أو سابق. وإذا كان ذلك مهمًا بالنسبة إليك، عليك التأكد من أنّ عنوان URL يفي بمتطلبات الإزالة الكاملة من نتائج البحث لدينا.
إزالة المحتوى الذي ليس بتنسيق HTML
إذا لم يكن المحتوى الذي تم تغييره بتنسيق (X)HTML (على سبيل المثال، إذا تم تغيير صورة أو ملف Flash أو ملف PDF)، لن تتمكن من استخدام أداة إزالة المحتوى المخزّن مؤقتًا. لذلك، إذا كان من المهم عدم ظهور المحتوى القديم ضمن نتائج البحث، يجب الاستعانة بالحل الأسرع، وهو تغيير عنوان URL للملف كي يعرض عنوان URL القديم رمز نتيجة HTTP 404
مع استخدام أداة إزالة عناوين URL لإزالة عنوان URL القديم. بخلاف ذلك، إذا اخترت السماح لمحرّك بحث Google بإعادة تحميل معلوماتك بشكل تلقائي، يُرجى العِلم أنّ معاينات المحتوى الذي ليس له تنسيق HTML (مثل روابط العرض السريع لملفات PDF) يمكن أن تستغرق وقتًا أطول في التعديل بعد إعادة الزحف مقارنةً بصفحات HTML العادية.
منع ظهور المقتطفات أو النُسخ المخزّنة مؤقتًا بشكل استباقي
بصفتك مشرف مواقع، يتوفر لك خيار استخدام علامات meta
لبرامج الروبوت لمنع ظهور المقتطفات أو النسخ المخزّنة مؤقتًا بشكل استباقي بدون استخدام أدوات الإزالة التي نوفّرها. ولا ننصح بهذا الإجراء كأسلوب تلقائي (يمكن للمستخدمين الاستفادة من المقتطف في التعرف على نتيجة البحث ذات الصلة بعملية بحثهم بشكل أسرع، في حين تمنحهم الصفحة المخزّنة مؤقتًا إمكانية عرض المحتوى الخاص بك حتى إذا حدث أمر غير متوقّع أدّى إلى عدم توفّر الخادم)، ولكن يمكنك استخدام علامة meta
المسماة nosnippet والخاصة ببرامج الروبوت لمنع ظهور المقتطف، أو علامة meta
المسماة noarchive والخاصة ببرامج robots من أجل إيقاف التخزين المؤقت للصفحة. يُرجى العِلم أنّه إذا تم تغيير ذلك في الصفحات الحالية والمعروفة، سيحتاج Googlebot إلى إعادة الزحف إلى هذه الصفحات وإعادة فهرستها قبل أن يصبح هذا التغيير مرئيًا في نتائج البحث.
نأمل أن تساعد مشاركة المدونة هذه في توضيح بعض العمليات ضمن أداة إزالة عناوين URL للصفحات المعدَّلة. سنتناول في مشاركة المدونة التالية الطرق المتاحة لطلب إزالة المحتوى الذي لا تملكه.
كالعادة، نرحّب بأي ملاحظات أو استفسارات من خلال منتدى مساعدة مشرفي المواقع.
المزيد من المشاركات ضمن هذه السلسلة
وأخيرًا، يمكنك أيضًا الاطّلاع على مشاركة إدارة المعلومات المتوفرة عنك على الإنترنت.
الناشر: جون مولر، محلل مؤشرات مشرفي المواقع
في Google في سويسرا
إنّ محتوى هذه الصفحة مرخّص بموجب ترخيص Creative Commons Attribution 4.0 ما لم يُنصّ على خلاف ذلك، ونماذج الرموز مرخّصة بموجب ترخيص Apache 2.0. للاطّلاع على التفاصيل، يُرجى مراجعة سياسات موقع Google Developers. إنّ Java هي علامة تجارية مسجَّلة لشركة Oracle و/أو شركائها التابعين.
[null,null,[],[[["\u003cp\u003eGoogle's search results may display outdated content even after a webpage has been updated.\u003c/p\u003e\n"],["\u003cp\u003eTo update Google's search results, you can wait for Google to recrawl the page, or request removal of the outdated content through Google's URL removal tool.\u003c/p\u003e\n"],["\u003cp\u003eIf you own the website, use Google Webmaster Tools to remove the snippet and cached page until Google recrawls the updated page.\u003c/p\u003e\n"],["\u003cp\u003eGoogle's URL removal tool does not prevent a page from ranking based on previous content, so for complete removal, consider the requirements for removal from search results altogether.\u003c/p\u003e\n"],["\u003cp\u003eTo prevent snippets or cached versions from appearing, use robots meta tags, but it's generally recommended to keep them for user experience.\u003c/p\u003e\n"]]],["To update outdated content in Google search results, first modify the live page. Then, either wait for Googlebot to re-crawl and re-index or use Google's URL removal tools. There are two options for URL removals: removing content from others' pages by specifying removed words or removing information from your own page via Google Webmaster Tools, without specifying removed words. For non-HTML content, change the file's URL. Lastly, webmasters can proactively prevent snippets and cached versions using robots meta tags.\n"],null,["# URL removals explained, part II: Removing sensitive text from a page\n\nFriday, August 06, 2010\n\n\nChange can happen---sometimes, as we saw in our\n[previous post on URL removals](/search/blog/2010/03/url-removal-explained-part-i-urls),\nyou may completely block or remove a page from your site. Other times you might only change parts\nof a page, or remove certain pieces of text. Depending on how frequently a page is being crawled,\nit can take some time before these changes get reflected in our search results. In this blog post\nwe'll look at the steps you can take if we're still showing old, removed content in our search\nresults, either in the form of a \"snippet\" or on the cached page that's linked to from the search\nresult. Doing this makes sense when the old content contains sensitive information that needs to\nbe removed quickly---it's not necessary to do this when you just update a website normally.\n\nAs an example, let's look at the following fictitious search result:\n\n|---------------------------------------------------------------------------------------------------------------------------------------------------|------------------------------|\n| **Walter** E. **Coyote** | \\\u003c Title |\n| Chief Development Officer at Acme Corp 1948-2003: worked on the top secret velocitus incalculii capturing device which has shown potential**...** | \\\u003c Snippet |\n| www.example.com/about/**waltercoyote** - Cached | \\\u003c URL + link to cached page |\n\n\nTo change the content shown in the snippet (or on the linked cached page),\n**you'll first need to change the content on the actual (live) page**. Unless a page's publicly\nvisible content is changed, Google's automatic processes will continue to show parts of the\noriginal content in our search results.\n\n\nOnce the page's content has been changed, there are several options available to make those\nchanges visible in our search results:\n\n1.\n **Wait for Googlebot to re-crawl and re-index the page**: This is the natural method for\n how most content is updated at Google. Sometimes it can take a fairly long time, depending on\n how frequently Googlebot currently crawls the page in question. Once we've re-crawled and\n re-indexed the page, the old content will usually not be visible as it'll be replaced by the\n current content. Provided Googlebot is not blocked from crawling the page in question (either\n by robots.txt or by not being able to access the server properly), you don't have to do\n anything special for this to take place. It's generally not possible to speed up crawling and\n indexing, as these processes are fully automated and depend on many external factors.\n\n2.\n Use\n [Google's public URL removal tool](https://www.google.com/webmasters/tools/removals)\n to **request removal of content that has been removed from someone else's webpage** . Using\n this tool, it's necessary to enter the\n [exact URL of the page](https://www.google.com/support/webmasters/bin/answer.py?answer=63758)\n that has been modified, select the \"Content has been removed from the page\" option, and then\n specify one or more words that have been completely removed from that page.\n\n\n Note that *none* of the words you enter can appear on the page; even if a word has been\n removed from one part of the page, your request will be denied if that word still appears on\n another part of the page. Be sure to choose a word (or words) that no longer appear\n *anywhere* on the page. If, in the above example, you removed\n \"top secret velocitus incalculii capturing device\", you should\n submit those words and not something like \"my project.\" However, if the word\n \"top\" or \"device\" still exists\n anywhere on the page, the request would be denied. To maximize your chances of success, it's\n often easiest to just enter one word that you're sure no longer appears anywhere on the page.\n\n\n Once your request has been processed and it's found that the submitted word(s) no longer\n appear on the page, the search result will no longer show a snippet, nor will the cached page\n be available. The title and the URL of the page will still be visible, and the entry may still\n appear in search results for searches related to the content that has been removed (such as\n searches for\n [velocitus incalculii](https://www.google.com/search?q=velocitus+incalculii)),\n even if those words no longer appear in the snippet. However, once the page has been\n re-crawled and re-indexed, the new snippet and cached page can be visible in our search\n results.\n\n\n Keep in mind that we will need to verify removal of the word(s) by viewing the page. If the\n page no longer exists and the server is returning a proper\n [`404` or `410` HTTP result code](https://en.wikipedia.org/wiki/List_of_HTTP_status_codes),\n making us unable to view the page, you may be better off\n [requesting removal of the page](/search/blog/2010/03/url-removal-explained-part-i-urls)\n altogether.\n3. Use Google Webmaster Tools URL removal tool to **request removal of information on a page from your website** . If you have access to the website in question and have verified ownership of it in [Google Webmaster Tools](https://search.google.com/search-console), you can use the URL removal tool there (under *Site Configuration \\\u003e Crawler access* ) to request that the snippet and the cached page be removed until the page has been re-crawled. To use this tool, you only need to submit the [exact URL of the page](https://www.google.com/support/webmasters/bin/answer.py?answer=63758) (you won't need to specify any removed words). Once your request has been processed, we'll remove the snippet and the cached page from search results. The title and the URL of the page will still be visible, and the page may also continue to rank in search results for queries related to content that has been removed. After the page has been re-crawled and re-indexed, the search result with an updated snippet and cached page (based on the new content) can be visible.\n\n\nGoogle indexes and ranks items based not only on the content of a page, but also on other external\nfactors, such as the inbound links to the URL. Because of this, it's possible for a URL to\ncontinue to appear in search results for content that no longer exists on the page, even after\nthe page has been re-crawled and re-indexed. While the URL removal tool can remove the snippet\nand the cached page from a search result, it will not change or remove the title of the search\nresult, change the URL that is shown, or prevent the page from being shown for searches based on\nany current or previous content. If this is important to you, you should make sure that the URL\nfulfills the requirements for a\n[complete removal from our search results](/search/blog/2010/03/url-removal-explained-part-i-urls).\n\nRemoving non-HTML content\n-------------------------\n\n\nIf the changed content is not in (X)HTML (for example if an image, a Flash file or a PDF file has\nbeen changed), you won't be able to use the cache removal tool. So if it's important that the old\ncontent no longer be visible in search results, the fastest solution would be to change the URL\nof the file so that the old URL returns a `404` HTTP result code and use the URL\nremoval tool to remove the old URL. Otherwise, if you chose to allow Google to naturally refresh\nyour information, know that previews of non-HTML content (such as\n[Quick View links for PDF files](https://googleblog.blogspot.com/2009/10/quickly-view-formatted-pdfs-in-your.html))\ncan take longer to update after recrawling than normal HTML pages would.\n\nProactively preventing the appearance of snippets or cached versions\n--------------------------------------------------------------------\n\n\nAs a webmaster, you have the option to use robots\n[`meta` tags](/search/docs/advanced/crawling/special-tags)\nto proactively prevent the appearance of snippets or cached versions without using our removal\ntools. While we don't recommend this as a default approach (the snippet can help users recognize a\nrelevant search result faster, and a cached page gives them the ability to view your content even\nin the unexpected event of your server not being available), you can use the \"nosnippet\" robots\n`meta` tag to\n[prevent showing of a snippet](/search/docs/crawling-indexing/robots-meta-tag#nosnippet),\nor the \"noarchive\" robots `meta` tag to disable caching of a page. Note that if this is changed on\nexisting and known pages, Googlebot will need to re-crawl and re-index those pages before this\nchange becomes visible in search results.\n\n\nWe hope this blog post helps to make some of the processes behind the URL removal tool for updated\npages a bit clearer. In our next blog post we'll look at ways to request removal of content that\nyou don't own; stay tuned!\n\n\nAs always, we welcome your feedback and questions in our\n[Webmaster Help Forum](https://support.google.com/webmasters/community/label?lid=5489e59697a233d7).\n\nOther posts of this series\n--------------------------\n\n- [Part I: Removing URLs and directories](/search/blog/2010/03/url-removal-explained-part-i-urls)\n- [Part II: Removing and updating cached content](/search/blog/2010/04/url-removals-explained-part-ii-removing)\n- [Part III: Removing content you don't own](/search/blog/2010/04/url-removal-explained-part-iii-removing)\n- [Part IV: Tracking requests, what not to remove](/search/blog/2010/05/url-removal-explained-part-iv-tracking)\n\n\nFinally, you might be also interested to read about\n[managing what information is available about you online](/search/blog/2009/10/managing-your-reputation-through-search).\n\n\nPosted by\n[John Mueller](https://twitter.com/JohnMu),\nWebmaster Trends Analyst, Google Switzerland"]]