เราอยู่ใน LinkedIn แล้วตอนนี้: หากต้องการข่าวสารและแหล่งข้อมูลจาก Google Search เกี่ยวกับการทำให้เว็บไซต์ของคุณค้นพบได้ โปรด
ติดตามเราใน LinkedIn
คำอธิบายเรื่องการนํา URL ออก ตอนที่ 2: การนำข้อความที่ละเอียดอ่อนออกจากหน้าเว็บ
จัดทุกอย่างให้เป็นระเบียบอยู่เสมอด้วยคอลเล็กชัน
บันทึกและจัดหมวดหมู่เนื้อหาตามค่ากำหนดของคุณ
วันศุกร์ที่ 6 สิงหาคม 2010
บางครั้งก็อาจมีการเปลี่ยนแปลงเกิดขึ้น อย่างที่เราเห็นในโพสต์ก่อนหน้าเรื่องการนํา URL ออก คุณสามารถบล็อกหรือนําหน้านั้นๆ ออกจากเว็บไซต์ได้อย่างสมบูรณ์ แต่บางครั้งคุณอาจจะเปลี่ยนแค่บางส่วนของหน้าหรือนําเนื้อหาบางส่วนออก การเปลี่ยนแปลงอาจใช้เวลาสักพักก่อนที่จะแสดงในผลการค้นหาของเรา ทั้งนี้ขึ้นอยู่กับความถี่ในการ Crawl หน้าเว็บ ในบล็อกโพสต์นี้ เราจะมาดูขั้นตอนที่คุณทําได้ในกรณีที่ยังมีเนื้อหาเก่าที่นําออกแล้วแสดงในผลการค้นหา ไม่ว่าจะในรูปแบบ "ตัวอย่างข้อมูล" หรือในหน้าเว็บที่แคชไว้ซึ่งลิงก์จากผลการค้นหาได้ การดําเนินการนี้เป็นสิ่งที่สมควรทำเมื่อเนื้อหาเก่ามีข้อมูลที่ละเอียดอ่อนซึ่งต้องนําออกอย่างรวดเร็ว ซึ่งหากเป็นเพียงแค่อัปเดตเว็บไซต์ตามปกติ คุณก็ไม่จําเป็นต้องดําเนินการใดๆ
ลองดูตัวอย่างผลการค้นหาสมมติต่อไปนี้
Walter E. Coyote |
< ชื่อ |
Chief Development Officer at Acme Corp 1948-2003: worked on the top
secret velocitus incalculii capturing device which has shown potential... |
< ตัวอย่างข้อมูล |
www.example.com/about/waltercoyote - แคชไว้ |
< URL + ลิงก์ไปยังหน้าที่แคช |
หากต้องการเปลี่ยนเนื้อหาที่แสดงในตัวอย่างข้อมูล (หรือในหน้าที่แคชไว้) ให้เปลี่ยนเนื้อหาในหน้าจริง (ที่เผยแพร่อยู่) ก่อน กระบวนการอัตโนมัติของ Google จะยังคงแสดงเนื้อหาเดิมบางส่วนในผลการค้นหาต่อไป เว้นแต่เนื้อหาที่มองเห็นได้ในหน้าเว็บจะมีการเปลี่ยนแปลง
เมื่อเนื้อหาในหน้าเว็บมีการเปลี่ยนแปลงแล้ว คุณจะเห็นตัวเลือกหลายอย่างในการทําให้การเปลี่ยนแปลงเหล่านั้นปรากฏในผลการค้นหา ดังนี้
-
รอให้ Googlebot ทำการ Crawl และจัดทําดัชนีหน้าเว็บอีกครั้ง: นี่เป็นวิธีตามปกติสำหรับการอัปเดตเนื้อหาส่วนใหญ่ที่ Google บางครั้งอาจใช้เวลาค่อนข้างนาน ทั้งนี้ขึ้นอยู่กับความถี่ที่ Googlebot ทำการ Crawl หน้าเว็บดังกล่าว เมื่อเราทำการ Crawl และจัดทําดัชนีหน้าเว็บอีกครั้งแล้ว เนื้อหาเก่ามักจะมองไม่เห็น เนื่องจากเนื้อหาจะถูกแทนที่ด้วยเนื้อหาปัจจุบัน หากว่า Googlebot ไม่ถูกบล็อกให้ทำการ Crawl หน้าเว็บ (ไม่ว่าจะโดย robots.txt หรือไม่สามารถเข้าถึงเซิร์ฟเวอร์ได้อย่างถูกต้อง) คุณก็ไม่จําเป็นต้องดําเนินการใดๆ เป็นพิเศษ โดยทั่วไป คุณจะเร่งขั้นตอนการ Crawl และการจัดทําดัชนีไม่ได้ เนื่องจากเป็นกระบวนการอัตโนมัติทั้งหมด และขึ้นอยู่กับปัจจัยภายนอกหลายอย่าง
-
ให้ใช้เครื่องมือนํา URL สาธารณะออกของ Google เพื่อขอให้นําเนื้อหาที่ถูกนําออกจากหน้าเว็บของผู้อื่นออก ในการใช้เครื่องมือนี้ คุณต้องป้อน URL ที่ถูกต้องของหน้าที่มีการแก้ไข เลือกตัวเลือก "เนื้อหาถูกนําออกจากหน้าเว็บแล้ว" จากนั้น ให้ระบุคําอย่างน้อย 1 คําที่ถูกนําออกจากหน้านั้นไปแล้วโดยสิ้นเชิง
โปรดทราบว่าต้องไม่มีคําที่คุณป้อนปรากฏอยู่ในหน้าเลย แม้ว่าจะมีการนําคําออกจากส่วนหนึ่งของหน้าแล้ว คําขอจะถูกปฏิเสธหากคํานั้นยังปรากฏอยู่ในส่วนอื่นของหน้า อย่าลืมเลือกคํา (หรือหลายคํา) ที่ไม่ปรากฏอยู่ในทุกที่บนหน้าเว็บอีกต่อไป ในตัวอย่างข้างต้น หากคุณได้นําคำ "top secret velocitus incalculii capturing device" ออกแล้ว คุณควรส่งคําดังกล่าว ไม่ใช่คำประเภทว่า "โครงการของฉัน" อย่างไรก็ตาม หากคํา "top" หรือ "device" ยังคงปรากฎอยู่ที่ตําแหน่งใดก็ตามในหน้าเว็บ คําขอจะถูกปฏิเสธ เพื่อเป็นการเพิ่มโอกาสสูงให้คำขอนำออกสำเร็จ ปกติแล้ว เราจะแนะนําให้ป้อนเพียงคําเดียวที่คุณแน่ใจว่าจะไม่ปรากฏที่ตําแหน่งใดบนหน้า
เมื่อมีการดําเนินการกับคําขอแล้ว และไม่พบคําที่ส่งในหน้าอีกต่อไป ผลการค้นหาจะไม่แสดงตัวอย่างข้อมูล และหน้าที่แคชไว้จะใช้งานไม่ได้อีก ชื่อและ URL ของหน้าจะยังคงอยู่ และคำที่เป็นปัญหาอาจยังปรากฏในผลการค้นหา หากมีการค้นหาที่เกี่ยวข้องกับเนื้อหาที่ถูกลบไป (เช่น การค้นหาคำว่า velocitus incalculii) แม้ว่าคำเหล่านั้นจะไม่ปรากฏในตัวอย่างข้อมูลก็ตาม อย่างไรก็ตามเมื่อมีการ Crawl และทำดัชนีหน้าอีกครั้ง ตัวอย่างข้อมูลและหน้าแคชใหม่จะปรากฏในผลการค้นหาของเรา
โปรดทราบว่าเราจะต้องยืนยันการนําคําดังกล่าวออกด้วยการดูหน้าเว็บ หากหน้านั้นไม่มีอยู่อีกต่อไปและเซิร์ฟเวอร์ส่งรหัสผลลัพธ์ HTTP ที่เหมาะสม ได้แก่ 404
หรือ 410
กลับมา ซึ่งทําให้เราไม่สามารถดูหน้าดังกล่าวได้ ก็แสดงว่าคำขอให้นําหน้าออกของคุณเป็นไปด้วยดี
-
ใช้เครื่องมือนํา URL ออกของเครื่องมือของผู้ดูแลเว็บของ Google เพื่อขอให้นําข้อมูลในหน้าเว็บออกจากเว็บไซต์ของคุณ หากคุณมีสิทธิ์เข้าถึงเว็บไซต์ที่เป็นปัญหาและได้ยืนยันการเป็นเจ้าของเว็บไซต์ใน Google เครื่องมือของผู้ดูแลเว็บแล้ว คุณจะใช้เครื่องมือนํา URL ออกได้ (อยู่ในส่วนการกำหนดค่าเว็บไซต์ > การอนุญาต Crawler) เพื่อขอให้นําตัวอย่างข้อมูลและหน้าที่แคชไว้ออกจนกว่าจะมีการ Crawl หน้านั้นอีกครั้ง หากต้องการใช้เครื่องมือนี้ คุณเพียงแค่ส่ง URL ที่ถูกต้องของหน้าเว็บเท่านั้น (ไม่จําเป็นต้องระบุคําที่นำออก) เมื่อคําขอได้รับการดําเนินการแล้ว เราจะนําตัวอย่างข้อมูลและหน้าเว็บที่แคชไว้ออกจากผลการค้นหา ชื่อและ URL ของหน้าเว็บจะยังปรากฏอยู่ และหน้าเว็บอาจยังคงอยู่ในอันดับในผลการค้นหาที่เกี่ยวข้องกับเนื้อหาที่นําออกไปแล้ว หลังจากที่ทำการ Crawl และจัดทำดัชนีหน้าเว็บอีกครั้งแล้ว ผลการค้นหาที่มีตัวอย่างข้อมูลที่อัปเดตและหน้าที่แคชไว้ (อิงตามเนื้อหาใหม่) จะปรากฏขึ้น
Google ไม่ได้จัดทําดัชนีและจัดอันดับรายการต่างๆ โดยอิงตามเนื้อหาของหน้าเว็บเท่านั้น แต่ยังรวมใช้ปัจจัยภายนอกอื่นๆ เช่น ลิงก์ขาเข้าไปยัง URL ด้วย ด้วยเหตุนี้ จึงอาจเป็นไปได้ที่ URL จะยังปรากฏในผลการค้นหาสำหรับเนื้อหาที่ไม่ได้อยู่ในหน้าแล้ว แม้ว่าจะมีการ Crawl และจัดทําดัชนีหน้าเว็บอีกครั้งแล้วก็ตาม แม้ว่าเครื่องมือนํา URL ออกจะสามารถนําตัวอย่างข้อมูลและหน้าที่แคชไว้ออกจากผลการค้นหาได้ แต่จะไม่เปลี่ยนหรือนําชื่อของผลการค้นหาออก ให้คุณเปลี่ยน URL ที่แสดงอยู่หรือป้องกันไม่ให้หน้าดังกล่าวแสดงในผลการค้นหาตามเนื้อหาในปัจจุบันหรือเนื้อหาก่อนหน้า หากเรื่องนี้สําคัญ คุณควรตรวจสอบว่า URL เป็นไปตามข้อกําหนดของการนําออกโดยสมบูรณ์จากผลการค้นหาของเราไหม
การนําเนื้อหาที่ไม่ใช่ HTML ออก
หากเนื้อหาที่มีการเปลี่ยนแปลงไม่อยู่ใน (X) HTML (เช่น หากมีการเปลี่ยนแปลงรูปภาพ ไฟล์ Flash หรือไฟล์ PDF ) คุณจะไม่สามารถใช้เครื่องมือนําแคชออก ดังนั้น หากเป็นเรื่องสำคัญที่เนื้อหาเก่าจะต้องไม่ปรากฏในผลการค้นหาอีก วิธีแก้ปัญหาที่เร็วที่สุดคือการเปลี่ยน URL ของไฟล์เพื่อให้ URL เก่าแสดงรหัสผลลัพธ์ HTTP 404
และใช้เครื่องมือนํา URL ออกเพื่อนํา URL เก่าออก มิเช่นนั้น คุณอาจเลือกอนุญาตให้ Google รีเฟรชข้อมูลตามปกติ โปรดทราบว่าตัวอย่างเนื้อหาที่ไม่ใช่ HTML (เช่น ลิงก์มุมมองด่วนสำหรับไฟล์ PDF) อาจใช้เวลานานกว่าหน้า HTML ปกติในการอัปเดตหลังจากที่ทำการ Crawl อีกครั้ง
ป้องกันเชิงรุกเพื่อไม่ให้ตัวอย่างข้อมูลหรือเวอร์ชันที่แคชไว้แสดงในผลการค้นหา
ในฐานะผู้ดูแลเว็บ คุณมีตัวเลือกในการใช้แท็ก meta
ของ robots เพื่อป้องกันลักษณะที่ปรากฏของตัวอย่างข้อมูลหรือเวอร์ชันที่แคชไว้ในเชิงรุกโดยไม่ต้องใช้เครื่องมือนําออก แม้ว่าเราจะไม่แนะนําวิธีนี้เป็นวิธีเริ่มต้น (ตัวอย่างข้อมูลอาจช่วยให้ผู้ใช้จดจําผลการค้นหาที่เกี่ยวข้องได้เร็วขึ้น และหน้าที่แคชไว้ช่วยให้ผู้ใช้ดูเนื้อหาของคุณได้แม้ในกรณีที่เกิดเหตุไม่คาดคิดที่เซิร์ฟเวอร์ไม่พร้อมใช้งาน) คุณสามารถใช้แท็ก meta
"nosnippet" ของ robots เพื่อป้องกันไม่ให้แสดงตัวอย่างข้อมูล หรือใช้แท็ก meta
"noarchive" ของ robots เพื่อปิดใช้การแคชของหน้าเว็บ โปรดทราบว่าหากมีการเปลี่ยนแปลงในหน้าที่มีอยู่และหน้าที่รู้จัก Googlebot จะต้องทำการ Crawl และจัดทําดัชนีหน้าเหล่านั้นอีกครั้งเพื่อให้การเปลี่ยนแปลงนี้ปรากฏในผลการค้นหา
เราหวังว่าบล็อกโพสต์นี้จะช่วยให้คุณเข้าใจขั้นตอนบางส่วนในเครื่องมือนํา URL ออกสําหรับหน้าเว็บที่อัปเดตมากขึ้น ในบล็อกโพสต์ถัดไป เราจะมาดูกันถึงวิธีส่งคำขอนำเนื้อหาที่คุณไม่ได้เป็นเจ้าของออก โปรดติดตามต่อไป
และเช่นเคย เรายินดีรับฟังความคิดเห็นและคําถามของคุณในฟอรัมความช่วยเหลือสําหรับผู้ดูแลเว็บ
โพสต์อื่นๆ ของซีรีส์นี้
นอกจากนี้ คุณอาจสนใจอ่านการจัดการข้อมูลเกี่ยวกับตัวคุณที่มีอยู่ทางออนไลน์
โพสต์โดย John Mueller นักวิเคราะห์เทรนด์สำหรับผู้ดูแลเว็บจาก Google Switzerland
เนื้อหาของหน้าเว็บนี้ได้รับอนุญาตภายใต้ใบอนุญาตที่ต้องระบุที่มาของครีเอทีฟคอมมอนส์ 4.0 และตัวอย่างโค้ดได้รับอนุญาตภายใต้ใบอนุญาต Apache 2.0 เว้นแต่จะระบุไว้เป็นอย่างอื่น โปรดดูรายละเอียดที่นโยบายเว็บไซต์ Google Developers Java เป็นเครื่องหมายการค้าจดทะเบียนของ Oracle และ/หรือบริษัทในเครือ
[null,null,[],[[["\u003cp\u003eGoogle's search results may display outdated content even after a webpage has been updated.\u003c/p\u003e\n"],["\u003cp\u003eTo update Google's search results, you can wait for Google to recrawl the page, or request removal of the outdated content through Google's URL removal tool.\u003c/p\u003e\n"],["\u003cp\u003eIf you own the website, use Google Webmaster Tools to remove the snippet and cached page until Google recrawls the updated page.\u003c/p\u003e\n"],["\u003cp\u003eGoogle's URL removal tool does not prevent a page from ranking based on previous content, so for complete removal, consider the requirements for removal from search results altogether.\u003c/p\u003e\n"],["\u003cp\u003eTo prevent snippets or cached versions from appearing, use robots meta tags, but it's generally recommended to keep them for user experience.\u003c/p\u003e\n"]]],["To update outdated content in Google search results, first modify the live page. Then, either wait for Googlebot to re-crawl and re-index or use Google's URL removal tools. There are two options for URL removals: removing content from others' pages by specifying removed words or removing information from your own page via Google Webmaster Tools, without specifying removed words. For non-HTML content, change the file's URL. Lastly, webmasters can proactively prevent snippets and cached versions using robots meta tags.\n"],null,["# URL removals explained, part II: Removing sensitive text from a page\n\nFriday, August 06, 2010\n\n\nChange can happen---sometimes, as we saw in our\n[previous post on URL removals](/search/blog/2010/03/url-removal-explained-part-i-urls),\nyou may completely block or remove a page from your site. Other times you might only change parts\nof a page, or remove certain pieces of text. Depending on how frequently a page is being crawled,\nit can take some time before these changes get reflected in our search results. In this blog post\nwe'll look at the steps you can take if we're still showing old, removed content in our search\nresults, either in the form of a \"snippet\" or on the cached page that's linked to from the search\nresult. Doing this makes sense when the old content contains sensitive information that needs to\nbe removed quickly---it's not necessary to do this when you just update a website normally.\n\nAs an example, let's look at the following fictitious search result:\n\n|---------------------------------------------------------------------------------------------------------------------------------------------------|------------------------------|\n| **Walter** E. **Coyote** | \\\u003c Title |\n| Chief Development Officer at Acme Corp 1948-2003: worked on the top secret velocitus incalculii capturing device which has shown potential**...** | \\\u003c Snippet |\n| www.example.com/about/**waltercoyote** - Cached | \\\u003c URL + link to cached page |\n\n\nTo change the content shown in the snippet (or on the linked cached page),\n**you'll first need to change the content on the actual (live) page**. Unless a page's publicly\nvisible content is changed, Google's automatic processes will continue to show parts of the\noriginal content in our search results.\n\n\nOnce the page's content has been changed, there are several options available to make those\nchanges visible in our search results:\n\n1.\n **Wait for Googlebot to re-crawl and re-index the page**: This is the natural method for\n how most content is updated at Google. Sometimes it can take a fairly long time, depending on\n how frequently Googlebot currently crawls the page in question. Once we've re-crawled and\n re-indexed the page, the old content will usually not be visible as it'll be replaced by the\n current content. Provided Googlebot is not blocked from crawling the page in question (either\n by robots.txt or by not being able to access the server properly), you don't have to do\n anything special for this to take place. It's generally not possible to speed up crawling and\n indexing, as these processes are fully automated and depend on many external factors.\n\n2.\n Use\n [Google's public URL removal tool](https://www.google.com/webmasters/tools/removals)\n to **request removal of content that has been removed from someone else's webpage** . Using\n this tool, it's necessary to enter the\n [exact URL of the page](https://www.google.com/support/webmasters/bin/answer.py?answer=63758)\n that has been modified, select the \"Content has been removed from the page\" option, and then\n specify one or more words that have been completely removed from that page.\n\n\n Note that *none* of the words you enter can appear on the page; even if a word has been\n removed from one part of the page, your request will be denied if that word still appears on\n another part of the page. Be sure to choose a word (or words) that no longer appear\n *anywhere* on the page. If, in the above example, you removed\n \"top secret velocitus incalculii capturing device\", you should\n submit those words and not something like \"my project.\" However, if the word\n \"top\" or \"device\" still exists\n anywhere on the page, the request would be denied. To maximize your chances of success, it's\n often easiest to just enter one word that you're sure no longer appears anywhere on the page.\n\n\n Once your request has been processed and it's found that the submitted word(s) no longer\n appear on the page, the search result will no longer show a snippet, nor will the cached page\n be available. The title and the URL of the page will still be visible, and the entry may still\n appear in search results for searches related to the content that has been removed (such as\n searches for\n [velocitus incalculii](https://www.google.com/search?q=velocitus+incalculii)),\n even if those words no longer appear in the snippet. However, once the page has been\n re-crawled and re-indexed, the new snippet and cached page can be visible in our search\n results.\n\n\n Keep in mind that we will need to verify removal of the word(s) by viewing the page. If the\n page no longer exists and the server is returning a proper\n [`404` or `410` HTTP result code](https://en.wikipedia.org/wiki/List_of_HTTP_status_codes),\n making us unable to view the page, you may be better off\n [requesting removal of the page](/search/blog/2010/03/url-removal-explained-part-i-urls)\n altogether.\n3. Use Google Webmaster Tools URL removal tool to **request removal of information on a page from your website** . If you have access to the website in question and have verified ownership of it in [Google Webmaster Tools](https://search.google.com/search-console), you can use the URL removal tool there (under *Site Configuration \\\u003e Crawler access* ) to request that the snippet and the cached page be removed until the page has been re-crawled. To use this tool, you only need to submit the [exact URL of the page](https://www.google.com/support/webmasters/bin/answer.py?answer=63758) (you won't need to specify any removed words). Once your request has been processed, we'll remove the snippet and the cached page from search results. The title and the URL of the page will still be visible, and the page may also continue to rank in search results for queries related to content that has been removed. After the page has been re-crawled and re-indexed, the search result with an updated snippet and cached page (based on the new content) can be visible.\n\n\nGoogle indexes and ranks items based not only on the content of a page, but also on other external\nfactors, such as the inbound links to the URL. Because of this, it's possible for a URL to\ncontinue to appear in search results for content that no longer exists on the page, even after\nthe page has been re-crawled and re-indexed. While the URL removal tool can remove the snippet\nand the cached page from a search result, it will not change or remove the title of the search\nresult, change the URL that is shown, or prevent the page from being shown for searches based on\nany current or previous content. If this is important to you, you should make sure that the URL\nfulfills the requirements for a\n[complete removal from our search results](/search/blog/2010/03/url-removal-explained-part-i-urls).\n\nRemoving non-HTML content\n-------------------------\n\n\nIf the changed content is not in (X)HTML (for example if an image, a Flash file or a PDF file has\nbeen changed), you won't be able to use the cache removal tool. So if it's important that the old\ncontent no longer be visible in search results, the fastest solution would be to change the URL\nof the file so that the old URL returns a `404` HTTP result code and use the URL\nremoval tool to remove the old URL. Otherwise, if you chose to allow Google to naturally refresh\nyour information, know that previews of non-HTML content (such as\n[Quick View links for PDF files](https://googleblog.blogspot.com/2009/10/quickly-view-formatted-pdfs-in-your.html))\ncan take longer to update after recrawling than normal HTML pages would.\n\nProactively preventing the appearance of snippets or cached versions\n--------------------------------------------------------------------\n\n\nAs a webmaster, you have the option to use robots\n[`meta` tags](/search/docs/advanced/crawling/special-tags)\nto proactively prevent the appearance of snippets or cached versions without using our removal\ntools. While we don't recommend this as a default approach (the snippet can help users recognize a\nrelevant search result faster, and a cached page gives them the ability to view your content even\nin the unexpected event of your server not being available), you can use the \"nosnippet\" robots\n`meta` tag to\n[prevent showing of a snippet](/search/docs/crawling-indexing/robots-meta-tag#nosnippet),\nor the \"noarchive\" robots `meta` tag to disable caching of a page. Note that if this is changed on\nexisting and known pages, Googlebot will need to re-crawl and re-index those pages before this\nchange becomes visible in search results.\n\n\nWe hope this blog post helps to make some of the processes behind the URL removal tool for updated\npages a bit clearer. In our next blog post we'll look at ways to request removal of content that\nyou don't own; stay tuned!\n\n\nAs always, we welcome your feedback and questions in our\n[Webmaster Help Forum](https://support.google.com/webmasters/community/label?lid=5489e59697a233d7).\n\nOther posts of this series\n--------------------------\n\n- [Part I: Removing URLs and directories](/search/blog/2010/03/url-removal-explained-part-i-urls)\n- [Part II: Removing and updating cached content](/search/blog/2010/04/url-removals-explained-part-ii-removing)\n- [Part III: Removing content you don't own](/search/blog/2010/04/url-removal-explained-part-iii-removing)\n- [Part IV: Tracking requests, what not to remove](/search/blog/2010/05/url-removal-explained-part-iv-tracking)\n\n\nFinally, you might be also interested to read about\n[managing what information is available about you online](/search/blog/2009/10/managing-your-reputation-through-search).\n\n\nPosted by\n[John Mueller](https://twitter.com/JohnMu),\nWebmaster Trends Analyst, Google Switzerland"]]