Giải thích về tính năng xoá URL, Phần IV: Theo dõi các yêu cầu của bạn và những nội dung không nên xoá
Sử dụng bộ sưu tập để sắp xếp ngăn nắp các trang
Lưu và phân loại nội dung dựa trên lựa chọn ưu tiên của bạn.
Thứ Hai, ngày 3 tháng 5 năm 2010
Trong bài cuối cùng này thuộc chuỗi nội dung về việc xoá URL, hãy cùng thảo luận về việc theo dõi các yêu cầu xoá của bạn, cũng như thời điểm không nên sử dụng công cụ xoá URL của Google. Nếu chưa, bạn nên đọc các bài đăng trước đó trong loạt bài này:
Bạn cũng có thể tìm hiểu cách quản lý những thông tin hiện có về bạn trên mạng.
Tìm hiểu trạng thái của yêu cầu
Yêu cầu xoá sẽ xuất hiện trong danh sách yêu cầu của bạn sau khi bạn gửi. Bạn có thể kiểm tra trạng thái của các yêu cầu bất cứ lúc nào để xem liệu nội dung đã bị xoá hay chưa, hay yêu cầu vẫn hoặc đang chờ xử lý hay đã bị từ chối.
Nếu một yêu cầu bị từ chối, bạn sẽ thấy đường liên kết "Tìm hiểu thêm" bên cạnh yêu cầu đó để giải thích lý do yêu cầu cụ thể đó bị từ chối. Vì mỗi loại yêu cầu xoá lại có những điều kiện riêng, nên lý do khiến yêu cầu cụ thể bị từ chối cũng có thể khác biệt. Đường liên kết "Tìm hiểu thêm" sẽ giúp bạn tìm ra những điều cần thay đổi để yêu cầu của bạn thành công. Ví dụ: có thể bạn cần thay đổi để URL đó đáp ứng các yêu cầu đối với hình thức xoá bạn đã yêu cầu; hoặc nếu không thể làm được việc đó, có thể bạn cần yêu cầu một hình thức xoá khác (một loại yêu cầu mà URL của bạn hiện đáp ứng).
Nếu một yêu cầu được đánh dấu là "Đã xoá" nhưng bạn vẫn thấy nội dung đó trong kết quả tìm kiếm, hãy kiểm tra những điều sau:
-
URL xuất hiện trong kết quả tìm kiếm có phải là URL giống hệt với URL mà bạn đã gửi để xoá không? Việc nội dung giống hoặc tương tự nhau xuất hiện trên nhiều URL trên một trang web là việc khá phổ biến. Có thể bạn đã xoá thành công một URL, nhưng vẫn thấy những URL khác có chứa nội dung đó.
Giải pháp: Yêu cầu xoá (các) URL khác có liên quan. Hãy xem bài viết trong Trung tâm trợ giúp của chúng tôi về cách chọn đúng URL để yêu cầu xoá/chặn.
-
Xin lưu ý rằng các URL có phân biệt chữ hoa chữ thường, vì vậy, yêu cầu xoá https://www.example.com/embarrassingstuff.html
không giống với yêu cầu xoá https://www.example.com/EmbarrassingStuff.html
Giải pháp: Yêu cầu xoá (các) URL khác có liên quan. Hãy xem bài viết trong Trung tâm trợ giúp của chúng tôi về cách chọn đúng URL để yêu cầu xoá/chặn.
-
Khi một yêu cầu được đánh dấu là "Đã xoá", điều này có thể mang nhiều ý nghĩa khác biệt tuỳ thuộc vào loại yêu cầu mà bạn gửi. Nếu bạn yêu cầu xoá toàn bộ một URL, thì trạng thái "Đã xoá" có nghĩa là toàn bộ URL đó không còn xuất hiện trong kết quả tìm kiếm của chúng tôi. Nếu bạn yêu cầu xoá phiên bản trong bộ nhớ đệm của một URL, thì "Đã xoá" có nghĩa là phiên bản lưu trong bộ nhớ đệm đã bị xoá và sẽ không xuất hiện trong kết quả tìm kiếm nữa; nhưng bản thân URL đó vẫn có thể xuất hiện.
Giải pháp: Kiểm tra kỹ loại yêu cầu xoá bằng cách xem cột "Loại xoá". Nếu bạn yêu cầu xoá nội dung trong bộ nhớ đệm nhưng lại muốn xoá toàn bộ URL, hãy đảm bảo rằng URL đó đáp ứng các yêu cầu về việc xoá toàn bộ, sau đó gửi một yêu cầu mới để xoá hoàn toàn URL.
-
Để dọn sạch nội dung thừa, chẳng hạn như các trang
404
cũ. Công cụ này dành cho những URL cần xoá ngay, chẳng hạn như những dữ liệu bí mật vô tình bị lộ. Nếu bạn mới thay đổi nội dung trên trang web và chỉ có một số URL lỗi thời trong chỉ mục, thì các trình thu thập dữ liệu của Google sẽ nhận ra điều này khi chúng tôi thu thập lại dữ liệu trên các URL của bạn và những trang đó sẽ tự biến mất khỏi kết quả tìm kiếm theo thời gian. Bạn không cần yêu cầu xoá ngay thông qua công cụ này.
-
Để xoá lỗi thu thập dữ liệu khỏi tài khoản Công cụ quản trị trang web. Công cụ xoá này sẽ xoá URL khỏi kết quả tìm kiếm của Google chứ không xoá URL khỏi tài khoản Công cụ quản trị trang web của bạn. Hiện tại, bạn không có cách nào để xoá URL khỏi báo cáo này theo cách thủ công; chúng sẽ tự nhiên biến mất theo thời gian khi chúng tôi ngừng thu thập dữ liệu những URL liên tục
404
.
-
Để "xây dựng lại trang web từ đầu". Nếu bạn lo lắng rằng trang web của mình có thể bị phạt, hoặc bạn muốn "xây dựng từ đầu" sau khi mua miền của một người khác, thì bạn không nên sử dụng công cụ xoá URL để xoá toàn bộ trang web rồi "bắt đầu lại". Các công cụ tìm kiếm thu thập nhiều thông tin qua các trang web khác (chẳng hạn như những người liên kết đến bạn, hoặc những từ mà họ dùng để mô tả trang web của bạn) và sử dụng thông tin này để giúp bạn hiểu trang web của bạn. Ngay cả khi chúng tôi có thể xoá mọi thông tin mà chúng tôi hiện biết về trang web của bạn, thì rất nhiều trang web như vậy sẽ hoạt động trở lại giống như khi chúng tôi thu thập lại dữ liệu trên tất cả những trang web khác giúp chúng tôi hiểu được trang web của bạn và đưa trang web đó vào ngữ cảnh Nếu lo lắng rằng miền của mình có một số dấu hiệu không hợp lệ trong quá khứ, bạn nên gửi một yêu cầu xem xét lại để cho chúng tôi biết vấn đề khiến bạn lo lắng cũng như những gì đã thay đổi (chẳng hạn như việc bạn mua miền từ người khác hoặc bạn đã thay đổi một số khía cạnh nhất định của trang web).
-
Để "tạm dừng" hoạt động của trang web sau khi bị tấn công. Nếu trang web của bạn bị tấn công và bạn muốn loại bỏ những URL không hợp lệ đã được lập chỉ mục, thì bạn có thể sử dụng công cụ xoá URL để xoá mọi URL mới do tin tặc tạo ra, ví dụ:
https://www.example.com/buy-cheap-cialis-skq3w598.html
.
Bạn không nên xoá toàn bộ trang web hoặc xoá những URL mà rốt cuộc bạn muốn Google lập chỉ mục. Thay vào đó, bạn chỉ cần dọn dẹp trang web và cho phép chúng tôi thu thập lại dữ liệu trên trang web của bạn để chúng tôi có thể lập chỉ mục lại nội dung mới đã được dọn dẹp càng sớm càng tốt.
Bài viết này cung cấp thêm thông tin chi tiết về cách xử lý hành vi tấn công.
-
Để giúp hệ thống lập chỉ mục đúng "phiên bản" của trang web của bạn. Khi yêu cầu xoá
https://www.example.com/tattoo.html
được chấp nhận, http://www.example.com/tattoo.html
cũng sẽ được xoá. Điều này cũng đúng đối với các phiên bản có www và không có www của URL hoặc trang web. Lý do là cùng một nội dung như vậy thường có sẵn tại từng URL trong số này và chúng tôi nhận thấy hầu hết quản trị viên trang web và người tìm kiếm không muốn những trang trùng lặp như vậy xuất hiện trong kết quả tìm kiếm. Tóm lại, bạn không nên dùng công cụ xoá URL làm công cụ chuẩn hoá.
Công cụ này không giữ phiên bản bạn mong muốn mà sẽ xoá tất cả phiên bản (http/https và có/không có www) của một URL.
Chúng tôi hy vọng loạt bài này đã giải đáp được thắc mắc của bạn về việc xoá nội dung khỏi kết quả tìm kiếm trên Google và giúp bạn khắc phục mọi vấn đề có thể phát sinh. Hãy tham gia Diễn đàn trợ giúp của chúng tôi nếu bạn vẫn còn thắc mắc.
Người đăng: Susan Moskwa, Chuyên viên phân tích xu hướng quản trị trang web
Trừ phi có lưu ý khác, nội dung của trang này được cấp phép theo Giấy phép ghi nhận tác giả 4.0 của Creative Commons và các mẫu mã lập trình được cấp phép theo Giấy phép Apache 2.0. Để biết thông tin chi tiết, vui lòng tham khảo Chính sách trang web của Google Developers. Java là nhãn hiệu đã đăng ký của Oracle và/hoặc các đơn vị liên kết với Oracle.
[null,null,[],[[["\u003cp\u003eThis post focuses on how to follow up on Google URL removal requests and when not to use the tool.\u003c/p\u003e\n"],["\u003cp\u003eUsers can check the status of their removal requests (removed, pending, or denied) and learn more about denials through the "Learn more" link.\u003c/p\u003e\n"],["\u003cp\u003eContent may still appear in search results after removal if similar content exists on multiple URLs, URLs are case-sensitive, or a cached removal was requested instead of a complete removal.\u003c/p\u003e\n"],["\u003cp\u003eThe URL removal tool should not be used for cleaning up 404 pages, crawl errors, restarting a site, removing hacked sites entirely, or canonicalization.\u003c/p\u003e\n"],["\u003cp\u003eGoogle recommends using the tool for urgent removals like exposed confidential data, and provides alternatives for other scenarios such as reconsideration requests and hacking recovery.\u003c/p\u003e\n"]]],["Upon submitting a removal request, you can track its status. If denied, a \"Learn more\" link explains why, guiding you to adjust the request or URL. \"Removed\" status can vary; it might mean the entire URL is gone or just the cached version. The tool shouldn't be used for cleaning up old pages, removing crawl errors from Webmaster Tools, starting a site from scratch, handling hacking cleanups of a site, or canonicalization; its main use is for removing urgent content. Remember that removing one version of a URL (http/https or www/non-www) removes all versions.\n"],null,["# URL removal explained, Part IV: Tracking your requests and what not to remove\n\nMonday, May 03, 2010\n\n\nIn this final installation in our URL removal series, let's talk about following up on your\nremoval requests, as well as when *not* to use Google's URL removal tool. If you haven't\nalready, I recommend reading the previous posts in this series:\n\n- [Part I: Removing URLs and directories](/search/blog/2010/03/url-removal-explained-part-i-urls)\n- [Part II: Removing and updating cached content](/search/blog/2010/04/url-removals-explained-part-ii-removing)\n- [Part III: Removing content you don't own](/search/blog/2010/04/url-removal-explained-part-iii-removing)\n- [Part IV: Tracking requests, what not to remove](/search/blog/2010/05/url-removal-explained-part-iv-tracking)\n\n\nYou might be also interested to read about\n[managing what information is available about you online](/search/blog/2009/10/managing-your-reputation-through-search).\n\nUnderstanding the status of your requests\n-----------------------------------------\n\n\nOnce you've submitted a removal request, it will appear in your list of requests. You can check\nthe status of your requests at any time to see whether the content has been removed, or whether\nthe request is still or pending or was denied.\n\n\nIf a request was denied, you should see a \"Learn more\" link next to it explaining why that\nparticular request was denied. Since different types of removals have different requirements, the\nreason why a particular request was denied can vary. The \"Learn more\" link should help you figure\nout what you need to change in order to make your request successful. For example, you may need to\nchange the URL in question so that it meets the requirements for the type of removal you\nrequested; or, if you can't do that, you may need to request a different type of removal (one\nwhose requirements your URL currently meets).\n\n\nIf a request has been marked \"Removed\" but you still see that content in search results, check\nthe following:\n\n-\n **Is the URL that's appearing in search results the exact same URL** that you submitted for\n removal? It's fairly common for the same, or similar, content to appear on multiple URLs on a\n site. You may have successfully removed one URL, but still see others containing that same\n content.\n\n **Solution:** Request removal of the other URL(s) in question. See our help center article\n about\n [which URL should you use for removal/block requests](https://www.google.com/support/webmasters/bin/answer.py?answer=63758)\n for help.\n-\n Keep in mind that **URLs are case sensitive** , so requesting removal of\n `https://www.example.com/embarrassingstuff.html` is not the same as requesting\n removal of `https://www.example.com/EmbarrassingStuff.html`\n\n **Solution:** Request removal of the other URL(s) in question. See our help center article\n about\n [which URL should you use for removal/block requests](https://www.google.com/support/webmasters/bin/answer.py?answer=63758)\n for help.\n-\n When a request is marked \"Removed,\" that can\n **mean different things depending on what type of request** you submitted. If you requested\n removal of an entire URL, then \"Removed\" should mean that that entire URL no longer appears in\n our search results. If you requested removal of the cached copy of a URL, \"Removed\" means that\n the cached copy has been removed and will no longer appear in search results; but the URL\n itself may still appear.\n\n\n **Solution:** Double-check what type of removal you requested by looking at the \"Removal\n Type\" column. If you requested a cache removal but you want the entire URL gone, make sure\n the URL meets the\n [requirements for complete removal](/search/blog/2010/03/url-removal-explained-part-i-urls)\n and then file a new request for complete removal of the URL.\n\nWhen not to use the URL removal tool\n------------------------------------\n\n- **To clean up cruft** , like old pages that `404`. The tool is intended for URLs that urgently need to be removed, such as confidential data that was accidentally exposed. If you recently made changes to your site and just have some outdated URLs in the index, Google's crawlers will see this as we recrawl your URLs, and those pages will naturally drop out of our search results over time. There's no need to request an urgent removal through this tool.\n- **To remove\n [crawl errors](https://support.google.com/webmasters/answer/9679690)** from your Webmaster Tools account. The removal tool removes URLs from Google's search results, not from your Webmaster Tools account. There's currently no way for you to manually remove URLs from this report; they will drop out naturally over time as we stop crawling URLs that repeatedly `404`.\n- **To \"start from scratch\"** with your site. If you're worried that your site may have a penalty, or you want to \"start from scratch\" after purchasing a domain from someone else, we don't recommend trying to use the URL removal tool to remove your entire site and then \"start over.\" Search engines gather a lot of information from other sites (such as who links to you, or what words they use to describe your site) and use this to help understand your site. Even if we could remove everything we currently know about your site, a lot of it would come back exactly the same once we'd recrawled all the other sites that help us understand your site and put it in context. If you're worried that your domain has some bad history, we recommend filing a [reconsideration request](https://www.google.com/support/webmasters/bin/answer.py?answer=35843) letting us know what you're worried about and what has changed (such as that you've acquired the domain from someone else, or that you've changed certain aspects of your site).\n- **To take your site \"offline\" after hacking.** If your site was hacked and you want to get rid of bad URLs that got indexed, you can use the URL removal tool to remove any new URLs that the hacker created, for example, `https://www.example.com/buy-cheap-cialis-skq3w598.html`. But we don't recommend removing your entire site, or removing URLs that you'll eventually want indexed; instead, simply clean up the hacking and let us recrawl your site so that we can reindex the new, cleaned-up content as soon as possible. [This article](/search/blog/2008/04/my-sites-been-hacked-now-what) contains more details on how to deal with hacking.\n- **To get the right \"version\" of your site indexed.** When a request to remove **https**`://www.example.com/tattoo.html` is accepted, **http**`://www.example.com/tattoo.html` is also removed. The same is true of the **www** and **non-www** versions of your URL or site. This is because the same content is often available at each of these URLs and we realize that most webmasters and searchers don't want these duplicates appearing in search results. In short, the URL removal tool should not be used as a [canonicalization](/search/docs/crawling-indexing/consolidate-duplicate-urls) tool. It won't keep your favorite version, it'll remove all versions (http/https and www/non-www) of a URL.\n\n\nWe hope this series has answered your questions about removing content from Google's search\nresults, and helped you troubleshoot any issues that may arise. Join us in our\n[Help Forum](https://support.google.com/webmasters/community/label?lid=5489e59697a233d7)\nif you still have questions.\n\nPosted by Susan Moskwa, Webmaster Trends Analyst"]]