เราอยู่ใน LinkedIn แล้วตอนนี้: หากต้องการข่าวสารและแหล่งข้อมูลจาก Google Search เกี่ยวกับการทำให้เว็บไซต์ของคุณค้นพบได้ โปรด
ติดตามเราใน LinkedIn
ข้อผิดพลาด 404 จะสร้างความเสียหายต่อเว็บไซต์ของฉันไหม
จัดทุกอย่างให้เป็นระเบียบอยู่เสมอด้วยคอลเล็กชัน
บันทึกและจัดหมวดหมู่เนื้อหาตามค่ากำหนดของคุณ
วันจันทร์ที่ 2 พฤษภาคม 2011
คุณกำลังใช้เครื่องมือของผู้ดูแลเว็บเพื่อดูว่าเว็บไซต์คุณเจ๋งแค่ไหน... แต่เดี๋ยวนะ ทำไมหน้าข้อผิดพลาดจากการ Crawl เต็มไปด้วยข้อผิดพลาด 404 (Not found)
!
เกิดอะไรขึ้นกับเว็บไซต์ของฉันเนี่ย
ไม่ต้องตกใจไป มาดูกันว่าข้อผิดพลาด 404
มี (หรือไม่มี) ผลกระทบต่อเว็บไซต์ของคุณอย่างไร
ถาม: ข้อผิดพลาด 404
ที่รายงานในเครื่องมือของผู้ดูแลเว็บมีผลต่อการจัดอันดับเว็บไซต์ของฉันไหม
ตอบ: ข้อผิดพลาด 404
เป็นเรื่องปกติในเว็บ อินเทอร์เน็ตมีการเปลี่ยนแปลงอยู่ตลอดเวลา มีเนื้อหาเกิดใหม่ เนื้อหาเก่าจะตายไป และเมื่อไม่มีเนื้อหา ตามหลักการแล้วก็จะส่งโค้ด HTTP 404
ตอบกลับมา เครื่องมือค้นหารู้ดีถึงเรื่องนี้ เราเองก็มีข้อผิดพลาด 404
ในเว็บไซต์ของเรา อย่างที่คุณเห็นด้านบน และทั่วทั้งเว็บ ที่จริงแล้วเราอยากให้เป็นแบบนั้น เมื่อลบหน้าในเว็บไซต์ คุณต้องทำให้หน้านั้นแสดงโค้ดตอบกลับ 404
หรือ 410
(ไม่ควรใช้ soft
404
) โปรดทราบว่าหากจะให้ Crawler ของเราเห็นโค้ดตอบกลับ HTTP ของ URL, Crawler จะต้องทำการ Crawl URL นั้นได้ หากคุณให้ไฟล์ robots.txt บล็อก URL ดังกล่าว เราจะทำการ Crawl ไม่ได้ และจะไม่เห็นโค้ดตอบกลับ การที่ URL บางรายการในเว็บไซต์ไม่มีแล้ว หรือแสดงข้อผิดพลาด 404
จะไม่ส่งผลต่อ URL อื่นๆ ของเว็บไซต์ (URL ที่แสดงผลรหัสสถานะ 200 (Success)
) ในผลการค้นหาของเรา
ถาม: ข้อผิดพลาด 404
ไม่เป็นอันตรายต่อเว็บไซต์ของฉันเลยใช่ไหม
ตอบ: หาก URL บางรายการในเว็บไซต์ของคุณเป็น 404
แค่เรื่องนี้จะไม่มีผลต่อคุณหรือในผลการค้นหาของ Google อย่างไรก็ตาม อาจมีเหตุผลอื่นๆ ที่คุณต้องแก้ไขข้อผิดพลาด 404
บางประเภท เช่น หากหน้าเว็บบางหน้าที่เป็น 404
เป็นหน้าเว็บที่คุณเป็นห่วงจริงๆ ก็ควรดูสาเหตุที่เราพบข้อผิดพลาด 404
เมื่อทำการ Crawl หากคุณเห็นการสะกดคําผิดของ URL ที่ยังใช้อยู่ (เช่น www.example.com/awsome แทนที่จะเป็น www.example.com/awesome) อาจเป็นไปได้ว่ามีคนเจตนาจะลิงก์ไปยังคุณและแกล้งพิมพ์ผิด แทนที่จะแสดง 404
คุณอาจทำการเปลี่ยนเส้นทาง 301
URL ที่สะกดผิดไปยัง URL ที่ถูกต้องและดูเจตนาการเข้าชมจากลิงก์นั้น นอกจากนี้ คุณยังควรช่วยผู้ใช้ไปที่หน้า 404
ในเว็บไซต์ ให้ผู้ใช้พบสิ่งที่ต้องการได้ แทนที่จะแค่บอกว่า "404
ไม่พบ"
ถาม: อยากทราบข้อมูลเพิ่มเติมเกี่ยวกับ "ข้อผิดพลาด soft 404
"
ตอบ: soft 404
จะแสดงเมื่อเว็บเซิร์ฟเวอร์ส่งโค้ดตอบกลับที่ไม่ใช่ 404
(หรือ 410
) สําหรับ URL ที่ไม่มีอยู่ ตัวอย่างที่พบได้บ่อยคือเจ้าของเว็บไซต์ต้องการแสดงหน้า 404
พร้อมข้อมูลที่เป็นประโยชน์สําหรับผู้ใช้ และคิดว่าถ้าเว็บไซต์จะแสดงเนื้อหาแก่ผู้ใช้ ก็ต้องส่งโค้ดตอบกลับ 200
แต่ไม่ใช่อย่างนั้น คุณใช้โค้ดตอบกลับ 404
ได้ และขณะเดียวกันก็แสดงเนื้อหาที่ต้องการได้ด้วย อีกตัวอย่างหนึ่งคือเมื่อเว็บไซต์เปลี่ยนเส้นทาง URL ที่ไม่รู้จักไปยังหน้าแรกแทนที่จะแสดงข้อผิดพลาด 404
ทั้งสองกรณีนี้จะส่งผลเสียต่อความเข้าใจและการจัดทําดัชนีเว็บไซต์ ดังนั้นเราขอแนะนําให้ตรวจสอบว่าเซิร์ฟเวอร์ของคุณแสดงโค้ดตอบกลับที่เหมาะสมสําหรับเนื้อหาที่ไม่มีอยู่จริง โปรดทราบว่าแค่หน้าเว็บบอกว่า "404
ไม่พบ" อาจไม่ได้หมายความว่ามีการส่งโค้ดตอบกลับ HTTP 404
จริงๆ ให้คุณใช้ฟีเจอร์โปรแกรม Googlebot จําลอง ในเครื่องมือของผู้ดูแลเว็บเพื่อตรวจสอบให้แน่นอนอีกครั้ง หากไม่ทราบว่าจะกําหนดค่าเซิร์ฟเวอร์ให้แสดงรหัสตอบกลับที่เหมาะสมอย่างไร โปรดดูเอกสารประกอบความช่วยเหลือของโฮสต์เว็บของคุณ
ถาม: ฉันจะทราบได้อย่างไรว่า URL ควรเป็น 404
หรือ 301
หรือ 410
ตอบ: เมื่อคุณนำหน้าออกจากเว็บไซต์ ให้คิดว่าจะมีการย้ายเนื้อหาไปไว้ที่อื่นไหม หรือคุณไม่คิดจะมีเนื้อหาประเภทนี้ในเว็บไซต์อีกต่อไป หากคุณจะย้ายเนื้อหานั้นไปยัง URL ใหม่ คุณควรใช้การเปลี่ยนเส้นทาง 301
URL เก่าไปยัง URL ใหม่ ซึ่งจะทําให้ระบบเปลี่ยนเส้นทางผู้ใช้ที่เข้ามายัง URL เก่าเพื่อค้นหาเนื้อหาดังกล่าวไปยังหน้าที่เกี่ยวข้องกับสิ่งที่ผู้ใช้กําลังค้นหาโดยอัตโนมัติ หากคุณจะทิ้งเนื้อหาดังกล่าวไปเลยและไม่มีเนื้อหาอื่นบนเว็บไซต์ที่จะตอบความต้องการเดียวกันนี้ให้แก่ผู้ใช้ได้ เช่นนั้น URL เก่าก็ควรแสดงผล 404
หรือ 410
ปัจจุบัน Google จะถือว่า 410 (Gone)
เหมือนกับ 404 (Not found)
จึงไม่สําคัญเลยว่าคุณจะส่งอย่างไหนกลับมา
ถาม: ข้อผิดพลาด 404
ส่วนใหญ่ของฉันเป็น URL แปลกๆ ที่ไม่เคยมีอยู่ในเว็บไซต์
เกิดอะไรขึ้น URL พวกนี้มาจากไหน
ตอบ: หาก Google พบลิงก์ที่ไหนสักแห่งในเว็บที่ชี้ไปยัง URL ในโดเมนของคุณ Google อาจพยายามทำการ Crawl ลิงก์นั้นไม่ว่าจะมีเนื้อหาอยู่จริงหรือไม่ก็ตาม และเมื่อ Google ทำการ Crawl, เซิร์ฟเวอร์ของคุณก็ควรแสดง 404
หากไม่พบอะไร ลิงก์เหล่านี้อาจเกิดขึ้นจากการพิมพ์ผิดเมื่อมีคนลิงก์ไปหาคุณ การกําหนดค่าบางประเภทไม่ถูกต้อง (หากลิงก์สร้างขึ้นโดยอัตโนมัติโดย CMS) หรือความพยายามของ Google ที่จะรู้จักคุณและทําการ Crawl ลิงก์ที่ฝังใน JavaScript หรือเนื้อหาที่ฝังไว้อื่นๆ หรืออาจเป็นส่วนหนึ่งของการตรวจสอบอย่างรวดเร็วจากฝั่งเราเองเพื่อดูว่าเซิร์ฟเวอร์ของคุณจัดการ URL ที่ไม่รู้จักอย่างไร เหล่านี้เป็นต้น หากคุณเห็นข้อผิดพลาด 404
รายงานอยู่ในเครื่องมือของผู้ดูแลเว็บสําหรับ URL ที่ไม่มีอยู่ในเว็บไซต์ คุณไม่ต้องสนใจ URL เหล่านั้นก็ได้ เราไม่รู้ว่า URL ใดมีความสําคัญสําหรับคุณ กับไม่รู้ว่า URL ใดที่ควรจะแสดง 404
ดังนั้น เราจึงแสดงข้อผิดพลาด 404
ทั้งหมดที่พบในเว็บไซต์ของคุณ และให้คุณเป็นคนตัดสินใจว่า URL รายการใด (หากมี) ที่ควรต้องตรวจสอบ
ถาม: มีคนคัดลอกเนื้อหาเว็บไซต์ของฉันและทําให้เกิดข้อผิดพลาด 404
จํานวนมาก URL เหล่านี้เป็น URL "จริง" ทั้งหมดที่มีโค้ดอื่นๆ ติดอยู่ เช่น https://www.example.com/images/kittens.jpg" width="100" height="300" alt="kittens"/>
กรณีนี้จะส่งผลกระทบต่อเว็บไซต์ของฉันไหม
ตอบ: โดยทั่วไป คุณไม่ต้องกังวลเลยว่า "ลิงก์เสีย" อย่างนี้จะส่งผลเสียต่อเว็บไซต์ เราเข้าใจว่าเจ้าของเว็บไซต์ควบคุมอะไรได้น้อยมากสำหรับพวกที่คัดลอกเนื้อหาเว็บไซต์ หรือพวกที่ลิงก์เนื้อหาด้วยวิธีการแปลกๆ หากคุณเชี่ยวชาญเรื่อง regex ก็อาจลองใช้การเปลี่ยนเส้นทาง URL เหล่านี้ แต่โดยทั่วไปแล้วไม่มีอะไรต้องกังวล นอกจากนี้ คุณสามารถส่งคําขอให้ลบออกได้เมื่อเชื่อว่ามีคนขโมยเนื้อหาต้นฉบับจากเว็บไซต์ของคุณ
ถาม: สัปดาห์ที่ผ่านมาฉันแก้ไขข้อผิดพลาด 404
ทั้งหมดที่ Search Console รายงาน แต่ข้อผิดพลาดเหล่านั้นยังคงอยู่ในบัญชี นี่หมายความว่าฉันไม่ได้แก้ไขอย่างถูกต้องใช่ไหม ต้องใช้เวลานานเท่าใดกว่าที่ข้อผิดพลาดดังกล่าวจะหายไป
ตอบ: ดูคอลัมน์ "ตรวจพบ" ในหน้าข้อผิดพลาดจากการ Crawl ซึ่งเป็นวันที่ล่าสุดที่เราตรวจพบข้อผิดพลาดแต่ละรายการ หากวันที่ในคอลัมน์เป็นวันที่ก่อนที่คุณจะแก้ไขข้อผิดพลาด แสดงว่าเราไม่พบข้อผิดพลาดเหล่านี้ตั้งแต่วันที่ดังกล่าว หากเป็นวันที่หลังจากนั้น แสดงว่าเรายังคงพบข้อผิดพลาด 404
เหล่านี้อยู่เมื่อทำการ Crawl
หลังจากแก้ไขแล้ว คุณสามารถตรวจสอบได้ว่า Crawler ของเราเห็นโค้ดตอบกลับใหม่หรือไม่โดยใช้โปรแกรม Googlebot จําลอง
ทำการทดสอบ 2-3 URL หากเห็นว่าถูกต้องแล้ว ข้อผิดพลาดเหล่านี้ควรจะเริ่มหายไปจากรายการข้อผิดพลาดจากการ Crawl
ถาม: ฉันจะใช้เครื่องมือนํา URL ออกของ Google เพื่อทําให้ข้อผิดพลาด 404
หายไปจากบัญชีของฉันได้เร็วขึ้นไหม
ตอบ: ไม่ เครื่องมือนํา URL ออกจะนํา URL ออกจากผลการค้นหาของ Google ไม่ใช่จากเครื่องมือของผู้ดูแลเว็บ ซึ่งออกแบบมาสําหรับคําขอนําออกแบบเร่งด่วนเท่านั้น และไม่จําเป็นต้องใช้หาก URL แสดง 404
อยู่แล้ว เพราะ URL ดังกล่าวจะหายไปจากผลการค้นหาอยู่แล้วเมื่อเวลาผ่านไป ดูรายละเอียดเพิ่มเติมเกี่ยวกับสิ่งที่เครื่องมือนํา URL ออกทําได้และทำไม่ได้ที่ครึ่งล่างของบล็อกโพสต์นี้
หากยังต้องการทราบข้อมูลเพิ่มเติมเกี่ยวกับข้อผิดพลาด 404
โปรดไปที่สัปดาห์ 404
จากบล็อก หรือไปที่ฟอรัมความช่วยเหลือสำหรับผู้ดูแลเว็บ
โพสต์โดย Susan Moskwa นักวิเคราะห์เทรนด์สำหรับผู้ดูแลเว็บ
เนื้อหาของหน้าเว็บนี้ได้รับอนุญาตภายใต้ใบอนุญาตที่ต้องระบุที่มาของครีเอทีฟคอมมอนส์ 4.0 และตัวอย่างโค้ดได้รับอนุญาตภายใต้ใบอนุญาต Apache 2.0 เว้นแต่จะระบุไว้เป็นอย่างอื่น โปรดดูรายละเอียดที่นโยบายเว็บไซต์ Google Developers Java เป็นเครื่องหมายการค้าจดทะเบียนของ Oracle และ/หรือบริษัทในเครือ
[null,null,[],[[["\u003cp\u003e404 errors on your site generally do not negatively impact your site's search ranking in Google.\u003c/p\u003e\n"],["\u003cp\u003eSoft 404 errors, where a page displays a 404 message but returns a success code like 200, can negatively impact your site's indexing and should be addressed.\u003c/p\u003e\n"],["\u003cp\u003eIf you move content to a new URL, implement a 301 redirect to guide users and search engines to the correct location.\u003c/p\u003e\n"],["\u003cp\u003eYou can safely ignore 404 errors for URLs that never existed on your site, as Google might crawl linked URLs regardless of their existence.\u003c/p\u003e\n"],["\u003cp\u003eGoogle's URL removal tool is not designed for removing 404 errors from Webmaster Tools but rather for removing specific URLs from search results.\u003c/p\u003e\n"]]],["`404` errors are normal and don't directly harm a site's search ranking. Ensure old content returns a `404` or `410` code, and redirect misspelled URLs with `301` to capture traffic. Soft `404` errors, where a non-404 code is used for non-existent pages, should be avoided. If content is moved, use `301` redirects; otherwise, use `404` or `410`. Ignore `404` errors for URLs that never existed. Fixing errors can be confirmed using \"Fetch as Googlebot.\" The URL removal tool doesn't affect Webmaster Tools' error reports.\n"],null,["# Do 404 errors hurt my site?\n\nMonday, May 02, 2011\n\n\nSo there you are, minding your own business, using Webmaster Tools to check out how awesome your\nsite is... but, wait! The\n[Crawl errors](https://support.google.com/webmasters/answer/7440203)\npage is full of\n[`404 (Not found)` errors](/search/blog/2008/08/its-404-week-at-webmaster-central)!\n*Is disaster imminent??*\n\n\nFear not, my young padawan. Let's take a look at `404` errors and how they do (or do\nnot) affect your site:\n\n\n**Q: Do the `404` errors reported in Webmaster Tools affect my site's ranking?** \n\nA: `404` errors are a perfectly normal part of the web; the Internet is always\nchanging, new content is born, old content dies, and when it dies it (ideally) returns a\n`404` HTTP response code. Search engines are aware of this; we have `404`\nerrors on our own sites, as you can see above, and we find them all over the web. In fact, we\nactually *prefer* that, when you get rid of a page on your site, you make sure that it\nreturns a proper `404` or `410` response code (rather than a `soft\n404`). Keep in mind that in order for our crawler to see the HTTP response code of a\nURL, it has to be able to crawl that URL---if the URL is blocked by your robots.txt file we won't be\nable to crawl it and see its response code. The fact that some URLs on your site no longer exist or\nreturn `404` errors does not affect how your site's other URLs (the ones that return\n[`200 (Success)`\nstatus codes](https://en.wikipedia.org/wiki/List_of_HTTP_status_codes)) perform in our search results.\n\n\n**Q: So `404` errors don't hurt my website at all?** \n\nA: If some URLs on your site `404`, this fact alone does not hurt you or count against\nyou in Google's search results. However, there may be other reasons that you'd want to address\ncertain types of `404` errors. For example, if some of the pages that\n`404` are pages you actually care about, you should look into why we're seeing\n`404` errors when we crawl them! If you see a misspelling of a legitimate URL\n(www.example.com/awsome instead of www.example.com/awesome), it's likely that someone intended to\nlink to you and simply made a typo. Instead of returning a `404`, you could\n`301` redirect the misspelled URL to the correct URL and capture the intended traffic\nfrom that link. You can also make sure that, when users do land on a `404` page on\nyour site, you\n[help them find what they were looking for](/search/docs/crawling-indexing/http-network-errors#pagegone)\nrather than just saying \"`404` Not found.\"\n\n\n**Q: Tell me more about \"`soft 404` errors.\"** \n\nA: A\n[`soft 404`](/search/docs/crawling-indexing/http-network-errors#soft-404-errors)\nis when a web server returns a response code other than `404` (or `410`) for\na URL that doesn't exist. A common example is when a site owner wants to return\n[a pretty `404` page with helpful information for their users](/search/blog/2008/08/make-your-404-pages-more-useful),\nand thinks that in order to serve content to users, they have to return a `200`\nresponse code. Not so! You can return a `404` response code *while* serving\nwhatever content you want. Another example is when a site redirects any unknown URLs to their\nhome page instead of returning `404` errors. Both of these cases can have negative\neffects on our understanding and indexing of your site, so we recommend making sure your server\nreturns the proper response codes for nonexistent content. Keep in mind that *just because a\npage **says** \"`404` Not Found,\" doesn't mean it's actually returning a\n`404` HTTP response code* ---use the\n[Fetch as Googlebot](https://www.google.com/support/webmasters/bin/answer.py?answer=158587)\nfeature in Webmaster Tools to double-check. If you don't know how to configure your server to\nreturn the right response codes, check out your web host's help documentation.\n\n\n**Q: How do I know whether a URL should `404`, or `301`, or\n`410`?** \n\nA: When you remove a page from your site, think about whether that content is moving somewhere\nelse, or whether you no longer plan to have that type of content on your site. If you're moving\nthat content to a new URL, you should `301` redirect the old URL to the new URL---that\nway when users come to the old URL looking for that content, they'll be automatically redirected\nto something relevant to what they were looking for. If you're getting rid of that content\nentirely and don't have anything on your site that would fill the same user need, then the old URL\nshould return a `404` or `410`. Currently Google treats\n`410 (Gone)` the same as `404 (Not found)`, so it's immaterial to us whether\nyou return one or the other.\n\n\n**Q: Most of my `404` errors are for bizarro URLs that never existed on my site.\nWhat's up with that? Where did they come from?** \n\nA: If Google finds a link somewhere on the web that points to a URL on your domain, it may try to\ncrawl that link, whether any content actually exists there or not; and when it does, your server\n*should* return a `404` if there's nothing there to find. These links could be\ncaused by someone making a typo when linking to you, some type of misconfiguration (if the links\nare automatically generated, for example, by a CMS), or by Google's increased efforts to recognize\nand crawl links embedded in JavaScript or other embedded content; or they may be part of a quick\ncheck from our side to see how your server handles unknown URLs, to name just a few. If you see\n`404` errors reported in Webmaster Tools for URLs that don't exist on your site, you\ncan safely ignore them. We don't know which URLs are important to you vs. which are supposed to\n`404`, so we show you *all* the `404` errors we found on your site and\nlet you decide which, if any, require your attention.\n\n\n**Q: Someone has scraped my site and caused a bunch of `404` errors in the\nprocess. They're all \"real\" URLs with other code tacked on, like\n`https://www.example.com/images/kittens.jpg\" width=\"100\" height=\"300\" alt=\"kittens\"/\u003e`\nWill this hurt my site?** \n\nA: Generally you don't need to worry about \"broken links\" like this hurting your site. We\nunderstand that site owners have little to no control over people who scrape their site, or who\nlink to them in strange ways. If you're a whiz with the\n[regex](https://www.google.com/search?q=define:regex),\nyou could consider\n[redirecting these URLs](/search/docs/crawling-indexing/301-redirects), but generally\nit's not worth worrying about. Remember that you can also file a\n[takedown request](https://www.google.com/dmca)\nwhen you believe someone is stealing original content from your website.\n\n\n**Q: Last week I fixed all the `404` errors that Webmaster Tools reported, but\nthey're still listed in my account. Does this mean I didn't fix them correctly? How long will it\ntake for them to disappear?** \n\nA: Take a look at the 'Detected' column on the Crawl errors page---this is the most recent date on\nwhich we detected each error. If the date(s) in that column are from before the time you fixed the\nerrors, that means we haven't encountered these errors since that date. If the dates are more\nrecent, it means we're continuing to see these `404` errors when we crawl.\n\n\nAfter implementing a fix, you can check whether our crawler is seeing the new response code by\nusing\n[Fetch as Googlebot](https://www.google.com/support/webmasters/bin/answer.py?answer=158587).\nTest a few URLs and, if they look good, these errors should soon start to disappear from your\nlist of Crawl errors.\n\n\n**Q: Can I use Google's URL removal tool to make `404` errors disappear from my\naccount faster?**\n\n\nA: No; the URL removal tool removes URLs from Google's search results, not from your Webmaster\nTools account. It's designed for urgent removal requests only, and using it isn't necessary when a\nURL already returns a `404`, as such a URL will drop out of our search results\nnaturally over time. See the bottom half of\n[this blog post](/search/blog/2010/05/url-removal-explained-part-iv-tracking)\nfor more details on what the URL removal tool can and can't do for you.\n\n\nStill want to know more about `404` errors? Check out\n[`404` week](/s/results/search/blog?q=%22404+week%22) from our blog, or drop\nby our\n[Webmaster Help Forum](https://support.google.com/webmasters/community).\n\n\nPosted by\n[Susan Moskwa](/search/blog/authors/susan-moskwa),\nWebmaster Trends Analyst"]]