404 エラーがサイトに与える悪影響
コレクションでコンテンツを整理
必要に応じて、コンテンツの保存と分類を行います。
2011 年 5 月 2 日(月曜日)
ウェブマスター ツールを使って自分のサイトの状態を確認したところ、クロールエラー ページが 404 (Not found)
エラーでいっぱいになっていたとします。このような場合、いったいどうしたらよいのでしょうか。
心配する必要はありません。この記事では、404
エラーと、このエラーがサイトに及ぼす影響について説明します。
Q: ウェブマスター ツールで報告される 404
エラーはサイトのランキングに影響しますか?
A: 404
エラーは、ウェブの動作としてまったく正常なものです。インターネットは常に変化しており、新しいコンテンツが作られ、古いコンテンツはなくなっていきます。コンテンツがなくなっている場合、通常は 404
HTTP レスポンス コードが返されます。検索エンジンはこのことを理解しています。上記の例のように、Google のサイトにも 404
エラーはあり、このエラーはインターネットの至るところで見られます。サイトからページが削除された場合は、soft
404
よりも、正しい 404
または 410
レスポンス コードが返されるほうが検索エンジンにとっては望ましいのです。Google のクローラーが URL の HTTP レスポンス コードを確認するためには、その URL をクロールする必要があります。そのため、該当の URL が robots.txt ファイルでブロックされていると、クロールしてレスポンス コードを確認することができません。サイトの一部の URL が存在しなくなったり、404
を返したりしても、検索結果におけるサイトの他の URL(200 (Success)
ステータス コードを返すもの)のランキングには影響しません。
Q: では、404
エラーがウェブサイトに悪影響を及ぼすことはないのですか?
A: サイトの一部の URL が 404
を返しているということ自体が、サイト所有者の評価や Google の検索結果に影響することはありません。ただし、一部の 404
エラーに対しては対処が必要です。たとえば、404
を返しているページがサイトにとって重要なページである場合は、なぜクロール時に 404
エラーが出ているのか調査すべきです。URL のスペルミス(www.example.com/awesome を誤って www.example.com/awsome としている場合など)がある場合は、誰かがサイトにリンクしようとしてタイプミスをしていることが考えられます。404
を返す代わりに、301
リダイレクトを使用して正しい URL にリダイレクトすれば、そのリンクからのトラフィックを得ることができます。また、ユーザーがサイトの 404
ページにアクセスした場合、「404
Not found」とだけ表示するのではなく、ユーザーにとって便利なページを用意することもできます。
Q: 「soft 404
エラー」について詳しく教えてください。
A: soft 404
エラーとは、ウェブサーバーが、存在しない URL に対して 404
(または 410
)以外のレスポンス コードを返す状態を指します。一般的な例としては、サイト所有者がユーザーにとって便利な 404
ページを提供したいと考え、そのようなコンテンツを提供するには必ず 200
レスポンス コードを返さなければならないと思っている場合です。しかし、404
を返しつつそのようなコンテンツを提供することは可能です。他の例としては、未知の URL に対して 404
を返す代わりにホームページにリダイレクトしている場合があります。どちらの場合も、Google がサイトを分析してインデックスに登録するのに支障が出る可能性があるため、存在しないコンテンツに関しては適切なレスポンス コードを返すことをおすすめします。ページに「404
Not Found」と書かれているからといって、実際に 404
HTTP レスポンス コードを返しているとは限りません。ウェブマスター ツールの Fetch as Googlebot 機能を使用して、そのページを再度確認してください。サーバーが正しいレスポンス コードを返すように設定する方法がわからない場合は、ホスティング サービスのヘルプ ドキュメントをご覧ください。
Q: URL が 404
、301
、410
のうちどれを返すべきか判断するにはどうすればよいですか?
A: サイトからページを削除する際には、そのコンテンツを別の場所に移動するのか、それとも今後サイト内に同種のコンテンツを置く予定はないのかを考えるようにします。コンテンツを新しい URL に移動する場合は、元の URL から新しい URL に 301
リダイレクトします。これにより、そのコンテンツを求めて元の URL にアクセスしたユーザーを、目的の情報に関連するコンテンツに自動的に誘導できます。そのコンテンツを完全に削除する予定であり、そのコンテンツを求めているユーザーの要望を満たすものも一切自分のサイトに置かない場合は、ユーザーが古い URL にアクセスしたときに 404
または 410
が返されるようにしてください。現在、Google は 410 (Gone)
を 404 (Not found)
と同じように処理します。そのため、どちらを返してもかまいません。
Q: 404
エラーのほとんどが、サイトに存在しない URL に対するものです。
これはどのようなトラフィックで、どこから来たのでしょうか?
A: 通常 Google は、ウェブ上のどこかであなたのサイト内へ張られたリンクを検出すると、コンテンツの有無を問わずそのリンクをクロールします。その URL が存在しない場合、サーバーは 404
を返す必要があります。こういった無効なリンクが発生する理由はいくつか考えられます。たとえば、サイトにリンクしようとした誰かがスペルミスをした場合、設定ミスの場合(CMS によってリンクが自動生成されているなど)、Google のクローラーが JavaScript や他の埋め込みコンテンツ内のリンクを認識してクロールしようとした場合、サーバーが未知の URL をどのように処理するかを Google が確認しようとした場合などです。サイトに存在しない URL に対してウェブマスター ツールが 404
を報告した場合は、無視しても問題ありません。Google は、サイトにとって重要な URL と、404
を返すべき URL を判別できません。このため、サイトで検出されたすべての 404
を報告し、対応が必要かどうかはサイト所有者の判断に任せています。
Q: サイトをスクレイピングされたため、大量の 404
エラーが発生しました。「https://www.example.com/images/kittens.jpg" width="100" height="300" alt="kittens"/>
」のような、実在する URL に他のコードが付け加えられたものです。これはサイトに悪影響を及ぼしますか?
A: 一般的に、このような「無効なリンク」がサイトに悪影響を及ぼすことはありません。Google は、サイト所有者側ではスクレイピングを行う者や、普通でない方法でリンクしようとする者を制御できないことを理解しています。正規表現を使いこなせる場合は、これらの URL をリダイレクトすることもできますが、通常は心配しなくても大丈夫です。また、サイトからコンテンツが盗用された確信がある場合は、著作権侵害の申し立てを行うこともできます。
Q: 先週、ウェブマスター ツールで報告された 404
エラーをすべて修正したのですが、まだ一覧に記載されています。正しく修正できなかったということでしょうか?エラーが表示されなくなるまでどれくらいかかりますか?
A: [クロールエラー] ページの [最終検出] 列をご覧ください。これは各エラーが検出された最新の日付を示しています。列の日付がエラーを修正した日より前であれば、それ以降そのエラーは発生していないことを意味します。日付が修正した日より後である場合は、それ以降もクロール時に 404
が発生していることになります。
修正後に Fetch as Googlebot を使用すると、クローラーが新しいレスポンス コードを認識できているかどうかを確認できます。いくつかの URL でテストして問題がなければ、それらはクロールエラーの一覧から消えていくはずです。
Q: アカウントから 404
エラーを早く消去するために、Google の URL の削除ツールを使ってもよいですか?
A: URL 削除ツールは Google の検索結果から URL を削除するためのものであり、ウェブマスター ツールのアカウントから削除するためのものではありません。404
を返すページはいずれ検索結果には表示されなくなるため、緊急の削除要請用のツールを使う必要はありません。URL 削除ツールを使用すべき場合とそうでない場合について詳しくは、このブログ投稿の後半をご覧ください。
404
エラーについてさらに詳しく知りたい方は、ブログの 404
特集をご覧いただくか、ウェブマスター ヘルプ フォーラムにお問い合わせください。
Posted by
Susan Moskwa,
Webmaster Trends Analyst
特に記載のない限り、このページのコンテンツはクリエイティブ・コモンズの表示 4.0 ライセンスにより使用許諾されます。コードサンプルは Apache 2.0 ライセンスにより使用許諾されます。詳しくは、Google Developers サイトのポリシーをご覧ください。Java は Oracle および関連会社の登録商標です。
[null,null,[],[[["\u003cp\u003e404 errors on your site generally do not negatively impact your site's search ranking in Google.\u003c/p\u003e\n"],["\u003cp\u003eSoft 404 errors, where a page displays a 404 message but returns a success code like 200, can negatively impact your site's indexing and should be addressed.\u003c/p\u003e\n"],["\u003cp\u003eIf you move content to a new URL, implement a 301 redirect to guide users and search engines to the correct location.\u003c/p\u003e\n"],["\u003cp\u003eYou can safely ignore 404 errors for URLs that never existed on your site, as Google might crawl linked URLs regardless of their existence.\u003c/p\u003e\n"],["\u003cp\u003eGoogle's URL removal tool is not designed for removing 404 errors from Webmaster Tools but rather for removing specific URLs from search results.\u003c/p\u003e\n"]]],["`404` errors are normal and don't directly harm a site's search ranking. Ensure old content returns a `404` or `410` code, and redirect misspelled URLs with `301` to capture traffic. Soft `404` errors, where a non-404 code is used for non-existent pages, should be avoided. If content is moved, use `301` redirects; otherwise, use `404` or `410`. Ignore `404` errors for URLs that never existed. Fixing errors can be confirmed using \"Fetch as Googlebot.\" The URL removal tool doesn't affect Webmaster Tools' error reports.\n"],null,["# Do 404 errors hurt my site?\n\nMonday, May 02, 2011\n\n\nSo there you are, minding your own business, using Webmaster Tools to check out how awesome your\nsite is... but, wait! The\n[Crawl errors](https://support.google.com/webmasters/answer/7440203)\npage is full of\n[`404 (Not found)` errors](/search/blog/2008/08/its-404-week-at-webmaster-central)!\n*Is disaster imminent??*\n\n\nFear not, my young padawan. Let's take a look at `404` errors and how they do (or do\nnot) affect your site:\n\n\n**Q: Do the `404` errors reported in Webmaster Tools affect my site's ranking?** \n\nA: `404` errors are a perfectly normal part of the web; the Internet is always\nchanging, new content is born, old content dies, and when it dies it (ideally) returns a\n`404` HTTP response code. Search engines are aware of this; we have `404`\nerrors on our own sites, as you can see above, and we find them all over the web. In fact, we\nactually *prefer* that, when you get rid of a page on your site, you make sure that it\nreturns a proper `404` or `410` response code (rather than a `soft\n404`). Keep in mind that in order for our crawler to see the HTTP response code of a\nURL, it has to be able to crawl that URL---if the URL is blocked by your robots.txt file we won't be\nable to crawl it and see its response code. The fact that some URLs on your site no longer exist or\nreturn `404` errors does not affect how your site's other URLs (the ones that return\n[`200 (Success)`\nstatus codes](https://en.wikipedia.org/wiki/List_of_HTTP_status_codes)) perform in our search results.\n\n\n**Q: So `404` errors don't hurt my website at all?** \n\nA: If some URLs on your site `404`, this fact alone does not hurt you or count against\nyou in Google's search results. However, there may be other reasons that you'd want to address\ncertain types of `404` errors. For example, if some of the pages that\n`404` are pages you actually care about, you should look into why we're seeing\n`404` errors when we crawl them! If you see a misspelling of a legitimate URL\n(www.example.com/awsome instead of www.example.com/awesome), it's likely that someone intended to\nlink to you and simply made a typo. Instead of returning a `404`, you could\n`301` redirect the misspelled URL to the correct URL and capture the intended traffic\nfrom that link. You can also make sure that, when users do land on a `404` page on\nyour site, you\n[help them find what they were looking for](/search/docs/crawling-indexing/http-network-errors#pagegone)\nrather than just saying \"`404` Not found.\"\n\n\n**Q: Tell me more about \"`soft 404` errors.\"** \n\nA: A\n[`soft 404`](/search/docs/crawling-indexing/http-network-errors#soft-404-errors)\nis when a web server returns a response code other than `404` (or `410`) for\na URL that doesn't exist. A common example is when a site owner wants to return\n[a pretty `404` page with helpful information for their users](/search/blog/2008/08/make-your-404-pages-more-useful),\nand thinks that in order to serve content to users, they have to return a `200`\nresponse code. Not so! You can return a `404` response code *while* serving\nwhatever content you want. Another example is when a site redirects any unknown URLs to their\nhome page instead of returning `404` errors. Both of these cases can have negative\neffects on our understanding and indexing of your site, so we recommend making sure your server\nreturns the proper response codes for nonexistent content. Keep in mind that *just because a\npage **says** \"`404` Not Found,\" doesn't mean it's actually returning a\n`404` HTTP response code* ---use the\n[Fetch as Googlebot](https://www.google.com/support/webmasters/bin/answer.py?answer=158587)\nfeature in Webmaster Tools to double-check. If you don't know how to configure your server to\nreturn the right response codes, check out your web host's help documentation.\n\n\n**Q: How do I know whether a URL should `404`, or `301`, or\n`410`?** \n\nA: When you remove a page from your site, think about whether that content is moving somewhere\nelse, or whether you no longer plan to have that type of content on your site. If you're moving\nthat content to a new URL, you should `301` redirect the old URL to the new URL---that\nway when users come to the old URL looking for that content, they'll be automatically redirected\nto something relevant to what they were looking for. If you're getting rid of that content\nentirely and don't have anything on your site that would fill the same user need, then the old URL\nshould return a `404` or `410`. Currently Google treats\n`410 (Gone)` the same as `404 (Not found)`, so it's immaterial to us whether\nyou return one or the other.\n\n\n**Q: Most of my `404` errors are for bizarro URLs that never existed on my site.\nWhat's up with that? Where did they come from?** \n\nA: If Google finds a link somewhere on the web that points to a URL on your domain, it may try to\ncrawl that link, whether any content actually exists there or not; and when it does, your server\n*should* return a `404` if there's nothing there to find. These links could be\ncaused by someone making a typo when linking to you, some type of misconfiguration (if the links\nare automatically generated, for example, by a CMS), or by Google's increased efforts to recognize\nand crawl links embedded in JavaScript or other embedded content; or they may be part of a quick\ncheck from our side to see how your server handles unknown URLs, to name just a few. If you see\n`404` errors reported in Webmaster Tools for URLs that don't exist on your site, you\ncan safely ignore them. We don't know which URLs are important to you vs. which are supposed to\n`404`, so we show you *all* the `404` errors we found on your site and\nlet you decide which, if any, require your attention.\n\n\n**Q: Someone has scraped my site and caused a bunch of `404` errors in the\nprocess. They're all \"real\" URLs with other code tacked on, like\n`https://www.example.com/images/kittens.jpg\" width=\"100\" height=\"300\" alt=\"kittens\"/\u003e`\nWill this hurt my site?** \n\nA: Generally you don't need to worry about \"broken links\" like this hurting your site. We\nunderstand that site owners have little to no control over people who scrape their site, or who\nlink to them in strange ways. If you're a whiz with the\n[regex](https://www.google.com/search?q=define:regex),\nyou could consider\n[redirecting these URLs](/search/docs/crawling-indexing/301-redirects), but generally\nit's not worth worrying about. Remember that you can also file a\n[takedown request](https://www.google.com/dmca)\nwhen you believe someone is stealing original content from your website.\n\n\n**Q: Last week I fixed all the `404` errors that Webmaster Tools reported, but\nthey're still listed in my account. Does this mean I didn't fix them correctly? How long will it\ntake for them to disappear?** \n\nA: Take a look at the 'Detected' column on the Crawl errors page---this is the most recent date on\nwhich we detected each error. If the date(s) in that column are from before the time you fixed the\nerrors, that means we haven't encountered these errors since that date. If the dates are more\nrecent, it means we're continuing to see these `404` errors when we crawl.\n\n\nAfter implementing a fix, you can check whether our crawler is seeing the new response code by\nusing\n[Fetch as Googlebot](https://www.google.com/support/webmasters/bin/answer.py?answer=158587).\nTest a few URLs and, if they look good, these errors should soon start to disappear from your\nlist of Crawl errors.\n\n\n**Q: Can I use Google's URL removal tool to make `404` errors disappear from my\naccount faster?**\n\n\nA: No; the URL removal tool removes URLs from Google's search results, not from your Webmaster\nTools account. It's designed for urgent removal requests only, and using it isn't necessary when a\nURL already returns a `404`, as such a URL will drop out of our search results\nnaturally over time. See the bottom half of\n[this blog post](/search/blog/2010/05/url-removal-explained-part-iv-tracking)\nfor more details on what the URL removal tool can and can't do for you.\n\n\nStill want to know more about `404` errors? Check out\n[`404` week](/s/results/search/blog?q=%22404+week%22) from our blog, or drop\nby our\n[Webmaster Help Forum](https://support.google.com/webmasters/community).\n\n\nPosted by\n[Susan Moskwa](/search/blog/authors/susan-moskwa),\nWebmaster Trends Analyst"]]