Google が地域対応ページをクロールする方法

サイトに「地域対応」ページが含まれている場合(つまり、検出された国やユーザーの使用言語に基づいて異なるコンテンツを返す場合)、それぞれの言語や地域に向けたすべてのコンテンツがクロール、インデックス登録、またはランク付けされるとは限りません。これは、Googlebot クローラの既定の IP アドレスが米国からと判定されることが原因です。さらに、クローラが送信する HTTP リクエストのヘッダーには、Accept-Language は設定されません。

地域分散クロール

Googlebot は米国内の IP アドレスに加え、米国外の IP アドレスもクロールに使用しています。

これまで推奨してきたとおり、Googlebot が特定の国からと判定されるときは、その国からのユーザーと同様に扱ってください。つまり、米国からのユーザーをブロックしてコンテンツにアクセスできないようにする一方で、オーストラリアからのユーザーにはコンテンツの表示を許可している場合、サーバーは米国からと判定される Googlebot をブロックし、オーストラリアからと判定される Googlebot へのアクセスを許可する必要があります。

その他の考慮事項

  • Googlebot では、すべてのクロール設定に同じユーザー エージェント文字列を使用します。詳しくは、Google クローラで使用されるユーザー エージェント文字列をご覧ください。
  • Googlebot の地域分散クロールは、リバース DNS ルックアップを使用して確認できます。
  • サイト内のすべての地域別コンテンツに、Robots Exclusion Protocol(ロボット排除プロトコル)が一貫して適用されていることを確認してください。つまり、robots meta タグと robots.txt ファイルが地域ごとに同じルールを指定している必要があります。