コレクションでコンテンツを整理
必要に応じて、コンテンツの保存と分類を行います。
Feedfetcher
Feedfetcher は、Google ニュースや PubSubHubbub の RSS フィードと Atom フィードを Google がクロールするための仕組みです。Feedfetcher は、アプリやサービスのユーザーがリクエストしたフィードを保存し、定期的に更新します。Google 検索のインデックスに登録されるのはポッドキャスト フィードのみです。ただし、Atom や RSS の仕様に準拠していないフィードでも、インデックスに登録される場合があります。ユーザーが管理するこのフィード取得ツールについて、よくある質問とその回答を次にご紹介します。
Google がサイトのフィードの一部またはすべてを取得しないようリクエストするにはどうすればよいですか?
Feedfetcher データを使用するサービスやアプリをユーザーが追加すると、Google の Feedfetcher はそのフィードのコンテンツを表示するためにフィードを取得しようとします。Feedfetcher のリクエストはユーザーによる明示的なアクションから発生し、自動化されたクローラーからは発生しないため、Feedfetcher は robots.txt のルールを無視します。
フィードが公開されている場合、Google はユーザーがそのフィードにアクセスすることを制限できません。この解決策の一つは、Feedfetcher-Google
ユーザー エージェントに対して404
、410
などのエラー ステータスのメッセージを返すようにサイトを設定することです。
フィードがブログやサイト ホスティング サービスから提供されている場合は、そのサービスを直接設定してフィードへのアクセスを制限します。
Feedfetcher はどのくらいの頻度でフィードを取得しますか?
Feedfetcher がサイトからフィードを取得する回数は、ほとんどの場合、平均して 1 時間に 1 回を超えることはありません。一部の頻繁に変更されるサイトに対しては、更新の頻度が高くなります。ネットワークの遅延により、Feedfetcher がフィードを取得する頻度が一時的に高くなったように見えることもあります。
Feedfetcher が私のサーバーや存在しないドメインから間違っているリンクをダウンロードしようとするのはなぜですか?
Feedfetcher は、ユーザーがインストールしたサービスまたはアプリからのリクエストを受けてフィードを取得します。ユーザーが、存在しないフィード URL をリクエストした可能性があります。
Feedfetcher は、ユーザーがインストールしたサービスまたはアプリからのリクエストを受けてフィードを取得します。「非公開」サーバーを知っているユーザーや、誤ってこのサーバーを入力したユーザーからリクエストされた可能性があります。
Feedfetcher が robots.txt ファイルの指示に従わないのはなぜですか?
Feedfetcher がフィードを取得するのは、フィードのデータをリクエストするサービスまたはアプリをユーザーが明示的に開始した後のみです。Feedfetcher はロボットではなくユーザーの直接的な代理人として動作するため、robots.txt の内容は無視されます。Feedfetcher は複数のユーザーの代理人として機能するため、アプリやサービスを通じてフィードを要求したすべてのユーザーに対して共通するフィードのリクエストを 1 つだけ作成することで、帯域幅を節約します。共通するフィードは RSS と Atom です。
Feedfetcher によるサイトのクロールをブロックするには、Feedfetcher-Google
ユーザー エージェントに対して 404
や 410
などのエラー ステータス メッセージを返すようにサーバーを設定してください。
Google.com の複数のマシンからアクセスがあり、それがすべてユーザー エージェント Feedfetcher であるのはなぜですか?
Feedfetcher は、複数のマシンに分散させることで、パフォーマンスを向上させてウェブの拡大に伴い拡張される設計になっています。帯域幅の使用量を節約するため、ネットワーク上で、取得するサイトの付近にあるマシンがよく使用されます。
ログにフィルタをかけたいので、Feedfetcher のリクエストで使用される IP アドレスを教えてください。
Feedfetcher が使用する IP アドレスは、user-triggered-fetchers-google.json オブジェクトに含まれています。
Feedfetcher がサイト上の同じページを何度もダウンロードするのはなぜですか?
一般に、Feedfetcher は所定のフィードを取得する際にサイトから各ファイルを 1 回のみダウンロードします。ごくまれに、マシンが停止し、再起動されると、最近アクセスされたばかりのページが再度取得されることがあります。
Feedfetcher はどのような種類のリンクをクロールしますか?
通常のウェブ クローラーとは異なり、Feedfetcher はクロールするリンクを検出しません。Feedfetcher を使用するサービスまたはアプリのユーザーによって提供される単一の URL をクロールします。
ここに記載されていない Feedfetcher 関連の質問については、どこに問い合わせればよいですか?
問題が解決しない場合は、検索セントラルのフォーラムに質問を投稿してみてください。
特に記載のない限り、このページのコンテンツはクリエイティブ・コモンズの表示 4.0 ライセンスにより使用許諾されます。コードサンプルは Apache 2.0 ライセンスにより使用許諾されます。詳しくは、Google Developers サイトのポリシーをご覧ください。Java は Oracle および関連会社の登録商標です。
最終更新日 2025-08-04 UTC。
[null,null,["最終更新日 2025-08-04 UTC。"],[[["\u003cp\u003eFeedfetcher is Google's tool for crawling RSS or Atom feeds for Google News and PubSubHubbub, primarily used by apps and services to display feed content.\u003c/p\u003e\n"],["\u003cp\u003eFeedfetcher acts as a user agent, ignoring robots.txt; to block it, configure your server to return a 404, 410, or other error status to the \u003ccode\u003eFeedfetcher-Google\u003c/code\u003e user agent.\u003c/p\u003e\n"],["\u003cp\u003eFeedfetcher typically refreshes feeds hourly, though frequency may vary based on update frequency and network conditions.\u003c/p\u003e\n"],["\u003cp\u003eFeedfetcher requests originate from user actions in apps or services, occasionally leading to requests for nonexistent or "secret" URLs.\u003c/p\u003e\n"],["\u003cp\u003eFeedfetcher operates from various IP addresses, which are publicly listed in a JSON file for filtering purposes.\u003c/p\u003e\n"]]],["Feedfetcher crawls RSS/Atom feeds for Google News and PubSubHubbub, storing and refreshing them for app/service users. It ignores robots.txt due to user-initiated requests. To block Feedfetcher, serve a 404 or 410 error to the `Feedfetcher-Google` user agent. Retrieval typically occurs hourly, but may be more frequent for frequently updated feeds. Feedfetcher operates across multiple machines and fetches only user-provided URLs. IP addresses are listed in `user-triggered-fetchers-google.json`.\n"],null,["# Google Feedfetcher | Google Search Central\n\nFeedfetcher\n===========\n\n\nFeedfetcher is how Google crawls RSS or Atom feeds for\n[Google News](https://play.google.com/store/apps/details?id=com.google.android.apps.magazines)\nand [PubSubHubbub](https://en.wikipedia.org/wiki/PubSubHubbub).\nFeedfetcher stores and periodically refreshes feeds that are requested by users of an app or\nservice. Only podcast feeds get indexed in Google Search; however, if a feed doesn't follow the\n[Atom](https://www.rfc-editor.org/rfc/rfc4287.txt) or\n[RSS](https://cyber.harvard.edu/rss/rss.html) specification, it\nmay still be indexed. Here are some answers to the most commonly asked questions about how this\nuser-controlled feed grabber works.\n\nHow do I request that Google not retrieve some or all of my site's feeds?\n-------------------------------------------------------------------------\n\n\nWhen users add a service or app that uses Feedfetcher data, Google's Feedfetcher attempts to\nobtain the content of the feed in order to display it. Since Feedfetcher requests come from\nexplicit action by human users, and not from automated crawlers, Feedfetcher ignores robots.txt\nrules.\n\n\nIf your feed is publicly available, Google can't restrict users from accessing it. One\nsolution is to configure your site to serve a `404`, `410`, or other error\nstatus message to `Feedfetcher-Google` user agent.\n\n\nIf your feed is provided by a blog or site hosting service, work directly with that service to\nrestrict access to your feed.\n\nHow often will Feedfetcher retrieve my feeds?\n---------------------------------------------\n\n\nFeedfetcher shouldn't retrieve feeds from most sites more than once every hour on average. Some\nfrequently updated sites may be refreshed more often. Note, however, that due to network delays,\nit's possible that Feedfetcher may briefly appear to retrieve your feeds more frequently.\n\nWhy is Feedfetcher trying to download incorrect links from my server, or from a domain that\ndoesn't exist?\n----------------------------------------------------------------------------------------------------------\n\n\nFeedfetcher retrieves feeds at the request of services or apps installed by users. It is\npossible that a user has requested a feed URL that does not exist.\n\nWhy is Feedfetcher downloading information from my \"secret\" web server?\n-----------------------------------------------------------------------\n\n\nFeedfetcher retrieves feeds at the request of services or apps installed by users. It is\npossible that the request came from a user who knows about your \"secret\" server or typed it in\nby mistake.\n\nWhy isn't Feedfetcher obeying my robots.txt file?\n-------------------------------------------------\n\n\nFeedfetcher retrieves feeds only after users have explicitly started a service or app that\nrequests data from the feed. Feedfetcher behaves as a direct agent of the human user, not as a\nrobot, so it ignores robots.txt entries. Since Feedfetcher acts as an agent for multiple\nusers, it conserves bandwidth by making requests for common feeds only once for all users who\nrequested the feed through an app or service. The common feeds are\n[RSS](https://en.wikipedia.org/wiki/RSS) and\n[Atom](https://en.wikipedia.org/wiki/Atom_(Web_standard)).\n\n\nYou can prevent Feedfetcher from crawling your site by configuring your server to serve a\n`404`, `410`, or other error status message to the\n`Feedfetcher-Google` user agent.\n\nWhy are there visits from multiple machines at Google.com, all with user-agent Feedfetcher?\n-------------------------------------------------------------------------------------------\n\n\nFeedfetcher was designed to be distributed on several machines to improve performance and scale as\nthe web grows. To cut down on bandwidth usage, the machines used are often located near the sites\nthat they're retrieving in the network.\n\nCan you tell me the IP addresses from which Feedfetcher makes requests so that I can filter my\nlogs?\n----------------------------------------------------------------------------------------------------\n\n\nThe IP addresses used by Feedfetcher are included in the\n[user-triggered-fetchers-google.json](https://developers.google.com/static/search/apis/ipranges/user-triggered-fetchers-google.json)\nobject.\n\nWhy is Feedfetcher downloading the same page on my site multiple times?\n-----------------------------------------------------------------------\n\n\nIn general, Feedfetcher only downloads one copy of each file from your site during a given feed\nretrieval. Very occasionally, the machines are stopped and restarted, which may cause it to again\nretrieve pages that it's recently visited.\n\nWhat kinds of links does Feedfetcher crawl?\n-------------------------------------------\n\n\nUnlike normal web crawlers, Feedfetcher isn't discovering links to crawl at all; instead, it\ncrawls a single URL that's provided to it by users of a service or app that uses Feedfetcher.\n\nMy Feedfetcher question isn't answered here. Where can I get more help?\n-----------------------------------------------------------------------\n\n\nIf you're still having trouble, try posting your question in the Search Central\n[forum](https://support.google.com/webmasters/community)."]]