创建和提交站点地图
本页面旨在介绍如何创建站点地图并将其提供给 Google。如果您刚开始接触站点地图,请先阅读我们的简介。
Google 支持由站点地图协议定义的站点地图格式。每种格式都有各自的优势和不足之处;请选择最适合您的网站和设置的站点地图格式(Google 没有偏好)。下表比较了不同的站点地图格式:
站点地图比较 | |||
---|---|---|---|
XML 站点地图 |
XML 站点地图是用途最广的站点地图格式。该格式易于扩展,可用于提供关于图片、视频和新闻内容的其他数据,以及网页的本地化版本。
|
||
RSS、mRSS 和 Atom 1.0 |
RSS、mRSS 和 Atom 1.0 站点地图在结构上与 XML 站点地图类似,但它们通常最容易提供,因为 CMS 会自动创建这些站点地图。
|
||
文本站点地图 |
这是最简单的站点地图格式,只能列出指向 HTML 和其他可编入索引的网页的网址。
|
站点地图最佳做法
站点地图最佳做法由站点地图协议定义。最容易被忽略的最佳做法与大小限制、站点地图位置以及站点地图中包含的网址相关。
站点地图大小限制:无论采用哪种格式,单个站点地图的文件大小一律不得超过 50MB(未压缩),并且其中包含的网址数量不得超过 50,000 个,否则必须将站点地图拆分成多个较小的站点地图。您也可以选择创建站点地图索引文件,然后将这个索引文件提交给 Google。您可以向 Google 提交多个站点地图和站点地图索引文件。如果您想在 Search Console 中跟踪各个站点地图的搜索效果,这么做可能会很有用。
站点地图文件编码和位置:站点地图文件必须采用 UTF-8 编码。您可以将站点地图托管在网站的任何位置,但除非您通过 Search Console 提交站点地图,否则站点地图只会影响父级目录中的下级目录。因此,如果站点地图发布在网站的根目录下,则可以影响网站上的所有文件,所以我们建议将站点地图发布在此目录下。
引用网址的属性:请在站点地图中使用完全限定的绝对网址。Google 会尝试抓取您列出的网址。例如,如果网站位于 https://www.example.com/
,请不要指定诸如 /mypage.html
(相对网址)这样的网址,而是使用完整的绝对网址:https://www.example.com/mypage.html
。
在站点地图中添加您希望在 Google 搜索结果中看到的网址。Google 通常会在其搜索结果中显示规范网址,而您可以通过站点地图加以影响。如果您为网页的移动版和桌面版提供了不同的网址,建议在站点地图中仅指向一个版本。但是,如果您认为需要同时指向这两个网址,请为网址添加注解,指明桌面版和移动版分别是哪个。
如需查看完整的最佳做法列表,请参阅站点地图协议。
XML 站点地图
XML 站点地图是用途最广的受支持站点地图格式。借助 Google 支持的站点地图扩展,您还可以提供有关图片、视频和新闻内容的更多信息以及网页的本地化版本。
下方是一个非常基本的 XML 站点地图,其中仅包含 1 个网址的位置信息:
<?xml version="1.0" encoding="UTF-8"?> <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <url> <loc>https://www.example.com/foo.html</loc> <lastmod>2022-06-04</lastmod> </url> </urlset>
您可以在 sitemaps.org 上找到更复杂的示例和完整文档。
关于 XML 站点地图的其他说明
- 和所有 XML 文件一样,所有标记值都必须实体转义。
-
Google 会忽略
<priority>
和<changefreq>
值。 -
如果
<lastmod>
值始终准确并可验证(例如通过与网页的最后修改日期进行比较),Google 会使用该值。
RSS、mRSS 和 Atom 1.0
如果您的 CMS 会生成 RSS 或 Atom Feed,您可以将该 Feed 的网址作为站点地图提交。 大多数 CMS 都会为您创建 Feed,但请注意,此类 Feed 仅提供近期网址的相关信息。
关于 RSS、mRSS 和 Atom 1.0 的其他说明
- Google 支持 RSS 2.0 Feed 和 Atom 1.0 Feed。
- 您可以使用 mRSS(媒体 RSS)Feed 向 Google 提供有关您网站上视频内容的详情。
- 和所有 XML 文件一样,所有标记值都必须实体转义。
文本站点地图
如果您只想提供网页网址,您可以创建一个通用的文本文件(每行包含一个网址),然后将该文件提交给 Google。例如,如果您的网站有两个网页,您可以将它们添加到位于 https://www.example.com/sitemap.txt
的文本站点地图中,如下所示:
https://www.example.com/file1.html https://www.example.com/file2.html
文本文件站点地图的其他说明
- 请勿在站点地图文件中添加除网址以外的任何其他内容。
- 您可以随意对该文本文件进行命名,但前提是要确保它的扩展名为
.txt
(例如,sitemap.txt)。
如何创建站点地图
创建站点地图,就是在告诉搜索引擎您希望让哪些网址显示在搜索结果中。这些就是规范网址。如果不同网址下可供访问的内容相同,请选择您偏好的网址并将其加入站点地图,而不是将所有指向相同内容的网址都加入站点地图。
在确定要将哪些网址加入站点地图后,选择下列方式之一来创建站点地图,具体取决于您网站的架构和大小:
- 让您的 CMS 为您生成站点地图。
- 如果要创建的站点地图包含的网址不到几十个,您可以手动创建站点地图。
- 如果要创建的站点地图包含的网址超过几十个,请自动生成站点地图。
让您的 CMS 为您生成站点地图
如果您使用的是 WordPress、Wix 或 Blogger 等 CMS,那么您的 CMS 可能已经向搜索引擎提供了站点地图。尝试搜索以下方面的信息:您的 CMS 如何生成站点地图,或者在您的 CMS 没有自动生成站点地图时如何创建站点地图。例如,如果您使用的是 Wix,请搜索“wix 站点地图”;如果您使用的是 Blogger,请搜索“Blogger RSS”。
手动创建站点地图
如果要创建的站点地图包含的网址不到几十个,您或许能够手动创建站点地图。 为此,请打开 Windows Notepad、Nano(Linux、MacOS)等文本编辑器,然后按照站点地图格式部分中所述的语法创建站点地图。您可以随意对该文件命名,只要网址中允许使用相应字符即可。
您可以手动创建较大的站点地图,但此过程非常繁琐,而且长期难以维护。
使用工具自动生成站点地图
如果要创建的站点地图包含的网址超过几十个,您需要自动生成站点地图。有很多工具可以生成站点地图。不过,最好是让您的网站制作软件为您生成站点地图。例如,您可以从您网站的数据库中提取网站的网址,然后将网址导出到屏幕上或网络服务器的实际文件中。请与您的开发者或服务器管理员讨论此解决方案。如果您需要代码方面的指导,不妨看看我们以前汇总的第三方站点地图生成器列表(已停止维护)。
您不必担心站点地图中的网址顺序,这些顺序对 Google 而言无关紧要。请注意站点地图的大小要求;如果站点地图过大,您必须将其拆分为多个较小的站点地图。详细了解如何管理大型站点地图。
将站点地图提交给 Google
请注意,提交站点地图只是给 Google 一个提示:我们无法保证 Google 一定会下载该站点地图或使用站点地图抓取网站上的网址。您可通过以下几种不同方法将站点地图提交给 Google:
- 使用站点地图报告在 Search Console 中提交站点地图。 这样,您就可以查看 Googlebot 何时访问了站点地图,以及潜在的处理错误。
- 使用 Search Console API 程序化地提交站点地图。
-
将下面这行内容插入到 robots.txt 文件中的任意位置,指定站点地图的路径。我们会在下次抓取 robots.txt 文件时找到该站点地图:
Sitemap: https://example.com/my_sitemap.xml
- 如果您使用 Atom 或 RSS,则可以使用 WebSub 向搜索引擎(包括 Google)广播您的更改。
如何跨网站提交多个网站的站点地图
如果您拥有多个网站,您可以创建一个或多个站点地图,其中包含您所有经过验证的网站对应的网址,然后将这些站点地图保存到同一位置,从而简化站点地图提交过程。您可以选用:
-
包含多个网站(包括不同网域中的网站)网址的单个站点地图。例如,位于
https://host1.example.com/sitemap.xml
的站点地图可以包含以下网址。https://host1.example.com
https://host2.example.com
https://host3.example.com
https://host1.example1.com
https://host1.example.ch
-
位于同一位置的多个站点地图(每个网站各一个)。
https://host1.example.com/host1-example-sitemap.xml
https://host1.example.com/host2-example-sitemap.xml
https://host1.example.com/host3-example-sitemap.xml
https://host1.example.com/host1-example1-sitemap.xml
https://host1.example.com/host1-example-ch-sitemap.xml
如需提交在同一位置托管的跨网站站点地图,您可以使用 Search Console 或 robots.txt。
使用 Search Console 跨网站提交站点地图
- 对于您要添加到站点地图中的所有网站,请确保您已验证所有权。
- 创建一个站点地图(如果您愿意,也可以创建多个),其中包含要涵盖的所有网站的网址。如果您愿意,可以将站点地图添加到站点地图索引文件中,并从此开始使用该站点地图索引。
- 使用 Google Search Console 提交站点地图或站点地图索引文件。
使用 robots.txt 跨网站提交站点地图
- 为每一个网站创建一个或多个站点地图。对于每一个站点地图文件,请确保其中仅包含来自特定网站的网址。
-
将所有站点地图上传到您可控制的单个网站,例如
https://sitemaps.example.com
。 -
对于每一个网站,请确保相应 robots.txt 文件引用的是该网站的站点地图。例如,您为
https://example.com/
创建了站点地图,并将站点地图托管在https://sitemaps.example.com/sitemap-example-com.xml
,请在 robots.txt 文件(网址为https://example.com/robots.txt
)中引用该站点地图。# robots.txt file of https://example.com/ sitemap: https://sitemaps.example.com/sitemap-example-com.xml
站点地图问题排查
您可以使用 Google Search Console 排查站点地图问题。如需帮助,请参阅站点地图问题排查指南。