2023 年 9 月 Google SEO“咨询交流时间”活动

这是 2023 年 9 月这一期的 Google 搜索引擎优化 (SEO)“咨询交流时间”活动的转写文稿。如需针对特定网站的帮助,建议您在 Google 搜索中心帮助社区中发帖咨询问题。

Google 是否错误地将我网站的 www 版本编入索引?

John:Wan 问:Google 错误地将我网站的 www 版本编入索引。正确的网页应该是 HTTP,然后域名为 .my,网址不含 www。

Wan,您好!我查看了您的网页,发现您的服务器似乎会自动从非 www 版本重定向到 www 版本,并相应地设置 link rel="canonical" 元素。初看起来,如果您使用 Chrome,它的前面可能没有 www,但如果您点击两次浏览器顶部的网址,网址会展开为包含 www 的完整网址。实际上,无论是网站的 www 版本还是非 www 版本,在 Google 搜索上都能正常显示。哇,好多 www!

为什么 Search Console 中过滤过的数据比整体数据还多?

Gary:Ornella 问:为什么 Search Console 中过滤过的数据比整体数据还多,这没有任何意义。

首先,我喜欢这个问题,但原因可能不太对。简单来答,我们大量使用布隆过滤器,因为我们需要处理大量数据,而布隆过滤器可以帮我们省下相当多的时间和储存空间。详细来答,仍是我们需要处理大量数据,因此大量运用布隆过滤器,但让我再解释一下布隆过滤器:如果要在一个集合中处理大量项目,我是指数十亿甚至数万亿个项目,快速查找数据会变得非常困难。这就是布隆过滤器的用武之地:借助布隆过滤器,您可以查询另一个包含主集合中可能项的哈希的集合,然后在该集合中查找数据。由于您会先查询哈希,查询的速度相当快,但有时可能会有数据丢失的情况(无论有意或无意),因此您会遇到数据缺失的问题:需要处理的数据越少,系统就能越准确地预测所找数据是否存在于主要集合中。简单来说,布隆过滤器通过预测数据集中是否存在所找数据来加快查询速度,但这会降低准确性,并且数据集越小,预测结果就越准确。

为什么我的 Google 协作平台网站的网页未正确编入索引?

John:有人用法语提问,基本上是问为什么我的 Google 协作平台网站的网页未正确编入索引。

收到用其他语言提的问题真是太好了。退一步来说,在 Google 协作平台上创建的网站可以并且会被编入 Google 搜索的索引。但是,Google 协作平台中使用的网址有点难跟踪,因为公开版本可能与您在登录后看到的网址不同。坦白说,这类网页虽然在技术层面上可编入索引,但并不适合 SEO 用途,而且在 Search Console 中跟踪可能比较复杂。如果 SEO 是您的主要考量,则在提交之前,不妨探索其他选项并了解优缺点。如果要在 Search Console 中进行效果跟踪,您还可以将自己的域名用于相应的 Google 协作平台内容。使用您自己的域名可让您更轻松地迁移(如果您选择这样做的话),并让您可在 Search Console 中验证整个网域的所有权

Gary:Sarabjit 问:我们的网站上有许多按钮,点击按钮会提取指向其他网页的链接。Google 能不能抓取这些链接?

一般来说,Googlebot 不会点击按钮。

如果我在撰写有价值的内容,“客座博文”(用于获取反向链接)会违反 Google 准则吗?

John:Brooke 问:如今大部分网站只提供向其购买“客座博文”(用于获取反向链接)的选项。如果我在撰写有价值的内容,这会违反 Google 准则吗?

Brooke,您好!感谢您提问。您好像已经做对了。是的,将客座博文用于链接用途违反我们的垃圾内容政策。尤其是,这些链接必须符合条件,表明自己不会影响搜索结果,这非常重要。您可以使用链接上的 rel=nofollowrel=sponsored 属性来这样做。可以通过投放广告来宣传您的网站,但链接应按照上述方式进行屏蔽。

电子商务类别网页上的内容是否有助于提高整体排名?

Gary:Brooke 问:电子商务类别网页上的内容是否有助于提高整体排名?

您可以按喜好向自己的网页中添加内容,毕竟,它们是您的网页。不过,请勿在您所有类别网页上重复地添加自动生成的模糊劣质文字。这看起来很不明智,即使对普通用户来说也是如此。如果您需要在网页上添加内容,请增添用户会真的觉得实用的内容,不要因为搜索可能需要(或您认为如此)而添加某些内容。您还可以查看我们在电子商务方面的建议

不正确的语义标记是否会导致 Google 对网站内容的了解欠佳?

John:不正确的语义标记是否会导致 Google 对网站内容的整体了解欠佳,进而导致 Google 很难将内容分配给分支版本?尤其是 <hr> 标记表示主题发生了变化,但我可能只会将其用于设计目的。

这是一个有趣的问题。一般来说,正确使用语义 HTML 有助于搜索引擎更好地了解网页的内容及上下文。例如,如果您标记网页上的标题,这清楚地表明您认为您的内容与该标题相符。这不是获得最高排名的秘密途径,但如果我们无法理解文本中的意思,那么以标题形式提供清晰的摘要确实会有所帮助。因为这个细微差别取决于 Google 对网页的了解程度,所以我建议您确保涵盖所有内容。反过来,从语义正确的 HTML 到语义不正确的 HTML,也有细微差别。搜索引擎是否仍能了解您的网页?那么,您可能无法发现搜索引擎对网页的了解有所不同。含义是否会突然变得模糊?或许您可以采用特定语义结构让含义清楚一些。具体而言,以 <hr> 标记为例,我想不出来错误使用该标记会使 Google 对页面的了解出现差异的情况。标记使用错误的方式不计其数,但我认为网页设计师可能不小心误用 <hr> 标记造成的影响似乎不大。总结一句,"视情况而定",希望这个回答令您满意。

在 Google Search Console 中,404 网页的报告包含了一些网址,似乎是来自 JSON 或 JavaScript 代码。我们应该忽略吗?

Gary:Reza 问:在 Google Search Console 中,404 网页的报告包含了一些网址,似乎是以某种方式无意中从某些 JSON 或 JavaScript 代码中挑选的。我们应该忽略这个吗?

您可以忽略这些网址,或者只需为其添加 noindex HTTP 标头

John:Dhruv 问:站点地图索引文件是否可以包含指向其他网域上的站点地图文件的链接?

您好,Dhruv!这个问题很有趣。Google 这边的回答是或许可以,因此建议您不要采用类似这样的设置。在两种情况下,您可以为不在同一网域中的网址提交站点地图,方法是通过 robots.txt 提交站点地图,或您已经在 Search Console 中验证了对所有网域的所有权。尤其是在分析网站时,Search Console 的所有权可能只有细微差异,而且无法立即显示,因此很容易忘记这个关联。如果您在处理站点地图文件,并决定要使用此类设置,我的建议是:在站点地图文件中添加一条 XML 注释,以便您记住这些要求并且日后不会无意中违反要求。由于 Search Console 是 Google 专有的,因此您可能还需要了解其他搜索引擎对此的要求。

如何降低 Google 为网站自行选择元描述的可能性?

Gary:Sam Bowers 问:如何降低 Google 为网站自行选择元描述的可能性?

好问题:Google 不会每次都这样做,但如果网页上没有太多内容,或相较于实际网页内容,元描述与用户查询更相关,那么 Google 算法通常就会使用元描述。详细了解元描述和摘要

能否指定搜索引擎漫游器不抓取网页上的特定部分?

John:有人问,能否指定搜索引擎漫游器不抓取网页上的特定部分(否则,Google 可抓取该网页并将其编入索引)。提问者还提到,自己的“超级菜单”中有大量重复内容,因此希望屏蔽这些菜单。

可以,您可以采取一些措施来阻止将网页的某些部分编入索引,但尤其是对于页眉、菜单、边栏、页脚等常见页面元素,您无需阻止它们被编入索引。搜索引擎会按原样处理网页内容,有时会出现超大菜单或超大页脚,这没关系。您可以使用含被 robots.txt 所禁止来源的 iframe,或是提取含有 JavaScript 的内容(类似于被 robots.txt 屏蔽)。如果您只想避免某些内容在摘要中显示,使用 data-nosnippet 属性就是个不错的方法。再次强调,您无需仅仅为了隐藏菜单而添加如此复杂的内容。不必要的复杂内容会带来过程意外中断的风险,因此最好只在确实需要如此的情况下采用此做法。

您是否建议在网页上实现无限滚动?对自然流量或 Googlebot 是否有任何影响?

Gary:Jeethu 问:您是否建议在网页上实现无限滚动?如果我添加该功能,对自然流量或 Googlebot 是否有任何影响?

这取决于您如何实现无限滚动。如果每个部分或虚拟网页也可通过一个唯一网址访问和找到,那么通常应该采用无限滚动

John:Ryan 问:如果首页中有链接显示在移动网络中,但在桌面版网页上,链接隐藏在 JavaScript 切换开关后,且必须被点击才能包含在 HTML 中,Google 是否会降低这些网页的价值?

嘿,Ryan。借助优先将移动版网站编入索引机制,我们会将移动版网页作为索引编制和发现链接的基本。如果移动版网页具有完整内容,您就大功告成了。您的桌面版网页上的内容比移动版中的少,这令我感到惊讶,但我想您也是有原因的。

对于保存到 Google 云端硬盘但未托管在网站上的 PDF 文件,Google 是否会将其编入索引?

Gary:匿名人士问:对于保存到 Google 云端硬盘但未托管在网站上的 PDF 文件,Google 是否会将其编入索引?如果会,需要多长时间?

会,Google 可以将 Google 云端硬盘上托管的公开 PDF 文件编入索引,这只是网站上的另一个网址。就像对于任何网址一样,只要几秒钟,Google 就能将这类 PDF 文件编入索引。

Google 如何抓取滚动劫持内容,这种做法是否会影响用户体验排名?

John:Matt 提交了一个问题:“滚动劫持”在网上的热度越来越高。通常它被视为不佳的用户体验,Google 如何抓取这类内容,这种做法是否会影响用户体验排名?Matt 还提供了一个链接,指向一篇关于滚动劫持的文章,我会在转写文稿中附上该链接。

您好,Matt!这是个有趣的问题。我没有意识到它叫“滚动劫持”,谢谢提供链接。我不认为 Google 会将此设置视为滥用行为,因此不会产生直接影响。不过,您可能会看到第二层面的技术影响。例如,Google 呈现网页时,会将网页加载在一个理论上非常大的移动设备中。如果网页因为这类诡计而未针对滚动事件显示内容,我们的系统可能会假设内容无法正确显示。因此,简而言之,我认为这个更应视为潜在的呈现问题,而不是质量问题。

为什么 Google Search Console 中的 robots.txt 屏蔽了的网址仍被编入索引?

Gary:Deniz Can Aral 问:为什么 Google Search Console 中的 robots.txt 屏蔽了的网址仍被编入索引?

这是一个相对常见的问题:即使已通过 robots.txt 禁止抓取相应网址,Google 仍可将该网址编入索引,但只有网址而非内容。不过,Google 索引中的这类网址数量并不多,因为仅当遭屏蔽的网址在网络上被搜索的次数非常高才会发生这种情况。如果这给您造成问题,请允许抓取该网址,并在 HTTP 标头中使用 noindex 规则或用 <meta> 标记

我们的网站中有不需要的 AI 内容!如何解决此问题或将这些内容从我的网站中移除?

John:Sonia 问:我们聘请了一些内容创作者,但他们提供了 AI 内容,我该如何解决这个问题?我只需要删除 AI 内容吗?要替换为新内容吗?要弃用旧网站,用新网址创建一个新网站吗?请给出建议!

Sonia,这很难回答。您似乎只是盲目地发布外部作者提供的内容,而不予审核?即使没有 AI 内容方面的问题,这似乎也是不太好。无论原因和来源如何,如果您在网站上发布了低质量内容,并且不想再与这些内容相关联,就可以移除相应内容或进行修正。建议您从大局来看:这些内容在网络上缺少吗,您的网站整体来说能为用户带来重要价值吗?或者,这些内容是网络上其他地方已存在的内容的翻新版本?或换个角度想,如果您的内容与其他网站原本已有的内容大致相同,那么为什么搜索引擎应该将您的内容编入索引,甚至让该内容在搜索结果中的排名靠前?当然,要打造一个精彩的网站,不仅需要有好的文章,还需要制定明确的策略和流程,以确保所有人都一起朝您的目标迈进。

我们被编入索引的网址数在一天之内激增。这是出于什么原因?

Gary:Lorenzo 问:我们被编入索引的网址数在一天之内激增:这是出于什么原因?

原因可能是我们增加硬盘数量,释放了一些空间,或是刚刚发现了这些新网址。这很难说。不管怎样,这都值得开香槟!庆祝一下!

Google 是否允许在一个网站图标文件中使用多种文件尺寸?

John:Dave 问:Google 是否允许在一个网站图标文件中使用多种文件尺寸?Google 是否可以理解以尺寸属性标记的多个图标,并挑选适当的图标?

您好,Dave!从技术上讲,.ico 文件格式支持您提供多种分辨率的文件。不过,随着用于各种用途的文件大小越来越多,我认为单独指定大小和文件通常会更好一些。Google 支持在 HTML 中使用多种网站图标尺寸,因此如果您想提供特定尺寸也没问题。

如果网站的某些部分采用不同 CMS,Google 是否会以不同方式判断?

Gary:Vivienne 问:如果网站的某些部分采用不同 CMS,Google 是否会以不同方式判断?

不需要。

在 Google 搜索中,我们的网站会将 PDF 下载页面显示为主页面。相应搜索结果可以更改吗?

John:Anna 问:我们基金会网站的 Google 搜索结果需要被重新抓取,它会将 PDF 下载页面显示为主页面。我们的网站是一家荷兰人权基金会的网站。相应搜索结果可以更改吗?

Anna,您好!我查看了您的网站,之所以系统显示其他页面而非您的首页,这是因为该页面含有 noindex 漫游器 <meta> 标记。此 <meta> 标记会阻止该页面被编入索引。将它移除后,情况应该很快就会恢复正常。

当我在 Google 搜索中搜索我的网站时,第一个结果是一个产品页面,而不是我的欢迎页面。为什么?

John:Julien 问:当我在 Google 搜索中搜索我的网站时,第一个结果是一个产品页面,而不是我的欢迎页面?这是为什么?这个产品页面甚至未准备好进行搜索引擎优化 (SEO),但我的欢迎页面已经准备好。

嗨,Julien。Google 会根据多种因素,针对特定查询,尝试确定哪些网页可能与用户最为相关。在信息检索中,概念之一就是基于感知到的用户意图。简而言之:用户在搜索此内容时是尝试做什么?用户是否在找有关特定产品或公司的更多信息?或是想立即购买这款产品?对于同一查询,这也会随着时间的推移而变化。但简而言之,这意味着即使网页还没有准备好进行 SEO,但如果当下系统认为该网页与查询相关,它可能还是会显示在搜索结果中。在实践中,我的建议是了解用户可能会通过哪些方式来到您的网站,并尽力满足用户的需求,这样无论用户最终到往何处,都能获得良好的体验。

我收到了一条关于改进 INP 问题的 Search Console 提醒。这项数据是如何计算出的,最简单的解决方法是什么?

John:Alejandro 提交了一个问题:John 和 Google 团队,大家好!今天我收到了一条关于改进 INP 问题的 Search Console 提醒。这项数据是如何计算出的,最简单的纠正方法是什么?

我无法在这里提供完整的回答,不过 web.dev 网站上有大量关于 Interaction to Next Paint(简称 INP)的文档。如果您有意提高您的网站在这方面的分数,建议您查看一下。请注意,INP 尚未纳入 Core Web Vitals,Core Web Vitals 只是我们的网页体验实用内容系统采用的众多指标之一。虽然改进 INP 确实有助于改善用户体验,但不要希望它能明显改变搜索排名。

如何将 3 万个网址从 Google Search Console 中移除,避免受到日本关键字黑客入侵?

John:Heather 问:如何将 3 万个网址从 GSC 中移除,避免受到日本关键字黑客入侵?

Heather,您好!得知您遭遇黑客入侵,我们深感抱歉。希望您在此期间能解决这个问题,不过 web.dev 上也有关于这类黑客入侵的内容,我会在转写文稿中附上链接。请注意,这类黑客入侵往往向 Google 伪装遭入侵的内容,因此您可能需要一些协助,仔细确认这类内容已完全移除。对于搜索结果而言,由于搜索结果涵盖的网页数量较多,建议您着重于曝光率较高的网页,然后将它们移除重新编入索引,借此手动移除这些网页,其余页面会自行删除。如果您已明确查找遭入侵的内容,您仍可以在一段时间内找到这些内容,但一般用户也会查找您的网站,因此目标应该是确保这些搜索结果没有问题。

在 Search Console 中提交网页以供编入索引后,为什么我的网页被取消编入索引?我现在已经执行此操作很多次了。

John:Grace 问:在 Search Console 中提交网页以供编入索引后,为什么我的网页被取消编入索引?我现在已经执行此操作很多次了。

嗨,Grace。我不清楚相关网页的内容,因此无法确定原因。但对我来说,这暗示我们的系统不太确信您网站及其内容的价值。我们几乎从未将某个网站的所有网页编入索引,所以这也是正常现象。您或许能请求编入索引一次,但我们的系统会在一段时间后重新评估内容和网站,并可能会再次舍弃这些网页。最佳做法是不要反复尝试请求将这些网页编入索引,而是要让我们的系统确信您网站的整体质量、为网络带来的独特价值,以及与用户实际查询的相符程度,然后,我们会自行将它编入索引。