2021 年 9 月 17 日,星期五
上个月,我们介绍了为网页搜索结果生成标题的新系统。非常感谢您的积极反馈,我们在此基础上进一步优化了我们的标题系统。下文详细介绍了我们一直以来做出的努力以及面向创作者的更多指南。
标题元素使用得最多
正如我们在上一篇博文中所说的,对于绝大多数网页搜索结果,我们的新系统都将 HTML 标题元素(有时称为标题标记)用作在搜索结果中显示的标题。根据您的反馈,我们对系统进行了更改,将标题元素的使用比例调整为 87% 左右,之前为 80% 左右。
为什么不始终使用标题元素?自 2012 年起,当我们的系统确定标题元素可能无法准确描述网页内容时,我们会使用标题元素之外的文本。某些网页的标题为空。有些网站为所有网页使用相同标题,而无论网页的实际内容如何。一些网页根本没有任何标题元素。
不局限于使用标题元素的示例
在一些情况下使用标题元素之外的内容可能很有用,我们的新系统经过精心设计,可以应对更多此类情况。根据我们从已检索的数万亿个网页中发现的实际问题,我们在下文举例介绍了该系统会检测哪些情况并据此做出调整。
标题不完整
如果大型网站使用模板为网页创建标题,但缺少部分内容,则通常会出现不完整标题。该模板可能会将网页的摘要放在标题中,后跟网站名称。在不完整的标题中,摘要通常会缺失,从而生成如下所示的标题:
| 网站名称
我们的系统会检测不完整标题,并通过查看标头元素中的信息或网页上的其他大型醒目文本调整此类标题。这会生成一个符合网站本身预期目的的标题,如下所示:
商品名称 | 网站名称
标题已过时
如果网站年复一年地使用同一个网页呈现周期性信息,但没有更新标题元素来反映最新日期,通常会发生标题过时问题。假设某个标题元素如下所示:
2020 年录取标准 - 优秀大学
在此示例中,此标题所属的网页提供大学录取信息。该网页包含一个内容为“2021 年录取标准”的大型醒目资讯标题,但由于某种原因,标题元素未更新为最新日期。我们的系统会检测这种不一致的情况,并在标题中使用资讯标题的正确日期:
2021 年录取标准 - 优秀大学
标题不准确
有时候标题无法准确反映网页的内容。例如,某个网页包含动态内容,并具有如下标题元素:
大型毛绒动物玩具、泰迪熊、北极熊 - 网站名称
人们有理由期待在此网页上看到上述商品。但这是一个静态标题,而对应的网页包含动态变化的内容。有时这些商品可能会显示,但有时不会显示。
我们的系统会尝试了解标题能否准确反映网页内容。如果不能,该系统可能会更改标题,以便用户更好地了解预计要看到的内容,例如:
毛绒动物玩具 - 网站名称
微样板标题
样板标题相当容易检测到。我们在某网站的所有网页或几乎所有网页上看到的相同标题就属于样板标题。微样板标题则是我们在某网站的一部分网页上看到的样板标题元素。我们的系统会检测并帮助应对这些情况,就像我们应对整个样板标题元素一样。
假设有一个关于电视节目的在线论坛。该论坛可能包含关于不同节目的讨论区,并且对于每个节目,还包含各剧季相关帖子的讨论区。微样板标题元素会显示在剧季网页上。这些标题省略了季号,因此不清楚哪个网页对应哪个剧季。这会生成重复的标题,如下所示:
我所认为的精彩电视节目
我所认为的精彩电视节目
我所认为的精彩电视节目
我们的系统可以检测到在大型醒目资讯标题文本中使用的季号,并在网页标题中插入季号,使标题更实用:
第 1 季 - 我所认为的精彩电视节目
第 2 季 - 我所认为的精彩电视节目
第 3 季 - 我所认为的精彩电视节目
面向网站所有者的指南
我们在标题方面为网站所有者提供的主要建议仍与我们关于该主题的帮助页面大致相同。 网站所有者应继续专注于创建优质的 HTML 标题元素。这些是目前为止我们使用率最高的元素。
除此之外,还应考虑这篇博文中的示例,了解您是否存在可能导致我们的系统不局限于使用标题元素的类似情况。我们所做的更改在很大程度上是为了纠正创作者可能未意识到其标题存在的问题。更改标题元素可能有助于确保您的标题元素能够再次得到使用。这事实上也是我们偏好的方式。
我们会继续努力改进标题
任何标题生成系统都不是完美无缺的。如上所述,始终使用标题元素也会出现问题。但我们也知道,我们的标题系统也不完美。您的反馈对于改进我们的系统非常有用。欢迎在我们的论坛中进一步提供反馈,包括以英语和日语讨论此主题的现有帖子。