谷歌搜索的透明度以及我们算不上什么秘密的“准则”

2010年7月11日星期四

原文: Google, transparency and our not-so-secret formula

发表者: Matt Cutts ,搜索质量团队首席工程师


标签: 竞争 欧盟 创新 网站站长

最近,欧盟委员会就一系列竞争申诉开始展开 初步调查 。部分申诉指责谷歌在确定搜索结果排名的方式和原因等问题上不够透明。这一说法让我难以接受。关于如何与网站发布者进行交流,谷歌已经设定过标准。下面让我向您介绍,谷歌如何对搜索结果进行排名及其根据。

关于谷歌 打分 的讨论主要集中在网页排名上。其实,所谓的 秘密准则 其实根本算不上什么秘密。 这篇论文 对其有详细的介绍。这篇早期的论文不仅介绍了网页排名的规则,同时还提到了谷歌排名的其他标准,其中包括 锚文本 、词语在文档内的位置、搜索关键词的相关性、所用字体的字号和类型、页面原始 HTML 代码以及词语大小写状态等。在过去几年中,谷歌陆续发布了 数百篇研究论文 。这些论文展现了许多与谷歌运营有关的 秘诀 ,以及谷歌所使用的 文档 基础 架构 。其中的一些 论文 不仅促进了开源 项目 的发展,同时还帮助了很多 公司 的成长。

学术论文只是其中一个方面,谷歌同时还通过其他方法介绍其经营方式。 1999 年,谢尔盖 . 布林参加了首届 网站站长 搜索引擎战略 大会 2001 年,谷歌成为首批加入 网站 站长的 世界 这一网络发布商在线论坛的搜索引擎之一。谷歌的的一个代表在论坛上发言 2800 多次,而另一位代表 AdWords 顾问则发言约 5000 次。

随着网络的发展,谷歌为实现透明化并促进信息交流所做出的努力也随之并进。我们于 2004 5 月开始发布博客,迄今为止我们已经在官方博客上发布了数以千计的博文。谷歌现有 70 多个官方博客,其中包括 官方网站站长博客 ,这是一个专门帮助网站站长了解谷歌运作方式并帮助他们在我们的搜索结果中获得期望排名的博客。相比其他任何一个大公司,谷歌发布了更多的博文。同时,我们还使用 几十 不同 语言 ,在我们的网站上提供 大量公共文档 ,向发布者提供建议。

作为谷歌“反垃圾网站”团队的主管(我们团队致力于阻止各种违反了谷歌的“ 网站站长指南 ”里公开、明确规定的垃圾网站行为),经常有人问我谷歌是如何运作的。这也是我 2005 年开始撰写 个人博客 的原因。迄今,我已经发表了数百篇关于谷歌的博文。我的博文话题广泛,从 常见的 网站错误 客新手 建议 。我还有幸在 30 多个搜索引擎会议上为网站站长做演讲,并对一些公共网站做评论和解析。事实上,这周我还将与 10 多个谷歌同事一起参加 另一 个搜索引擎会议 ,解答相关疑问。

我们实验了各种方式,以帮助网站站长了解谷歌搜索排名的运作。我们举行了多次 网站站长现场谈话 的在线直播,吸引了数百名参与者实时参加。此外,我们还尝试过发布 Twitter 消息和 播客 。而我还想介绍一种我最喜欢的方式,通过它,我们开诚公布地向网络发布商提供建议:去年,我们收集了许多来自公众的问题,并在 网站站长视频频道 中发布了数百段视频答复。这些视频的播放次数超过 150 万次!我们还通过在线博客回答公众关于谷歌业务运作的问题。

这样的例子不胜枚举。谷歌还与其他搜索引擎合作,探讨如何让网站站长的工作变得更为轻松。由此产生的一系列行业标准有: 指定首选的网站地址 url 格式 以及 网站地图 ,此举将使网站站长能够轻松地告知搜索引擎关于其网页的信息。谷歌还推出了一个网站站长论坛,谷歌员工和一些经验丰富的 超级用户 经常会登陆这一论坛,解答关于某些特定站点的问题。我们还推出了人工服务的“ 虚拟 网站 诊所 ”,为从 旧金山 到俄罗斯、从 印度 到西班牙语系的各地用户提供一对一的回复和建议。我们甚至还确认了谷歌算法中并不使用的排名符号,如 关键词元标记 ,因为这样能帮助网站站长省去一些无用功,并 帮他们避免不必要的官司 纠纷。

令人沮丧的是,即便是谷歌所有的 2 万名员工全天候回答网站发布商的问题,我们仍然无法解答所有网站站长的问题。原因何在?因为互联网上有超过 1.92 亿个注册域名 。这也是我们推出 谷歌网站站长工具 的原因,谷歌网站站长工具是一个一站式站点,能提供可扩展的自助式服务信息,网站站长也可通过该工具向我们提供数据。要全面介绍我们向网站站长推出的这些功能强大的免费工具,恐怕需要再写一篇完整的博文,因此在这里我仅列出其中的一些功能:

  • 网站站长能够在重复元标记或标题标签缺失等问题上获得建议。
  • 那些我们认为违反了谷歌 网站站长指南 、并在我们的索引中遭受了谷歌所采取的相应措施的网站的站长可 申请复议
  • 遭受黑客攻击的网站站长可以获得攻击其网站的恶意软件的详细信息。在移除受攻击内容之后,他们可以从网站上取回网页, Googlebot 将确认恶意内容已被完全清除。
  • 网站站长可以找出谷歌在抓取其网站时遇到的错误。

最近,一位谷歌员工发表博文,介绍了如何通过这些免费的公共工具来诊断其超过宽带上限的 网站空间 (webhost) 问题 。数百万网站站长也采取了类似的办法,利用谷歌的免费工具获取与其网站相关的有用信息。

谷歌致力于创建一种尽可能公开的经营方式,甚至帮助用户 将数据从谷歌产品中导出 。同时,我们并不认为企业有某些特定的商业秘密是不合理的,尤其当我们的保密是为了避免网站垃圾制造者和黑客利用我们的系统。如果那些试图篡改谷歌搜索排名的人了解到了谷歌排名运作的所有细节,那么要将我们的搜索结果 篡改 成毫无关联的内容简直就轻松多了,比如说改成色情内容和恶意站点,而最终蒙受损失的将会是用户。

最后我想说的是,随便批评谷歌的 秘诀 不是什么难事,但这并不是事实。多年来,谷歌一直致力于以一种开放的方式开展业务,它向发布商提供关于谷歌排名规则的信息,并努力解答无论是发布商还是用户的各种问题。如果这就是人们对 秘密 的定义的话,那么,谷歌的秘密无疑是在搜索的世界中保守得最糟糕的秘密。