统一多语言模板内容

2010年10月21日星期四

发布者: Sur abhi Gupta Joachim Kupke & Jayesh Vyas ,搜索本地化与索引团队

原文: Unifying content under multilingual templates

如果你拥有一家含有此类网页的全球网站:

  • 模板(如侧面导航、页脚)可以通过机器翻译为多种语言,
  • 在主要内容不变的前提下,创建大量复制网页,

而且有时搜索结果会引导用户去往非用户所希望使用的语言的网页。如果是这样,我们能够帮助你通过以下方法引导你的国际用户:
<link rel=”alternate” hreflang="a-different-language" href="https://url-of-the-different-language-page" />

正如你所知道的那样,当 rel=”canonical” 301 response code 得到正确实施,我们就能够更为精确地从副本 URL 中收集信息,如整合它们的链接属性。现在,如果 rel=”alternate” hreflang=”x” rel=”canonical” 301s 相结合,我们不仅会获得更为精确的索引和链接属性,还能够为用户提供其首选语言的 URL 版本。

示例配置: rel=”alternate” hreflang=”x”

这一切是怎样发挥作用的呢?假如你拥有一家 example.com 网站,网站名为“ The Network ”,用户可以在这个网站上创建自己的简介信息。比如说一位西班牙语用户 Javier Lopez https://es.example.com/javier-lopez 上创建了自己的主页:


因为想吸引多语言用户,因此当 Javier 点击“ Publish ”(发布)后,他的简介信息将立刻通过翻译模板被翻译为其他语言版本,并分别在独立的 URL 上发布。


两种本地化版本,英语的 https://en.example.com/javier-lopez 和法语的 https://fr.example.com/javier-lopez


老问题:多语言版本造成的重复内容

上面的设置允许使用不同语言的访客更轻松地理解网站内容,但是搜索引擎可能会遇到一些问题:针对同一份 Javier 简介,共有三种不同的 URL (英语、法语和西班牙语版本)。网站站长希望避免因多个版本出现 重复内容 的问题(如 PageRank 稀释),同时确保用户得到正确的语言版本。

为本地化模板设计的新解决方案

首先要声明的是,我们的战略并不适合所有网页内容都获得完全翻译的多语言网站。我们的服务对象主要是这样的网站:模板已经得到本地化,但不同语言 / 国家的网页的主要内容仍互为副本且保持一致。

在采取具体步骤之前,请注意以下准备工作:

  • 使一个 URL 与一种内容相关联。建议不要使多个语种的网页采用同一个 URL ,如根据用户信息( IP 地址、 Accept-Language HTTP 头信息等)通过 example.com/page.html 同时提供法语版和英语版。

  • 如使用多种语言,最好在 URL 中加入语言或国家信息,如 example.com/en/welcome.html example.com/fr/accueil.html (标明了“ en ”和“ fr ”),而不要使用 example.com/welcome.html example.com/accueil.html (不含明确的国家 / 语言信息)。请参加有关 设计本地化 URL 多语言网站 的博客,那里提供了更多建议。

设置新特性:

第一步:选择合适的权威 URL
权威 URL 是指你需要索引和返回给用户的内容版本。

要使正确的内容成为可索引内容,我们第一步要做的是选择一种能够反映网页主要内容的真实位置的权威 URL 。在上文所举的例子中,由于 Javier 是一位使用西班牙语的用户,而且他在 es.example.com 上创建了自己的简历,因此 https://es.example.com/javier-lopez 就是理所当然的权威 URL 。所有其他版本的标题与摘要截图都必须从权威 URL 中选取。

确定权威 URL 后,你可以进行以下步骤中的一种:

A. 将其他语言版本 301 ( 永久重定向 ) 至权威 URL

例如,如果一位法语用户登录了 fr.example.com/javier-lopez (不是权威 URL ),可以把这个网页加入 cookie 中,以记住用户所选择的语言-法语。然后将 fr.example.com/javier-lopez 永久重定向至权威 URL es.example.com/javier-lopez 。由于存在 cookie 信息, es.example.com/javier-lopez 仍将以法语渲染其样板文件(即使在 es.example.com 子域中!)与此类似, en.example.com/javier-lopez 将把这个 cookie 值设为英语,然后将其 301 重定向至 es.example.com/javier-lopez

如果多语言用户希望通过你的网站获得不同的体验,也可增加语言选择链接。

B.
使用 rel=”canonical”

在其他语言版本中加入指向你选择的权威 URL 的链接 rel=”canonical” 标记。在我们的例子中,由于 Javier 简历的权威 URL 是西班牙语,因此其英语和法语网页(甚至也可包括西班牙语网页本身)应包含 <link rel=”canonical” href="https://es.example.com/javier-lopez" />

这种设置方法不使用 Cookies 。因此,使用法语的用户将打开采用西班牙语模板的 es.example.com/javier-lopez 。如果你希望法语用户在谷歌搜索结果中获得法语版本 fr.example.com/javier-lopez ,请实施步骤 2

2 步:在权威 URL 中设置 rel=”alternate” 链接标记,使用其 hreflang 属性明确各种语言版本。

rel=”alternate” URL
可根据用户的语言偏好显示在搜索结果中。不过,其标题和摘要截图仍从权威 URL 中产生(与 rel=”canonical” 一致),而不是来自任何 rel=”alternate” URL

你可以在选定的权威 URL https://es.example.com/javier-lopez 中增加以下标记,以帮助谷歌对国际用户显示正确的本地化版本:

<link rel=”alternate” hreflang="en" href="https://en.example.com/javier-lopez" />

<link rel=”alternate” hreflang="fr" href="https://fr.example.com/javier-lopez" />


rel=”alternate”
表明 URL 含有位于 href URI 的其他版本。 Hreflang 注明了其他 URL 版本的语言代码,可使用 ISO-639 中的代码。

请注意:如果你的网站支持多种语言,而你在公布多个 rel=”alternate” URL 时担心文件变大,请参见我们的帮助中心文章 rel=”alternate” 设置文件大小限制

完成这些步骤后, “The Network” 的设置如下:

  • https://en.example.com/javier-lopez

或者利用语言 cookie 301s (重定向),或者含有

<link rel=”canonical” href=”https://es.example.com/javier-lopez” />

  • https://fr.example.com/javier-lopez

或者利用语言 cookie 301s (重定向),或者含有

<link rel=”canonical” href=”https://es.example.com/javier-lopez” />
  • https://es.example.com/javier-lopez

是权威 URL ,且含有
<link rel=”alternate” hreflang="en" href="https://en.example.com/javier-lopez" />



<link rel=”alternate” hreflang="fr" href="https://fr.example.com/javier-lopez" />


上述步骤的结果

  • 当您的内容出现在搜索结果中时,用户可能会看到与其所使用的语言相应的 URL— 无论此 URL 是否权威 URL 。(好消息!)这是因为利用 rel=”canonical” 301 重定向,我们能够收集权威 URL 的不同语言版本。在工作时间,利用 rel=”alternate” hreflang=”x” ,我们能够为用户提供正确语言版本的 URL :英语用户将获得 en.example.com/javier-lopez 作为 Javier 简历的 URL ,法语用户将获得 fr.example.com/javier-lopez ,西班牙语用户将看到 es.example.com/javier-lopez

  • 实施步骤 1 之后,用户只能在搜索结果中看到只有权威 URL 的内容(即副本 URL 中的内容将无法搜索到)。由于西班牙语版本 es.example.com/javier-lopez 是权威版本,因此所有包含此页模板内容(如 [Javier Lopez familia] )的搜索请求(使用任何语言时)都可能返回他的简历信息(权威版本的内容)。另一方面,包含“副本”模板内容的搜索请求(如 [Javier Lopez family] )就不大可能返回他的简历网页。如果你希望其他语言版本也得到索引且可搜索,请避免使用 rel=”canonical” rel=”alternate”

  • 副本语言网页的索引属性(如链接信息)将与权威 URL 整合。


总结(再强调一遍!)

针对已经将模板本地化但网页主要内容仍未得到翻译的网站:

1 步: 确定权威 URL 后,可以使用 rel=”canonical” 301 (永久重定向)将各种本地化网页重定向为权威 URL


2 步: 在权威 URL 中使用不同的样板文件通过 rel=”alternate” 链接标记注明具体语言的副本内容。通过这种方式,谷歌能够向互联网用户显示正确的 URL 本地化版本。

我们知道这种方法可能有点复杂,如果你有任何问题,请在我们的 网站站长论坛 中提出!