使用多语言网站

2010 年 3 月 19 日,星期五

多语言网站是指使用多种语言提供内容的网站。以下示例都属于多语言网站:同时提供英语和法语版本的某加拿大公司的网站,或者以西班牙语和葡萄牙语显示的有关拉丁美洲足球的博客。

通常情况下,当目标受众群体包含不同语言的使用者时,构建多语言网站是可行的。如果您关于拉丁美洲足球的博客旨在覆盖巴西受众群体,那么您可以选择仅发布葡萄牙语博客。但如果您也想覆盖来自阿根廷的足球迷,那么提供西班牙语内容就可以帮助您实现此目的。

Google 和语言识别

Google 会尝试确定您的每个网页的主要语言。如果您以一种语言显示每个网页,并且避免并排翻译,则可以更轻松地进行语言识别。虽然 Google 可以多种语言识别某个网页,但我们建议对网页的所有元素(标头、边栏、菜单等)使用同一种语言。

请注意,Google 会忽略所有代码级语言信息,从“lang”属性到文档类型定义 (DTD)。某些网页编辑程序会自动创建这些属性,因此,在尝试确定网页的语言时,这些属性并不是很可靠。

访问 Google 并用自己的语言进行搜索的用户希望能找到本地化的搜索结果,而身为网站站长的您就需要出力了:如果您要将网页本地化,请参考下面的提示将其显示在搜索结果中

多语言网站剖析:网址结构

开发多语言网站时,无需创建特殊网址。尽管如此,您的用户可能还是需要通过浏览一下网址来确定他们正在访问网站的哪个部分。例如,以下网址可让用户知道他们位于此网站的英语版块:https://example.ca/en/mountain-bikes.htmlhttps://en.example.ca/mountain-bikes.html。而这些其他网址可让用户知道他们正在浏览同一网页的法语版本:https://example.ca/fr/mountain-bikes.htmlhttps://fr.example.ca/mountain-bikes.html。此外,这种网址结构还有助于您更轻松地分析多语言内容的索引。

如果要创建包含非英文字符的网址,请务必使用 UTF-8 编码。从您的内容中链接到 UTF-8 编码网址时,应对其进行正确转义。如果您需要手动对网址进行转义,可以轻松地找到一个可替您执行该操作的在线网址编码器。例如,我想将以下网址从英语翻译成法语 https://example.ca/fr/mountain-bikes.html,可能如下所示:https://example.ca/fr/vélo-de-montagne.html。由于此网址包含一个非英文字符 (é),因此经过正确转义用于网页中的链接的网址应如下所示:https://example.ca/fr/v%C3%A9lo-de-montagne.html

抓取您的多语言网站并将其编入索引

我们建议您不要将自动翻译编入索引。自动翻译的内容有时会让人觉得“不知所云”,而且还可能被视为网络垃圾。更重要的是,制作多语言网站的目的是通过以多种语言提供有价值的内容来吸引更多受众群体。如果您的用户无法理解自动翻译的内容,或者用户感觉到虚假的翻译,您应该问问自己是否真的希望向用户呈现此类内容。

如果要本地化,请确保 Googlebot 能够轻松抓取网站的所有语言版本。考虑逐页交叉链接。也就是说,您可以在以不同语言提供相同内容的网页之间提供链接。这对用户来说也非常实用。 根据前面的示例,我们假设一位法语用户恰巧访问了 https://example.ca/en/mountain-bikes.html;现在,只需点击一下,用户就可以访问 https://example.ca/fr/vélo-de-montagne.html,并用法语查看相同的内容。

为了使网站上的所有内容都更易于抓取,请避免根据用户感知到的语言自动重定向。这些重定向可能会阻止用户(和搜索引擎)浏览网站的所有版本。

最后但同样重要的是,请分别为每种语言的内容指定不同的网址,不要使用 Cookie 显示翻译版本。

使用字符编码

Google 会直接从 HTTP 标头、HTML 页面标头和内容中提取字符编码。无需注意字符编码,只需注意冲突的信息(例如内容和标头之间)。虽然 Google 可以识别不同的字符编码,但我们建议您尽可能在网站上使用 UTF-8。

语气会有些杂乱…

现在,您已了解了所有这些知识,当您说多种语言时,语气可能会有些杂乱,但您的网站不一定要如此!

如需了解详情,请阅读我们关于多区域网站的博文;敬请期待我们的下一篇博文,在本文中,我们将深入探讨在使用全球网站时可能出现的特殊情形。在此之前,欢迎随时访问帮助论坛并参与讨论