重音字符和界面语言会对搜索结果产生哪些影响?

2007年8月15日星期三


当搜索用户输入带有重音字符的关键词时,我们的算法语言会同时考虑包含和不包含这个重音符号的关键词。例如,用户输入了"México"这个词,而我们返回的搜索结果将包括含有"México"和"Mexico"的网页。



相反,如果用户输入了关键词时未使用重音字符,而这个词的拼写方法也可能带有重音字符,那么我们的算法语言就会同时考虑带有或不带有重音符号的关键词。所以,如果用户输入了"Mexico"这个词,我们将返回与"Mexico"和"México"有关的网页结果。


搜索用户的界面语言由会产生哪些影响呢?

在这个过程中,搜索用户的界面语言也纳入了我们的考虑范围。例如,由于各种语言对于重音字符使用的规则不尽相同,所以重音字符与非重音字符的对等关系也会因用户界面语言的不同而异。

不仅如此,我们认为与界面语言相同语种的文件更具相关性 。如果搜索用户的界面语言是英语,我们的算法语言就假定查询是以英语为主 ,而且用户希望我们能够返回英文资料。

这就是说,即便对于相同的搜索关键词,不同的界面语言下返回的搜索 结果也不尽相同。如果用户只选择特定的语言,那么搜索结果还可能因用户所处的地 点而异(根据他们的IP地址判断)。如果用户已经订制了自己的个性化搜索 ,这同样会对搜索结果产生影响。

下面的例子说明了使用西班牙语界面的用户搜索"Mexico "时返回的结果。

请注意,当界面语言为西班牙语时,即使输入的关键词本身并没有重音 字符,更多的结果还是带有重音字符的。

如何对搜索结果加以限制?

为了获得仅含有特定语言版本的搜索结果(包含还是不包含重音字符 ),您可以在检索词的前面加上一个" + "。例如,搜索"+Mexico"时 ,返回的网页中将只含有"Mexico"(而没有"México")。相反,搜索" +México"时返回的网页中将只含有
"México"而没有"Mexico"。您也许会注意到 ,有些搜索结果似乎没有使用您所规定的语言版本,但是这个语言版本的关键词出现在了网页内容或网页的底本 文字中,而没有出现在结果的标题或描述中。(您可以在 站长工具 中选择 " 统计数据 ">“ 网页分析 ”来查看与您的网站相连接的顶层底本文字)。下面的例子表明了使用" +Mexico"为关键词搜索时返回的结果。