Google Cloud Search 具有多种默认的扩展、解读和优化功能,这些功能会影响搜索结果。如果您看到意外的搜索结果,请先参阅本指南,然后再与 Cloud Search 支持团队联系。
在本文档中,用户查询以方括号显示(例如 [query]),系统解读以引号显示(例如 "interpretation")。
本文档中的查询结果是行为的说明性示例,可帮助您了解扩展、解读和优化如何运作;实际结果可能会有所不同。
默认展开
假设用户搜索了 [Joe’s PDFs],但某些结果包含突出显示的字词(例如 "documents"),而不是 "PDFs"。这是因为 Cloud Search 会扩展查询以包含同义词和词干,这与 Google 搜索类似。这种扩展有助于检索与查询的意图和目的相符的文档。然后,排名算法会确保最佳匹配项显示在顶部。
当用户搜索 [Joe’s PDFs] 时,Cloud Search 可能会提供以下附加字词:
- 对于
[Joe’s],它可能会匹配"joe"(词干扩展)和"joes"(基于标点符号的同义词)。 - 对于
[PDFs],它可能会匹配"documents"(同义词扩展)和"pdf"(词干扩展)。
默认同义词并不总是双向的。例如,搜索 [phishing] 可能匹配 "phish",但搜索 [phish] 可能不匹配 "phishing"。
连字符和下划线分隔的字词的展开方式
Cloud Search 会以不同的方式处理连字符字词及其不含连字符的等效字词,例如 [walk-in closet] 和 [walk in closet]。它还针对连字符和下划线分隔的字词(例如 [walk-in] 和 [walk_in])应用不同的优化。
补偿默认展开次数
Cloud Search 不保证任何特定的扩展。如需确保双向同义词或特定领域的扩展,请创建自己的同义词。如需了解详情,请参阅定义同义词。
默认解读
Cloud Search 会根据您的数据源架构提供自然语言解读。如需了解详情,请参阅构建架构以获得最佳查询解释。
停用自然语言解读
如需针对特定查询停用自然语言解读,请在搜索请求中将 QueryInterpretationOptions.disableNlInterpretation 设置为 true。
默认优化
Cloud Search 提供以下默认优化:
拼写更正混合:对于查询
[corpoate benefits],Cloud Search 会匹配"corpoate"和正确拼写"corporate"。补充结果:对于结果较少或没有结果的查询,Cloud Search 会使用一组宽泛的相关字词。如需了解详情,请参阅处理补充结果。
对文档和查询进行归一化处理
标准化是指在查询之前或之后对字词或短语进行标准化处理。为确保响应一致,请考虑执行以下归一化步骤:
如需对文档进行归一化处理,请执行以下操作:
- 为代码库中的关键字词选择规范拼写。
- 更正源文档或编入索引期间的拼写,使其与规范形式一致。
如需对查询进行标准化处理,请执行以下操作:
- 在将用户查询发送到 Cloud Search 之前拦截这些查询。
- 重写查询中的字词,以匹配索引数据源中最常见的拼写。
- 将重写的查询发送到 Cloud Search。
停用扩展、解读和优化
如需针对特定查询停用这些功能,请在搜索请求中将 QueryInterpretationOptions.enableVerbatimMode 设置为 true。