补偿默认扩展、解释和优化

Google Cloud Search 具有多种默认的扩展、解读和优化功能,这些功能会影响搜索结果。如果您看到意外的搜索结果,请先参阅本指南,然后再与 Cloud Search 支持团队联系。

在本文档中,用户查询以方括号显示(例如 [query]),系统解读以引号显示(例如 "interpretation")。

本文档中的查询结果是行为的说明性示例,可帮助您了解扩展、解读和优化如何运作;实际结果可能会有所不同。

默认展开

假设用户搜索了 [Joe’s PDFs],但某些结果包含突出显示的字词(例如 "documents"),而不是 "PDFs"。这是因为 Cloud Search 会扩展查询以包含同义词和词干,这与 Google 搜索类似。这种扩展有助于检索与查询的意图和目的相符的文档。然后,排名算法会确保最佳匹配项显示在顶部。

当用户搜索 [Joe’s PDFs] 时,Cloud Search 可能会提供以下附加字词:

  • 对于 [Joe’s],它可能会匹配 "joe"(词干扩展)和 "joes"(基于标点符号的同义词)。
  • 对于 [PDFs],它可能会匹配 "documents"(同义词扩展)和 "pdf"(词干扩展)。

默认同义词并不总是双向的。例如,搜索 [phishing] 可能匹配 "phish",但搜索 [phish] 可能不匹配 "phishing"

连字符和下划线分隔的字词的展开方式

Cloud Search 会以不同的方式处理连字符字词及其不含连字符的等效字词,例如 [walk-in closet][walk in closet]。它还针对连字符和下划线分隔的字词(例如 [walk-in][walk_in])应用不同的优化。

补偿默认展开次数

Cloud Search 不保证任何特定的扩展。如需确保双向同义词或特定领域的扩展,请创建自己的同义词。如需了解详情,请参阅定义同义词

默认解读

Cloud Search 会根据您的数据源架构提供自然语言解读。如需了解详情,请参阅构建架构以获得最佳查询解释

停用自然语言解读

如需针对特定查询停用自然语言解读,请在搜索请求中将 QueryInterpretationOptions.disableNlInterpretation 设置为 true

默认优化

Cloud Search 提供以下默认优化:

  • 拼写更正混合:对于查询 [corpoate benefits],Cloud Search 会匹配 "corpoate" 和正确拼写 "corporate"

  • 补充结果:对于结果较少或没有结果的查询,Cloud Search 会使用一组宽泛的相关字词。如需了解详情,请参阅处理补充结果

对文档和查询进行归一化处理

标准化是指在查询之前或之后对字词或短语进行标准化处理。为确保响应一致,请考虑执行以下归一化步骤:

  • 如需对文档进行归一化处理,请执行以下操作:

    1. 为代码库中的关键字词选择规范拼写。
    2. 更正源文档或编入索引期间的拼写,使其与规范形式一致。
  • 如需对查询进行标准化处理,请执行以下操作:

    1. 在将用户查询发送到 Cloud Search 之前拦截这些查询。
    2. 重写查询中的字词,以匹配索引数据源中最常见的拼写。
    3. 将重写的查询发送到 Cloud Search。

停用扩展、解读和优化

如需针对特定查询停用这些功能,请在搜索请求中将 QueryInterpretationOptions.enableVerbatimMode 设置为 true