Cải thiện chất lượng tìm kiếm

Chất lượng tìm kiếm đề cập đến chất lượng của kết quả tìm kiếm về thứ hạng và khả năng thu hồi theo cảm nhận của người dùng khi đưa ra cụm từ tìm kiếm.

Xếp hạng là việc sắp xếp các mục và khả năng nhớ lại là số lượng mục có liên quan được truy xuất. Mục (còn được gọi là tài liệu) là bất kỳ nội dung kỹ thuật số nào mà Google Cloud Search có thể lập chỉ mục. Các loại mục bao gồm tài liệu Microsoft Office, tệp PDF, một hàng trong cơ sở dữ liệu, các URL duy nhất, v.v. Một mục bao gồm:

  • Siêu dữ liệu có cấu trúc
  • Nội dung có thể lập chỉ mục
  • ACL

Cloud Search sử dụng nhiều tín hiệu để truy xuất và xếp hạng kết quả của cụm từ tìm kiếm; các mục là kết quả của một cụm từ tìm kiếm. Bạn có thể tác động đến các tín hiệu của Cloud Search thông qua chế độ cài đặt trong giản đồ, nội dung và siêu dữ liệu của mục (trong quá trình lập chỉ mục) và ứng dụng tìm kiếm. Mục tiêu của tài liệu này là giúp bạn cải thiện chất lượng tìm kiếm thông qua việc sửa đổi những yếu tố ảnh hưởng đến tín hiệu này.

Để biết thông tin tóm tắt về các chế độ cài đặt được đề xuất và không bắt buộc, hãy tham khảo bài viết Tóm tắt các chế độ cài đặt chất lượng tìm kiếm được đề xuất và không bắt buộc.

Ảnh hưởng đến điểm số mức độ liên quan

Tính thời sự đề cập đến mức độ liên quan của một kết quả tìm kiếm với các cụm từ tìm kiếm ban đầu. Mức độ liên quan theo chủ đề của một mặt hàng được tính dựa trên các tiêu chí sau:

  • Tầm quan trọng của từng cụm từ tìm kiếm.
  • Số lượt trùng khớp (số lần một cụm từ tìm kiếm xuất hiện trong nội dung hoặc siêu dữ liệu của mục).
  • Loại kết quả trùng khớp mà cụm từ tìm kiếm và các biến thể của cụm từ đó có với một mục được lập chỉ mục trong Cloud Search.

Để ảnh hưởng đến điểm số mức độ liên quan theo chủ đề của một thuộc tính văn bản, hãy xác định RetrievalImportance trên thuộc tính văn bản trong giản đồ của bạn. Một kết quả khớp với cơ sở lưu trú có RetrievalImportance cao sẽ mang lại điểm số cao hơn so với kết quả khớp với cơ sở lưu trú có RetrievalImportance thấp.

Ví dụ: giả sử bạn có một nguồn dữ liệu có các đặc điểm sau:

  • Nguồn dữ liệu này được dùng để lưu trữ nhật ký về các lỗi phần mềm.
  • Mỗi lỗi đều có tên, nội dung mô tả và mức độ ưu tiên.

Hầu hết người dùng sẽ truy vấn nguồn dữ liệu này bằng tên lỗi, vì vậy, bạn sẽ đặt RetrievalImportance trên tên thành HIGHEST trong giản đồ.

Ngược lại, hầu hết người dùng có thể không truy vấn nguồn dữ liệu này bằng nội dung mô tả lỗi, vì vậy, hãy đặt RetrievalImportance trên nội dung mô tả thành DEFAULT. Sau đây là giản đồ mẫu chứa các chế độ cài đặt RetrievalImportance.

{
  "objectDefinitions": [
    {
      "name": "issues",
      "propertyDefinitions": [
        {
          "name": "summary",
          "textPropertyOptions": {
            "retrievalImportance": {
              "importance": HIGHEST
              }
            }
          },
        {
          "name": "description",
          "textPropertyOptions": {
            "retrievalImportance": {
              "importance": DEFAULT
              }
            }
          },
        {
          "name": "label",
            "isRepeatable": true,
          "textPropertyOptions": {
            "retrievalImportance": {
              "importance": DEFAULT
              }
            }
          },
        {
          "name": "comments",
          "textPropertyOptions": {
            "retrievalImportance": {
              "importance": DEFAULT
              }
            }
          },
        {
          "name": "project",
          "textPropertyOptions": {
            "retrievalImportance": {
              "importance": HIGH
              }
            }
          },
        {
          "name": "duedate",
          "datePropertyOptions": {
          }
        },
        ...
      ]
    }
  ]
}

Trong trường hợp tài liệu HTML, các thẻ như <title><h1>, cùng với các chế độ cài đặt định dạng như cỡ chữ và in đậm, được dùng để xác định mức độ quan trọng của nhiều cụm từ. Nếu ContentFormatTEXT, thì ItemContent có tầm quan trọng là DEFAULT trong việc truy xuất và nếu đó là HTML, thì tầm quan trọng của việc truy xuất sẽ được xác định dựa trên các thuộc tính HTML.

Độ mới của ảnh hưởng

Độ mới đo lường thời gian gần đây nhất mà một mục được sửa đổi và được xác định bằng các thuộc tính createTimeupdateTime trong ItemMetadata. Các mặt hàng cũ sẽ bị hạ cấp trong kết quả tìm kiếm.

Bạn có thể ảnh hưởng đến cách tính độ mới của một đối tượng bằng cách điều chỉnh freshnessPropertyfreshnessDuration của FreshnessOptions trong giản đồ.

freshnessProperty cho phép bạn sử dụng thuộc tính ngày hoặc dấu thời gian để tính toán độ mới thay vì updateTime mặc định.

Trong ví dụ trước về hệ thống theo dõi lỗi phần mềm, ngày đến hạn có thể được dùng làm freshnessProperty để các mục có ngày đến hạn gần với ngày hiện tại nhất được coi là "mới hơn" và được tăng thứ hạng. Sau đây là giản đồ mẫu chứa các chế độ cài đặt freshnessProperty:

{
  "objectDefinitions": [
    {
      "name": "issues",
      "options": {
        "freshnessOptions": {
          "freshnessProperty": "duedate"
        }
      },
      "propertyDefinitions": [
        {
          "name": "summary",
          "textPropertyOptions": {
            "retrievalImportance": {
              "importance": HIGHEST
            }
          }
        },
        {
          "name": "duedate",
          "datePropertyOptions": {
          }
        },
        ...
      ]
    }
  ]
}

Sử dụng freshnessDuration để xác định thời điểm một mặt hàng được coi là đã lỗi thời. Ví dụ: bạn có thể có một nguồn dữ liệu không được lập chỉ mục thường xuyên hoặc bạn không muốn độ mới ảnh hưởng đến thứ hạng. Bạn có thể đạt được mục tiêu này bằng cách chỉ định một giá trị cao cho freshnessDuration.

Giả sử bạn có một nguồn dữ liệu chứa thông tin hồ sơ nhân viên. Trong trường hợp này, bạn có thể muốn có một freshnessDuration cao vì những thay đổi đối với thông tin nhân viên thường không liên quan đến thứ hạng của nhân viên. Sau đây là giản đồ mẫu chứa chế độ cài đặt freshnessDuration:

{
  "objectDefinitions": [
    {
      "name": "people",
      "options": {
        "freshnessOptions": {
          "freshnessDuration": "315360000s", # 100 years
        }
      },
    }
  ]
}

Bạn cũng có thể đặt freshnessDuration thành một giá trị rất nhỏ cho những nguồn dữ liệu có nội dung thay đổi nhanh chóng, chẳng hạn như nguồn dữ liệu chứa các bài viết tin tức. Trong trường hợp này, những tài liệu được tạo hoặc sửa đổi gần đây nhất sẽ phù hợp nhất. Sau đây là giản đồ mẫu chứa chế độ cài đặt freshnessDuration cho một nguồn dữ liệu chứa nội dung thay đổi nhanh chóng:

{
  "objectDefinitions": [
    {
      "name": "news",
      "options": {
        "freshnessOptions": {
          "freshnessDuration": "259200s", # 3 days
        }
      },
    }
  ]
}

Ảnh hưởng đến chất lượng

Chất lượng là chỉ số đo lường độ chính xác và mức độ hữu ích của một mặt hàng. Một nguồn dữ liệu có thể chứa nhiều tài liệu tương tự về mặt ngữ nghĩa, mỗi tài liệu có một mức chất lượng khác nhau. Bạn có thể chỉ định giá trị chất lượng từ 0 đến 1 bằng cách sử dụng SearchQualityMetadata. Những mặt hàng có giá trị cao hơn sẽ được tăng thứ hạng so với những mặt hàng có giá trị thấp hơn. Chỉ sử dụng chế độ cài đặt này nếu bạn cần tác động hoặc cải thiện chất lượng của một mục bên ngoài thông tin được cung cấp cho Cloud Search.

Ví dụ: giả sử bạn có một nguồn dữ liệu chứa các tài liệu về phúc lợi của nhân viên. Bạn có thể sử dụng SearchQualityMetadata để tăng thứ hạng của những tài liệu do nhân viên Nhân sự soạn thảo so với những tài liệu do nhân viên khác soạn thảo.

Sau đây là lược đồ mẫu chứa các chế độ cài đặt SearchQualityMetadata cho các vấn đề trong hệ thống theo dõi lỗi:

{
  "name": "datasources/.../items/issue1",
  "acl": {
    ...
  },
  "metadata": {
    "title": "Issue 1"
    "objectType": "issues"
  },
  ...
}

{
  "name": "datasources/.../items/issue2",
  "acl": {
    ...
  },
  "metadata": {
    "title": "Issue 2"
    "objectType": "issues"
    "searchQualityMetadata": {
      "quality": 0.5
    }
  },
  ...
}

{
  "name": "datasources/.../items/issue3",
  "acl": {
    ...
  },
  "metadata": {
    "title": "Issue 3"
    "objectType": "issues"
    "searchQualityMetadata": {
      "quality": 1
    }
  },
  ...
}

Với giản đồ này, khi người dùng tìm kiếm bằng cụm từ tìm kiếm "vấn đề", Vấn đề 3 trong giản đồ (chất lượng là 1) được xếp hạng cao hơn Vấn đề 2 (chất lượng là 0,5) và Vấn đề 1 (nếu không có gì được chỉ định, chất lượng mặc định là 0).

Loại trường ảnh hưởng

Cloud Search cho phép bạn tác động đến thứ hạng dựa trên giá trị của các thuộc tính enum hoặc số nguyên. Đối với mỗi thuộc tính số nguyên hoặc enum, bạn có thể chỉ định một OrderedRanking. Chế độ cài đặt này có các giá trị sau:

  • NO_ORDER (mặc định): Thuộc tính này không ảnh hưởng đến thứ hạng.
  • ASCENDING: Các mặt hàng có giá trị cao hơn của thuộc tính số nguyên hoặc thuộc tính enum này sẽ được tăng thứ hạng so với các mặt hàng có giá trị thấp hơn.
  • DESCENDING: Những mặt hàng có giá trị thấp hơn của thuộc tính số nguyên hoặc enum sẽ được tăng thứ hạng so với những mặt hàng có giá trị cao hơn.

Ví dụ: giả sử mỗi lỗi trong hệ thống theo dõi lỗi đều có một thuộc tính enum để lưu trữ mức độ ưu tiên của lỗi là HIGH (1), MEDIUM (2) hoặc LOW (3). Trong trường hợp này, việc thiết lập OrderedRankingDESCENDING sẽ giúp tăng thứ hạng cho các lỗi có mức độ ưu tiên HIGH so với các lỗi có mức độ ưu tiên LOW. Sau đây là giản đồ mẫu chứa các chế độ cài đặt OrderedRanking cho các vấn đề trong hệ thống theo dõi lỗi:

{
  "objectDefinitions": [
    {
      "name": "issues",
      "options": {
        "freshnessOptions": {
          "freshnessProperty": "duedate",
        }
      },
      "propertyDefinitions": [
        {
          "name": "summary",
          "textPropertyOptions": {
            "retrievalImportance": {
              "importance": HIGHEST
            }
          }
        },
        {
          "name": "duedate",
          "datePropertyOptions": {
          }
        },
        {
          "name": "priority",
          "enumPropertyOptions": {
            "possibleValues": [
              {
                "stringValue": "HIGH",
                "integerValue": 1
              },
              {
                "stringValue": "MEDIUM",
                "integerValue": 2
              },
              {
                "stringValue": "LOW",
                "integerValue": 3
              }
            ],
            "orderedRanking": DESCENDING,
          }
        },

        ...
      ]
    }
  ]
}

Hệ thống theo dõi lỗi cũng có thể có một thuộc tính số nguyên có tên là votes dùng để thu thập ý kiến phản hồi của người dùng về tầm quan trọng tương đối của một lỗi. Bạn có thể sử dụng thuộc tính votes để tác động đến thứ hạng bằng cách cung cấp tầm quan trọng cao hơn cho những lỗi có nhiều phiếu bầu nhất. Trong trường hợp này, bạn có thể chỉ định OrderedRanking làm ASCENDING cho thuộc tính votes để những vấn đề có nhiều lượt bình chọn nhất sẽ được tăng thứ hạng. Sau đây là giản đồ mẫu chứa chế độ cài đặt OrderedRanking cho các vấn đề trong hệ thống theo dõi lỗi:

{
  "objectDefinitions": [
    {
      "name": "issues",
      "propertyDefinitions": [
        {
          "name": "summary",
          "textPropertyOptions": {
            "retrievalImportance": {
              "importance": HIGHEST
            }
          }
        },
        {
          "name": "description",
          "textPropertyOptions": {
            "retrievalImportance": {
              "importance": DEFAULT
            }
          }
        },
        {
          "name": "votes",
          "integerPropertyOptions": {
            "orderedRanking": ASCENDING,
            "minimumValue": 0,
            "maximumValue": 1000,
          }
        },

        ...
      ]
    }
  ]
}

Ảnh hưởng đến thứ hạng thông qua việc mở rộng truy vấn

Mở rộng truy vấn là việc mở rộng các cụm từ trong truy vấn, sử dụng từ đồng nghĩa và chính tả để truy xuất kết quả phù hợp hơn.

Sử dụng từ đồng nghĩa để ảnh hưởng đến kết quả tìm kiếm

Cloud Search sử dụng các từ đồng nghĩa được suy luận từ nội dung công khai trên web để mở rộng các cụm từ tìm kiếm. Bạn cũng có thể xác định từ đồng nghĩa tuỳ chỉnh để nắm bắt thuật ngữ dành riêng cho tổ chức, chẳng hạn như từ viết tắt thường dùng trong một tổ chức hoặc thuật ngữ dành riêng cho ngành.

Bạn có thể xác định từ đồng nghĩa tuỳ chỉnh trong một nguồn dữ liệu hoặc dưới dạng một nguồn dữ liệu riêng biệt. Theo mặc định, từ đồng nghĩa được áp dụng cho tất cả nguồn dữ liệu trên mọi ứng dụng tìm kiếm. Tuy nhiên, bạn có thể nhóm các từ đồng nghĩa theo nguồn dữ liệu và ứng dụng tìm kiếm. Để biết thông tin về cách xác định từ đồng nghĩa tuỳ chỉnh, bao gồm cả việc nhóm theo ứng dụng tìm kiếm, hãy tham khảo bài viết Xác định từ đồng nghĩa.

Sử dụng chính tả để ảnh hưởng đến kết quả tìm kiếm

Cloud Search đưa ra các đề xuất chính tả dựa trên các mô hình được xây dựng bằng dữ liệu công khai của Google Tìm kiếm. Nếu phát hiện lỗi chính tả trong ngữ cảnh của một cụm từ tìm kiếm, Cloud Search sẽ trả về cụm từ tìm kiếm được đề xuất trong SpellResult. Người dùng có thể thấy chính tả được đề xuất dưới dạng một gợi ý. Ví dụ: người dùng có thể viết sai cụm từ tìm kiếm "employe" và có thể nhận được đề xuất "Bạn có muốn nói là employee không?"

Cloud Search cũng sử dụng tính năng sửa lỗi chính tả làm từ đồng nghĩa để giúp truy xuất những tài liệu có thể bị bỏ lỡ do lỗi chính tả.

Tác động đến thứ hạng thông qua chế độ cài đặt ứng dụng tìm kiếm

Như đã đề cập trong phần Giới thiệu về Google Cloud Search, Ứng dụng tìm kiếm là một nhóm các chế độ cài đặt. Khi được liên kết với một giao diện tìm kiếm, nhóm này sẽ cung cấp thông tin theo bối cảnh về các lượt tìm kiếm. Các cấu hình sau đây cho phép bạn tác động đến thứ hạng thông qua ứng dụng tìm kiếm:

  • Cấu hình tính điểm
  • Cấu hình nguồn

Hai phần sau đây giải thích cách các cấu hình này hữu ích trong việc ảnh hưởng đến việc xếp hạng.

Điều chỉnh cấu hình tính điểm

Đối với mỗi ứng dụng tìm kiếm, bạn có thể chỉ định một ScoringConfig được dùng để kiểm soát việc áp dụng một số tín hiệu trong quá trình xếp hạng. Hiện tại, bạn có thể tắt độ mớihoạt động cá nhân hoá.

Nếu bị tắt, tính năng mới nhất sẽ bị tắt cho tất cả nguồn dữ liệu có trong ứng dụng tìm kiếm, bất kể các lựa chọn về tính mới nhất được chỉ định trong giản đồ cho nguồn dữ liệu. Tương tự, nếu tính năng cá nhân hoá bị tắt, thì mức tăng chủ sở hữu và mức tăng tương tác sẽ không ảnh hưởng đến thứ hạng.

Để biết hướng dẫn từng bước về cách định cấu hình chế độ cài đặt này, hãy tham khảo bài viết Tuỳ chỉnh trải nghiệm tìm kiếm trong Cloud Search.

Điều chỉnh cấu hình nguồn

Cấu hình nguồn cho phép bạn chỉ định các chế độ cài đặt ở cấp nguồn dữ liệu trong một ứng dụng tìm kiếm. Các chế độ cài đặt sau đây được hỗ trợ:

  • Tầm quan trọng của nguồn
  • Chèn lấn

Đặt tầm quan trọng của nguồn

Mức độ quan trọng của nguồn đề cập đến mức độ quan trọng tương đối của một nguồn dữ liệu trong một ứng dụng tìm kiếm. Bạn có thể chỉ định chế độ cài đặt này trong trường SourceImportance bên trong SourceScoringConfig. Các mặt hàng trong một nguồn dữ liệu có tầm quan trọng của nguồn là HIGH sẽ được tăng thứ hạng so với các mặt hàng trong một nguồn dữ liệu có tầm quan trọng của nguồn là DEFAULT hoặc LOW. Hãy sử dụng chế độ cài đặt này để tác động đến việc xếp hạng khi bạn cho rằng người dùng sẽ thích kết quả từ một số nguồn dữ liệu nhất định.

Ví dụ: giả sử bạn có một cổng thông tin hỗ trợ sản phẩm chứa dữ liệu khắc phục sự cố bên ngoài và nội bộ. Trong trường hợp này, bạn có thể muốn định cấu hình ứng dụng tìm kiếm để ưu tiên kết quả từ nguồn dữ liệu nội bộ.

Để biết hướng dẫn từng bước về cách định cấu hình chế độ cài đặt này, hãy tham khảo bài viết Tuỳ chỉnh trải nghiệm tìm kiếm trong Cloud Search.

Đặt khoảng cách

Hiện tượng trùng lặp đề cập đến số lượng kết quả tối đa có thể được trả về từ một nguồn dữ liệu trong một ứng dụng tìm kiếm. Bạn có thể kiểm soát giá trị này bằng cách sử dụng trường numResults trong SourceCrowdingConfig. Giá trị này mặc định là 3, tức là nếu chúng tôi đã hiển thị 3 kết quả từ một nguồn dữ liệu, thì Cloud Search sẽ bắt đầu trình bày kết quả từ các nguồn dữ liệu khác. Các mục trong nguồn dữ liệu đầu tiên chỉ được xem xét lại nếu tất cả các nguồn dữ liệu đã đạt đến giới hạn về số lượng hoặc không còn kết quả nào khác từ các nguồn dữ liệu khác.

Chế độ cài đặt này giúp đảm bảo sự đa dạng của kết quả tìm kiếm và ngăn một nguồn dữ liệu chiếm ưu thế trên trang kết quả tìm kiếm.

Để biết hướng dẫn từng bước về cách định cấu hình chế độ cài đặt này, hãy tham khảo bài viết Tuỳ chỉnh trải nghiệm tìm kiếm trong Cloud Search.

Ảnh hưởng đến thứ hạng thông qua hoạt động cá nhân hoá

Cá nhân hoá là việc trình bày kết quả tìm kiếm được cá nhân hoá dựa trên từng người dùng truy cập vào kết quả. Bạn có thể tác động đến thứ hạng bằng cách ưu tiên các mục dựa trên những tiêu chí sau:

  • Quyền sở hữu mặt hàng
  • Lượt tương tác với mặt hàng
  • Lượt nhấp của người dùng
  • Ngôn ngữ của mặt hàng

Ba phần sau đây đề cập đến cách tác động đến chất lượng tìm kiếm dựa trên các tiêu chí này.

Ảnh hưởng đến thứ hạng dựa trên quyền sở hữu mặt hàng

Quyền sở hữu mặt hàng là việc tăng thứ hạng cho những mặt hàng thuộc quyền sở hữu của người dùng thực hiện cụm từ tìm kiếm. Mỗi mục đều có một ItemAcl có trường owners. Nếu người dùng thực hiện một truy vấn là chủ sở hữu của một mục, thì theo mặc định, mục đó sẽ được tăng thứ hạng. Bạn có thể tắt tính năng cá nhân hoá trong ứng dụng tìm kiếm.

Tăng thứ hạng dựa trên lượt tương tác với mặt hàng

Tương tác với mặt hàng là việc tăng thứ hạng cho những mặt hàng mà người dùng có truy vấn tìm kiếm đã tương tác (xem, bình luận, chỉnh sửa, v.v.).

Các tín hiệu tương tác với mục được tự động thu thập cho các sản phẩm của Google Workspace, chẳng hạn như Drive và Gmail. Đối với các sản phẩm khác, bạn có thể cung cấp dữ liệu tương tác ở cấp mặt hàng, bao gồm loại tương tác (xem, chỉnh sửa), dấu thời gian của lượt tương tác và người dùng chính (người dùng đã tương tác với mặt hàng). Xin lưu ý rằng những mặt hàng có lượt tương tác gần đây sẽ được tăng thứ hạng nhiều hơn.

Tăng thứ hạng dựa trên lượt nhấp của người dùng

Cloud Search thu thập số lượt nhấp vào kết quả tìm kiếm hiện tại và sử dụng số lượt nhấp đó để cải thiện thứ hạng cho các lượt tìm kiếm trong tương lai bằng cách tăng thứ hạng cho những mục mà người dùng đó đã nhấp vào trước đây.

Ảnh hưởng đến thứ hạng thông qua việc diễn giải cụm từ tìm kiếm

Tính năng diễn giải cụm từ tìm kiếm của Cloud Search tự động diễn giải các toán tử và bộ lọc trong cụm từ tìm kiếm của người dùng, đồng thời chuyển đổi những phần tử đó thành một cụm từ tìm kiếm có cấu trúc dựa trên toán tử. Hoạt động diễn giải truy vấn sử dụng các toán tử được xác định trong giản đồ, cùng với các tài liệu được lập chỉ mục, để suy luận ý nghĩa truy vấn của người dùng. Tính năng này cho phép người dùng tìm kiếm bằng số lượng từ khoá tối thiểu nhưng vẫn nhận được kết quả chính xác. Để biết thêm thông tin, hãy tham khảo bài viết Cấu trúc một lược đồ để diễn giải truy vấn tối ưu.

Tăng thứ hạng dựa trên ngôn ngữ của mặt hàng

Ngôn ngữ đề cập đến việc hạ thứ hạng của những mặt hàng có ngôn ngữ không khớp với ngôn ngữ của cụm từ tìm kiếm. Các yếu tố sau ảnh hưởng đến việc xếp hạng mặt hàng theo ngôn ngữ:

  • Ngôn ngữ truy vấn. Ngôn ngữ được tự động phát hiện của cụm từ tìm kiếm hoặc languageCode được chỉ định trong RequestOptions.

    Nếu tạo giao diện tìm kiếm tuỳ chỉnh, bạn nên đặt languageCode thành ngôn ngữ giao diện hoặc lựa chọn ngôn ngữ ưu tiên của người dùng (ví dụ: ngôn ngữ của trình duyệt web hoặc trang giao diện tìm kiếm). Ngôn ngữ truy vấn được tự động phát hiện sẽ được ưu tiên hơn languageCode, để chất lượng tìm kiếm không bị ảnh hưởng khi người dùng nhập một truy vấn bằng ngôn ngữ khác với ngôn ngữ giao diện của họ.

  • Ngôn ngữ của mặt hàng. contentLanguage được đặt trong ItemMetadata tại thời điểm lập chỉ mục hoặc ngôn ngữ nội dung do Cloud Search tự động phát hiện.

    Nếu contentLanguage của một tài liệu bị bỏ trống tại thời điểm lập chỉ mục và ItemContent được điền sẵn, thì Cloud Search sẽ cố gắng phát hiện ngôn ngữ được dùng trong ItemContent và lưu trữ ngôn ngữ đó ở bên trong. Ngôn ngữ được phát hiện tự động sẽ không được thêm vào trường contentLanguage.

Nếu ngôn ngữ của cụm từ tìm kiếm và mặt hàng trùng khớp, thì không có quy tắc hạ cấp ngôn ngữ nào được áp dụng. Nếu các chế độ cài đặt này không khớp, thì mặt hàng sẽ bị hạ cấp. Tính năng hạ cấp ngôn ngữ không được áp dụng cho những tài liệu có contentLanguage trống và Cloud Search không thể tự động phát hiện ngôn ngữ. Do đó, thứ hạng của một tài liệu sẽ không bị ảnh hưởng nếu Cloud Search không phát hiện được ngôn ngữ của tài liệu đó.

Tăng thứ hạng dựa trên bối cảnh của mặt hàng

Bạn có thể tăng thứ hạng cho những mục phù hợp hơn với bối cảnh của một cụm từ tìm kiếm. Ngữ cảnh (contextAttributes) là một tập hợp các thuộc tính được đặt tên mà bạn có thể chỉ định trong quá trình lập chỉ mục và trong yêu cầu tìm kiếm để cung cấp ngữ cảnh cho một cụm từ tìm kiếm cụ thể.

Ví dụ: giả sử một mục (chẳng hạn như tài liệu về phúc lợi của nhân viên) phù hợp hơn trong bối cảnh của LocationDepartment, chẳng hạn như thành phố (San Francisco), tiểu bang (California), quốc gia (USA) và Department (Engineering). Trong trường hợp này, bạn có thể lập chỉ mục mục đó bằng các thuộc tính được đặt tên sau:

{
  ...
  "metadata": {
    "contextAttributes": [
      {
        name: "Location"
        values: [
          "San Francisco",
          "California",
          "USA"
        ],
      },
      {
        name: "Department"
        values: [
          "Engineering"
        ],
      }
    ],
  },
  ...
}

Khi người dùng nhập cụm từ tìm kiếm "lợi ích" vào giao diện tìm kiếm, bạn có thể thêm thông tin vị trí và bộ phận của người dùng vào yêu cầu tìm kiếm. Ví dụ: sau đây là một yêu cầu tìm kiếm có chứa thông tin về vị trí và bộ phận của một Kỹ sư ở Chicago:

{
  ...
  "contextAttributes": [
    {
      name: "Location"
      values: [
        "Chicago",
        "Illinois",
        "USA"
      ],
    },
    {
      name: "Department"
      values: [
        "Engineering"
      ],
    }
  ],
  ...
}

Vì cả mục được lập chỉ mục và yêu cầu tìm kiếm đều chứa các thuộc tính "Department=Engineering" và "Location=USA", nên mục được lập chỉ mục (một tài liệu về phúc lợi của nhân viên) xuất hiện ở vị trí cao hơn trong kết quả tìm kiếm.

Giả sử một người dùng khác, là một Kỹ sư ở Ấn Độ, nhập cụm từ tìm kiếm "benefits" (lợi ích) vào giao diện tìm kiếm. Sau đây là một yêu cầu tìm kiếm có chứa thông tin về vị trí và bộ phận của họ:

{
  ...
  "contextAttributes": [
    {
      name: "Location"
      values: [
        "Bengaluru",
        "Karnataka",
        "India"
      ],
    },
    {
      name: "Department"
      values: [
        "Engineering"
      ],
    }
  ],
  ...
}

Vì cả mục được lập chỉ mục và yêu cầu tìm kiếm chỉ chứa thuộc tính "Department=Engineering" (Phòng ban=Kỹ thuật), nên mục được lập chỉ mục chỉ xuất hiện cao hơn một chút trong kết quả tìm kiếm (khi so sánh với cụm từ tìm kiếm đầu tiên là "benefits" (lợi ích) do một Kỹ sư ở Chicago, Illinois, Hoa Kỳ nhập).

Sau đây là một số ví dụ về bối cảnh mà bạn có thể muốn sử dụng để tăng thứ hạng:

  • Vị trí: Các mục có thể phù hợp hơn với người dùng ở một vị trí cụ thể, chẳng hạn như một toà nhà, thành phố, quốc gia hoặc khu vực.
  • Vai trò công việc: Các mục có thể phù hợp hơn với người dùng có một vai trò công việc cụ thể, chẳng hạn như Nhà văn kỹ thuật hoặc Kỹ sư.
  • Bộ phận: Các mục có thể phù hợp hơn với một số bộ phận nhất định, chẳng hạn như bộ phận Bán hàng hoặc bộ phận Tiếp thị.
  • Cấp bậc công việc: Các mục có thể phù hợp hơn với một số cấp bậc công việc nhất định, chẳng hạn như Giám đốc hoặc CEO.
  • Loại nhân viên: Các mục có thể phù hợp hơn với một số loại nhân viên, chẳng hạn như nhân viên bán thời gian và nhân viên toàn thời gian.
  • Thời gian làm việc: Các mục có thể phù hợp hơn với thời gian làm việc của nhân viên, chẳng hạn như nhân viên mới.

Ảnh hưởng đến thứ hạng thông qua mức độ phổ biến của mặt hàng

Cloud Search tăng thứ hạng cho các mục phổ biến; tức là tăng thứ hạng cho những mục nhận được lượt nhấp trong các cụm từ tìm kiếm gần đây.

Tác động đến thứ hạng thông qua tính năng tăng số lượt nhấp

Cloud Search thu thập số lượt nhấp vào kết quả tìm kiếm hiện tại và sử dụng số lượt nhấp đó để cải thiện thứ hạng cho các lượt tìm kiếm trong tương lai bằng cách tăng cường các mục phổ biến cho một cụm từ tìm kiếm cụ thể.

Tóm tắt các chế độ cài đặt chất lượng tìm kiếm nên dùng và không bắt buộc

Bảng sau đây liệt kê tất cả các chế độ cài đặt chất lượng tìm kiếm được đề xuất và không bắt buộc. Những đề xuất này sẽ giúp bạn khai thác tối đa lợi ích từ các mô hình xếp hạng của Cloud Search.

Cài đặtVị tríĐề xuất/không bắt buộcThông tin chi tiết
Cài đặt giản đồ
ItemContent trườngItemContentĐề xuấtKhi tạo hoặc cập nhật giản đồ, hãy điền nội dung không có cấu trúc của một mục. Trường này được dùng để tạo đoạn trích.
RetrievalImportance trườngRetrievalImportanceĐề xuấtKhi tạo hoặc cập nhật một giản đồ, hãy đặt cho các thuộc tính văn bản rõ ràng là quan trọng hoặc theo chủ đề.
FreshnessOptionsFreshnessOptionsKhông bắt buộcKhi tạo hoặc cập nhật giản đồ, hãy đặt để đảm bảo rằng các mặt hàng không bị hạ cấp do dữ liệu không chính xác hoặc các trường hợp thiếu dữ liệu.
Chế độ cài đặt lập chỉ mục
createTime/updateTimeItemMetadataĐề xuấtĐiền sẵn trong quá trình lập chỉ mục một mục.
contentLanguageItemMetadataĐề xuấtĐiền sẵn trong quá trình lập chỉ mục một mục. Nếu không có, Cloud Search sẽ cố gắng phát hiện ngôn ngữ được dùng trong ItemContent.
owners trườngItemAcl()Đề xuấtĐiền sẵn trong quá trình lập chỉ mục một mục.
Từ đồng nghĩa tuỳ chỉnh_dictionaryEntry giản đồĐề xuấtXác định ở cấp nguồn dữ liệu hoặc dưới dạng nguồn dữ liệu riêng biệt trong quá trình lập chỉ mục.
quality trườngSearchQualityMetadataKhông bắt buộcĐể tăng chất lượng cơ bản so với các mặt hàng tương tự về ngữ nghĩa, hãy đặt chất lượng trong quá trình lập chỉ mục. Việc đặt trường này cho tất cả mặt hàng trong một nguồn dữ liệu sẽ vô hiệu hoá hiệu ứng của trường.
dữ liệu tương tác ở cấp mặt hànginteractionKhông bắt buộcNếu nguồn dữ liệu ghi lại và cung cấp quyền truy cập vào các lượt tương tác của người dùng, hãy điền sẵn các lượt tương tác cho từng mục trong quá trình lập chỉ mục.
thuộc tính số nguyên/enumOrderedRankingKhông bắt buộcKhi thứ tự của các mục có liên quan, hãy chỉ định thứ hạng theo thứ tự cho các thuộc tính số nguyên và enum trong quá trình lập chỉ mục.
Tìm chế độ cài đặt ứng dụng
Personalization=falseScoringConfig hoặc sử dụng giao diện người dùng quản trị Cloud SearchĐề xuấtKhi tạo hoặc cập nhật ứng dụng tìm kiếm. Đảm bảo bạn cung cấp thông tin chính xác về chủ sở hữu như mô tả trong bài viết Tác động đến thứ hạng thông qua hoạt động cá nhân hoá
SourceImportance trườngSourceCrowdingConfigKhông bắt buộcĐể thiên vị kết quả từ một số nguồn dữ liệu nhất định, hãy đặt trường này.
numResults trườngSourceCrowdingConfigKhông bắt buộcĐể kiểm soát tính đa dạng của kết quả, hãy đặt trường này.

Các bước tiếp theo

Sau đây là một số bước tiếp theo bạn có thể thực hiện:

  1. Cấu trúc một giản đồ để diễn giải truy vấn tối ưu.

  2. Tìm hiểu cách tận dụng giản đồ _dictionaryEntry để xác định từ đồng nghĩa cho các thuật ngữ thường dùng trong công ty của bạn. Để sử dụng giản đồ _dictionaryEntry, hãy tham khảo phần Xác định từ đồng nghĩa.