Cải thiện chất lượng tìm kiếm

Chất lượng tìm kiếm đề cập đến chất lượng của kết quả tìm kiếm về thứ hạng và khả năng thu hồi theo cảm nhận của người dùng.

Thứ hạng là thứ tự của các mục và khả năng thu hồi là số lượng mục có liên quan được truy xuất. Mục (hoặc tài liệu) là bất kỳ nội dung kỹ thuật số nào mà Google Cloud Search có thể lập chỉ mục, chẳng hạn như tài liệu Microsoft Office, tệp PDF, hàng trong cơ sở dữ liệu hoặc URL duy nhất. Một mục bao gồm:

  • Siêu dữ liệu có cấu trúc
  • Nội dung có thể lập chỉ mục
  • ACL

Cloud Search sử dụng nhiều tín hiệu để truy xuất và xếp hạng kết quả. Bạn có thể tác động đến các tín hiệu này thông qua các chế độ cài đặt trong giản đồ, nội dung và siêu dữ liệu của mục cũng như ứng dụng tìm kiếm. Tài liệu này giúp bạn cải thiện chất lượng tìm kiếm bằng cách sửa đổi các yếu tố ảnh hưởng đến tín hiệu này.

Để biết thông tin tóm tắt về các chế độ cài đặt, hãy xem phần Tóm tắt các chế độ cài đặt chất lượng tìm kiếm.

Tác động đến điểm số về tính thời sự

Tính thời sự là mức độ liên quan của kết quả tìm kiếm đến các cụm từ tìm kiếm. Cloud Search tính toán tính thời sự dựa trên:

  • Tầm quan trọng của từng cụm từ tìm kiếm.
  • Số lượt truy cập (tần suất một cụm từ tìm kiếm xuất hiện trong nội dung hoặc siêu dữ liệu).
  • Các kiểu khớp giữa cụm từ tìm kiếm và mục đã lập chỉ mục.

Để tác động đến điểm số về tính thời sự của một thuộc tính văn bản, hãy xác định RetrievalImportance trong giản đồ. Kết quả khớp trên một thuộc tính có RetrievalImportance cao sẽ có điểm số cao hơn.

Ví dụ: nếu bạn lưu trữ nhật ký lỗi phần mềm, thì người dùng có thể sẽ tìm kiếm theo tên lỗi. Đặt RetrievalImportance cho tên thành HIGHEST. Đối với nội dung mô tả, hãy sử dụng DEFAULT.

{
  "objectDefinitions": [
    {
      "name": "issues",
      "propertyDefinitions": [
        {
          "name": "summary",
          "textPropertyOptions": {
            "retrievalImportance": { "importance": "HIGHEST" }
          }
        },
        {
          "name": "description",
          "textPropertyOptions": {
            "retrievalImportance": { "importance": "DEFAULT" }
          }
        }
      ]
    }
  ]
}

Đối với tài liệu HTML, các thẻ như <title><h1> giúp xác định tầm quan trọng của cụm từ. Nếu ContentFormatTEXT, thì ItemContent sẽ sử dụng tầm quan trọng DEFAULT. Nếu là HTML, thì tầm quan trọng sẽ phụ thuộc vào các thuộc tính HTML.

Tác động đến tính mới

Tính mới đo lường thời gian gần đây nhất một mục được sửa đổi, sử dụng createTimeupdateTime trong ItemMetadata. Các mục cũ hơn sẽ có thứ hạng thấp hơn.

Bạn có thể tác động đến tính mới bằng cách điều chỉnh freshnessPropertyfreshnessDuration trong FreshnessOptions. freshnessProperty cho phép bạn sử dụng ngày hoặc dấu thời gian tuỳ chỉnh thay vì updateTime. Đối với lỗi, bạn có thể sử dụng ngày đến hạn để các mục có ngày gần nhất với hiện tại sẽ có thứ hạng cao hơn.

{
  "objectDefinitions": [
    {
      "name": "issues",
      "options": {
        "freshnessOptions": { "freshnessProperty": "duedate" }
      }
    }
  ]
}

Sử dụng freshnessDuration để chỉ định thời điểm một mục được coi là lỗi thời. Giá trị cao, chẳng hạn như 100 năm, sẽ vô hiệu hoá hiệu ứng tính mới. Điều này hữu ích cho dữ liệu tĩnh như hồ sơ nhân viên. Đối với tin tức, hãy sử dụng giá trị nhỏ như 3 ngày.

Tác động đến chất lượng

Chất lượng đo lường độ chính xác và mức độ hữu ích của một mục. Chỉ định một giá trị từ 0 đến 1 bằng cách sử dụng SearchQualityMetadata. Giá trị càng cao thì thứ hạng càng cao. Ví dụ: bạn có thể tăng thứ hạng cho các tài liệu về lợi ích do bộ phận nhân sự soạn thảo.

{
  "metadata": {
    "searchQualityMetadata": { "quality": 1.0 }
  }
}

Tác động bằng cách sử dụng loại trường

Bạn có thể tác động đến thứ hạng dựa trên các thuộc tính enum hoặc số nguyên bằng cách sử dụng OrderedRanking:

  • NO_ORDER (mặc định): Không ảnh hưởng đến thứ hạng.
  • ASCENDING: Giá trị càng cao thì thứ hạng càng cao.
  • DESCENDING: Giá trị càng thấp thì thứ hạng càng cao.

Đối với mức độ ưu tiên của lỗi, hãy sử dụng DESCENDING nếu HIGH là 1 và LOW là 3. Đối với thuộc tính votes, hãy sử dụng ASCENDING.

Tác động đến thứ hạng thông qua tính năng mở rộng truy vấn

Mở rộng truy vấn sử dụng từ đồng nghĩa và chính tả để cải thiện kết quả.

Sử dụng các từ đồng nghĩa

Cloud Search sử dụng nội dung công khai trên web cho các từ đồng nghĩa. Bạn cũng có thể xác định các từ đồng nghĩa tuỳ chỉnh cho thuật ngữ dành riêng cho tổ chức. Xem bài viết Xác định từ đồng nghĩa.

Sử dụng chính tả

Cloud Search cung cấp các đề xuất chính tả trong SpellResult. Tính năng này cũng sử dụng các bản sửa lỗi chính tả làm từ đồng nghĩa để tìm tài liệu.

Tác động đến thứ hạng thông qua chế độ cài đặt Ứng dụng tìm kiếm

Ứng dụng tìm kiếm cung cấp thông tin theo bối cảnh. Bạn có thể tác động đến thứ hạng bằng cách sử dụng các chế độ cài đặt sau.

Điều chỉnh cấu hình tính điểm

Chỉ định a ScoringConfig để tắt tính mới hoặc tính năng cá nhân hoá. Việc tắt tính năng cá nhân hoá sẽ xoá các yếu tố tăng cường chủ sở hữulượt tương tác. Xem bài viết Tuỳ chỉnh trải nghiệm tìm kiếm.

Điều chỉnh cấu hình nguồn

Chỉ định các chế độ cài đặt ở cấp nguồn dữ liệu:

  • Tầm quan trọng của nguồn: Các mục từ nguồn có tầm quan trọng HIGH sẽ có thứ hạng cao hơn.
  • Chèn lấn: Giới hạn kết quả từ một nguồn (mặc định là 3) để đảm bảo tính đa dạng.

Cá nhân hoá

Tính năng cá nhân hoá ưu tiên kết quả dựa trên người dùng:

  • Quyền sở hữu mục: Tăng cường các mục do người dùng sở hữu.
  • Lượt tương tác với mục: Tăng cường các mục mà người dùng đã xem, chỉnh sửa hoặc bình luận gần đây.
  • Lượt nhấp của người dùng: Tăng cường các mục mà người dùng đã nhấp trước đó. Đừng sửa đổi URL kết quả vì URL này được dùng để thu thập dữ liệu này.

Diễn giải cụm từ tìm kiếm

Tính năng diễn giải cụm từ tìm kiếm chuyển đổi cụm từ tìm kiếm của người dùng thành cụm từ tìm kiếm có cấu trúc, dựa trên toán tử bằng cách sử dụng định nghĩa giản đồ. Tính năng này cung cấp kết quả chính xác ngay cả khi chỉ có một vài từ khoá. Xem bài viết Cấu trúc giản đồ để diễn giải cụm từ tìm kiếm tối ưu.

Ngôn ngữ của mục

Cloud Search hạ cấp các mục có ngôn ngữ không khớp với ngôn ngữ của cụm từ tìm kiếm. Đặt languageCode trong RequestOptions theo lựa chọn ưu tiên của người dùng.

Bối cảnh của mục

Sử dụng contextAttributes để tăng thứ hạng cho các mục có liên quan đến bối cảnh của cụm từ tìm kiếm, chẳng hạn như vị trí hoặc bộ phận.

Mức độ phổ biến của mục

Cloud Search tăng cường các mục mà người dùng thường xuyên nhấp vào trong các cụm từ tìm kiếm gần đây. Đừng sửa đổi URL kết quả tìm kiếm vì URL này được dùng để theo dõi các lượt nhấp này.

Tóm tắt các chế độ cài đặt chất lượng tìm kiếm

Các bảng sau đây cung cấp thông tin tóm tắt về các chế độ cài đặt chất lượng tìm kiếm:

Cài đặt giản đồ

Cài đặt Thông tin vị trí Nội dung đề xuất Thông tin chi tiết
ItemContent ItemContent Đề xuất Tính thời sự
RetrievalImportance RetrievalImportance Đề xuất Tính thời sự
FreshnessOptions FreshnessOptions Không bắt buộc Tính mới

Cài đặt lập chỉ mục

Cài đặt Thông tin vị trí Nội dung đề xuất Thông tin chi tiết
createTime/updateTime ItemMetadata Đề xuất Tính mới
contentLanguage ItemMetadata Đề xuất Ngôn ngữ của mục
owners ItemAcl Đề xuất Quyền sở hữu mục
Từ đồng nghĩa tuỳ chỉnh _dictionaryEntry Đề xuất Sử dụng các từ đồng nghĩa
quality SearchQualityMetadata Không bắt buộc Tác động đến chất lượng
Dữ liệu tương tác interaction Không bắt buộc Lượt tương tác với mục
OrderedRanking OrderedRanking Không bắt buộc Loại trường

Cài đặt ứng dụng tìm kiếm

Cài đặt Thông tin vị trí Nội dung đề xuất Thông tin chi tiết
Tắt tính năng cá nhân hoá ScoringConfig Đề xuất Cá nhân hoá
Tầm quan trọng của nguồn SourceCrowdingConfig Không bắt buộc Cấu hình nguồn
Chèn lấn SourceCrowdingConfig Không bắt buộc Cấu hình nguồn

Các bước tiếp theo

  1. Cấu trúc giản đồ để diễn giải cụm từ tìm kiếm tối ưu.
  2. Xác định từ đồng nghĩa.