Chất lượng tìm kiếm liên quan đến chất lượng của kết quả tìm kiếm trên phương diện xếp hạng và nhớ lại theo cảm nhận của người dùng khi thực hiện cụm từ tìm kiếm.
Xếp hạng đề cập đến thứ tự của các mặt hàng và thu hồi đề cập đến số lượng mặt hàng các mục có liên quan được truy xuất. Mục (còn gọi là tài liệu) là bất kỳ nội dung kỹ thuật số mà Google Cloud Search có thể lập chỉ mục. Loại mục bao gồm tài liệu Microsoft Office, tệp PDF, một hàng trong cơ sở dữ liệu, duy nhất URL, v.v. Một mục bao gồm:
- Siêu dữ liệu có cấu trúc
- Nội dung có thể lập chỉ mục
- ACL
Cloud Search sử dụng nhiều tín hiệu để truy xuất và xếp hạng cụm từ tìm kiếm kết quả; các mục có được từ một cụm từ tìm kiếm. Bạn có thể tác động đến Các tín hiệu của Cloud Search thông qua các chế độ cài đặt trong giản đồ, nội dung của mục và siêu dữ liệu (trong quá trình lập chỉ mục) và ứng dụng tìm kiếm. Mục tiêu của trường hợp này giúp bạn cải thiện chất lượng tìm kiếm thông qua việc sửa đổi tín hiệu cho người có ảnh hưởng.
Để xem thông tin tóm tắt về các chế độ cài đặt nên dùng và không bắt buộc, hãy tham khảo Tóm tắt các chế độ cài đặt chất lượng tìm kiếm được đề xuất và không bắt buộc.
Ảnh hưởng đến điểm số thời sự
Tính chủ đề đề cập đến mức độ liên quan của kết quả tìm kiếm với cụm từ tìm kiếm ban đầu . Tính thời sự của một mục được tính dựa trên các tiêu chí sau:
- Tầm quan trọng của từng cụm từ truy vấn.
- Số lần truy cập (số lần một cụm từ truy vấn xuất hiện trong nội dung hoặc siêu dữ liệu).
- Loại cụm từ khớp với cụm từ truy vấn và các biến thể của cụm từ đó đi kèm với một mặt hàng được lập chỉ mục trong Cloud Search.
Để tác động đến điểm số về tính thời sự của một thuộc tính văn bản,
định nghĩa RetrievalImportance
trên thuộc tính văn bản trong giản đồ của bạn. Kết quả trùng khớp trên một cơ sở lưu trú có điểm số cao
RetrievalImportance
mang lại điểm số cao hơn so với một trận đấu trên
cơ sở lưu trú có RetrievalImportance
thấp.
Ví dụ: giả sử bạn có nguồn dữ liệu có các đặc điểm sau:
- Nguồn dữ liệu này được dùng để lưu trữ nhật ký tìm lỗi phần mềm.
- Mỗi lỗi đều có tên, nội dung mô tả và mức độ ưu tiên.
Hầu hết người dùng sẽ truy vấn nguồn dữ liệu này bằng tên lỗi, vì vậy, bạn
đặt RetrievalImportance
trên tên thành HIGHEST
trong giản đồ.
Ngược lại, hầu hết người dùng không thể truy vấn nguồn dữ liệu này bằng cách sử dụng mô tả của
lỗi, vì vậy, hãy đặt RetrievalImportance
trong phần mô tả thành DEFAULT
.
Dưới đây là giản đồ mẫu chứa các chế độ cài đặt RetrievalImportance
.
{
"objectDefinitions": [
{
"name": "issues",
"propertyDefinitions": [
{
"name": "summary",
"textPropertyOptions": {
"retrievalImportance": {
"importance": HIGHEST
}
}
},
{
"name": "description",
"textPropertyOptions": {
"retrievalImportance": {
"importance": DEFAULT
}
}
},
{
"name": "label",
"isRepeatable": true,
"textPropertyOptions": {
"retrievalImportance": {
"importance": DEFAULT
}
}
},
{
"name": "comments",
"textPropertyOptions": {
"retrievalImportance": {
"importance": DEFAULT
}
}
},
{
"name": "project",
"textPropertyOptions": {
"retrievalImportance": {
"importance": HIGH
}
}
},
{
"name": "duedate",
"datePropertyOptions": {
}
},
...
]
}
]
}
Trong trường hợp là tài liệu HTML, các thẻ như <title>
và <h1>
, cùng với
các cài đặt định dạng như cỡ chữ và in đậm, được dùng để xác định
tầm quan trọng của nhiều thuật ngữ. Nếu
ContentFormat
là TEXT
,
ItemContent
có tầm quan trọng truy xuất DEFAULT
và nếu là HTML, tầm quan trọng truy xuất của nó
được xác định dựa trên các thuộc tính HTML.
Ảnh hưởng đến độ mới
Độ mới đo lường thời gian một mặt hàng được sửa đổi và xác định gần đây
bởi các thuộc tính createTime
và updateTime
trong
ItemMetadata
.
Các mục cũ hơn bị giảm hạng trong kết quả tìm kiếm.
Bạn có thể tác động đến cách tính toán độ mới cho một đối tượng bằng cách điều chỉnh
freshnessProperty
và freshnessDuration
của
FreshnessOptions
trong giản đồ.
freshnessProperty
cho phép bạn sử dụng thuộc tính ngày hoặc dấu thời gian cho
độ mới của tính toán thay vì updateTime
mặc định.
Trong ví dụ trước về hệ thống theo dõi lỗi phần mềm, ngày đến hạn có thể
được dùng dưới dạng freshnessProperty
sao cho các mục có ngày đến hạn gần nhất với
ngày hiện tại được coi là "mới hơn" và được tăng thứ hạng. Đang theo dõi
giản đồ mẫu chứa freshnessProperty
chế độ cài đặt:
{
"objectDefinitions": [
{
"name": "issues",
"options": {
"freshnessOptions": {
"freshnessProperty": "duedate"
}
},
"propertyDefinitions": [
{
"name": "summary",
"textPropertyOptions": {
"retrievalImportance": {
"importance": HIGHEST
}
}
},
{
"name": "duedate",
"datePropertyOptions": {
}
},
...
]
}
]
}
Sử dụng freshnessDuration
để xác định thời điểm một mục được coi là đã lỗi thời.
Ví dụ: có thể bạn có một nguồn dữ liệu không được lập chỉ mục thường xuyên hoặc
mà bạn không muốn độ mới ảnh hưởng đến việc xếp hạng. Bạn có thể đạt được điều này
bằng cách chỉ định giá trị cao cho freshnessDuration
.
Giả sử bạn có nguồn dữ liệu với thông tin hồ sơ nhân viên. Trong phần này
giả sử, bạn có thể muốn freshnessDuration
cao vì các thay đổi đối với nhân viên
thường không liên quan đến thứ hạng của nhân viên. Đang theo dõi
giản đồ mẫu chứa chế độ cài đặt freshnessDuration
:
{
"objectDefinitions": [
{
"name": "people",
"options": {
"freshnessOptions": {
"freshnessDuration": "315360000s", # 100 years
}
},
}
]
}
Bạn cũng có thể đặt freshnessDuration
thành một giá trị rất nhỏ cho nguồn dữ liệu
có nội dung thay đổi nhanh chóng, chẳng hạn như nguồn dữ liệu chứa các bài viết.
Trong trường hợp này, các tài liệu được tạo hoặc sửa đổi gần đây nhất là phù hợp nhất.
Dưới đây là giản đồ mẫu chứa chế độ cài đặt freshnessDuration
cho một dữ liệu
nguồn chứa nội dung thay đổi nhanh chóng:
{
"objectDefinitions": [
{
"name": "news",
"options": {
"freshnessOptions": {
"freshnessDuration": "259200s", # 3 days
}
},
}
]
}
Ảnh hưởng đến chất lượng
Chất lượng là thước đo độ chính xác và hữu ích của
một mặt hàng. Một nguồn dữ liệu có thể chứa nhiều tài liệu giống nhau về mặt ngữ nghĩa, mỗi tài liệu
với một mức chất lượng khác. Bạn có thể chỉ định một giá trị chất lượng trong khoảng từ 0 đến
1 sử dụng SearchQualityMetadata
.
Các mặt hàng có giá trị cao hơn sẽ được tăng thứ hạng so với các mặt hàng có điểm thấp hơn
giá trị. Chỉ sử dụng chế độ cài đặt này nếu bạn cần tác động hoặc tăng chất lượng của
ngoài thông tin được cung cấp cho Cloud Search.
Ví dụ: giả sử bạn có nguồn dữ liệu chứa các lợi ích cho nhân viên
tài liệu. Bạn có thể sử dụng SearchQualityMetadata
để tăng thứ hạng của
tài liệu do nhân viên bộ phận Nhân sự tạo thay vì tài liệu do người khác tạo
nhân viên.
Dưới đây là giản đồ mẫu chứa các chế độ cài đặt SearchQualityMetadata
cho
các vấn đề trong hệ thống theo dõi lỗi:
{
"name": "datasources/.../items/issue1",
"acl": {
...
},
"metadata": {
"title": "Issue 1"
"objectType": "issues"
},
...
}
{
"name": "datasources/.../items/issue2",
"acl": {
...
},
"metadata": {
"title": "Issue 2"
"objectType": "issues"
"searchQualityMetadata": {
"quality": 0.5
}
},
...
}
{
"name": "datasources/.../items/issue3",
"acl": {
...
},
"metadata": {
"title": "Issue 3"
"objectType": "issues"
"searchQualityMetadata": {
"quality": 1
}
},
...
}
Với giản đồ này, khi người dùng tìm kiếm bằng cụm từ tìm kiếm "vấn đề", Vấn đề 3 trong giản đồ (chất lượng 1) được xếp hạng cao hơn Vấn đề 2 (chất lượng 0,5) và Vấn đề 1 (nếu không có gì được chỉ định, chất lượng mặc định là 0).
Tác động bằng cách sử dụng loại trường
Cloud Search cho phép bạn tác động đến thứ hạng dựa trên giá trị của enum hoặc
các thuộc tính số nguyên. Đối với mỗi thuộc tính số nguyên hoặc enum,
OrderedRanking
có thể được chỉ định. Chế độ cài đặt này có các giá trị sau:
NO_ORDER
(mặc định): Cơ sở lưu trú không ảnh hưởng đến thứ hạng.ASCENDING
: Các mục có giá trị cao hơn của thuộc tính số nguyên hoặc enum sẽ được tăng thứ hạng so với các mặt hàng có giá trị thấp hơn.DESCENDING
: Các mục có giá trị thuộc tính số nguyên hoặc enum thấp hơn sẽ được tăng thứ hạng so với các mặt hàng có giá trị cao hơn.
Ví dụ: giả sử mỗi lỗi trong hệ thống theo dõi lỗi có một thuộc tính enum cho
lưu trữ mức độ ưu tiên của lỗi ở dạng HIGH
(1), MEDIUM
(2) hoặc LOW
(3). Trong trường hợp này, việc đặt OrderedRanking
là DESCENDING
sẽ cung cấp
tăng thứ hạng lên HIGH
lỗi ưu tiên so với LOW
lỗi ưu tiên.
Dưới đây là giản đồ mẫu chứa các chế độ cài đặt OrderedRanking
cho các vấn đề trong một
hệ thống theo dõi lỗi:
{
"objectDefinitions": [
{
"name": "issues",
"options": {
"freshnessOptions": {
"freshnessProperty": "duedate",
}
},
"propertyDefinitions": [
{
"name": "summary",
"textPropertyOptions": {
"retrievalImportance": {
"importance": HIGHEST
}
}
},
{
"name": "duedate",
"datePropertyOptions": {
}
},
{
"name": "priority",
"enumPropertyOptions": {
"possibleValues": [
{
"stringValue": "HIGH",
"integerValue": 1
},
{
"stringValue": "MEDIUM",
"integerValue": 2
},
{
"stringValue": "LOW",
"integerValue": 3
}
],
"orderedRanking": DESCENDING,
}
},
...
]
}
]
}
Một hệ thống theo dõi lỗi cũng có thể có một thuộc tính số nguyên có tên là votes
dùng để
thu thập ý kiến phản hồi từ người dùng về tầm quan trọng tương đối của lỗi. Bạn có thể sử dụng
thuộc tính votes
để tác động đến thứ hạng bằng cách đưa ra mức độ quan trọng cao hơn cho
lỗi có nhiều lượt bình chọn nhất. Trong trường hợp này, bạn có thể chỉ định
OrderedRanking
là ASCENDING
cho tài sản votes
để thu hút được nhiều lượt bình chọn nhất
sẽ được tăng thứ hạng. Dưới đây là giản đồ mẫu chứa OrderedRanking
chế độ cài đặt cho các vấn đề trong hệ thống theo dõi lỗi:
{
"objectDefinitions": [
{
"name": "issues",
"propertyDefinitions": [
{
"name": "summary",
"textPropertyOptions": {
"retrievalImportance": {
"importance": HIGHEST
}
}
},
{
"name": "description",
"textPropertyOptions": {
"retrievalImportance": {
"importance": DEFAULT
}
}
},
{
"name": "votes",
"integerPropertyOptions": {
"orderedRanking": ASCENDING,
"minimumValue": 0,
"maximumValue": 1000,
}
},
...
]
}
]
}
Tác động đến xếp hạng thông qua mở rộng truy vấn
Mở rộng truy vấn đề cập đến việc mở rộng cụm từ trong truy vấn, sử dụng các từ đồng nghĩa và chính tả, để truy xuất kết quả tốt hơn.
Sử dụng các từ đồng nghĩa để tác động đến kết quả tìm kiếm
Cloud Search sử dụng các từ đồng nghĩa được suy ra từ nội dung web công khai để mở rộng các cụm từ tìm kiếm. Bạn cũng có thể xác định các từ đồng nghĩa tuỳ chỉnh để chụp thuật ngữ của từng tổ chức, chẳng hạn như từ viết tắt phổ biến dùng trong thuật ngữ của tổ chức hoặc ngành cụ thể.
Từ đồng nghĩa tuỳ chỉnh có thể được xác định trong một nguồn dữ liệu hoặc dưới dạng dữ liệu riêng biệt nguồn. Theo mặc định, các từ đồng nghĩa được áp dụng cho tất cả các nguồn dữ liệu trên tất cả các cụm từ tìm kiếm . Tuy nhiên, bạn có thể nhóm các từ đồng nghĩa theo nguồn dữ liệu và ứng dụng tìm kiếm. Để biết thông tin về cách xác định từ đồng nghĩa tuỳ chỉnh, bao gồm nhóm theo ứng dụng tìm kiếm, hãy tham khảo Định nghĩa từ đồng nghĩa.
Sử dụng chính tả để tác động đến kết quả tìm kiếm
Cloud Search cung cấp các đề xuất chính tả dựa trên các mô hình được xây dựng bằng cách sử dụng
dữ liệu công khai của Google Tìm kiếm. Nếu Cloud Search phát hiện lỗi chính tả trong ngữ cảnh
của một truy vấn, hàm này sẽ trả về truy vấn được đề xuất trong
SpellResult
.
Hệ thống có thể hiển thị cách viết đề xuất cho người dùng dưới dạng một đề xuất. Cho
ví dụ: người dùng có thể viết sai chính tả cụm từ truy vấn “nhân viên” và có thể nhận được
gợi ý "Ý của bạn là nhân viên?"
Cloud Search cũng sử dụng tính năng sửa lỗi chính tả làm từ đồng nghĩa để giúp truy xuất tài liệu mà có thể bị bỏ sót do lỗi chính tả.
Tác động đến thứ hạng thông qua chế độ cài đặt của ứng dụng tìm kiếm
Như đã đề cập trong Giới thiệu về Google Cloud Search, một sản phẩm Tìm kiếm Ứng dụng là một nhóm các chế độ cài đặt mà khi được liên kết với một nội dung tìm kiếm giao diện, cung cấp thông tin theo ngữ cảnh về tìm kiếm. Nội dung sau đây cho phép bạn tác động đến thứ hạng thông qua ứng dụng tìm kiếm:
- Cấu hình điểm số
- Cấu hình nguồn
Hai phần sau đây giải thích cách những cấu hình này hữu ích trong đang gây ảnh hưởng đến thứ hạng.
Điều chỉnh cấu hình tính điểm
Đối với mỗi ứng dụng tìm kiếm, bạn có thể chỉ định một ScoringConfig dùng để kiểm soát việc áp dụng một số tín hiệu trong quá trình xếp hạng. Hiện tại, bạn có thể tắt tính năng làm mới và cá nhân hoá.
Nếu bạn tắt độ mới, thì tính năng này sẽ bị tắt cho tất cả các nguồn dữ liệu được liệt kê trong ứng dụng tìm kiếm, bất kể tuỳ chọn làm mới nào được chỉ định trong giản đồ cho nguồn dữ liệu. Tương tự, nếu tính năng cá nhân hoá bị tắt, chủ sở hữu mức tăng và mức độ tương tác không ảnh hưởng đến thứ hạng.
Để biết hướng dẫn từng bước về cách định cấu hình cài đặt này, hãy tham khảo Tùy chỉnh trải nghiệm tìm kiếm trong Cloud Search.
Điều chỉnh cấu hình nguồn
Cấu hình nguồn cho phép bạn chỉ định chế độ cài đặt cấp nguồn dữ liệu trong một ứng dụng tìm kiếm. Các chế độ cài đặt sau được hỗ trợ:
- Tầm quan trọng của nguồn
- Chèn lấn
Thiết lập mức độ quan trọng của nguồn
Mức độ quan trọng của nguồn là mức độ quan trọng tương đối của một nguồn dữ liệu trong một
ứng dụng tìm kiếm. Bạn có thể chỉ định chế độ cài đặt này trong trường SourceImportance
bên trong
SourceScoringConfig
.
Các mục trong một nguồn dữ liệu có tầm quan trọng của nguồn HIGH
sẽ được tăng thứ hạng
so với các mục từ một nguồn dữ liệu có nguồn DEFAULT
hoặc LOW
tầm quan trọng của chúng. Hãy sử dụng chế độ cài đặt này để tác động đến thứ hạng khi bạn cho rằng người dùng
muốn có kết quả từ một số nguồn dữ liệu nhất định.
Ví dụ: giả sử bạn có cổng hỗ trợ sản phẩm chứa thông tin dữ liệu khắc phục sự cố nội bộ. Trong trường hợp này, bạn có thể muốn định cấu hình ứng dụng tìm kiếm của bạn để ưu tiên kết quả từ nguồn dữ liệu nội bộ.
Để biết hướng dẫn từng bước về cách định cấu hình cài đặt này, hãy tham khảo Tùy chỉnh trải nghiệm tìm kiếm trong Cloud Search.
Đặt chế độ tập trung
Lượt kết nối là số lượng kết quả tối đa có thể được trả về từ
nguồn dữ liệu trong ứng dụng tìm kiếm. Giá trị này
có thể được kiểm soát bằng trường numResults
trong
SourceCrowdingConfig
.
Giá trị mặc định là 3, nghĩa là nếu chúng tôi cho thấy 3 kết quả từ một dữ liệu
Cloud Search bắt đầu trình bày kết quả từ các nguồn dữ liệu khác. Mục
từ nguồn dữ liệu đầu tiên chỉ được xem xét lại nếu tất cả các nguồn dữ liệu đã
đã đạt đến giới hạn quá tải hoặc không còn kết quả nào từ dữ liệu khác
nguồn.
Chế độ cài đặt này rất hữu ích trong việc đảm bảo tính đa dạng của các kết quả tìm kiếm và ngăn chặn một nguồn dữ liệu chi phối trang kết quả tìm kiếm.
Để biết hướng dẫn từng bước về cách định cấu hình cài đặt này, hãy tham khảo Tùy chỉnh trải nghiệm tìm kiếm trong Cloud Search.
Tác động đến thứ hạng thông qua hoạt động cá nhân hoá
Cá nhân hoá đề cập đến việc trình bày kết quả tìm kiếm được cá nhân hoá dựa trên việc từng người dùng truy cập vào kết quả. Bạn có thể tác động đến thứ hạng bằng cách sắp xếp thứ tự ưu tiên cho các mục dựa trên các tiêu chí sau:
- Quyền sở hữu mục
- Lượt tương tác với mục
- Số lượt nhấp của người dùng
- Ngôn ngữ của mục
Ba phần sau đây trình bày cách tác động đến chất lượng tìm kiếm dựa trên các tiêu chí này.
Tác động đến thứ hạng dựa trên quyền sở hữu mục
Quyền sở hữu mặt hàng đề cập đến việc tăng thứ hạng cho các mặt hàng do người dùng sở hữu
thực hiện cụm từ tìm kiếm. Mỗi mục có một
ItemAcl
có trường owners
. Nếu người dùng thực thi truy vấn là chủ sở hữu của một mục,
thì theo mặc định, mục đó sẽ được tăng thứ hạng. Bạn có thể bật
tắt tính năng cá nhân hoá trong ứng dụng tìm kiếm.
Tăng thứ hạng dựa trên hoạt động tương tác của vật phẩm
Lượt tương tác với mặt hàng đề cập đến việc tăng thứ hạng cho những mặt hàng mà người dùng tìm kiếm truy vấn mà người dùng đã tương tác (xem, nhận xét, chỉnh sửa, v.v.).
Google Workspace tự động thu thập các tín hiệu về hoạt động tương tác của mặt hàng như Drive và Gmail. Đối với các sản phẩm khác, bạn có thể cung cấp thông tin ở cấp mặt hàng lượt tương tác bao gồm loại tương tác (xem, chỉnh sửa), dấu thời gian của lượt tương tác và người dùng chính (người dùng đã tương tác với mặt hàng). Lưu ý rằng những mặt hàng được tương tác gần đây sẽ được tăng thứ hạng cao hơn.
Tăng thứ hạng dựa trên lượt nhấp của người dùng
Cloud Search thu thập các lượt nhấp vào kết quả tìm kiếm hiện tại và sử dụng dữ liệu này để cải thiện thứ hạng cho các lượt tìm kiếm trong tương lai bằng cách tăng thứ hạng các mặt hàng mà người dùng nhấp vào trước đó cùng một người dùng.
Tác động đến thứ hạng thông qua diễn giải cụm từ tìm kiếm
Tính năng diễn giải truy vấn của Cloud Search tự động diễn giải trong truy vấn của người dùng và chuyển đổi những yếu tố đó thành truy vấn có cấu trúc, dựa trên toán tử. Việc diễn giải truy vấn sử dụng toán tử xác định trong giản đồ, cùng với các tài liệu được lập chỉ mục, để suy ra những gì người dùng truy vấn. Tính năng này cho phép người dùng tìm kiếm mà không cần từ khoá cụ thể mà vẫn thu được kết quả chính xác. Để biết thêm thông tin, hãy tham khảo Xây dựng một giản đồ để diễn giải truy vấn tối ưu.
Tăng thứ hạng dựa trên ngôn ngữ của mục
Ngôn ngữ đề cập đến việc giảm hạng cho các mặt hàng có ngôn ngữ sử dụng không khớp với ngôn ngữ của truy vấn. Các yếu tố sau ảnh hưởng đến thứ hạng của mục dựa trên ngôn ngữ:
Ngôn ngữ truy vấn. Ngôn ngữ được phát hiện tự động của truy vấn tìm kiếm, hoặc
languageCode
được chỉ định trongRequestOptions
.Nếu xây dựng giao diện tìm kiếm tuỳ chỉnh, bạn nên đặt
languageCode
thành ngôn ngữ giao diện hoặc tuỳ chọn ngôn ngữ của người dùng (ví dụ: ngôn ngữ của trình duyệt web hoặc trang giao diện tìm kiếm). Truy vấn được phát hiện tự động được ưu tiên hơnlanguageCode
, vì vậy, chất lượng tìm kiếm sẽ không bị xâm phạm khi người dùng nhập một truy vấn bằng ngôn ngữ khác với ngôn ngữ của họ .Ngôn ngữ của mục.
contentLanguage
được đặt trongItemMetadata
tại thời điểm lập chỉ mục, hoặc ngôn ngữ nội dung do Cloud Search tự động phát hiện.Nếu
contentLanguage
của một tài liệu bị để trống tại thời điểm lập chỉ mục vàItemContent
đã được điền sẵn, Cloud Search sẽ cố gắng phát hiện ngôn ngữ được sử dụng trongItemContent
và lưu trữ nội bộ. Hệ thống phát hiện tự động ngôn ngữ chưa được thêm vào trườngcontentLanguage
.
Nếu ngôn ngữ của truy vấn và mục khớp với nhau, thì tính năng giảm hạng ngôn ngữ sẽ không được áp dụng. Nếu
các chế độ cài đặt này không khớp thì mặt hàng sẽ bị giảm hạng. Tính năng giảm hạng ngôn ngữ không phải là
đã áp dụng cho các tài liệu có contentLanguage
trống và Cloud Search không thể
tự động phát hiện ngôn ngữ. Do đó, thứ hạng của tài liệu không
bị ảnh hưởng nếu Cloud Search không thể phát hiện ngôn ngữ của dịch vụ.
Tăng thứ hạng dựa trên bối cảnh của mặt hàng
Bạn có thể tăng thứ hạng cho các mặt hàng phù hợp hơn với bối cảnh
của một cụm từ tìm kiếm. Bối cảnh
(contextAttributes
)
là một tập hợp các thuộc tính được đặt tên mà bạn có thể chỉ định trong quá trình lập chỉ mục và trong
yêu cầu tìm kiếm, để cung cấp ngữ cảnh cho một truy vấn tìm kiếm cụ thể.
Ví dụ: Giả sử một mục, chẳng hạn như tài liệu phúc lợi cho nhân viên,
phù hợp trong bối cảnh của Location
và Department
, chẳng hạn như một thành phố
(San Francisco
), tiểu bang (California
), quốc gia (USA
) và Department
(Engineering
). Trong trường hợp này, bạn có thể lập chỉ mục mặt hàng bằng các
thuộc tính được đặt tên:
{
...
"metadata": {
"contextAttributes": [
{
name: "Location"
values: [
"San Francisco",
"California",
"USA"
],
},
{
name: "Department"
values: [
"Engineering"
],
}
],
},
...
}
Khi người dùng nhập cụm từ tìm kiếm về "lợi ích" vào giao diện tìm kiếm, bạn có thể bao gồm thông tin vị trí và phòng ban của người dùng trong cụm từ tìm kiếm của bạn. Ví dụ: đây là một yêu cầu tìm kiếm có chứa vị trí và phòng ban thông tin cho một kỹ sư ở Chicago:
{
...
"contextAttributes": [
{
name: "Location"
values: [
"Chicago",
"Illinois",
"USA"
],
},
{
name: "Department"
values: [
"Engineering"
],
}
],
...
}
Bởi vì cả mục được lập chỉ mục và yêu cầu tìm kiếm đều chứa các thuộc tính của "Phòng=Kỹ thuật" và "Vị trí=Hoa Kỳ", mục được lập chỉ mục (nhân viên tài liệu về lợi ích) xuất hiện ở vị trí cao hơn trong kết quả tìm kiếm.
Bây giờ, giả sử một người dùng khác, một Kỹ sư ở Ấn Độ, nhập truy vấn tìm kiếm là "lợi ích" vào giao diện tìm kiếm. Sau đây là yêu cầu tìm kiếm chứa thông tin về địa điểm và bộ phận:
{
...
"contextAttributes": [
{
name: "Location"
values: [
"Bengaluru",
"Karnataka",
"India"
],
},
{
name: "Department"
values: [
"Engineering"
],
}
],
...
}
Bởi vì cả mục được lập chỉ mục và yêu cầu tìm kiếm chỉ chứa của "Phòng=Kỹ thuật", mặt hàng được lập chỉ mục chỉ xuất hiện một chút cao hơn trong kết quả tìm kiếm (khi so với cụm từ tìm kiếm đầu tiên của "lợi ích" do một Kỹ sư ở Chicago Illinois, Hoa Kỳ nhập vào).
Sau đây là một số ngữ cảnh mẫu mà bạn có thể muốn sử dụng để tăng thứ hạng:
- Vị trí: Các mục có thể phù hợp hơn với người dùng ở một vị trí cụ thể, chẳng hạn như một toà nhà, thành phố, quốc gia hoặc khu vực.
- Vai trò công việc: Các mục có thể phù hợp hơn với người dùng trong một vai trò công việc cụ thể, chẳng hạn như Nhân viên viết kỹ thuật hoặc Kỹ sư.
- Phòng ban: Các mục có thể liên quan hơn đến một số phòng ban nhất định, chẳng hạn như Bán hàng hoặc Tiếp thị.
- Cấp độ công việc: Các mục có thể phù hợp hơn với một số cấp độ công việc nhất định, chẳng hạn như Giám đốc hoặc Giám đốc điều hành.
- Loại nhân viên: Các mục có thể phù hợp hơn với một số kiểu nhân viên nhất định, chẳng hạn như nhân viên toàn thời gian và bán thời gian.
- Thâm niên: Các mục có thể liên quan hơn đến thâm niên công tác của một nhân viên, chẳng hạn như nhân viên mới tuyển dụng.
Tác động đến thứ hạng thông qua mức độ phổ biến của mặt hàng
Cloud Search tăng thứ hạng cho các mặt hàng phổ biến; tức là tính năng này sẽ tăng những mục đã nhận được lượt nhấp trong các cụm từ tìm kiếm gần đây.
Ảnh hưởng đến thứ hạng thông qua lượt nhấp
Cloud Search thu thập các lượt nhấp vào kết quả tìm kiếm hiện tại và sử dụng kết quả này để cải thiện thứ hạng cho các lượt tìm kiếm trong tương lai bằng cách tăng cường các mục phổ biến cho một cụm từ tìm kiếm cụ thể.
Tóm tắt các chế độ cài đặt chất lượng tìm kiếm được đề xuất và không bắt buộc
Bảng sau đây liệt kê tất cả yếu tố chất lượng tìm kiếm được đề xuất và không bắt buộc phần cài đặt. Những đề xuất này sẽ giúp bạn khai thác tối đa các mô hình xếp hạng của Cloud Search.
Xem xét | Vị trí | Đề xuất/không bắt buộc | Thông tin chi tiết |
---|---|---|---|
Cài đặt giản đồ | |||
ItemContent trường | ItemContent | Đề xuất | Khi tạo hoặc cập nhật giản đồ, hãy điền nội dung phi cấu trúc của một mặt hàng. Trường này được dùng để tạo đoạn mã. |
RetrievalImportance trường | RetrievalImportance | Đề xuất | Khi tạo hoặc cập nhật giản đồ, hãy đặt cho các thuộc tính văn bản rõ ràng là quan trọng hoặc theo chủ đề. |
FreshnessOptions | FreshnessOptions | Không bắt buộc | Khi tạo hoặc cập nhật giản đồ, hãy đặt để đảm bảo các mặt hàng không bị giảm hạng do dữ liệu không chính xác hoặc các trường hợp thiếu dữ liệu. |
Chế độ cài đặt lập chỉ mục | |||
createTime /updateTime | ItemMetadata | Đề xuất | Điền trong quá trình lập chỉ mục một mục. |
contentLanguage | ItemMetadata | Đề xuất | Điền trong quá trình lập chỉ mục một mục. Nếu không có, Cloud Search sẽ cố gắng phát hiện ngôn ngữ dùng trong ItemContent . |
owners trường | ItemAcl() | Đề xuất | Điền trong quá trình lập chỉ mục một mục. |
Từ đồng nghĩa tuỳ chỉnh | Giản đồ _dictionaryEntry | Đề xuất | Xác định ở cấp nguồn dữ liệu hoặc dưới dạng nguồn dữ liệu riêng biệt trong quá trình lập chỉ mục. |
quality trường | SearchQualityMetadata | Không bắt buộc | Để tăng chất lượng cơ sở so với các mục tương tự về mặt ngữ nghĩa, hãy thiết lập chất lượng trong quá trình lập chỉ mục. Việc đặt trường này cho tất cả các mục trong một nguồn dữ liệu sẽ vô hiệu hoá tác động của trường này. |
dữ liệu lượt tương tác ở cấp mặt hàng | interaction | Không bắt buộc | Nếu nguồn dữ liệu ghi lại và cung cấp quyền truy cập vào các hoạt động tương tác của người dùng, hãy điền các lượt tương tác cho từng mục trong quá trình lập chỉ mục. |
thuộc tính số nguyên/enum | OrderedRanking | Không bắt buộc | Khi thứ tự của các mục có liên quan, hãy chỉ định thứ hạng theo thứ tự cho các thuộc tính số nguyên và enum trong quá trình lập chỉ mục. |
Cài đặt ứng dụng tìm kiếm | |||
Personalization=false | ScoringConfig hoặc sử dụng giao diện quản trị viên CloudSearch | Đề xuất | Khi tạo hoặc cập nhật ứng dụng tìm kiếm. Đảm bảo bạn cung cấp đúng thông tin về chủ sở hữu như mô tả trong bài viết Ảnh hưởng đến thứ hạng thông qua tính năng cá nhân hoá |
SourceImportance trường | SourceCrowdingConfig | Không bắt buộc | Để sai lệch kết quả từ một số nguồn dữ liệu nhất định, hãy đặt trường này. |
numResults trường | SourceCrowdingConfig | Không bắt buộc | Để kiểm soát tính đa dạng của kết quả, hãy đặt trường này. |
Các bước tiếp theo
Dưới đây là một vài bước tiếp theo bạn có thể thực hiện:
Tìm hiểu cách tận dụng Giản đồ
_dictionaryEntry
để xác định từ đồng nghĩa cho các cụm từ thường dùng trong công ty của bạn. Để sử dụng_dictionaryEntry
giản đồ, tham chiếu đến Định nghĩa từ đồng nghĩa.