Bạn có thể thiết lập Google Cloud Search để trả về kết quả từ nội dung tại cơ sở hạ tầng của tổ chức bằng nội dung trên Google Workspace. Bạn sử dụng trình kết nối SharePoint tại chỗ của Google Cloud Search và định cấu hình trình kết nối đó để truy cập vào một nguồn dữ liệu SharePoint cụ thể.
Điểm quan trọng cần lưu ý
Chế độ cài đặt SharePoint được tôn trọng
Trình kết nối Cloud Search SharePoint On-Prem luôn tuân theo chế độ cài đặt Search Visibility (Chế độ hiển thị tìm kiếm) trên SharePoint và bạn không thể ghi đè chế độ cài đặt này. Đối với tài liệu nháp, các quyền trên tài khoản người dùng (mà trình kết nối sử dụng để truy cập vào SharePoint Online) sẽ kiểm soát những tài liệu nháp được lập chỉ mục và trả về. Nếu tài khoản chỉ có quyền "Đọc toàn quyền", thì trình kết nối sẽ tuân theo chế độ cài đặt "Chế độ hiển thị mục nháp" trên SharePoint.
Bạn cũng có thể định cấu hình trình kết nối để giới hạn kết quả dựa trên quyền truy cập vào tài khoản người dùng. Bạn có thể sử dụng các thực thể chính của Google và các thực thể chính bên ngoài để xác định ACL. Để áp dụng tính năng cắt bớt nội dung bảo mật cho nội dung SharePoint, hãy đồng bộ hoá các danh tính bên ngoài sau đây với Danh bạ Google:
- Người dùng Active Directory
- Nhóm Active Directory
- Nhóm cục bộ trên SharePoint (có người dùng và nhóm Active Directory làm thành viên)
Để đồng bộ hoá người dùng và nhóm AD, bạn có thể sử dụng Google Cloud Directory Sync để bật các nhóm được liên kết với danh tính. Để đồng bộ hoá các nhóm cục bộ trên SharePoint, bạn có thể sử dụng Trình kết nối danh tính SharePoint.
Trình kết nối cũng cần thực hiện tra cứu bằng AD để tìm nạp thêm thông tin nhằm đồng bộ hoá các thực thể chính. Ví dụ: tra cứu bằng AD cho phép trình kết nối thực hiện những việc sau:
- Ánh xạ SID cho một nhóm miền với sAMAccountName tương ứng.
- Liên kết sAMAccountName của người dùng với địa chỉ email cho tư cách thành viên nhóm cục bộ trên SharePoint.
Tối ưu hoá cho công cụ tìm kiếm
Bạn có thể cải thiện trải nghiệm của người dùng bằng cách định cấu hình trình kết nối để trả về kết quả tìm kiếm phù hợp hơn.
Để sử dụng API, hãy đặt giá trị cho các tham số tạo HTML trong tệp cấu hình của trình kết nối SharePoint Online. Các thông số này cho phép bạn đặt những trường có tác động cao hơn hoặc thấp hơn đối với các kết quả trùng khớp.
Để thiết lập giản đồ, hãy làm theo hướng dẫn trong bài viết Tạo và đăng ký giản đồ. Khi bạn thiết lập giản đồ:
Để liên kết tên của các loại nội dung SharePoint với định nghĩa đối tượng tương ứng, trình kết nối sẽ chuẩn hoá tên loại nội dung bằng cách loại trừ các ký tự không được hỗ trợ. Đối với các định nghĩa về đối tượng, Cloud Search API chỉ hỗ trợ các ký tự hợp lệ từ A-Z, a-z và 0-9. Ví dụ: loại nội dung "Thông báo" liên kết với định nghĩa đối tượng "Thông báo". Loại nội dung "Bài báo tin tức" liên kết với "NewsArticle" (không có dấu cách).
Khi không thể so khớp định nghĩa đối tượng với định nghĩa đối tượng, trình kết nối sẽ sử dụng loại đối tượng dự phòng (
itemMetadata.objectType
). Tìm hiểu thêm về các thông số cấu hình siêu dữ liệu.Để liên kết tên thuộc tính SharePoint với định nghĩa thuộc tính, trình kết nối sẽ chuẩn hoá tên thuộc tính bằng cách giải mã các ký tự được mã hoá bằng thập lục phân và xoá tiền tố "ows_", sau đó loại trừ các ký tự không được hỗ trợ (tất cả ký tự ngoại trừ A-Z, a-z và 0-9 là ký tự hợp lệ).
Xử lý thư trong Microsoft Outlook
Khi gặp tệp .msg của Microsoft Outlook trong quá trình lập chỉ mục nội dung, trình kết nối sẽ ghi đè loại nội dung nghe nhìn cho các tệp đó và lập chỉ mục dưới dạng application/vnd.ms-outlook.
Cấu hình nhiều người dùng
Nếu SharePoint của bạn là một bản triển khai nhiều người dùng, trong đó nhiều trang web của khách hàng được lưu trữ trên cùng một ứng dụng Web, thì bạn cần định cấu hình chế độ bộ sưu tập trang web trong tệp cấu hình. Trong các bản triển khai nhiều người dùng, bạn chỉ nhận được quyền cho bộ sưu tập trang web và không thể nhận được quyền Đọc toàn quyền theo yêu cầu của trình kết nối SharePoint cục bộ.
Cách bật chế độ tập hợp trang web:
- Cấp cho tài khoản người dùng của trình kết nối quyền quản trị viên bộ sưu tập trang web.
- Đặt
sharepoint.server
trong tệp cấu hình của trình kết nối thành URL của bộ sưu tập trang web, chẳng hạn nhưhttp://sharepoint.example.com/sites/sitecollection
. URL không cần phải sử dụng đúng trường hợp như trên SharePoint. - Đặt
sharepoint.siteCollectionOnly
trong tệp cấu hình của trình kết nối thànhtrue
.
Nếu có nhiều bộ sưu tập trang web cần lập chỉ mục trong môi trường nhiều người dùng, bạn cần định cấu hình một thực thể trình kết nối cho mỗi bộ sưu tập trang web.
Hạn chế đã biết của trình kết nối
- Thời gian để trình kết nối phát hiện các thay đổi đối với các mục trong cơ sở dữ liệu sẽ tăng lên theo số lượng cơ sở dữ liệu mà trình kết nối theo dõi.
- Mức sử dụng bộ nhớ tăng lên theo số lượng người dùng và nhóm riêng biệt mà bạn sử dụng trong ACL cho mỗi bộ sưu tập trang web.
- Bạn chỉ có thể định cấu hình trình kết nối bằng các danh tính từ một miền Active Directory.
- Một số tên gốc phổ biến của Active Directory và Windows (chẳng hạn như
Everyone
,BUILTIN\Users
vàAll Authenticated Users
) không được hỗ trợ. - Thông báo xoá không được gửi tức thì và có thể mất hơn 4 giờ để trình kết nối nhận ra rằng người dùng đã xoá nội dung khỏi kho lưu trữ nguồn.
Yêu cầu hệ thống
Yêu cầu hệ thống | |
---|---|
Hệ điều hành |
|
Phần mềm |
|
Xác thực |
|
Triển khai trình kết nối
Điều kiện tiên quyết
Tạo khoá riêng tư Google Workspace chứa mã tài khoản dịch vụ của bạn. Để tìm hiểu cách lấy khoá riêng tư, hãy xem bài viết Thiết lập quyền truy cập vào API Google Cloud Search.
Quản trị viên Google Workspace của bạn phải thêm một nguồn dữ liệu để tìm kiếm. Ghi lại mã nguồn dữ liệu.
Nếu trình kết nối trả về kết quả dựa trên ACL (kết quả không công khai), thì quản trị viên Google Workspace phải tạo hai nguồn danh tính và cung cấp cho bạn mã nhận dạng của các nguồn đó:
- Nguồn nhận dạng để đồng bộ hoá người dùng và nhóm Active Directory.
- Nguồn Nhận dạng cho các nhóm POS Cục bộ
Quản trị viên cũng phải lấy mã khách hàng Google Workspace của tổ chức và cung cấp cho bạn.
Tìm hiểu cách lấy các giá trị này trong bài viết Ánh xạ danh tính người dùng trong Cloud Search.
Thiết lập tài khoản người dùng cho trình kết nối có quyền Đọc toàn bộ đối với Ứng dụng web SharePoint trong chính sách người dùng.
Nếu Ứng dụng web SharePoint không có một bộ sưu tập trang web gốc, hãy tạo một bộ sưu tập.
Nếu có bất kỳ tập hợp trang web nào bị khoá và bị khoá, hãy đăng nhập vào máy chủ Perfetto bằng tài khoản có đặc quyền của Quản trị viên và chạy tập lệnh
PrepareWriteLockedSites.ps1
.Để nhận các chỉ số nguồn dữ liệu nhằm thông báo cho cấu hình trình kết nối, hãy đăng nhập vào máy chủ SharePoint bằng một tài khoản có đặc quyền quản trị trang trại và chạy
diagnose_sp.ps1
.Kết quả báo cáo số lượng ứng dụng web, tài liệu và thành viên nhóm người dùng. Sử dụng thông tin này để ước tính số lượng thực thể của trình kết nối mà bạn cần, yêu cầu về bộ nhớ và số lượng tài liệu.
Bước 1. Cài đặt phần mềm trình kết nối Google Cloud Search SharePoint On-Prem.
Sao chép kho lưu trữ trình kết nối trên GitHub.
$ git clone https://github.com/google-cloudsearch/sharepoint-connector.git $ cd sharepoint-connector
Kiểm tra phiên bản trình kết nối mong muốn:
$ git checkout tags/latest_version
Trong đó:
latest_version
= một giá trị nhưv1-0.0.5
Tạo trình kết nối.
$ mvn package
Để bỏ qua các lượt kiểm thử khi tạo trình kết nối, hãy chạy
mvn package -DskipTests
thay vìmvn package
.Sao chép tệp zip của trình kết nối vào thư mục cài đặt cục bộ:
$ cp target/google-cloudsearch-sharepoint-connector-latest_version.zip installation-dir $ cd installation-dir $ unzip google-cloudsearch-sharepoint-connector-latest_version.zip $ cd google-cloudsearch-sharepoint-connector-latest_version
Bước 2. Tạo tệp cấu hình trình kết nối SharePoint cục bộ
Trong cùng thư mục với quá trình cài đặt trình kết nối, hãy tạo một tệp. Bạn nên đặt tên cho tệp là
connector-config.properties
để không cần có tham số dòng lệnh bổ sung để chạy trình kết nối. Nếu bạn dự định chạy nhiều phiên bản trình kết nối, hãy thêm thông tin chi tiết vào tên để phân biệt các phiên bản đó.Thêm các tham số dưới dạng cặp khoá/giá trị vào nội dung tệp, như trong ví dụ sau:
### Sharepoint On-Prem Connector configuration ### # Required parameters for data source access api.sourceId=08ef8becd116faa4546b8ca2c84b2879 api.serviceAccountPrivateKeyFile=service_account.json api.identitySourceId=08ef8becd116faa475de26d9b291fed9 # Required parameters for SharePoint on-premises access sharepoint.server=http://sp-2016:32967/sites/doc-center-site-collection sharepoint.siteCollectionOnly=true sharepoint.username=contoso\\admin sharepoint.password=pa$sw0rd sharepoint.stripDomainInUserPrincipals=true # Required parameters for AD lookup adLookup.host=dc.contoso.com adLookup.username=contoso\\admin adLookup.password=pa$sw0rd api.referenceIdentitySources=CONTOSO,contoso api.referenceIdentitySource.contoso.id=08ef8becd116faa5d3783f8c5a80e5aa api.referenceIdentitySource.CONTOSO.id=08ef8becd116faa5d3783f8c5a80e5aa # Optional parameters for schema mapping contentTemplate.sharepointItem.title=Title contentTemplate.sharepointItem.unmappedColumnsMode=APPEND
Để biết nội dung mô tả chi tiết về từng thông số, hãy chuyển đến tài liệu tham khảo về thông số cấu hình.
(Không bắt buộc) Định cấu hình thêm các thông số của trình kết nối nếu cần. Để biết thông tin chi tiết, hãy xem bài viết Thông số trình kết nối do Google cung cấp.
Bước 3. Đối với HTTPS, hãy thêm SharePoint làm máy chủ lưu trữ đáng tin cậy
Nếu SharePoint được định cấu hình để sử dụng HTTPS, hãy lấy chứng chỉ SharePoint để thêm SharePoint làm máy chủ đáng tin cậy cho trình kết nối.
Trên máy tính sẽ chạy trình kết nối, hãy mở trình duyệt và truy cập AppSheet.
Trong trang cảnh báo mở ra, hãy nhấp vào Tôi hiểu rủi ro và Thêm ngoại lệ. Trang này hiển thị một thông báo như "Kết nối này không đáng tin cậy" vì chứng chỉ được tự ký và không do một Tổ chức phát hành chứng chỉ đáng tin cậy ký.
Khi nút Xem xuất hiện, hãy nhấp vào nút đó.
Chuyển đến thẻ Chi tiết rồi nhấp vào Xuất.
Lưu chứng chỉ bằng tên
sharepoint.crt
trong thư mục trình kết nối.Nhấp vào Close (Đóng), rồi nhấp vào Cancel (Huỷ) để đóng cửa sổ.
Mở lời nhắc lệnh và nhập lệnh sau:
$ keytool -importcert -keystore cacerts.jks -storepass changeit -file sharepoint.crt -alias sharepoint
Khi được nhắc "Tin cậy chứng chỉ này?", hãy trả lời có.
Bước 4. Thiết lập tính năng ghi nhật ký
Trong thư mục chứa tệp nhị phân của trình kết nối, hãy tạo một thư mục có tên là
logs
.Trong cùng thư mục (không phải
logs
), hãy tạo một tệp được mã hoá Latin1 có tênlogging.properties
.Thêm văn bản sau vào
logging.properties
:handlers = java.util.logging.ConsoleHandler,java.util.logging.FileHandler # Default log level .level = INFO # uncomment line below to increase logging level for SharePoint APIsa #com.google.enterprise.cloudsearch.sharepoint.level=FINE # uncomment line below to increase logging level to enable API trace #com.google.api.client.http.level = FINE java.util.logging.ConsoleHandler.level = INFO java.util.logging.FileHandler.pattern=logs/connector-sharepoint.%g.log java.util.logging.FileHandler.limit=10485760 java.util.logging.FileHandler.count=10 java.util.logging.FileHandler.formatter=java.util.logging.SimpleFormatter
Bước 5. Định cấu hình trình kết nối danh tính SharePoint tại chỗ
Bạn phải thực hiện bước này để áp dụng ACL dựa trên danh tính của SharePoint On-Prem cho kết quả tìm kiếm. Nếu thiết lập trình kết nối bằng ACL công khai, bạn có thể bỏ qua bước này.
Trong cùng thư mục với quá trình cài đặt trình kết nối SharePoint Online, hãy tạo một tệp và đặt tên là
sharepoint-onprem-identity-connector.config
.Thêm các tham số dưới dạng cặp khoá/giá trị vào nội dung tệp, như trong ví dụ sau:
### SharePoint On-prem identity connector configuration ### # Required parameters for data source access api.customerId=C05d3djk8 api.serviceAccountPrivateKeyFile=service_account.json api.identitySourceId=08ef8becd116faa475de26d9b291fed9 # Required parameters for SharePoint access sharepoint.server=http://sp-2016:32967/sites/doc-center-site-collection sharepoint.siteCollectionOnly=true sharepoint.username=contoso\\admin sharepoint.password=pa$sw0rd sharepoint.stripDomainInUserPrincipals=true # Required parameters for AD lookup adLookup.host=dc.contoso.com adLookup.username=contoso\\admin adLookup.password=pa$sw0rd api.referenceIdentitySources=CONTOSO,contoso api.referenceIdentitySource.contoso.id=08ef8becd116faa5d3783f8c5a80e5aa api.referenceIdentitySource.CONTOSO.id=08ef8becd116faa5d3783f8c5a80e5aa
Các giá trị này gần giống với trình kết nối POS On-Prem, ngoại trừ việc tham số này là
api.customerId
thay vìapi.sourceId
. Giá trị củaapi.customerId
là mã khách hàng mà bạn nhận được từ quản trị viên Google Workspace.
Bước 6. Khởi chạy trình kết nối Perfetto On-Prem
Trong các bước sau, bạn sẽ liên kết các thực thể chính trong cả Active Directory tại chỗ và bộ sưu tập trang web SharePoint với các danh tính trong dịch vụ Cloud Identity. Quá trình đồng bộ hoá này được thực hiện bằng Google Cloud Directory Sync (GCDS) và trình kết nối danh tính SharePoint tại chỗ.
Sau khi GCDS đồng bộ hoá người dùng và nhóm, để đồng bộ hoá các nhóm bộ sưu tập trang web SharePoint, hãy chạy trình kết nối danh tính SharePoint On-Prem. Cuối cùng, hãy chạy trình kết nối SharePoing On-Prem để lập chỉ mục và phân phát kết quả cho người dùng Cloud Search.
Nếu bạn chưa thực hiện, hãy định cấu hình và chạy GCDS. Hãy nhớ bật nhóm được ánh xạ danh tính.
Chạy trình kết nối danh tính SharePoint tại chỗ:
$ java -Djava.util.logging.config.file=logging.properties -cp "google-cloudsearch-sharepoint-connector-version.jar" com.google.enterprise.cloudsearch.sharepoint.SharePointIdentityConnector -Dconfig=sharepoint-onprem-identity-connector.config
Chạy trình kết nối SharePoint tại chỗ. Sử dụng cú pháp lệnh cho tính năng bảo mật trang web SharePoint:
HTTP (không yêu cầu máy chủ đáng tin cậy):
$ java -Djava.util.logging.config.file=logging.properties -jar google-cloudsearch-sharepoint-connector-v1-version.jar
HTTPS (thêm Perfetto làm máy chủ lưu trữ đáng tin cậy):
$ java -Djavax.net.ssl.trustStore=cacerts.jks -Djavax.net.ssl.trustStoreType=jks -Djavax.net.ssl.trustStorePassword=changeit -Djava.util.logging.config.file=logging.properties -jar google-cloudsearch-sharepoint-connector-v1-version.jar
Tài liệu tham khảo về tham số cấu hình
Truy cập nguồn dữ liệu
Xem xét | Thông số |
Mã nguồn dữ liệu | api.sourceId=1234567890abcdef
Bắt buộc. Mã nguồn dữ liệu Google Cloud Search do quản trị viên Google Workspace thiết lập. |
Đường dẫn đến tệp khoá riêng tư của tài khoản dịch vụ | api.serviceAccountPrivateKeyFile=PrivateKey.json
Bắt buộc. Đường dẫn đến tệp khoá tài khoản dịch vụ Google Cloud Search. |
Quyền truy cập vào SharePoint trên máy
Xem xét | Thông số |
URL máy chủ SharePoint | sharepoint.server=http://yoursharepoint.example.com/
Bắt buộc. URL của máy chủ SharePoint dưới dạng tên máy chủ đủ điều kiện, chẳng hạn như http://yoursharepoint.example.com/. Nếu tên máy chủ chưa đủ điều kiện, thì bạn phải đặt chế độ ghi đè DNS trên máy chủ của trình kết nối. |
Tên người dùng SharePoint | sharepoint.username=YOURDOMAIN\\ConnectorUser
Bắt buộc khi bạn chạy trình kết nối trên Linux hoặc trên máy Windows không thuộc miền AD của SharePoint Server. |
Mật khẩu Perfetto | sharepoint.password=user_password
Bắt buộc khi bạn chạy trình kết nối trên Linux hoặc trên máy Windows không thuộc miền AD của SharePoint Server. |
Sử dụng tính năng Xác thực trực tiếp để kết nối với SharePoint | sharepoint.username=AdaptorUser Live Authentication Id
|
Sử dụng tính năng Xác thực ADFS để kết nối với SharePoint | sharepoint.username=AdaptorUser@yourdomain.com
|
Lập chỉ mục bộ sưu tập trang web
Xem xét | Thông số |
Loại chỉ mục | sharepoint.siteCollectionOnly=boolean
Không bắt buộc, ngoại trừ các trường hợp triển khai SharePoint nhiều người dùng (tìm hiểu thêm). Đặt thành đúng để đặt chỉ mục trình kết nối |
Liên kết danh tính POS
Xem xét | Thông số |
Mã nguồn nhận dạng | api.identitySourceId=1234567890abcdef
Bắt buộc. Mã nguồn nhận dạng để đồng bộ hoá Nhóm cục bộ trên SharePoint.Mã nguồn Google Cloud Search do quản trị viên Google Workspace thiết lập, như mô tả trong phần Thêm nguồn dữ liệu để tìm kiếm. |
Tham chiếu nguồn nhận dạng | api.referenceIdentitySources=CONTOSO,contoso
Danh sách các nguồn nhận dạng tham chiếu được phân tách bằng dấu phẩy cho các thư mục chính đang hoạt động. Giá trị khớp với tên NETBIOS của Active Directory của các thực thể chính trong Active Directory tham chiếu. |
Tham chiếu mã nguồn nhận dạng | api.referenceIdentitySource.DOMAIN.id=identity-source-id
Bắt buộc. Mã nguồn nhận dạng để đồng bộ hoá các thực thể Active Directory. |
Tìm kiếm Active Directory
Xem xét | Thông số |
Máy chủ Active Directory | adLookup.host=host
Bắt buộc. Tên máy chủ thư mục đang hoạt động, chẳng hạn như dc.contoso.com hoặc địa chỉ IP. |
Cổng tra cứu Active Directory | adLookup.port=port
Không bắt buộc. Giá trị mặc định là 389. Sử dụng 686 cho SSL. |
Phương thức tra cứu Active Directory | adLookup.method=value
Không bắt buộc. Giá trị mặc định là "standard". Đối với các kết nối HTTPS, hãy đặt thành "ssl". |
Người dùng tra cứu Active Directory | adLookup.username=CONTOSO\user1
Bắt buộc. Người dùng được phép thực hiện tra cứu trong Active Directory. |
Mật khẩu tra cứu Active Directory | adLookup.password=password123
Bắt buộc. Mật khẩu cho người dùng do |
Tạo nội dung HTML
Xem xét | Thông số |
Trường tiêu đề mẫu HTML | contentTemplate.sharePointItem.title=Title
Trường SharePoint để dùng làm tiêu đề mẫu HTML cho HTML được tạo. |
Trường chất lượng tìm kiếm cao cho nội dung HTML | contentTemplate.sharePointItem.quality.high=highField1[,highField2,...]
Danh sách các trường được phân tách bằng dấu phẩy để đưa vào HTML đã tạo dưới dạng trường chất lượng cao. Khi cụm từ tìm kiếm khớp với các trường này, kết quả sẽ được xếp hạng cao hơn. |
Trường chất lượng tìm kiếm trung bình cho nội dung HTML | contentTemplate.sharePointItem.quality.medium=mediumField1[,mediumField2,...]
Danh sách các trường được phân tách bằng dấu phẩy để đưa vào HTML được tạo dưới dạng các trường có chất lượng trung bình. |
Các trường nội dung HTML có chất lượng tìm kiếm thấp | contentTemplate.sharePointItem.quality.low=lowField1[,lowField2,...]
Danh sách các trường được phân tách bằng dấu phẩy để đưa vào HTML đã tạo dưới dạng trường chất lượng thấp. |
Cột chưa liên kết nội dung HTML | contentTemplate.sharepointItem.unmappedColumnsMode=APPEND
Cách trình kết nối xử lý các cột chưa được liên kết. Giá trị là APPEND (mặc định) hoặc IGNORE.
|