Bạn có thể thiết lập Google Cloud Search để trả về kết quả từ nội dung tại chỗ trên SharePoint của tổ chức, ngoài nội dung trên Google Workspace. Bạn sử dụng trình kết nối SharePoint tại chỗ của Google Cloud Search và định cấu hình trình kết nối này để truy cập vào một nguồn dữ liệu cụ thể trên SharePoint.
Điểm quan trọng cần lưu ý
Tuân thủ các chế độ cài đặt của SharePoint
Trình kết nối Cloud Search SharePoint tại chỗ luôn tuân thủ chế độ cài đặt Search Visibility (Khả năng hiển thị khi tìm kiếm) trên SharePoint và bạn không thể ghi đè chế độ cài đặt này. Đối với tài liệu nháp, các quyền đối với tài khoản người dùng (mà trình kết nối dùng để truy cập vào SharePoint Online) sẽ kiểm soát những tài liệu nháp được lập chỉ mục và trả về. Nếu tài khoản chỉ có quyền "Đọc toàn bộ", thì trình kết nối sẽ tuân theo chế độ cài đặt "Hiển thị mục nháp" trên SharePoint.
Bạn cũng có thể định cấu hình trình kết nối để giới hạn kết quả dựa trên quyền truy cập vào tài khoản người dùng. Bạn có thể sử dụng các thực thể chính của Google và thực thể chính bên ngoài để xác định ACL. Để áp dụng tính năng cắt bỏ bảo mật cho nội dung trên SharePoint, hãy đồng bộ hoá các danh tính bên ngoài sau đây với Danh bạ Google:
- Người dùng Active Directory
- Nhóm Active Directory
- Nhóm cục bộ của SharePoint (có người dùng và nhóm Active Directory làm thành viên)
Để đồng bộ hoá người dùng và nhóm trong AD, bạn có thể dùng Google Cloud Directory Sync để bật các nhóm được liên kết danh tính. Để đồng bộ hoá các nhóm cục bộ của SharePoint, bạn có thể sử dụng Trình kết nối danh tính SharePoint.
Trình kết nối cũng cần thực hiện tra cứu bằng AD để tìm nạp thêm thông tin nhằm đồng bộ hoá các thực thể chính. Ví dụ: tính năng tra cứu bằng AD cho phép trình kết nối thực hiện những việc sau:
- Ánh xạ SID cho một nhóm miền với sAMAccountName tương ứng.
- Liên kết sAMAccountName của người dùng với địa chỉ email cho thành viên nhóm cục bộ của SharePoint.
Tối ưu hoá công cụ tìm kiếm
Bạn có thể cải thiện trải nghiệm của người dùng bằng cách định cấu hình trình kết nối để trả về kết quả tìm kiếm phù hợp hơn.
Để sử dụng API này, hãy đặt các giá trị cho tham số tạo HTML trong tệp cấu hình trình kết nối SharePoint Online. Các thông số này cho phép bạn đặt những trường có tác động cao hơn hoặc thấp hơn đến kết quả khớp.
Để thiết lập một giản đồ, hãy làm theo hướng dẫn trong phần Tạo và đăng ký giản đồ. Khi bạn thiết lập một giản đồ:
Để liên kết tên của các loại nội dung SharePoint với các định nghĩa đối tượng tương ứng, trình kết nối sẽ chuẩn hoá tên loại nội dung bằng cách loại trừ các ký tự không được hỗ trợ. Đối với các định nghĩa về đối tượng, Cloud Search API chỉ hỗ trợ các ký tự A-Z, a-z và 0-9 là các ký tự hợp lệ. Ví dụ: loại nội dung "Thông báo" liên kết với định nghĩa đối tượng "Thông báo". Loại nội dung "Bài viết tin tức" tương ứng với "NewsArticle" (không có khoảng trắng).
Khi không thể so khớp một định nghĩa đối tượng với một định nghĩa đối tượng, trình kết nối sẽ sử dụng loại đối tượng dự phòng (
itemMetadata.objectType
). Tìm hiểu thêm về các thông số cấu hình siêu dữ liệu.Để liên kết tên thuộc tính SharePoint với định nghĩa thuộc tính, trình kết nối sẽ chuẩn hoá tên thuộc tính bằng cách giải mã các ký tự được mã hoá bằng số thập lục phân và xoá tiền tố "ows_", sau đó loại trừ các ký tự không được hỗ trợ (tất cả các ký tự ngoại trừ A-Z, a-z và 0-9 là các ký tự hợp lệ).
Xử lý thư trong Microsoft Outlook
Khi trình kết nối gặp phải các tệp .msg của Microsoft Outlook trong quá trình lập chỉ mục nội dung, trình kết nối sẽ ghi đè loại nội dung nghe nhìn cho các tệp và lập chỉ mục các tệp đó dưới dạng application/vnd.ms-outlook.
Cấu hình nhiều đối tượng thuê
Nếu SharePoint của bạn là một triển khai nhiều người thuê, trong đó nhiều trang web của khách hàng được lưu trữ trên cùng một ứng dụng Web, thì bạn cần định cấu hình chế độ tuyển tập trang web trong tệp cấu hình. Trong các triển khai nhiều đối tượng thuê, bạn chỉ có quyền đối với tuyển tập trang web của mình và không thể có quyền Đọc toàn bộ theo yêu cầu của trình kết nối SharePoint tại cơ sở.
Cách bật chế độ tuyển tập trang web:
- Cấp cho tài khoản người dùng trình kết nối quyền quản trị viên bộ sưu tập trang web.
- Đặt
sharepoint.server
trong tệp cấu hình trình kết nối thành URL của tuyển tập trang web, chẳng hạn nhưhttp://sharepoint.example.com/sites/sitecollection
. URL không cần phải sử dụng chính xác cùng một trường hợp như trên SharePoint. - Đặt
sharepoint.siteCollectionOnly
trong tệp cấu hình trình kết nối thànhtrue
.
Nếu có nhiều tuyển tập trang web cần lập chỉ mục trong môi trường nhiều người thuê, bạn cần định cấu hình một phiên bản trình kết nối cho từng tuyển tập trang web.
Các hạn chế đã biết của trình kết nối
- Thời gian mà trình kết nối cần để phát hiện các thay đổi đối với các mục trong cơ sở dữ liệu sẽ tăng lên theo số lượng cơ sở dữ liệu mà trình kết nối giám sát.
- Mức tiêu thụ bộ nhớ tăng lên khi số lượng người dùng và nhóm riêng biệt mà bạn sử dụng trong danh sách kiểm soát truy cập cho mỗi tuyển tập trang web tăng lên.
- Bạn chỉ có thể thiết lập trình kết nối bằng danh tính của một miền Active Directory.
- Một số đối tượng chính thường dùng trong Active Directory và Windows, chẳng hạn như
Everyone
,BUILTIN\Users
vàAll Authenticated Users
, không được hỗ trợ. - Thông báo xoá không được gửi ngay lập tức và có thể mất hơn 4 giờ để một trình kết nối nhận ra rằng người dùng đã xoá nội dung khỏi kho lưu trữ nguồn.
Yêu cầu hệ thống
Yêu cầu hệ thống | |
---|---|
Hệ điều hành |
|
Phần mềm |
|
Xác thực |
|
Triển khai trình kết nối
Điều kiện tiên quyết
Tạo khoá riêng tư Google Workspace chứa mã nhận dạng tài khoản dịch vụ của bạn. Để tìm hiểu cách lấy khoá riêng tư, hãy xem bài viết Định cấu hình quyền truy cập vào API Google Cloud Search.
Quản trị viên Google Workspace phải thêm một nguồn dữ liệu để tìm kiếm. Ghi lại mã nhận dạng nguồn dữ liệu.
Nếu trình kết nối trả về kết quả dựa trên ACL (kết quả không phải là công khai), thì quản trị viên Google Workspace của bạn phải tạo hai nguồn nhận dạng và cung cấp cho bạn mã nhận dạng của chúng:
- Một nguồn nhận dạng để đồng bộ hoá người dùng và nhóm trong Active Directory.
- Một nguồn danh tính cho các nhóm cục bộ trên SharePoint
Quản trị viên cũng phải lấy mã khách hàng Google Workspace của tổ chức và cung cấp cho bạn.
Tìm hiểu cách lấy các giá trị này trong phần Ánh xạ danh tính người dùng trên Maps trong Cloud Search.
Thiết lập tài khoản người dùng cho trình kết nối có quyền Đọc toàn bộ đối với Ứng dụng web SharePoint trong chính sách người dùng.
Nếu Ứng dụng web SharePoint không có một tuyển tập trang web gốc, hãy tạo một tuyển tập trang web gốc.
Nếu có bất kỳ tuyển tập trang web nào bị khoá ghi, hãy đăng nhập vào máy chủ SharePoint bằng tài khoản có đặc quyền Quản trị viên và chạy tập lệnh
PrepareWriteLockedSites.ps1
.Để nhận các chỉ số về nguồn dữ liệu nhằm cung cấp thông tin cho cấu hình trình kết nối, hãy đăng nhập vào máy chủ SharePoint bằng một tài khoản có đặc quyền quản trị trang trại và chạy
diagnose_sp.ps1
.Đầu ra báo cáo số lượng ứng dụng web, tài liệu và tư cách thành viên nhóm người dùng. Hãy sử dụng thông tin này để ước tính số lượng phiên bản trình kết nối bạn cần, yêu cầu về bộ nhớ và số lượng tài liệu.
Bước 1. Cài đặt phần mềm trình kết nối Google Cloud Search SharePoint tại chỗ.
Sao chép kho lưu trữ trình kết nối trên GitHub.
$ git clone https://github.com/google-cloudsearch/sharepoint-connector.git $ cd sharepoint-connector
Kiểm tra phiên bản trình kết nối mong muốn:
$ git checkout tags/latest_version
Trong đó:
latest_version
= một giá trị nhưv1-0.0.5
Tạo trình kết nối.
$ mvn package
Để bỏ qua các kiểm thử khi bạn tạo trình kết nối, hãy chạy
mvn package -DskipTests
thay vìmvn package
.Sao chép tệp zip của trình kết nối vào thư mục cài đặt cục bộ:
$ cp target/google-cloudsearch-sharepoint-connector-latest_version.zip installation-dir $ cd installation-dir $ unzip google-cloudsearch-sharepoint-connector-latest_version.zip $ cd google-cloudsearch-sharepoint-connector-latest_version
Bước 2. Tạo tệp cấu hình trình kết nối SharePoint tại chỗ
Tạo một tệp trong cùng thư mục với trình kết nối. Google đề xuất bạn đặt tên cho tệp là
connector-config.properties
để không cần thêm thông số dòng lệnh để chạy trình kết nối. Nếu bạn dự định chạy nhiều phiên bản trình kết nối, hãy thêm thông tin chi tiết vào tên để phân biệt các phiên bản đó.Thêm các tham số dưới dạng cặp khoá/giá trị vào nội dung tệp, như trong ví dụ sau:
### Sharepoint On-Prem Connector configuration ### # Required parameters for data source access api.sourceId=08ef8becd116faa4546b8ca2c84b2879 api.serviceAccountPrivateKeyFile=service_account.json api.identitySourceId=08ef8becd116faa475de26d9b291fed9 # Required parameters for SharePoint on-premises access sharepoint.server=http://sp-2016:32967/sites/doc-center-site-collection sharepoint.siteCollectionOnly=true sharepoint.username=contoso\\admin sharepoint.password=pa$sw0rd sharepoint.stripDomainInUserPrincipals=true # Required parameters for AD lookup adLookup.host=dc.contoso.com adLookup.username=contoso\\admin adLookup.password=pa$sw0rd api.referenceIdentitySources=CONTOSO,contoso api.referenceIdentitySource.contoso.id=08ef8becd116faa5d3783f8c5a80e5aa api.referenceIdentitySource.CONTOSO.id=08ef8becd116faa5d3783f8c5a80e5aa # Optional parameters for schema mapping contentTemplate.sharepointItem.title=Title contentTemplate.sharepointItem.unmappedColumnsMode=APPEND
Để biết nội dung mô tả chi tiết về từng tham số, hãy xem tài liệu tham khảo về các tham số cấu hình.
(Không bắt buộc) Định cấu hình các thông số bổ sung của trình kết nối, nếu cần. Để biết thông tin chi tiết, hãy xem phần Các tham số của trình kết nối do Google cung cấp.
Bước 3. Đối với HTTPS, hãy thêm SharePoint làm máy chủ tin cậy
Nếu SharePoint được định cấu hình để sử dụng HTTPS, hãy lấy chứng chỉ SharePoint để thêm chứng chỉ đó làm máy chủ lưu trữ đáng tin cậy cho trình kết nối.
Trên máy tính sẽ chạy trình kết nối, hãy mở một trình duyệt rồi truy cập vào SharePoint.
Trong trang cảnh báo mở ra, hãy nhấp vào Tôi hiểu rõ các rủi ro và Thêm ngoại lệ. Trang này cho thấy một thông báo như "Kết nối này không đáng tin cậy" vì chứng chỉ là tự ký và không được ký bởi một Tổ chức phát hành chứng chỉ đáng tin cậy.
Khi nút Xem xuất hiện, hãy nhấp vào nút đó.
Chuyển đến thẻ Chi tiết rồi nhấp vào Xuất.
Lưu chứng chỉ trong thư mục trình kết nối bằng tên
sharepoint.crt
.Nhấp vào Đóng rồi nhấp vào Huỷ để đóng các cửa sổ.
Mở giao diện nhập dòng lệnh rồi nhập lệnh sau:
$ keytool -importcert -keystore cacerts.jks -storepass changeit -file sharepoint.crt -alias sharepoint
Khi được nhắc "Tin tưởng chứng chỉ này?", hãy trả lời có.
Bước 4. Thiết lập tính năng ghi nhật ký
Trong thư mục chứa tệp nhị phân của trình kết nối, hãy tạo một thư mục có tên là
logs
.Trong cùng một thư mục (không phải
logs
), hãy tạo một tệp được mã hoá Latin1 có tên làlogging.properties
.Thêm văn bản sau vào
logging.properties
:handlers = java.util.logging.ConsoleHandler,java.util.logging.FileHandler # Default log level .level = INFO # uncomment line below to increase logging level for SharePoint APIsa #com.google.enterprise.cloudsearch.sharepoint.level=FINE # uncomment line below to increase logging level to enable API trace #com.google.api.client.http.level = FINE java.util.logging.ConsoleHandler.level = INFO java.util.logging.FileHandler.pattern=logs/connector-sharepoint.%g.log java.util.logging.FileHandler.limit=10485760 java.util.logging.FileHandler.count=10 java.util.logging.FileHandler.formatter=java.util.logging.SimpleFormatter
Bước 5. Định cấu hình trình kết nối danh tính SharePoint tại chỗ
Bạn phải thực hiện bước này để áp dụng các ACL dựa trên danh tính của SharePoint tại chỗ cho kết quả tìm kiếm. Nếu thiết lập trình kết nối bằng ACL công khai, bạn có thể bỏ qua bước này.
Trong cùng thư mục với quá trình cài đặt trình kết nối SharePoint Online, hãy tạo một tệp và đặt tên là
sharepoint-onprem-identity-connector.config
.Thêm các tham số dưới dạng cặp khoá/giá trị vào nội dung tệp, như trong ví dụ sau:
### SharePoint On-prem identity connector configuration ### # Required parameters for data source access api.customerId=C05d3djk8 api.serviceAccountPrivateKeyFile=service_account.json api.identitySourceId=08ef8becd116faa475de26d9b291fed9 # Required parameters for SharePoint access sharepoint.server=http://sp-2016:32967/sites/doc-center-site-collection sharepoint.siteCollectionOnly=true sharepoint.username=contoso\\admin sharepoint.password=pa$sw0rd sharepoint.stripDomainInUserPrincipals=true # Required parameters for AD lookup adLookup.host=dc.contoso.com adLookup.username=contoso\\admin adLookup.password=pa$sw0rd api.referenceIdentitySources=CONTOSO,contoso api.referenceIdentitySource.contoso.id=08ef8becd116faa5d3783f8c5a80e5aa api.referenceIdentitySource.CONTOSO.id=08ef8becd116faa5d3783f8c5a80e5aa
Các giá trị này gần giống với giá trị của trình kết nối SharePoint tại cơ sở, ngoại trừ việc thay vì
api.sourceId
, tham số làapi.customerId
. Giá trị củaapi.customerId
là mã khách hàng mà bạn nhận được từ quản trị viên Google Workspace.
Bước 6. Khởi chạy trình kết nối SharePoint tại chỗ
Trong các bước sau, bạn sẽ ánh xạ các đối tượng chính trong cả Active Directory tại chỗ và tuyển tập trang web SharePoint với các danh tính trong dịch vụ Cloud Identity. Quá trình đồng bộ hoá này được thực hiện bằng Google Cloud Directory Sync (GCDS) và trình kết nối danh tính SharePoint tại cơ sở.
Sau khi GCDS đồng bộ hoá người dùng và nhóm, để đồng bộ hoá các nhóm tuyển tập trang web SharePoint, hãy chạy trình kết nối danh tính SharePoint tại cơ sở. Cuối cùng, hãy chạy trình kết nối SharePoing On-Prem để lập chỉ mục và phân phát kết quả cho người dùng Cloud Search.
Nếu bạn chưa làm, hãy thiết lập và chạy GCDS. Hãy nhớ bật nhóm được ánh xạ danh tính.
Chạy trình kết nối danh tính SharePoint tại chỗ:
$ java -Djava.util.logging.config.file=logging.properties -cp "google-cloudsearch-sharepoint-connector-version.jar" com.google.enterprise.cloudsearch.sharepoint.SharePointIdentityConnector -Dconfig=sharepoint-onprem-identity-connector.config
Chạy trình kết nối SharePoint tại chỗ. Sử dụng cú pháp lệnh cho tính năng bảo mật trang web SharePoint của bạn:
HTTP (không yêu cầu máy chủ đáng tin cậy):
$ java -Djava.util.logging.config.file=logging.properties -jar google-cloudsearch-sharepoint-connector-v1-version.jar
HTTPS (thêm SharePoint làm máy chủ lưu trữ đáng tin cậy):
$ java -Djavax.net.ssl.trustStore=cacerts.jks -Djavax.net.ssl.trustStoreType=jks -Djavax.net.ssl.trustStorePassword=changeit -Djava.util.logging.config.file=logging.properties -jar google-cloudsearch-sharepoint-connector-v1-version.jar
Tài liệu tham khảo về thông số cấu hình
Truy cập nguồn dữ liệu
Cài đặt | Thông số |
Mã nguồn dữ liệu | api.sourceId=1234567890abcdef
Bắt buộc. Mã nguồn dữ liệu Google Cloud Search do quản trị viên Google Workspace thiết lập. |
Đường dẫn đến tệp khoá riêng tư của tài khoản dịch vụ | api.serviceAccountPrivateKeyFile=PrivateKey.json
Bắt buộc. Đường dẫn đến tệp khoá tài khoản dịch vụ Google Cloud Search. |
Quyền truy cập vào SharePoint tại chỗ
Cài đặt | Thông số |
URL máy chủ SharePoint | sharepoint.server=http://yoursharepoint.example.com/
Bắt buộc. URL của máy chủ SharePoint dưới dạng tên máy chủ lưu trữ đủ điều kiện, chẳng hạn như http://yoursharepoint.example.com/. Nếu tên máy chủ không đủ điều kiện, thì bạn phải đặt chế độ ghi đè DNS trên máy chủ lưu trữ trình kết nối. |
Tên người dùng SharePoint | sharepoint.username=YOURDOMAIN\\ConnectorUser
Bắt buộc khi bạn chạy trình kết nối trên Linux hoặc trên một máy Windows không thuộc miền AD của SharePoint Server. |
Mật khẩu SharePoint | sharepoint.password=user_password
Bắt buộc khi bạn chạy trình kết nối trên Linux hoặc trên một máy Windows không thuộc miền AD của SharePoint Server. |
Sử dụng tính năng Xác thực trực tiếp để kết nối với SharePoint | sharepoint.username=AdaptorUser Live Authentication Id
|
Sử dụng phương thức xác thực ADFS để kết nối với SharePoint | sharepoint.username=AdaptorUser@yourdomain.com
|
Lập chỉ mục tuyển tập trang web
Cài đặt | Thông số |
Loại chỉ mục | sharepoint.siteCollectionOnly=boolean
Không bắt buộc, ngoại trừ các triển khai SharePoint nhiều người thuê (tìm hiểu thêm). Đặt thành true để chỉ mục trình kết nối |
Ánh xạ danh tính trên SharePoint
Cài đặt | Thông số |
Mã nguồn nhận dạng | api.identitySourceId=1234567890abcdef
Bắt buộc. Mã nguồn nhận dạng để đồng bộ hoá Nhóm cục bộ của SharePoint.Mã nguồn Google Cloud Search do quản trị viên Google Workspace thiết lập, như mô tả trong phần Thêm nguồn dữ liệu để tìm kiếm. |
Tham chiếu các nguồn nhận dạng | api.referenceIdentitySources=CONTOSO,contoso
Danh sách các nguồn nhận dạng tham chiếu được phân tách bằng dấu phẩy cho các nguyên tắc của Active Directory. Giá trị này khớp với tên NETBIOS của Active Directory của các nguyên tắc tham chiếu trong Active Directory. |
Mã tham chiếu nguồn nhận dạng | api.referenceIdentitySource.DOMAIN.id=identity-source-id
Bắt buộc. Mã nguồn nhận dạng để đồng bộ hoá các đối tượng chính trong Active Directory. |
Tìm kiếm trong Active Directory
Cài đặt | Thông số |
Máy chủ Active Directory | adLookup.host=host
Bắt buộc. Tên máy chủ Active Directory, chẳng hạn như dc.contoso.com hoặc địa chỉ IP. |
Cổng tra cứu Active Directory | adLookup.port=port
Không bắt buộc. Giá trị mặc định là 389. Sử dụng 686 cho SSL. |
Phương thức tra cứu Active Directory | adLookup.method=value
Không bắt buộc. Giá trị mặc định là "standard". Đối với các kết nối HTTPS, hãy đặt thành "ssl". |
Người dùng tra cứu Active Directory | adLookup.username=CONTOSO\user1
Bắt buộc. Người dùng được phép thực hiện các lượt tìm kiếm trong Active Directory. |
Mật khẩu tra cứu Active Directory | adLookup.password=password123
Bắt buộc. Mật khẩu cho người dùng do |
Tạo nội dung HTML
Cài đặt | Thông số |
Trường tiêu đề mẫu HTML | contentTemplate.sharePointItem.title=Title
Trường SharePoint dùng làm tiêu đề mẫu HTML cho HTML được tạo. |
Các trường chất lượng tìm kiếm cao của nội dung HTML | contentTemplate.sharePointItem.quality.high=highField1[,highField2,...]
Danh sách các trường được phân tách bằng dấu phẩy để đưa vào HTML đã tạo dưới dạng các trường chất lượng cao. Khi các cụm từ tìm kiếm khớp với những trường này, kết quả sẽ được xếp hạng cao hơn. |
Các trường chất lượng tìm kiếm nội dung HTML trung bình | contentTemplate.sharePointItem.quality.medium=mediumField1[,mediumField2,...]
Danh sách các trường được phân tách bằng dấu phẩy để đưa vào HTML đã tạo dưới dạng các trường có chất lượng trung bình. |
Các trường chất lượng tìm kiếm thấp của nội dung HTML | contentTemplate.sharePointItem.quality.low=lowField1[,lowField2,...]
Một danh sách các trường được phân tách bằng dấu phẩy để đưa vào HTML đã tạo dưới dạng các trường có chất lượng thấp. |
Cột nội dung HTML chưa được liên kết | contentTemplate.sharepointItem.unmappedColumnsMode=APPEND
Cách trình kết nối xử lý các cột chưa được liên kết. Giá trị là APPEND (mặc định) hoặc IGNORE.
|