Ta strona została przetłumaczona przez Cloud Translation API.

Tworzenie łącznika treści

Łącznik treści to program, który służy do przeszukiwania danych w repozytorium przedsiębiorstwa i wypełniania źródła danych. Google udostępnia te opcje tworzenia łączników treści:

Pakiet SDK łącznika treści. Jest to dobra opcja, jeśli programujesz w języku Java. Pakiet SDK oprogramowania sprzęgającego treści to otoczka interfejsu API REST, która umożliwia szybkie tworzenie oprogramowania sprzęgającego. Aby utworzyć łącznik treści za pomocą pakietu SDK, zapoznaj się z artykułem Tworzenie łącznika treści za pomocą pakietu SDK Content Connector.
interfejs REST API niskiego poziomu lub biblioteki API. Skorzystaj z tych opcji, jeśli nie programujesz w języku Java lub jeśli baza kodu lepiej obsługuje interfejs REST API lub bibliotekę. Aby utworzyć oprogramowanie sprzęgające treści za pomocą interfejsu API REST, zapoznaj się z artykułem Tworzenie oprogramowania sprzęgającego treści za pomocą interfejsu API REST.

Typowy łącznik treści wykonuje te zadania:

Odczytuje i przetwarza parametry konfiguracji.
Pobiera z repozytorium treści innych firm oddzielne fragmenty danych, które można indeksować, zwane „elementami”.
Łączy listy kontroli dostępu, metadane i dane treści w indeksowane elementy.
Indeksuje elementy w źródle danych Cloud Search.
(opcjonalnie) Odbiera powiadomienia o zmianach z repozytorium treści zewnętrznych. Powiadomienia o zmianach są przekształcane w żądania indeksowania, aby zsynchronizować źródło danych Cloud Search z repozytorium innej firmy. Konektor wykonuje to zadanie tylko wtedy, gdy repozytorium obsługuje wykrywanie zmian.

Tworzenie oprogramowania sprzęgającego treści za pomocą pakietu SDK Content Connector

W sekcjach poniżej znajdziesz informacje o tym, jak utworzyć oprogramowanie sprzęgające treści za pomocą pakietu SDK oprogramowania sprzęgającego treści.

Konfigurowanie zależności

Aby korzystać z pakietu SDK, musisz uwzględnić w pliku kompilacji określone zależności. Kliknij kartę poniżej, aby wyświetlić zależności dla środowiska kompilacji:

Maven

<dependency>
<groupId>com.google.enterprise.cloudsearch</groupId>
<artifactId>google-cloudsearch-indexing-connector-sdk</artifactId>
<version>v1-0.0.3</version>
</dependency>

Gradle

compile group: 'com.google.enterprise.cloudsearch',
        name: 'google-cloudsearch-indexing-connector-sdk',
        version: 'v1-0.0.3'

Tworzenie konfiguracji oprogramowania sprzęgającego

Każdy łącznik ma plik konfiguracyjny zawierający parametry używane przez łącznik, takie jak identyfikator repozytorium. Parametry są zdefiniowane jako pary klucz-wartość, np.api.sourceId=1234567890abcdef.

Pakiet SDK Google Cloud Search zawiera kilka dostarczonych przez Google parametrów konfiguracji używanych przez wszystkie oprogramowania sprzęgające. W pliku konfiguracyjnym musisz zadeklarować te parametry dostarczone przez Google:

W przypadku łącznika treści musisz zadeklarować parametry api.sourceId i api.serviceAccountPrivateKeyFile, ponieważ określają one lokalizację repozytorium i klucza prywatnego potrzebnego do uzyskania dostępu do repozytorium.

W przypadku łącznika tożsamości musisz zadeklarować api.identitySourceId, ponieważ ten parametr określa lokalizację zewnętrznego źródła tożsamości. Jeśli synchronizujesz użytkowników, musisz też zadeklarować api.customerId jako unikalny identyfikator konta Google Workspace Twojej firmy.

Jeśli nie chcesz zastępować domyślnych wartości innych parametrów dostarczonych przez Google, nie musisz deklarować ich w pliku konfiguracyjnym. Więcej informacji o parametrach konfiguracyjnych dostarczanych przez Google, np. o tym, jak generować określone identyfikatory i klucze, znajdziesz w artykule Parametry konfiguracyjne dostarczane przez Google.

Możesz też zdefiniować własne parametry specyficzne dla repozytorium, które będą używane w pliku konfiguracyjnym.

Przekazywanie pliku konfiguracji do oprogramowania sprzęgającego

Ustaw właściwość systemową config, aby przekazać plik konfiguracji do łącznika. Usługę możesz ustawić za pomocą argumentu -D podczas uruchamiania złącza. Na przykład to polecenie uruchamia łącznik z plikiem konfiguracyjnym MyConfig.properties:

java -classpath myconnector.jar;... -Dconfig=MyConfig.properties MyConnector

Jeśli tego argumentu brakuje, pakiet SDK próbuje uzyskać dostęp do domyślnego pliku konfiguracyjnego o nazwie connector-config.properties.

Określ strategię przechodzenia

Główną funkcją łącznika treści jest przeszukiwanie repozytorium i indeksowanie jego danych. Musisz wdrożyć strategię przechodzenia na podstawie rozmiaru i układu danych w repozytorium. Możesz zaprojektować własną strategię lub wybrać jedną z tych strategii zaimplementowanych w pakiecie SDK:

Strategia pełnego przeszukiwania

Strategia pełnego przeszukiwania skanuje całe repozytorium i indeksuje wszystkie elementy. Ta strategia jest zwykle stosowana, gdy masz małe repozytorium i możesz sobie pozwolić na pełne przeszukiwanie przy każdej indeksacji.

Ta strategia przechodzenia jest odpowiednia w przypadku małych repozytoriów zawierających głównie statyczne, niehierarchiczne dane. Możesz też użyć tej strategii przechodzenia, gdy wykrywanie zmian jest trudne lub nie jest obsługiwane przez repozytorium.

Strategia przechodzenia listy

Strategia przechodzenia po liście skanuje całe repozytorium, w tym wszystkie węzły podrzędne, i określa stan każdego elementu. Następnie oprogramowanie sprzęgające wykonuje drugie przejście i indeksuje tylko elementy, które są nowe lub zostały zaktualizowane od czasu ostatniego indeksowania. Ta strategia jest często używana do przeprowadzania przyrostowych aktualizacji istniejącego indeksu (zamiast pełnego przeszukiwania za każdym razem, gdy aktualizujesz indeks).

Ta strategia przechodzenia jest odpowiednia, gdy wykrywanie zmian jest trudne lub nie jest obsługiwane przez repozytorium, masz dane niehierarchiczne i pracujesz z bardzo dużymi zbiorami danych.

Przeszukiwanie grafu

Strategia przechodzenia po grafie skanuje cały węzeł nadrzędny, określając stan każdego elementu. Następnie oprogramowanie sprzęgające wykonuje drugie przejście i indeksuje tylko elementy w węźle głównym, które są nowe lub zostały zaktualizowane od czasu ostatniego indeksowania. Na koniec łącznik przekazuje identyfikatory podrzędne, a następnie indeksuje elementy w węzłach podrzędnych, które są nowe lub zostały zaktualizowane. Oprogramowanie sprzęgające kontynuuje rekursywnie wszystkie węzły podrzędne, dopóki nie zostaną przetworzone wszystkie elementy. Takie przechodzenie jest zwykle używane w przypadku repozytoriów hierarchicznych, w których wyświetlanie wszystkich identyfikatorów nie jest praktyczne.

Ta strategia jest odpowiednia, jeśli masz dane hierarchiczne, które wymagają indeksowania, np. serię katalogów lub stron internetowych.

Każda z tych strategii przechodzenia jest implementowana przez klasę łącznika szablonu w pakiecie SDK. Możesz wdrożyć własną strategię przechodzenia, ale te szablony znacznie przyspieszają tworzenie łącznika. Aby utworzyć łącznik za pomocą szablonu, przejdź do sekcji odpowiadającej strategii przechodzenia:

Tworzenie łącznika pełnego przeszukiwania za pomocą klasy szablonu
Tworzenie łącznika przechodzenia po liście za pomocą klasy szablonu
Tworzenie oprogramowania sprzęgającego do przechodzenia po grafie za pomocą klasy szablonu

Tworzenie łącznika pełnego przeszukiwania za pomocą klasy szablonu

Ta sekcja dokumentacji odnosi się do fragmentów kodu z przykładu FullTraversalSample.

Wdrażanie punktu wejścia oprogramowania sprzęgającego

Punktem wejścia do łącznika jest metoda main(). Głównym zadaniem tej metody jest utworzenie instancji klasy Application i wywołanie jej metody start() w celu uruchomienia oprogramowania sprzęgającego.

Przed wywołaniem funkcji application.start() użyj klasy IndexingApplication.Builder do utworzenia instancji szablonu FullTraversalConnector. Funkcja FullTraversalConnector przyjmuje obiekt Repository, którego metody implementujesz. Poniższy fragment kodu pokazuje, jak wdrożyć metodę main():

FullTraversalSample.java

Tworzenie łącznika treści Zadbaj o dobrą organizację dzięki kolekcji Zapisuj i kategoryzuj treści zgodnie ze swoimi preferencjami.

Tworzenie oprogramowania sprzęgającego treści za pomocą pakietu SDK Content Connector

Konfigurowanie zależności

Maven

Gradle

Tworzenie konfiguracji oprogramowania sprzęgającego

Przekazywanie pliku konfiguracji do oprogramowania sprzęgającego

Określ strategię przechodzenia

Tworzenie łącznika pełnego przeszukiwania za pomocą klasy szablonu

Wdrażanie punktu wejścia oprogramowania sprzęgającego

Zaimplementuj interfejs Repository.

Pobieranie parametrów konfiguracji niestandardowej

Przeprowadź pełne przeszukiwanie

Ustawianie uprawnień do elementu

Ustawianie metadanych elementu

Tworzenie elementu, który można indeksować

Zapakuj każdy indeksowany element w iterator

Następne kroki

Tworzenie łącznika przechodzenia po liście za pomocą klasy szablonu

Wdrażanie punktu wejścia oprogramowania sprzęgającego

Zaimplementuj interfejs Repository.

Pobieranie parametrów konfiguracji niestandardowej

Przejdź przez listę

Przesyłanie identyfikatorów produktów i wartości skrótu

Pobieranie i obsługa każdego elementu

Obsługa usuniętych elementów

Obsługa niezmienionych elementów

Ustawianie uprawnień do elementu

Ustawianie metadanych elementu

Tworzenie elementu, który można indeksować

Następne kroki

Tworzenie łącznika przechodzenia po grafie za pomocą klasy szablonu

Wdrażanie punktu wejścia oprogramowania sprzęgającego

Zaimplementuj interfejs Repository.

Pobieranie parametrów konfiguracji niestandardowej

Wykonaj przeszukiwanie grafu

Przesyłanie identyfikatorów produktów i wartości skrótu

Pobieranie i obsługa każdego elementu

Obsługa usuniętych elementów

Ustawianie uprawnień do elementu

Ustawianie metadanych elementu

Tworzenie elementu, który można indeksować

Umieszczanie identyfikatorów elementów podrzędnych w kolejce indeksowania Cloud Search

Następne kroki

Tworzenie oprogramowania sprzęgającego treści przy użyciu interfejsu API REST

Określ strategię przechodzenia

Wdrażanie strategii przechodzenia i indeksowanie elementów

Obsługa zmian w repozytorium

Tworzenie łącznika treści

Zaimplementuj interfejs `Repository`.

Zaimplementuj interfejs `Repository`.

Zaimplementuj interfejs `Repository`.