Możesz skonfigurować Google Cloud Search tak, aby zwracał wyniki z zasobów Microsoft Windows organizacji oprócz treści z Google Workspace. Użyj łącznika Google Cloud Search File Systems i skonfiguruj go tak, aby uzyskać dostęp do określonych udziałów Windows. Jedna instancja łącznika może obsługiwać wiele udziałów Microsoft Windows.
Ważne kwestie
Ciągłe automatyczne aktualizacje
Domyślnie oprogramowanie sprzęgające stale monitoruje ścieżki początkowe (wartości z fs.src
w pliku konfiguracyjnym oprogramowania sprzęgającego) podczas uruchamiania. Gdy system plików zgłasza zmiany w kontroli treści lub dostępu, powoduje to ponowne zindeksowanie systemu plików przez konektor. Ponownie przeszukiwanie może wymagać wielu zasobów. Aby wyłączyć monitorowanie systemu plików, ustaw fs.monitorForUpdates
na false
. Znacznie zmniejszysz wykorzystanie zasobów przez usługę łączoną, ale opóźnisz moment, w którym usługa połączona uwzględni zmiany. Więcej informacji
Kontrola dostępu DFS
System DFS stosuje kontrolę dostępu do swoich połączeń i zazwyczaj każde połączenie DFS ma własną listę ACL. Jednym z mechanizmów używanych przez DFS jest enumeracja oparta na dostępie (ABE), która może ograniczać linki DFS zwracane użytkownikowi. Użytkownicy mogą uzyskać tylko podzbiór połączeń DFS lub nawet tylko jedno połączenie, gdy ABE izoluje hostowane katalogi domowe. Gdy łącznik przechodzi przez system DFS, uwzględnia listę kontroli dostępu DFS i listę kontroli dostępu do udostępniania docelowego, a lista kontroli dostępu do udostępniania dziedziczy listę kontroli dostępu DFS.
Znane ograniczenia
- System plików: łącznik System plików nie obsługuje dysków mapowanych ani dysków lokalnych.
- Rozproszony system plików: skonfigurowany dysk mapowany do UNC DFS nie działa prawidłowo. Niektóre listy ACL nie są odczytywane prawidłowo.
- Oprogramowanie sprzęgające systemy plików obsługuje nazwy Namespaces i linki Distributed File System (DFS). Jednak łącznik obsługuje linki DFS tylko w przestrzeni nazw DFS, a nie zwykłe foldery w tej przestrzeni.
- Linki do plików zwracane na stronie cloudsearch.google.com nie są klikalne. Linki do plików zwracane przez Query API nie są klikalne w większości przeglądarek.
Wymagania systemowe
Wymagania systemowe | |
---|---|
System operacyjny |
|
Oprogramowanie |
|
Protokoły systemu plików |
Nieobsługiwane: lokalne systemy plików Windows, Sun Network File System (NFS) 2.0, Sun Network File System (NFS) 3.0 lub lokalny system plików Linux. |
Wdrażanie oprogramowania sprzęgającego
Wymagania wstępne
Zanim wdrożysz łącznik Cloud Search File Systems, upewnij się, że w Twoim środowisku znajdują się wszystkie te wymagane komponenty:
Informacje Google Workspace wymagane do ustanowienia relacji między Google Cloud Search a źródłem danych:
- klucz prywatny Google Workspace (zawierający identyfikator konta usługi). Informacje o uzyskiwaniu klucza prywatnego znajdziesz w artykule Konfigurowanie dostępu do interfejsu Google Cloud Search API REST.
- Identyfikator źródła danych Google Workspace. Informacje o uzyskiwaniu identyfikatora źródła danych znajdziesz w artykule Dodawanie źródła danych do wyszukiwania.
- Identyfikator źródła tożsamości. Informacje o tym, jak uzyskać identyfikator źródła tożsamości, znajdziesz w artykule Tworzenie źródła tożsamości. Jeśli synchronizujesz katalog Google Workspace z Active Directory, skonfiguruj źródło tożsamości za pomocą GCDS.
Te dane logowania może Ci zwykle udostępnić administrator Google Workspace Twojej organizacji.
Upewnij się, że konto Windows ma wystarczające uprawnienia, jak opisano w sekcji poniżej.
Wymagane uprawnienia konta Microsoft Windows
Konto Microsoft Windows, na którym działa sprzęg, musi mieć wystarczające uprawnienia do wykonywania tych czynności:
- Wyświetlanie listy zawartości folderów
- czytać zawartość dokumentów,
- odczytywać atrybuty plików i folderów;
- uprawnienia do odczytu (listy ACL) zarówno plików, jak i folderów;
- Uprawnienia do zapisu atrybutów podstawowych
Członkostwo w jednej z tych grup zapewnia kontom systemu Windows wystarczające uprawnienia potrzebne do działania łącznika:
- Administratorzy
- Zaawansowani użytkownicy
- Operatorzy drukowania
- Operatorzy serwerów
Krok 1. Instalowanie łącznika systemów plików Google Cloud Search
Pobierz repozytorium usługi łącznika z GitHuba i je skompiluj.
Aby używać Gita na serwerze z systemem Windows:
Sklonuj repozytorium:
> git clone https://github.com/google-cloudsearch/windows-filesystems-connector.git > cd windows-filesystems-connector
Pobierz odpowiednią wersję oprogramowania sprzęgającego:
> git checkout tags/v1-0.0.3
Aby pobrać bezpośrednio z GitHuba:
- Wejdź na https://github.com/google-cloudsearch/windows-filesystems-connector.
- Kliknij Klonuj lub pobierz Pobierz plik ZIP.
- Rozpakuj pakiet.
- Przejdź do nowego katalogu:
> cd windows-filesystems-connector
Utwórz oprogramowanie sprzęgające. W razie potrzeby zainstaluj Apache Maven.
> mvn package
Aby pominąć testy podczas kompilowania łącznika, uruchom
mvn package -DskipTests
zamiastmvn package
.Skopiuj plik ZIP z oprogramowaniem sprzęgającym do lokalnego katalogu instalacji:
> cp target/google-cloudsearch-windows-filesystems-connector-v1-0.0.3.zip installation-dir > cd installation-dir > unzip google-cloudsearch-windows-filesystems-connector-v1-0.0.3.zip > cd google-cloudsearch-windows-filesystems-connector-v1-0.0.3
Krok 2. Tworzenie pliku konfiguracji oprogramowania sprzęgającego
W tym samym katalogu, w którym zainstalowano usługę łącznika, utwórz plik o nazwie
connector-config.properties
.Dodaj parametry jako pary klucz-wartość do zawartości pliku, jak w tym przykładzie:
### File system connector configuration ### # Required parameters for Cloud Search data source and identity source access api.serviceAccountPrivateKeyFile=/path/to/file.json api.sourceId=0123456789abcde api.identitySourceId=a1b1c1234567 # Required parameters for file system access fs.src=\\\\host\\share;\\\\dfshost\\dfsnamespace;\\\\dfshost\\dfsnamespace\\link # Optional parameters for file system monitoring traverse.abortAfterExceptions=500 fs.monitorForUpdates = true fs.preserveLastAccessTime = IF_ALLOWED
Szczegółowe opisy poszczególnych parametrów znajdziesz w dokumentacji parametrów konfiguracji.
(Opcjonalnie) W razie potrzeby skonfiguruj inne parametry łącznika. Szczegółowe informacje znajdziesz w sekcji Parametry złącza dostarczanego przez Google.
Krok 3. Włącz logowanie
- W katalogu zawierającym plik binarny oprogramowania sprzęgającego utwórz folder o nazwie
logs
. Utwórz plik o nazwie
logging.properties
w formacie ASCII lub UTF-8 w katalogu zawierającym plik binarny łącznika i dodaj do niego tę treść:handlers = java.util.logging.ConsoleHandler,java.util.logging.FileHandler # Default log level .level = WARNING com.google.enterprise.cloudsearch.level = INFO com.google.enterprise.cloudsearch.fs.level = INFO # uncomment line below to increase logging level to enable API trace #com.google.api.client.http.level = FINE java.util.logging.ConsoleHandler.level = INFO java.util.logging.FileHandler.pattern=logs/connector-fs.%g.log java.util.logging.FileHandler.limit=10485760 java.util.logging.FileHandler.count=10 java.util.logging.FileHandler.formatter=java.util.logging.SimpleFormatter
Krok 4. (Opcjonalnie) Konfigurowanie typów mediów
Domyślnie oprogramowanie sprzęgające próbuje wykryć typ multimediów dla każdego pliku za pomocą funkcji wykrywania typu multimediów udostępnianej przez JDK. W systemie Microsoft Windows JDK korzysta z rejestru systemu Windows, aby określić typy mediów dla plików. Brak wpisu w rejestrze może spowodować, że w przypadku niektórych plików typ multimediów będzie miał wartość null.
W razie potrzeby możesz określić typ zawartości, który zastąpi wszystkie istniejące powiązania lub uniemożliwi użycie typu null.
- W katalogu usługi tworzenia raportów utwórz plik
mime-type.properties
zaszyfrowany za pomocą kodowania Latin-1. Wpisz rozszerzenia plików i odpowiadające im typy multimediów, jak w poniższych przykładach:
xlsx=application/vnd.openxmlformats-officedocument.spreadsheetml.sheet one=application/msonenote txt=text/plain pdf=application/pdf
Krok 5. Uruchom oprogramowanie sprzęgające Systemy plików
Po zainstalowaniu i skonfigurowaniu łącznika File Systems uruchom go na hoście, wpisując polecenie podobne do tego:
> java -jar google-cloudsearch-windows-filesystems-connector-v1-0.0.3.jar -Djava.util.logging.config.file=logging.properties[ -Dconfig=my.config]
Podaj ścieżkę do pliku konfiguracyjnego, jeśli jest inna niż domyślna (w tym samym katalogu co plik binarny o nazwie connector-config.properties
).
Informacje o parametrach konfiguracji
Dostęp do źródła danych
Ustawienie | Parametr |
Identyfikator źródła danych | api.sourceId=1234567890abcdef
Wymagane. Identyfikator źródła Google Cloud Search skonfigurowany przez administratora Google Workspace. |
Ścieżka do pliku klucza prywatnego konta usługi | api.serviceAccountPrivateKeyFile=./PrivateKey.json
Wymagane. Plik klucza konta usługi Google Cloud Search do obsługi szyfrowania w przypadku szyfrowania w systemie plików Google Cloud Search. |
Identyfikator źródła tożsamości | api.identitySourceId=x0987654321
Wymagane. Identyfikator źródła tożsamości Cloud Search skonfigurowany przez administratora Google Workspace do synchronizowania tożsamości w Active Directory za pomocą GCDS. |
Dostęp do systemu plików
Ustawienie | Parametr |
Systemy plików źródłowych | fs.src=path1[,path2, ...]
Wymagane. Podaj systemy plików źródłowych jako co najmniej 1 źródło UNC rozdzielone separatorem skonfigurowanym za pomocą opcji |
Znak separatora ścieżki
Ustawienie | Parametr |
Znak separatora ścieżki | fs.src.separator=separator-character
Domyślnym separatorem jest „;”. Jeśli ścieżki źródłowe zawierają średniki, możesz ustawić inny separator, np. przecinek („,”), który nie koliduje ze znakami w ścieżkach i nie jest zarezerwowany przez samą składnię pliku z właściwościami. Jeśli wartość |
Działanie oprogramowania sprzęgającego
Ustawienie | Parametr |
Domena Windows | fs.supportedDomain=domain
Wymagane, aby umożliwić użytkownikom skonfigurowanym za pomocą GCDS dostęp do dokumentów za pomocą Cloud Search. Podaj jako jedną nazwę NetBIOS domeny Active Directory. |
Dodawanie kont do listy ACL | fs.supportedAccounts=account-1[, account-2,...]
Lista kont oddzielonych przecinkami, które mają być uwzględnione w regułach dostępu, niezależnie od tego, czy są to konta wbudowane. Wartością domyślną jest |
Wykluczanie kont wbudowanych z list dostępu | fs.builtinGroupPrefix=prefix
Określ przedrostek kont wbudowanych. Konto, które zaczyna się od tego prefiksu, jest uważane za wbudowane i nie jest uwzględniane na listach kontroli dostępu. Wartością domyślną jest |
Zezwalanie na indeksowanie ukrytych plików i folderów | fs.crawlHiddenFiles=boolean
Ustaw na |
Zezwalanie na indeksowanie zindeksowanych folderów i wyliczeń w ramach przestrzeni nazw DFS | fs.indexFolders=boolean
Gdy wartość to |
Włączanie monitorowania zmian w systemie plików | fs.monitorForUpdates=boolean
Gdy wartość wynosi |
Ustawianie maksymalnego rozmiaru pamięci podręcznej katalogów | fs.directoryCacheSize=number-of-entries
Maksymalny rozmiar pamięci podręcznej katalogu. Połączenie używa pamięci podręcznej do identyfikowania ukrytych folderów, aby uniknąć indeksowania plików i folderów w ukrytych folderach. Domyślnie jest to 50 tys. wpisów, które zajmują zwykle 10–15 MB pamięci RAM. |
Zachowanie sygnatury czasowej i kontrola indeksowania
Ustawienie | Parametr |
Zachowaj sygnaturę czasową ostatniego dostępu | fs.preserveLastAccessTime=value
Podczas indeksowania plików i folderów przez konwerter może on zmienić sygnaturę czasową ostatniego dostępu do plików i folderów na czas indeksowania. Jeśli czasy ostatniego dostępu nie są zachowywane, systemy kopii zapasowych i archiwów mogą nie przenosić odpowiednich plików i folderów do pamięci podręcznej z powodu wizyty wtyczki. Domyślnie łącznik próbuje zachować czas ostatniego dostępu ( Możliwe wartości:
|
indeksowanie tylko plików, do których dostęp uzyskano po określonej dacie; | fs.lastAccessedDate=YYYY-MM-DD
Przeskanuj treści tylko wtedy, gdy czas ostatniego dostępu jest późniejszy niż podana data. Wartością domyślną jest Podaj datę w formacie ISO8601: RRRR-MM-DD. Jeśli np. wartość to 2010-01-01, łącznik indeksuje tylko treści, do których dostęp uzyskano po 1 stycznia 2010 r. Jeśli określisz wartość |
Przeszukiwanie tylko plików, do których dostęp był uzyskiwany w ciągu określonej liczby dni | fs.lastAccessedDays=number-of-days
Przeszukiwać treści tylko wtedy, gdy czas ostatniego dostępu jest mniejszy niż podana liczba dni. Wartością domyślną jest Użyj tej właściwości, aby wygasić wcześniej zindeksowane treści, do których od jakiegoś czasu nie ma dostępu. Ustaw na przykład wartość 365, aby indeksować treści tylko wtedy, gdy były one dostępne w ciągu ostatniego roku. Jeśli określisz wartość |
indeksowanie tylko plików, które zostały zmodyfikowane po określonej dacie; | fs.lastModifiedDate=YYYY-MM-DD
Przeskanuj treści tylko wtedy, gdy czas ostatniej modyfikacji jest późniejszy niż wskazana data. Wartością domyślną jest Podaj datę w formacie ISO8601: RRRR-MM-DD. Jeśli np. wartość to 2010-01-01, łącznik indeksuje tylko treści, które zostały zmodyfikowane po 1 stycznia 2010 r. Jeśli określisz wartość |
Przeszukiwanie tylko plików, które zostały zmodyfikowane w ciągu określonej liczby dni | fs.lastModifiedDays=number-of-days
Przeszukiwaj treści tylko wtedy, gdy czas ostatniej modyfikacji mieści się w okresie określonym w liczbie dni przed datą bieżącą. Wartością domyślną jest Użyj tej właściwości, aby wygasić wcześniej zindeksowane treści, które od jakiegoś czasu nie zostały zmodyfikowane. Ustaw na przykład wartość 365, aby indeksować treści tylko wtedy, gdy zostały one zmodyfikowane w ciągu ostatniego roku. Jeśli określisz wartość |
Pomiń kontrolę dostępu do udostępniania plików
Domyślnie sprzęg dba o integralność kontroli dostępu, gdy wysyła listy kontroli dostępu (ACL) do interfejsu indeksowania API, w tym listy ACL na udostępnieniu pliku. W niektórych konfiguracjach jednak łącznik może nie mieć wystarczających uprawnień do odczytu uprawnień ACL udziału. W takich przypadkach w wynikach wyszukiwania nie są wyświetlane żadne pliki przechowywane w tym udostępnieniu plików.
Możesz skonfigurować usługę łączenie tak, aby ignorowała listę kontroli dostępu do udostępniania, dzięki czemu treści będą zawsze zwracane w wynikach wyszukiwania. W tym przypadku interfejs API indeksowania otrzymuje listę ACL udostępniania z pełną kontrolą dostępu, a nie rzeczywistą listę ACL udostępniania.
Ustawienie | Parametr |
Pomiń kontrolę dostępu do udostępniania plików | fs.skipShareAccessControl=boolean
Ustaw na |