Puedes configurar Google Cloud Search para que muestre resultados del contenido local de SharePoint de tu organización, además del contenido de Google Workspace. Utilizas el conector de SharePoint On-Prem de Google Cloud Search y lo configuras para acceder a una fuente de datos específica de SharePoint.
Consideraciones importantes
Configuración de SharePoint respetada
El conector de SharePoint On-Prem de Cloud Search siempre respeta la configuración de visibilidad de búsqueda en SharePoint, que no se puede anular. En el caso de los documentos en borrador, los permisos de la cuenta de usuario (que el conector usa para acceder a SharePoint Online) controlan qué documentos en borrador se indexan y muestran. Si la cuenta solo tiene permisos de “lectura completa”, el conector respeta la configuración de “visibilidad de elementos en borrador” en SharePoint.
También puedes configurar el conector para limitar los resultados según el acceso a la cuenta del usuario. Puedes usar principales de Google y principales externos para definir LCA. Para aplicar recortes de seguridad para el contenido de SharePoint, sincroniza las siguientes identidades externas con el directorio de Google:
- Usuarios de Active Directory
- Grupos de Active Directory
- Grupos locales de SharePoint (con grupos y usuarios de Active Directory como miembros)
Para sincronizar los usuarios y grupos de AD, usa Google Cloud Directory Sync, que habilita los grupos de identidad asignados. Para sincronizar los grupos locales de SharePoint, usa el conector de identidad de SharePoint.
El conector también debe realizar la búsqueda con AD para obtener información adicional para sincronizar los principales. Por ejemplo, la búsqueda con AD permite que el conector haga lo siguiente:
- Asigna el SID de un grupo de dominio al sAMAccountName correspondiente.
- La asignación de un sAMAccountName de usuario a la dirección de correo electrónico para las membresías del grupo local de SharePoint
Optimización de la búsqueda
Para mejorar la experiencia de tus usuarios, configura el conector para que muestre resultados de la búsqueda más relevantes.
Para usar la API, establece valores para los parámetros de generación de HTML en el archivo de configuración del conector de SharePoint Online. Estos parámetros te permiten establecer qué campos tienen un impacto más alto o más bajo en las coincidencias.
Para configurar un esquema, sigue las instrucciones en Crea y registra un esquema. Cuando configuras un esquema, sucede lo siguiente:
Para asignar los nombres de los tipos de contenido de SharePoint a las definiciones de objetos correspondientes, el conector normaliza los nombres de los tipos de contenido mediante la exclusión de los caracteres no admitidos. En el caso de las definiciones de objetos, la API de Cloud Search solo admite A-Z, a-z y 0-9 como caracteres válidos. Por ejemplo, el tipo de contenido “Anuncios” se asigna a la definición del objeto “Anuncios”. El tipo de contenido "News Article" se asigna a "NewsArticle" (sin espacio).
Cuando el conector no puede hacer coincidir una definición de objeto con otra, usa el tipo de objeto de resguardo (
itemMetadata.objectType
). Obtén más información sobre los parámetros de configuración de metadatos.Para asignar los nombres de las propiedades de SharePoint a las definiciones de propiedades, el conector normaliza los nombres de las propiedades mediante la decodificación de los caracteres con codificación hexadecimal y la eliminación de los prefijos "ows_". Luego, excluye los caracteres no admitidos (todos los caracteres excepto A-Z, a-z y 0-9 como caracteres válidos).
Manejo de mensajes de Microsoft Outlook
Cuando el conector encuentra archivos .msg de Microsoft Outlook mientras indexa contenido, anula el tipo de contenido multimedia de los archivos y los indexa como application/vnd.ms-outlook.
.
Configuraciones de varios usuarios
Si tu SharePoint es una implementación de varias instancias, en la que se alojan varios sitios de clientes en la misma aplicación web, debes configurar el modo de colección de sitios en el archivo de configuración. En las implementaciones multiusuario, solo obtienes permisos para tu colección de sitios y no puedes obtener permisos de lectura completa, como lo requiere el conector de SharePoint On-Prem.
Para habilitar el modo de colección de sitios, haz lo siguiente:
- Otorga a la cuenta de usuario del conector permisos de administrador de la colección de sitios.
- Establece
sharepoint.server
en el archivo de configuración del conector en la URL de la colección de sitios, comohttp://sharepoint.example.com/sites/sitecollection
. No es necesario que la URL use exactamente el mismo caso que en SharePoint. - Configura
sharepoint.siteCollectionOnly
en el archivo de configuración del conector comotrue
.
Si tienes varias colecciones de sitios para indexar en un entorno de varias instancias, debes configurar una instancia del conector por cada una de las colecciones de sitios.
Limitaciones conocidas del conector
- El tiempo que tarda el conector en detectar cambios en los elementos de las bases de datos aumenta con la cantidad de bases de datos que supervisa el conector.
- El consumo de memoria aumenta con la cantidad de grupos y usuarios únicos que usas en las LCA para cada colección de sitios.
- Puedes configurar el conector con identidades de un solo dominio de Active Directory.
- Algunos principales comunes de Active Directory y Windows, como
Everyone
,BUILTIN\Users
yAll Authenticated Users
, no son compatibles. - Las notificaciones de eliminación no son instantáneas y un conector puede tardar más de 4 horas en reconocer que un usuario borró contenido del repositorio de origen.
Requisitos del sistema
Requisitos del sistema | |
---|---|
Sistema operativo |
|
Software |
|
Autenticación |
|
Implementa el conector
Requisitos previos
Crea una clave privada de Google Workspace, que contiene el ID de tu cuenta de servicio. Para obtener información sobre cómo obtener una clave privada, consulta Configura el acceso a la API de Google Cloud Search.
Tu administrador de Google Workspace debe agregar una fuente de datos en la que se buscará. Registra el ID de la fuente de datos.
Si el conector muestra resultados basados en LCA (los resultados no son públicos), el administrador de Google Workspace debe crear dos fuentes de identidad y proporcionarte sus IDs:
- Una fuente de identidad para sincronizar los usuarios y grupos de Active Directory
- Una fuente de identidad para los grupos locales de SharePoint
El administrador también debe obtener el ID de cliente de Google Workspace de tu organización y proporcionarte el ID.
Obtén información para obtener estos valores en Asignar identidades de usuarios en Cloud Search.
Configura una cuenta de usuario para el conector que tenga permisos de lectura completa en la aplicación web de SharePoint en la política del usuario.
Si la aplicación web de SharePoint no tiene una colección de sitios raíz, crea una.
Si alguna colección de sitios tiene bloqueo de escritura, accede al servidor de SharePoint con una cuenta que tenga privilegios de administrador y ejecuta la secuencia de comandos
PrepareWriteLockedSites.ps1
.Para obtener métricas de la fuente de datos que te permitan definir la configuración del conector, accede al servidor de SharePoint con una cuenta que tenga privilegios de administración de la granja y ejecuta
diagnose_sp.ps1
.El resultado informa la cantidad de aplicaciones web, documentos y membresías de grupos de usuarios. Usa esta información para estimar la cantidad de instancias de conectores que necesitas, los requisitos de memoria y el recuento de documentos.
Paso 1: Instala el software del conector de SharePoint On-Prem de Google Cloud Search.
Clona el repositorio del conector desde GitHub.
$ git clone https://github.com/google-cloudsearch/sharepoint-connector.git $ cd sharepoint-connector
Consulta la versión deseada del conector:
$ git checkout tags/latest_version
Dónde:
latest_version
= un valor comov1-0.0.5
Compila el conector.
$ mvn package
Para omitir las pruebas cuando compilas el conector, ejecuta
mvn package -DskipTests
en lugar demvn package
.Copia el archivo ZIP del conector en el directorio de instalación local:
$ cp target/google-cloudsearch-sharepoint-connector-latest_version.zip installation-dir $ cd installation-dir $ unzip google-cloudsearch-sharepoint-connector-latest_version.zip $ cd google-cloudsearch-sharepoint-connector-latest_version
Paso 2: Crea el archivo de configuración del conector de SharePoint On-Prem
En el mismo directorio que la instalación del conector, crea un archivo. Google recomienda que al archivo le pongas el nombre
connector-config.properties
para que no se necesiten parámetros de línea de comandos adicionales para ejecutar el conector. Si planeas ejecutar muchas instancias de conectores, agrega detalles al nombre para distinguirlo.Agrega parámetros como pares clave-valor al contenido del archivo, como en el siguiente ejemplo:
### Sharepoint On-Prem Connector configuration ### # Required parameters for data source access api.sourceId=08ef8becd116faa4546b8ca2c84b2879 api.serviceAccountPrivateKeyFile=service_account.json api.identitySourceId=08ef8becd116faa475de26d9b291fed9 # Required parameters for SharePoint on-premises access sharepoint.server=http://sp-2016:32967/sites/doc-center-site-collection sharepoint.siteCollectionOnly=true sharepoint.username=contoso\\admin sharepoint.password=pa$sw0rd sharepoint.stripDomainInUserPrincipals=true # Required parameters for AD lookup adLookup.host=dc.contoso.com adLookup.username=contoso\\admin adLookup.password=pa$sw0rd api.referenceIdentitySources=CONTOSO,contoso api.referenceIdentitySource.contoso.id=08ef8becd116faa5d3783f8c5a80e5aa api.referenceIdentitySource.CONTOSO.id=08ef8becd116faa5d3783f8c5a80e5aa # Optional parameters for schema mapping contentTemplate.sharepointItem.title=Title contentTemplate.sharepointItem.unmappedColumnsMode=APPEND
Para obtener descripciones detalladas de cada parámetro, consulta la referencia de los parámetros de configuración.
(Opcional) Configura parámetros de conector adicionales según sea necesario. Para obtener más información, consulta Parámetros de conectores que proporciona Google.
Paso 3: Para HTTPS, agrega SharePoint como un host confiable
Si SharePoint está configurado para usar HTTPS, obtén un certificado de SharePoint para agregarlo como un host confiable para el conector.
En la computadora en la que se ejecutará el conector, abre un navegador y ve a SharePoint.
En la página de advertencia que se abre, haz clic en Comprendo los riesgos y Agregar excepción. La página muestra un mensaje como “Esta conexión no es de confianza” (This Connection is Untrusted) porque el certificado está autofirmado y no está firmado por una autoridad certificadora de confianza.
Una vez que el botón Ver esté disponible, haz clic en él.
Ve a la pestaña Detalles y haz clic en Exportar.
Guarda el certificado en el directorio del conector con el nombre
sharepoint.crt
.Haz clic en Cerrar y, luego, en Cancelar para cerrar las ventanas.
Abre un símbolo del sistema y, luego, ingresa el siguiente comando:
$ keytool -importcert -keystore cacerts.jks -storepass changeit -file sharepoint.crt -alias sharepoint
Cuando aparezca la pregunta “¿Confías en este certificado?”, responde sí.
Paso 4: Configura el registro
En el directorio que contiene el objeto binario del conector, crea una carpeta llamada
logs
.En el mismo directorio (no
logs
), crea un archivo con codificación Latin1 llamadologging.properties
.Agrega el siguiente texto a
logging.properties
:handlers = java.util.logging.ConsoleHandler,java.util.logging.FileHandler # Default log level .level = INFO # uncomment line below to increase logging level for SharePoint APIsa #com.google.enterprise.cloudsearch.sharepoint.level=FINE # uncomment line below to increase logging level to enable API trace #com.google.api.client.http.level = FINE java.util.logging.ConsoleHandler.level = INFO java.util.logging.FileHandler.pattern=logs/connector-sharepoint.%g.log java.util.logging.FileHandler.limit=10485760 java.util.logging.FileHandler.count=10 java.util.logging.FileHandler.formatter=java.util.logging.SimpleFormatter
Paso 5: Configura el conector de identidad de SharePoint On-Prem
Este paso es obligatorio para aplicar las LCA basadas en identidades de SharePoint On-Prem a los resultados de la búsqueda. Si configuras el conector con ACL públicas, puedes omitir este paso.
En el mismo directorio que la instalación del conector de SharePoint Online, crea un archivo y asígnale el nombre
sharepoint-onprem-identity-connector.config
.Agrega parámetros como pares clave-valor al contenido del archivo, como en el siguiente ejemplo:
### SharePoint On-prem identity connector configuration ### # Required parameters for data source access api.customerId=C05d3djk8 api.serviceAccountPrivateKeyFile=service_account.json api.identitySourceId=08ef8becd116faa475de26d9b291fed9 # Required parameters for SharePoint access sharepoint.server=http://sp-2016:32967/sites/doc-center-site-collection sharepoint.siteCollectionOnly=true sharepoint.username=contoso\\admin sharepoint.password=pa$sw0rd sharepoint.stripDomainInUserPrincipals=true # Required parameters for AD lookup adLookup.host=dc.contoso.com adLookup.username=contoso\\admin adLookup.password=pa$sw0rd api.referenceIdentitySources=CONTOSO,contoso api.referenceIdentitySource.contoso.id=08ef8becd116faa5d3783f8c5a80e5aa api.referenceIdentitySource.CONTOSO.id=08ef8becd116faa5d3783f8c5a80e5aa
Los valores son casi los mismos que los del conector de SharePoint On-Prem, excepto que, en lugar de
api.sourceId
, el parámetro esapi.customerId
. El valor deapi.customerId
es el ID de cliente que obtuviste de tu administrador de Google Workspace.
Paso 6: Inicia el conector de SharePoint On-Prem
En los siguientes pasos, asignarás los principales de Active Directory local y la colección de sitios de SharePoint a identidades en el servicio de Cloud Identity. Esta sincronización se realiza con Google Cloud Directory Sync (GCDS) y el conector de identidad de SharePoint On-Prem.
Después de que GCDS sincronice los usuarios y los grupos, para sincronizar los grupos de colecciones de sitios de SharePoint, ejecuta el conector de identidad de SharePoint On-Prem. Por último, ejecuta el conector de SharePoint On-Prem para indexar y entregar resultados a tus usuarios de Cloud Search.
Si aún no lo hiciste, configura y ejecuta GCDS. Asegúrate de habilitar los grupos con identidades asignadas.
Ejecuta el conector de identidad de SharePoint On-Prem:
$ java -Djava.util.logging.config.file=logging.properties -cp "google-cloudsearch-sharepoint-connector-version.jar" com.google.enterprise.cloudsearch.sharepoint.SharePointIdentityConnector -Dconfig=sharepoint-onprem-identity-connector.config
Ejecuta el conector de SharePoint On-Prem. Usa la sintaxis del comando para la seguridad de tu sitio de SharePoint:
HTTP (no se requiere un host de confianza):
$ java -Djava.util.logging.config.file=logging.properties -jar google-cloudsearch-sharepoint-connector-v1-version.jar
HTTPS (agrega SharePoint como el host de confianza):
$ java -Djavax.net.ssl.trustStore=cacerts.jks -Djavax.net.ssl.trustStoreType=jks -Djavax.net.ssl.trustStorePassword=changeit -Djava.util.logging.config.file=logging.properties -jar google-cloudsearch-sharepoint-connector-v1-version.jar
Referencia de los parámetros de configuración
Acceso a la fuente de datos
Configuración | Parámetro |
ID de la fuente de datos | api.sourceId=1234567890abcdef
Obligatorio. El ID de la fuente de datos de Google Cloud Search que configura el administrador de Google Workspace |
Ruta de acceso al archivo de claves privadas de la cuenta de servicio | api.serviceAccountPrivateKeyFile=PrivateKey.json
Obligatorio. Es la ruta de acceso al archivo de claves de la cuenta de servicio de Google Cloud Search. |
Acceso a SharePoint On-Prem
Configuración | Parámetro |
URL del servidor de SharePoint | sharepoint.server=http://yoursharepoint.example.com/
Obligatorio. La URL del servidor de SharePoint como un nombre de host completo, como http://tusharepoint.example.com/. Si el nombre de host no está completo, debes configurar la anulación de DNS en el host del conector. |
Nombre de usuario de SharePoint | sharepoint.username=YOURDOMAIN\\ConnectorUser
Es obligatorio cuando ejecutas el conector en Linux o una máquina de Windows que no forma parte del dominio AD del servidor de SharePoint. |
Contraseña de SharePoint | sharepoint.password=user_password
Es obligatorio cuando ejecutas el conector en Linux o una máquina de Windows que no forma parte del dominio AD del servidor de SharePoint. |
Usa la autenticación en vivo para conectarte a SharePoint | sharepoint.username=AdaptorUser Live Authentication Id
|
Usa la autenticación de ADFS para conectarte a SharePoint | sharepoint.username=AdaptorUser@yourdomain.com
|
Indexación de colecciones de sitios
Configuración | Parámetro |
Tipo de índice | sharepoint.siteCollectionOnly=boolean
Opcional, excepto para las implementaciones de SharePoint multiusuario (obtén más información). Establece este valor en verdadero para que el conector indexe |
Asignación de identidad de SharePoint
Configuración | Parámetro |
ID de la fuente de identidad | api.identitySourceId=1234567890abcdef
Obligatorio. ID de fuente de identidad para sincronizar grupos locales de SharePoint.El ID de fuente de Google Cloud Search configurado por el administrador de Google Workspace, como se describe en Agregar fuentes de datos en las que se buscará. |
Fuentes de identidad de referencia | api.referenceIdentitySources=CONTOSO,contoso
Es una lista de fuentes de identidad de referencia para principales de Active Directory delimitada por comas. El valor coincide con el nombre NETBIOS de Active Directory de los principales de Active Directory de referencia. |
ID de las fuentes de identidad de referencia | api.referenceIdentitySource.DOMAIN.id=identity-source-id
Obligatorio. El ID de la fuente de identidad para sincronizar los principales de Active Directory |
Búsqueda de Active Directory
Configuración | Parámetro |
Host de Active Directory | adLookup.host=host
Obligatorio. Nombre de host de Active Directory, como dc.contoso.com, o dirección IP |
Puerto de búsqueda de Active Directory | adLookup.port=port
Opcional. El valor predeterminado es 389. Usa 686 para SSL. |
Método de búsqueda de Active Directory | adLookup.method=value
Opcional. El valor predeterminado es "standard". Para las conexiones HTTPS, configúralo como "ssl". |
Usuario de búsqueda de Active Directory | adLookup.username=CONTOSO\user1
Obligatorio. Usuario autorizado para realizar búsquedas de Active Directory |
Contraseña de búsqueda de Active Directory | adLookup.password=password123
Obligatorio. Contraseña para el usuario especificado por |
Generación de contenido HTML
Configuración | Parámetro |
Campo de título de plantilla HTML | contentTemplate.sharePointItem.title=Title
Es el campo de SharePoint que se usará como el título de la plantilla HTML para el HTML generado. |
Campos de alta calidad de búsqueda de contenido HTML | contentTemplate.sharePointItem.quality.high=highField1[,highField2,...]
Es una lista separada por comas de los campos que se incluirán en el HTML generado como campos de alta calidad. Cuando los términos de la búsqueda coinciden con estos campos, los resultados se clasifican en una posición superior. |
Campos de calidad media de búsqueda de contenido HTML | contentTemplate.sharePointItem.quality.medium=mediumField1[,mediumField2,...]
Es una lista de campos separados por comas que se incluirán en el HTML generado como campos de calidad media. |
Campos de baja calidad de búsqueda de contenido HTML | contentTemplate.sharePointItem.quality.low=lowField1[,lowField2,...]
Es una lista separada por comas de los campos que se incluirán en el HTML generado como campos de baja calidad. |
Columnas sin asignar de contenido HTML | contentTemplate.sharepointItem.unmappedColumnsMode=APPEND
Cómo maneja el conector las columnas no asignadas El valor es APPEND (predeterminado) o IGNORE.
|