Améliorer la qualité de la recherche

La qualité de la recherche fait référence à la qualité des résultats de recherche en termes de classement et de rappel, telle que perçue par l'utilisateur qui effectue la requête de recherche.

Le classement fait référence à l'ordre des éléments, et le rappel au nombre d'éléments pertinents récupérés. Un élément (également appelé "document") désigne tout contenu numérique que Google Cloud Search peut indexer. Les types d'éléments incluent les documents Microsoft Office, les fichiers PDF, une ligne dans une base de données, des URL uniques, etc. Un élément se compose des éléments suivants:

  • Métadonnées structurées
  • Contenu indexable
  • LCA

Cloud Search utilise différents signaux pour récupérer et classer les résultats de recherche, c'est-à-dire les éléments renvoyés par une requête de recherche. Vous pouvez influencer les signaux de Cloud Search via les paramètres du schéma, le contenu et les métadonnées de l'élément (lors de l'indexation) et l'application de recherche. L'objectif de ce document est de vous aider à améliorer la qualité de recherche en modifiant ces facteurs d'influence des signaux.

Pour obtenir un récapitulatif des paramètres recommandés et facultatifs, consultez la section Récapitulatif des paramètres de qualité de recherche recommandés et facultatifs.

Influencer le score de pertinence

La pertinence fait référence à la pertinence d'un résultat de recherche par rapport aux termes de la requête d'origine. La pertinence d'un élément est calculée en fonction des critères suivants:

  • Importance de chaque terme de requête.
  • Nombre de résultats (nombre de fois où un terme de requête apparaît dans le contenu ou les métadonnées de l'élément).
  • Type de correspondances du terme de requête et de ses variantes avec un élément indexé dans Cloud Search.

Pour influencer le score de pertinence d'une propriété textuelle, définissez RetrievalImportance sur la propriété textuelle dans votre schéma. Une correspondance sur un établissement avec un RetrievalImportance élevé génère un score plus élevé qu'une correspondance sur un établissement avec un RetrievalImportance faible.

Par exemple, imaginons que vous disposiez d'une source de données présentant les caractéristiques suivantes:

  • La source de données permet de stocker l'historique des bugs logiciels.
  • Chaque bug possède un nom, une description et une priorité.

La plupart des utilisateurs interrogent cette source de données à l'aide du nom de l'erreur. Vous devez donc définir RetrievalImportance sur le nom sur HIGHEST dans le schéma.

À l'inverse, la plupart des utilisateurs ne peuvent pas interroger cette source de données à l'aide de la description du bug. Définissez donc RetrievalImportance sur la description sur DEFAULT. Voici un exemple de schéma contenant des paramètres RetrievalImportance.

{
  "objectDefinitions": [
    {
      "name": "issues",
      "propertyDefinitions": [
        {
          "name": "summary",
          "textPropertyOptions": {
            "retrievalImportance": {
              "importance": HIGHEST
              }
            }
          },
        {
          "name": "description",
          "textPropertyOptions": {
            "retrievalImportance": {
              "importance": DEFAULT
              }
            }
          },
        {
          "name": "label",
            "isRepeatable": true,
          "textPropertyOptions": {
            "retrievalImportance": {
              "importance": DEFAULT
              }
            }
          },
        {
          "name": "comments",
          "textPropertyOptions": {
            "retrievalImportance": {
              "importance": DEFAULT
              }
            }
          },
        {
          "name": "project",
          "textPropertyOptions": {
            "retrievalImportance": {
              "importance": HIGH
              }
            }
          },
        {
          "name": "duedate",
          "datePropertyOptions": {
          }
        },
        ...
      ]
    }
  ]
}

Dans le cas des documents HTML, des balises telles que <title> et <h1>, ainsi que des paramètres de mise en forme tels que la taille de la police et le gras, sont utilisées pour déterminer l'importance de divers termes. Si ContentFormat est TEXT, ItemContent a une importance de récupération DEFAULT. Si le code est HTML, son importance de récupération est déterminée en fonction des propriétés HTML.

Influencer la fraîcheur

Le niveau d'actualisation mesure à quel point un élément a été modifié récemment et est déterminé par les propriétés createTime et updateTime dans ItemMetadata. Les articles plus anciens sont rétrogradés dans les résultats de recherche.

Vous pouvez influer sur la façon dont la fraîcheur est calculée pour un objet en ajustant les freshnessProperty et freshnessDuration de FreshnessOptions dans le schéma.

freshnessProperty vous permet d'utiliser des propriétés de date ou d'horodatage pour calculer la fraîcheur au lieu de updateTime par défaut.

Dans notre exemple précédent d'un système de suivi des bugs logiciels, la date limite peut être utilisée comme freshnessProperty afin que les éléments dont la date limite est la plus proche de la date actuelle soient considérés comme "plus récents" et obtiennent une amélioration du classement. Voici un exemple de schéma contenant des paramètres freshnessProperty:

{
  "objectDefinitions": [
    {
      "name": "issues",
      "options": {
        "freshnessOptions": {
          "freshnessProperty": "duedate"
        }
      },
      "propertyDefinitions": [
        {
          "name": "summary",
          "textPropertyOptions": {
            "retrievalImportance": {
              "importance": HIGHEST
            }
          }
        },
        {
          "name": "duedate",
          "datePropertyOptions": {
          }
        },
        ...
      ]
    }
  ]
}

Utilisez freshnessDuration pour identifier quand un élément est considéré comme obsolète. Par exemple, vous pouvez avoir une source de données qui n'est pas indexée régulièrement ou pour laquelle vous ne souhaitez pas que la fraîcheur influence le classement. Pour y parvenir, spécifiez une valeur élevée pour freshnessDuration.

Supposons que vous disposiez d'une source de données contenant des informations sur le profil des employés. Dans ce scénario, vous pouvez choisir un freshnessDuration élevé, car les modifications apportées aux informations sur les employés ne sont souvent pas pertinentes pour le classement de l'employé. Voici un exemple de schéma contenant le paramètre freshnessDuration:

{
  "objectDefinitions": [
    {
      "name": "people",
      "options": {
        "freshnessOptions": {
          "freshnessDuration": "315360000s", # 100 years
        }
      },
    }
  ]
}

Vous pouvez également définir freshnessDuration sur une valeur très faible pour les sources de données dont le contenu change rapidement, comme une source de données contenant des articles d'actualité. Dans ce scénario, les documents les plus récemment créés ou modifiés sont les plus pertinents. Voici un exemple de schéma contenant le paramètre freshnessDuration pour une source de données contenant du contenu en rapide évolution:

{
  "objectDefinitions": [
    {
      "name": "news",
      "options": {
        "freshnessOptions": {
          "freshnessDuration": "259200s", # 3 days
        }
      },
    }
  ]
}

Influencer la qualité

La qualité est une mesure de la justesse et de l'utilité d'un élément. Une source de données peut contenir plusieurs documents sémantiquement similaires, chacun avec un niveau de qualité différent. Vous pouvez spécifier une valeur de qualité comprise entre 0 et 1 à l'aide de SearchQualityMetadata. Les articles dont la valeur est plus élevée sont mieux classés que ceux dont la valeur est plus faible. N'utilisez ce paramètre que si vous devez influencer ou améliorer la qualité d'un élément en dehors des informations fournies à Cloud Search.

Par exemple, supposons que vous disposiez d'une source de données contenant des documents sur les avantages des employés. Vous pouvez utiliser SearchQualityMetadata pour améliorer le classement des documents créés par les employés des ressources humaines par rapport à ceux créés par d'autres employés.

Voici un exemple de schéma contenant des paramètres SearchQualityMetadata pour les problèmes d'un système de suivi des bugs:

{
  "name": "datasources/.../items/issue1",
  "acl": {
    ...
  },
  "metadata": {
    "title": "Issue 1"
    "objectType": "issues"
  },
  ...
}

{
  "name": "datasources/.../items/issue2",
  "acl": {
    ...
  },
  "metadata": {
    "title": "Issue 2"
    "objectType": "issues"
    "searchQualityMetadata": {
      "quality": 0.5
    }
  },
  ...
}

{
  "name": "datasources/.../items/issue3",
  "acl": {
    ...
  },
  "metadata": {
    "title": "Issue 3"
    "objectType": "issues"
    "searchQualityMetadata": {
      "quality": 1
    }
  },
  ...
}

Compte tenu de ce schéma, lorsqu'un utilisateur effectue une recherche avec le terme de recherche "problème", le problème 3 du schéma (qualité de 1) est classé plus haut que le problème 2 (qualité de 0,5) et le problème 1 (si rien n'est spécifié, la qualité par défaut est de 0).

Influencer à l'aide du type de champ

Cloud Search vous permet d'influencer le classement en fonction de la valeur des propriétés énumérées ou des propriétés entières. Pour chaque propriété d'entier ou d'énumération, un OrderedRanking peut être spécifié. Ce paramètre peut prendre les valeurs suivantes:

  • NO_ORDER (par défaut): la propriété n'a aucune incidence sur le classement.
  • ASCENDING: les éléments dont la valeur de cette propriété entière ou d'énumération est plus élevée sont mieux classés que ceux dont la valeur est plus faible.
  • DESCENDING: les éléments dont la valeur de la propriété entière ou d'énumération est plus faible sont mieux classés que ceux dont la valeur est plus élevée.

Par exemple, supposons que chaque bug d'un système de suivi des bugs dispose d'une propriété enum pour stocker la priorité du bug sous la forme HIGH (1), MEDIUM (2) ou LOW (3). Dans ce scénario, définir un OrderedRanking sur DESCENDING permet d'améliorer le classement des bugs de priorité HIGH par rapport aux bugs de priorité LOW. Voici un exemple de schéma contenant des paramètres OrderedRanking pour les problèmes d'un système de suivi des bugs:

{
  "objectDefinitions": [
    {
      "name": "issues",
      "options": {
        "freshnessOptions": {
          "freshnessProperty": "duedate",
        }
      },
      "propertyDefinitions": [
        {
          "name": "summary",
          "textPropertyOptions": {
            "retrievalImportance": {
              "importance": HIGHEST
            }
          }
        },
        {
          "name": "duedate",
          "datePropertyOptions": {
          }
        },
        {
          "name": "priority",
          "enumPropertyOptions": {
            "possibleValues": [
              {
                "stringValue": "HIGH",
                "integerValue": 1
              },
              {
                "stringValue": "MEDIUM",
                "integerValue": 2
              },
              {
                "stringValue": "LOW",
                "integerValue": 3
              }
            ],
            "orderedRanking": DESCENDING,
          }
        },

        ...
      ]
    }
  ]
}

Un système de suivi des bugs peut également comporter une propriété entière appelée votes, qui permet de recueillir les commentaires des utilisateurs sur l'importance relative d'un bug. Vous pouvez utiliser la propriété votes pour influencer le classement en accordant une importance plus élevée aux bugs ayant reçu le plus de votes. Dans ce cas, vous pouvez spécifier OrderedRanking comme ASCENDING pour la propriété votes afin que les problèmes ayant reçu le plus de votes soient mieux classés. Voici un exemple de schéma contenant des paramètres OrderedRanking pour les problèmes d'un système de suivi des bugs:

{
  "objectDefinitions": [
    {
      "name": "issues",
      "propertyDefinitions": [
        {
          "name": "summary",
          "textPropertyOptions": {
            "retrievalImportance": {
              "importance": HIGHEST
            }
          }
        },
        {
          "name": "description",
          "textPropertyOptions": {
            "retrievalImportance": {
              "importance": DEFAULT
            }
          }
        },
        {
          "name": "votes",
          "integerPropertyOptions": {
            "orderedRanking": ASCENDING,
            "minimumValue": 0,
            "maximumValue": 1000,
          }
        },

        ...
      ]
    }
  ]
}

Influer sur le classement grâce à l'extension des requêtes

L'expansion de la requête consiste à développer les termes de la requête à l'aide de synonymes et d'orthographe pour obtenir de meilleurs résultats.

Utiliser des synonymes pour influencer les résultats de recherche

Cloud Search utilise des synonymes inférés à partir du contenu Web public pour élargir les termes de requête. Vous pouvez également définir des synonymes personnalisés pour capturer la terminologie propre à une organisation, comme les acronymes courants utilisés dans une organisation ou la terminologie propre à un secteur.

Les synonymes personnalisés peuvent être définis dans une source de données ou en tant que source de données distincte. Par défaut, les synonymes sont pris en compte pour toutes les sources de données dans l'ensemble des applications de recherche. Cependant, vous pouvez regrouper des synonymes par source de données et application de recherche. Pour en savoir plus sur la définition de synonymes personnalisés, y compris le regroupement par application de recherche, consultez la section Définir des synonymes.

Influer sur les résultats de recherche en modifiant l'orthographe

Cloud Search fournit des suggestions d'orthographe basées sur des modèles créés à l'aide des données publiques de la recherche Google. Si Cloud Search détecte une faute de frappe dans le contexte d'une requête, il renvoie la requête suggérée dans SpellResult. La suggestion d'orthographe peut s'afficher sous forme de suggestion pour l'utilisateur. Par exemple, l'utilisateur peut mal épeler le terme de requête "employe" et recevoir la suggestion "Vous voulez dire "employé" ?".

Cloud Search utilise également les corrections d'orthographe comme synonymes pour vous aider à récupérer des documents qui auraient pu être manqués en raison d'une faute d'orthographe.

Influer sur le classement via les paramètres de l'application de recherche

Comme indiqué dans la section Présentation de Google Cloud Search, une application de recherche est un groupe de paramètres qui, lorsqu'ils sont associés à une interface de recherche, fournissent des informations contextuelles sur les recherches. Les configurations suivantes vous permettent d'influencer le classement via l'application de recherche:

  • Configuration de la notation
  • Configuration de la source

Les deux sections suivantes expliquent comment ces configurations sont utiles pour influencer le classement.

Ajuster la configuration de la notation

Pour chaque application de recherche, vous pouvez spécifier un ScoringConfig qui permet de contrôler l'application de certains signaux lors du classement. Actuellement, vous pouvez désactiver la fraîcheur et la personnalisation.

Si la fraîcheur est désactivée, elle l'est pour toutes les sources de données listées dans l'application de recherche, quelles que soient les options de fraîcheur spécifiées dans le schéma pour la source de données. De même, si la personnalisation est désactivée, l'optimisation pour le propriétaire et l'optimisation pour les interactions n'ont aucune incidence sur le classement.

Pour obtenir des instructions détaillées sur la configuration de ce paramètre, consultez la page Personnaliser l'expérience de recherche dans Cloud Search.

Ajuster la configuration source

La configuration de la source vous permet de spécifier des paramètres au niveau de la source de données dans une application de recherche. Les paramètres suivants sont acceptés:

  • Importance de la source
  • Regroupement

Définir l'importance de la source

L'importance de la source fait référence à l'importance relative d'une source de données dans une application de recherche. Ce paramètre peut être spécifié dans le champ SourceImportance dans SourceScoringConfig. Les éléments d'une source de données avec une importance de source HIGH reçoivent une amélioration du classement par rapport aux éléments d'une source de données avec une importance de source DEFAULT ou LOW. Utilisez ce paramètre pour influencer le classement lorsque vous pensez que les utilisateurs préfèrent les résultats de certaines sources de données.

Par exemple, supposons que vous disposiez d'un portail d'assistance produit contenant des données de dépannage externes et internes. Dans ce scénario, vous pouvez configurer votre application de recherche pour prioriser les résultats de la source de données interne.

Pour obtenir des instructions détaillées sur la configuration de ce paramètre, consultez la page Personnaliser l'expérience de recherche dans Cloud Search.

Définir le regroupement

Le surpeuplement désigne le nombre maximal de résultats pouvant être renvoyés à partir d'une source de données dans une application de recherche. Cette valeur peut être contrôlée à l'aide du champ numResults dans SourceCrowdingConfig. Cette valeur est définie par défaut sur 3, ce qui signifie que si nous avons affiché trois résultats d'une source de données, la recherche dans le cloud commence à présenter les résultats d'autres sources de données. Les éléments de la première source de données ne sont réexaminés que si toutes les sources de données ont atteint leur limite de surpopulation ou s'il n'y a plus de résultats provenant d'autres sources de données.

Ce paramètre permet de garantir la diversité des résultats de recherche et d'éviter qu'une seule source de données ne domine la page de résultats de recherche.

Pour obtenir des instructions détaillées sur la configuration de ce paramètre, consultez la page Personnaliser l'expérience de recherche dans Cloud Search.

Influer sur le classement grâce à la personnalisation

La personnalisation désigne la présentation de résultats de recherche personnalisés en fonction de l'utilisateur qui y accède. Vous pouvez influencer le classement en hiérarchisant les éléments en fonction des critères suivants:

  • Propriété de l'article
  • Interaction avec l'article
  • Le mobinaute clique
  • Langue de l'article

Les trois sections suivantes expliquent comment influencer la qualité de recherche en fonction de ces critères.

Classement de l'influence en fonction de la propriété des éléments

La propriété des articles consiste à améliorer le classement des articles appartenant à l'utilisateur qui effectue la requête de recherche. Chaque élément possède un ItemAcl avec un champ owners. Si l'utilisateur qui exécute une requête est le propriétaire d'un élément, celui-ci bénéficie d'un classement amélioré par défaut. Vous pouvez désactiver la personnalisation dans l'application de recherche.

Améliorer le classement en fonction de l'interaction avec l'article

L'interaction avec les éléments consiste à améliorer le classement des éléments avec lesquels l'utilisateur de la requête de recherche a interagi (consultés, commentés, modifiés, etc.).

Les signaux d'interaction avec les éléments sont automatiquement obtenus pour les produits Google Workspace tels que Drive et Gmail. Pour les autres produits, vous pouvez fournir des données d'interaction au niveau de l'élément, y compris le type d'interaction (vue, modification), le code temporel de l'interaction et l'entité principale (utilisateur ayant interagi avec l'élément). Notez que les éléments avec des interactions récentes bénéficient d'un meilleur classement.

Augmenter le classement en fonction des clics des utilisateurs

Cloud Search collecte les clics sur les résultats de recherche actuels et les utilise pour améliorer le classement des futures recherches en mettant en avant les éléments sur lesquels l'utilisateur a déjà cliqué.

Influer sur le classement grâce à l'interprétation des requêtes

La fonctionnalité d'interprétation des requêtes de Cloud Search interprète automatiquement les opérateurs et les filtres dans la requête d'un utilisateur, et convertit ces éléments en requête structurée basée sur des opérateurs. L'interprétation des requêtes utilise les opérateurs définis dans le schéma, ainsi que les documents indexés, pour déduire la signification de la requête de l'utilisateur. Cette fonctionnalité permet à un utilisateur d'effectuer une recherche avec un nombre minimal de mots clés, tout en obtenant des résultats précis. Pour en savoir plus, consultez la section Structurer un schéma pour une interprétation optimale des requêtes.

Améliorer le classement en fonction de la langue de l'article

Langue : indique si les éléments dont la langue ne correspond pas à celle de la requête sont rétrogradés dans le classement. Les facteurs suivants ont une incidence sur le classement des éléments en fonction de la langue:

  • Langue de la requête. Langue détectée automatiquement de la requête de recherche ou languageCode spécifié dans RequestOptions.

    Si vous créez une interface de recherche personnalisée, vous devez définir languageCode sur la langue de l'interface ou les préférences linguistiques de l'utilisateur (par exemple, la langue du navigateur Web ou de la page de l'interface de recherche). La langue de la requête détectée automatiquement prévaut sur languageCode, de sorte que la qualité de la recherche ne soit pas compromise lorsqu'un utilisateur saisit une requête dans une langue différente de celle de son interface.

  • Langue de l'article. La valeur contentLanguage définie dans ItemMetadata au moment de l'indexation ou la langue du contenu détectée automatiquement par Cloud Search.

    Si le contentLanguage d'un document est laissé vide au moment de l'indexation et que le ItemContent est renseigné, Cloud Search tente de détecter la langue utilisée dans le ItemContent et la stocke en interne. La langue détectée automatiquement n'est pas ajoutée au champ contentLanguage.

Si la langue de la requête et de l'article correspondent, aucune rétrogradation de langue n'est appliquée. Si ces paramètres ne correspondent pas, l'élément est rétrogradé. La rétrogradation de la langue n'est pas appliquée aux documents pour lesquels contentLanguage est vide et que la recherche dans le cloud n'a pas pu détecter automatiquement la langue. Par conséquent, le classement d'un document n'est pas affecté si Cloud Search ne parvient pas à détecter sa langue.

Améliorer le classement d'un élément dans les résultats de recherche grâce au contexte

Vous pouvez améliorer le classement des éléments les plus pertinents par rapport au contexte d'une requête de recherche. Le contexte (contextAttributes) est un ensemble d'attributs nommés que vous pouvez spécifier lors de l'indexation et dans la requête de recherche pour fournir un contexte à une requête de recherche spécifique.

Par exemple, supposons qu'un élément, tel qu'un document sur les avantages sociaux des employés, soit plus pertinent dans le contexte d'un Location et d'un Department, tels qu'une ville (San Francisco), un État (California), un pays (USA) et un Department (Engineering). Dans ce cas, vous pouvez indexer l'élément avec les attributs nommés suivants:

{
  ...
  "metadata": {
    "contextAttributes": [
      {
        name: "Location"
        values: [
          "San Francisco",
          "California",
          "USA"
        ],
      },
      {
        name: "Department"
        values: [
          "Engineering"
        ],
      }
    ],
  },
  ...
}

Lorsque l'utilisateur saisit la requête de recherche "avantages" dans l'interface de recherche, vous pouvez inclure les informations de localisation et le service de l'utilisateur dans la requête de recherche. Par exemple, voici une requête de recherche contenant des informations sur l'emplacement et le service d'un ingénieur à Chicago:

{
  ...
  "contextAttributes": [
    {
      name: "Location"
      values: [
        "Chicago",
        "Illinois",
        "USA"
      ],
    },
    {
      name: "Department"
      values: [
        "Engineering"
      ],
    }
  ],
  ...
}

Étant donné que l'élément indexé et la requête de recherche contiennent les attributs "Department=Engineering" (Département = Ingénierie) et "Location=USA" (Emplacement = États-Unis), l'élément indexé (un document sur les avantages sociaux des employés) apparaît plus haut dans les résultats de recherche.

Supposons maintenant qu'un autre utilisateur, un ingénieur en Inde, saisisse la requête de recherche "avantages" dans l'interface de recherche. Voici une requête de recherche contenant des informations sur son emplacement et son département:

{
  ...
  "contextAttributes": [
    {
      name: "Location"
      values: [
        "Bengaluru",
        "Karnataka",
        "India"
      ],
    },
    {
      name: "Department"
      values: [
        "Engineering"
      ],
    }
  ],
  ...
}

Étant donné que l'élément indexé et la requête de recherche ne contiennent que l'attribut "Department=Engineering", l'élément indexé n'apparaît que légèrement plus haut dans les résultats de recherche (par rapport à la première requête de recherche "avantages" saisie par un ingénieur basé à Chicago (Illinois, États-Unis)).

Voici quelques exemples de contextes que vous pouvez utiliser pour améliorer votre classement:

  • Emplacement: les éléments peuvent être plus pertinents pour les utilisateurs situés à un emplacement particulier (un bâtiment, une ville, un pays ou une région, par exemple).
  • Rôle: des éléments peuvent être plus pertinents pour les utilisateurs occupant un rôle particulier, comme rédacteur technique ou ingénieur.
  • Service: les éléments peuvent être plus pertinents pour certains services, comme les ventes ou le marketing.
  • Niveau de poste: les éléments peuvent être plus pertinents pour certains niveaux de poste, comme directeur ou PDG.
  • Type d'employé: certains éléments peuvent être plus pertinents pour certains types d'employés, comme les employés à temps partiel et à temps plein.
  • Ancienneté: des éléments peuvent être plus ou moins pertinents selon l'ancienneté d'un employé, par exemple s'il s'agit d'un nouvel employé.

Améliorer le classement grâce à la popularité des articles

Cloud Search améliore le classement des éléments populaires, c'est-à-dire ceux qui ont reçu des clics dans des requêtes de recherche récentes.

Influer sur le classement grâce à Clickboost

Cloud Search collecte les clics sur les résultats de recherche actuels et les utilise pour améliorer le classement des futures recherches en mettant en avant les éléments populaires pour une requête de recherche spécifique.

Résumé des paramètres de qualité de recherche recommandés et facultatifs

Le tableau suivant liste tous les paramètres de qualité de recherche recommandés et facultatifs. Ces recommandations devraient vous aider à tirer le meilleur parti des modèles de classement de Cloud Search.

ParamètreLieuRecommandé/FacultatifDétails
Paramètres du schéma
Champ ItemContentItemContentRecommandéLorsque vous créez ou mettez à jour votre schéma, renseignez le contenu non structuré d'un élément. Ce champ est utilisé pour générer des extraits.
Champ RetrievalImportanceRetrievalImportanceRecommandéLorsque vous créez ou mettez à jour un schéma, définissez des propriétés de texte qui sont clairement importantes ou d'actualité.
FreshnessOptionsFreshnessOptionsFacultatifLorsque vous créez ou mettez à jour un schéma, définissez cette option pour vous assurer que les éléments ne sont pas rétrogradés en raison de données incorrectes ou de données manquantes.
Paramètres d'indexation
createTime/updateTimeItemMetadataRecommandéRemplissez les données pendant l'indexation d'un élément.
contentLanguageItemMetadataRecommandéRemplissez les données pendant l'indexation d'un élément. En l'absence de cette valeur, Cloud Search tente de détecter la langue utilisée dans ItemContent.
Champ ownersItemAcl()RecommandéRemplissez les données pendant l'indexation d'un élément.
Synonymes personnalisésSchéma _dictionaryEntryRecommandéDéfinissez-les au niveau de la source de données ou en tant que source de données distincte lors de l'indexation.
Champ qualitySearchQualityMetadataFacultatifPour améliorer la qualité de base par rapport aux autres éléments sémantiquement similaires, définissez la qualité lors de l'indexation. Si vous définissez ce champ pour tous les éléments d'une source de données, son effet sera nul.
Données sur les interactions au niveau des articlesinteractionFacultatifSi la source de données enregistre et fournit l'accès aux interactions des utilisateurs, renseignez les interactions pour chaque élément lors de l'indexation.
Propriétés entières/énuméréesOrderedRankingFacultatifLorsque l'ordre des éléments est pertinent, spécifiez le classement ordonné pour les propriétés entières et d'énumération lors de l'indexation.
Rechercher les paramètres de l'application
Personalization=falseScoringConfig ou à l'aide de l'UI d'administration de Cloud SearchRecommandéLorsque vous créez ou mettez à jour l'application de recherche. Assurez-vous de fournir les informations sur le propriétaire correctes, comme décrit dans l'article Influer sur le classement grâce à la personnalisation.
Champ SourceImportanceSourceCrowdingConfigFacultatifPour biaiser les résultats de certaines sources de données, définissez ce champ.
Champ numResultsSourceCrowdingConfigFacultatifPour contrôler la diversité des résultats, définissez ce champ.

Étapes suivantes

Voici quelques étapes que vous pouvez également suivre :

  1. Structurez un schéma pour une interprétation optimale des requêtes.

  2. Apprendre à exploiter le schéma _dictionaryEntry pour définir des synonymes des termes couramment utilisés dans votre entreprise. Pour utiliser le schéma _dictionaryEntry, consultez Définir des synonymes.