Identification de la langue
Restez organisé à l'aide des collections
Enregistrez et classez les contenus selon vos préférences.

L'API d'identification de la langue intégrée à l'appareil de ML Kit vous permet de déterminer la langue d'une chaîne de texte.
L'identification de la langue peut être utile lorsque vous travaillez avec du texte fourni par l'utilisateur, qui n'est souvent associé à aucune information linguistique.
iOS
Android
Capacités clés
Compatibilité avec de nombreuses langues. Identifie plus d'une centaine de langues différentes. Consultez la liste complète.
Compatibilité avec le texte en caractères romanisés. Identifie l'arabe, le bulgare, le grec, l'hindi, le japonais, le russe et le chinois en caractères natifs et romanisés.
Exemples de résultats
Identification simple de la langue |
"Mon aéroglisseur est plein d'anguilles." |
en (anglais) |
"Dao shan xue hai" |
zh-Latn (Chinois latinisé) |
"ph'nglui mglw'nafh wgah'nagl fhtagn" |
und (indéterminé) |
Répartition du niveau de confiance |
"un coup d'état amical" |
en (0,52)
fr (0,44)
ca (0,03)
|
Sauf indication contraire, le contenu de cette page est régi par une licence Creative Commons Attribution 4.0, et les échantillons de code sont régis par une licence Apache 2.0. Pour en savoir plus, consultez les Règles du site Google Developers. Java est une marque déposée d'Oracle et/ou de ses sociétés affiliées.
Dernière mise à jour le 2025/08/29 (UTC).
[null,null,["Dernière mise à jour le 2025/08/29 (UTC)."],[[["\u003cp\u003eML Kit's language identification API allows you to determine the language of a text string, which is particularly helpful when dealing with user-generated content that often lacks language information.\u003c/p\u003e\n"],["\u003cp\u003eIt supports a wide range of languages, including romanized versions of Arabic, Bulgarian, Greek, Hindi, Japanese, Russian, and Chinese text.\u003c/p\u003e\n"],["\u003cp\u003eThe API can provide a simple language identification or a confidence distribution across multiple languages for a given text.\u003c/p\u003e\n"]]],["ML Kit's on-device API identifies the language of text strings, supporting over one hundred languages, including romanized versions of Arabic, Bulgarian, Greek, Hindi, Japanese, Russian, and Chinese. It's designed for user-provided text that lacks language information. The API outputs language codes (e.g., `en` for English) or `und` for undetermined. For ambiguous cases, it provides a confidence distribution across multiple languages (e.g., `en` (0.52), `fr` (0.44)).\n"],null,["With ML Kit's on-device language identification API, you can determine the\nlanguage of a string of text.\n\nLanguage identification can be useful when working with user-provided text,\nwhich often doesn't come with any language information.\n\n[iOS](/ml-kit/language/identification/ios)\n[Android](/ml-kit/language/identification/android)\n\nKey capabilities\n\n- **Broad language support.** Identifies over one hundred different languages. See the\n [complete list](/ml-kit/language/identification/langid-support).\n\n- **Romanized text support.** Identifies Arabic, Bulgarian, Greek, Hindi, Japanese,\n Russian, and Chinese text in both native and romanized script.\n\nExample results\n\n| Simple language identification ||\n|---------------------------------------|-------------------------------|\n| \"My hovercraft is full of eels.\" | `en` (English) |\n| \"Dao shan xue hai\" | `zh-Latn` (Latinized Chinese) |\n| \"ph'nglui mglw'nafh wgah'nagl fhtagn\" | `und` (undetermined) |\n\n| Confidence distribution ||\n|---------------------------|-------------------------------------|\n| \"an amicable coup d'etat\" | `en` (0.52) `fr` (0.44) `ca` (0.03) |"]]