Идентификация языка
Оптимизируйте свои подборки
Сохраняйте и классифицируйте контент в соответствии со своими настройками.

С помощью встроенного в устройство API идентификации языка ML Kit вы можете определить язык текстовой строки.
Идентификация языка может быть полезна при работе с текстом, предоставленным пользователем, который часто не содержит никакой информации о языке.
iOS Android
Ключевые возможности
Широкая языковая поддержка. Определяет более ста различных языков. Посмотреть полный список .
Поддержка романизированного текста. Определяет арабский, болгарский, греческий, хинди, японский, русский и китайский текст как родным, так и латинизированным шрифтом.
Примеры результатов
Простая идентификация языка |
---|
"Мое судно на воздушной подушке полно угрей." | en (английский) |
«Дао Шань Сюэ Хай» | zh-Latn (латинизированный китайский) |
"п'нглуи мглв'нафх вга'нагл фхтагн" | und (неопределенный) |
Распределение уверенности |
---|
«мирный государственный переворот» | en (0,52) fr (0,44) ca (0,03) |
Если не указано иное, контент на этой странице предоставляется по лицензии Creative Commons "С указанием авторства 4.0", а примеры кода – по лицензии Apache 2.0. Подробнее об этом написано в правилах сайта. Java – это зарегистрированный товарный знак корпорации Oracle и ее аффилированных лиц.
Последнее обновление: 2025-08-29 UTC.
[null,null,["Последнее обновление: 2025-08-29 UTC."],[[["\u003cp\u003eML Kit's language identification API allows you to determine the language of a text string, which is particularly helpful when dealing with user-generated content that often lacks language information.\u003c/p\u003e\n"],["\u003cp\u003eIt supports a wide range of languages, including romanized versions of Arabic, Bulgarian, Greek, Hindi, Japanese, Russian, and Chinese text.\u003c/p\u003e\n"],["\u003cp\u003eThe API can provide a simple language identification or a confidence distribution across multiple languages for a given text.\u003c/p\u003e\n"]]],["ML Kit's on-device API identifies the language of text strings, supporting over one hundred languages, including romanized versions of Arabic, Bulgarian, Greek, Hindi, Japanese, Russian, and Chinese. It's designed for user-provided text that lacks language information. The API outputs language codes (e.g., `en` for English) or `und` for undetermined. For ambiguous cases, it provides a confidence distribution across multiple languages (e.g., `en` (0.52), `fr` (0.44)).\n"],null,["With ML Kit's on-device language identification API, you can determine the\nlanguage of a string of text.\n\nLanguage identification can be useful when working with user-provided text,\nwhich often doesn't come with any language information.\n\n[iOS](/ml-kit/language/identification/ios)\n[Android](/ml-kit/language/identification/android)\n\nKey capabilities\n\n- **Broad language support.** Identifies over one hundred different languages. See the\n [complete list](/ml-kit/language/identification/langid-support).\n\n- **Romanized text support.** Identifies Arabic, Bulgarian, Greek, Hindi, Japanese,\n Russian, and Chinese text in both native and romanized script.\n\nExample results\n\n| Simple language identification ||\n|---------------------------------------|-------------------------------|\n| \"My hovercraft is full of eels.\" | `en` (English) |\n| \"Dao shan xue hai\" | `zh-Latn` (Latinized Chinese) |\n| \"ph'nglui mglw'nafh wgah'nagl fhtagn\" | `und` (undetermined) |\n\n| Confidence distribution ||\n|---------------------------|-------------------------------------|\n| \"an amicable coup d'etat\" | `en` (0.52) `fr` (0.44) `ca` (0.03) |"]]