
Interfejs ML Kit Text Recognition v2 rozpoznaje tekst w dowolnym zestawie znaków w językach chińskim, dewanagari, japońskim, koreańskim i łacińskim. Interfejs API może również służyć do automatyzacji zadań wprowadzania danych, takich jak przetwarzanie kart kredytowych, rachunków czy wizytówek firm.
Najważniejsze funkcje
- Rozpoznawanie tekstu w różnych alfabetach i językach Obsługa rozpoznawania tekstu w językach chińskim, dewanagari, japońskim, koreańskim i łacińskim
- Analizuje strukturę tekstu Umożliwia wykrywanie symboli, elementów, wierszy i akapitów.
- Określ język tekstu Określa język rozpoznanego tekstu.
- Rozpoznawanie w czasie rzeczywistym: rozpoznaje tekst w czasie rzeczywistym na wielu różnych urządzeniach
Struktura tekstu
Moduł rozpoznawania tekstu dzieli tekst na bloki, linie, elementy i symbole. Ogólnie rzecz biorąc:
- Blok to sąsiadujący się z nimi zestaw wierszy tekstu, np. akapit lub kolumna, 
- Linia to sąsiedni zestaw słów na tej samej osi, 
- Element to ciągły zestaw znaków alfanumerycznych („słowo”) na tej samej osi w większości języków łacińskich lub słowo w innych 
- Symbol to pojedynczy znak alfanumeryczny na tej samej osi w większości języków łacińskich lub znak w innych językach. 
Na ilustracji poniżej pokazujemy przykłady każdej z tych opcji w kolejności malejącej. Pierwszy wyróżniony blok w kolorze turkusowym to blok tekstu. Drugi zestaw wyróżnionych bloków (kolor niebieski) to Wiersze tekstu. Trzeci zestaw wyróżnionych bloków, ciemnoniebieskich, to Words.

W przypadku wszystkich wykrytych bloków, linii, elementów i symboli interfejs API zwraca ramki ograniczające, punkty narożne, informacje o rotacji, wskaźnik ufności, rozpoznawany język i rozpoznany tekst.
Przykładowe wyniki

Zdjęcie: Dietmar Rabich, Wikimedia Commons, "Düsseldorf, Wege der parlamentarischen Demokratie -- 2015 -- 8123", CC BY-SA 4.0
| Rozpoznany tekst | |
|---|---|
| Tekst | Wege der parlamentarischen Demokratie | 
| Bloki | (1 blok) | 
| Blok 0 | |
|---|---|
| Tekst | Wege der parlamentarischen Demokratie | 
| Ramka | (296, 665 – 796, 882) | 
| Punkty narożne | (296, 719), (778, 665), (796, 828), (314, 882) | 
| Rozpoznany kod języka | de | 
| Linie | (3 wiersze) | 
| Wiersz 0 | |
|---|---|
| Tekst | Wege der | 
| Ramka | (434, 678, 670, 749) | 
| Punkty narożne | (434, 705), (665, 678), (670, 722), (439, 749) | 
| Rozpoznany kod języka | de | 
| Wskaźnik ufności | 0,8766741 | 
| Stopień obrotu | -6,6116457 | 
| Elementy | (2 elementy) | 
| Element 0 | |
|---|---|
| Tekst | Wege | 
| Ramka | (434, 689, 575, 749) | 
| Punkty narożne | (434 705), (570, 689), (575, 733), (439, 749) | 
| Rozpoznany kod języka | de | 
| Wskaźnik ufności | 0,8964844 | 
| Stopień obrotu | -6,6116457 | 
| Elementy | (4 elementy) | 
| Symbol 0 | |
|---|---|
| Tekst | Ś | 
| Ramka | (434, 698, - 500, 749) | 
| Punkty narożne | (434, 706), (495, 698), (500, 741), (439, 749) | 
| Wskaźnik ufności | 0,87109375 | 
| Stopień obrotu | -6,611646 | 
