ה-API של ML Kit Text Recognition v2 יכול לזהות טקסט בכל מערכת תווים של סינית, דוואנגרי, יפנית, קוריאנית ולטינית. אפשר להשתמש ב-API גם כדי להפוך משימות של הזנת נתונים לאוטומטיות, כמו עיבוד של כרטיסי אשראי, קבלות וכרטיסי ביקור.
יכולות עיקריות
- זיהוי טקסט בכמה סקריפטים ושפות, תמיכה בזיהוי טקסט בכתבים סיניים, דוואנגרי, יפנית, קוריאנית ולטינית
- ניתוח מבנה טקסט. תמיכה בזיהוי של סמלים, רכיבים, קווים ופסקאות
- זיהוי שפת הטקסט זיהוי השפה של הטקסט המזוהה
- זיהוי בזמן אמת מאפשר לזהות טקסט בזמן אמת במגוון רחב של מכשירים
מבנה הטקסט
הכלי לזיהוי טקסט מפלח את הטקסט לבלוקים, לשורות, לאלמנטים ולסמלים. באופן כללי:
בלוק הוא קבוצה רציפה של שורות טקסט, כמו פסקה או עמודה,
קו הוא קבוצה רציפה של מילים על אותו ציר, וגם
רכיב הוא קבוצה רציפה של תווים אלפאנומריים ('מילה') על אותו ציר ברוב השפות הלטיניות, או מילה בשפות אחרות
סמל הוא תו אלפאנומרי יחיד באותו ציר ברוב השפות הלטיניות, או תו בשפות אחרות
בתמונות שלמטה מודגשות דוגמאות לכל אחת מהן בסדר יורד. הבלוק המודגש הראשון בציאן הוא בלוק של טקסט. הקבוצה השנייה של הבלוקים המודגשים, בכחול, היא שורות הטקסט. לבסוף, הקבוצה השלישית של הבלוקים המודגשים, בכחול כהה, היא 'מילים'.
בכל הבלוקים, הקווים, הרכיבים והסמלים שזוהו, ה-API מחזיר את התיבות התוחמות, נקודות הפינות, פרטי הסיבוב, דירוג הסמך, שפות מזוהות וטקסט מזוהה.
תוצאות לדוגמה
טקסט שזוהה | |
---|---|
טקסט | Wege der parlamentarischen דמוקרטי |
חסימות | (בלוק אחד) |
חסימת 0 | |
---|---|
טקסט | וג' דר פרלמנטארישן הדמוקרטי |
מסגרת | (296, 665 - 796, 882) |
נקודות פינה | (296, 719), (778, 665), (796, 828), (314, 882) |
קוד שפה מזוהה | de |
קווים | (3 שורות) |
שורה 0 | |
---|---|
טקסט | וג' דר |
מסגרת | (434, 678 - 670, 749) |
נקודות פינה | (434, 705), (665, 678), (670, 722), (439, 749) |
קוד שפה מזוהה | de |
ציון סמך | 0.8766741 |
מעלות סיבוב | -6.6116457 |
Elements | (2 רכיבים) |
רכיב 0 | |
---|---|
טקסט | ווג |
מסגרת | (434, 689 - 575, 749) |
נקודות פינה | (434, 705), (570, 689), (575, 733), (439, 749) |
קוד שפה מזוהה | de |
ציון סמך | 0.8964844 |
מעלות סיבוב | -6.6116457 |
Elements | (4 רכיבים) |
סמל 0 | |
---|---|
טקסט | W |
מסגרת | (434, 698 - 500, 749) |
נקודות פינה | (434, 706), (495, 698), (500, 741), (439, 749) |
ציון סמך | 0.87109375 |
מעלות סיבוב | -6.611646 |