זיהוי טקסט גרסה 2

ה-API של ML Kit Text Recognition v2 יכול לזהות טקסט בכל מערכת תווים של סינית, דוואנגרי, יפנית, קוריאנית ולטינית. אפשר להשתמש ב-API גם כדי להפוך משימות של הזנת נתונים לאוטומטיות, כמו עיבוד של כרטיסי אשראי, קבלות וכרטיסי ביקור.

iOS Android

יכולות עיקריות

  • זיהוי טקסט בכמה סקריפטים ושפות, תמיכה בזיהוי טקסט בכתבים סיניים, דוואנגרי, יפנית, קוריאנית ולטינית
  • ניתוח מבנה טקסט. תמיכה בזיהוי של סמלים, רכיבים, קווים ופסקאות
  • זיהוי שפת הטקסט זיהוי השפה של הטקסט המזוהה
  • זיהוי בזמן אמת מאפשר לזהות טקסט בזמן אמת במגוון רחב של מכשירים

מבנה הטקסט

הכלי לזיהוי טקסט מפלח את הטקסט לבלוקים, לשורות, לאלמנטים ולסמלים. באופן כללי:

  • בלוק הוא קבוצה רציפה של שורות טקסט, כמו פסקה או עמודה,

  • קו הוא קבוצה רציפה של מילים על אותו ציר, וגם

  • רכיב הוא קבוצה רציפה של תווים אלפאנומריים ('מילה') על אותו ציר ברוב השפות הלטיניות, או מילה בשפות אחרות

  • סמל הוא תו אלפאנומרי יחיד באותו ציר ברוב השפות הלטיניות, או תו בשפות אחרות

בתמונות שלמטה מודגשות דוגמאות לכל אחת מהן בסדר יורד. הבלוק המודגש הראשון בציאן הוא בלוק של טקסט. הקבוצה השנייה של הבלוקים המודגשים, בכחול, היא שורות הטקסט. לבסוף, הקבוצה השלישית של הבלוקים המודגשים, בכחול כהה, היא 'מילים'.

בכל הבלוקים, הקווים, הרכיבים והסמלים שזוהו, ה-API מחזיר את התיבות התוחמות, נקודות הפינות, פרטי הסיבוב, דירוג הסמך, שפות מזוהות וטקסט מזוהה.

תוצאות לדוגמה


תמונה: Dietmar Rabich, Wikimedia Commons, "Düsseldorf, Wege der parlamentarischen Demokratie -- 2015 -- 8123", CC BY-SA 4.0
טקסט שזוהה
טקסט Wege
der parlamentarischen
דמוקרטי
חסימות (בלוק אחד)
חסימת 0
טקסט וג' דר פרלמנטארישן הדמוקרטי
מסגרת (296, 665 - 796, 882)
נקודות פינה (296, 719), (778, 665), (796, 828), (314, 882)
קוד שפה מזוהה de
קווים (3 שורות)
שורה 0
טקסט וג' דר
מסגרת (434, 678 - 670, 749)
נקודות פינה (434, 705), (665, 678), (670, 722), (439, 749)
קוד שפה מזוהה de
ציון סמך 0.8766741
מעלות סיבוב -6.6116457
Elements (2 רכיבים)
רכיב 0
טקסט ווג
מסגרת (434, 689 - 575, 749)
נקודות פינה (434, 705), (570, 689), (575, 733), (439, 749)
קוד שפה מזוהה de
ציון סמך 0.8964844
מעלות סיבוב -6.6116457
Elements (4 רכיבים)
סמל 0
טקסט W
מסגרת (434, 698 - 500, 749)
נקודות פינה (434, 706), (495, 698), (500, 741), (439, 749)
ציון סמך 0.87109375
מעלות סיבוב -6.611646