
ML Kit Text Recognition v2 API สามารถจดจำข้อความในชุดอักขระจีน เทวนาครี ญี่ปุ่น เกาหลี และละติน นอกจากนี้ API ยังนำมาใช้เพื่อดำเนินงานป้อนข้อมูลโดยอัตโนมัติ เช่น การประมวลผลบัตรเครดิต ใบเสร็จ และนามบัตรได้ด้วย
ความสามารถหลัก
- จดจำข้อความในสคริปต์และภาษาต่างๆ รองรับการจดจำข้อความในตัวอักษรจีน เทวนาครี ญี่ปุ่น เกาหลี และละติน
- วิเคราะห์โครงสร้างข้อความ รองรับการตรวจหาสัญลักษณ์ องค์ประกอบ บรรทัด และย่อหน้า
- ระบุภาษาของข้อความ ระบุภาษาของข้อความที่รู้จัก
- การจดจำแบบเรียลไทม์ จดจำข้อความแบบเรียลไทม์ในอุปกรณ์ที่หลากหลายได้
โครงสร้างข้อความ
โปรแกรมจดจำข้อความจะแบ่งข้อความออกเป็นบล็อก เส้น องค์ประกอบ และสัญลักษณ์ กล่าวโดยคร่าวๆ:
บล็อกคือชุดบรรทัดข้อความต่อเนื่องกัน เช่น ย่อหน้าหรือคอลัมน์
เส้นคือชุดคำต่อกันบนแกนเดียวกัน และ
องค์ประกอบคือชุดอักขระที่เป็นตัวอักษรและตัวเลขคละกัน ("คำ") ที่อยู่ติดกันบนแกนเดียวกันในภาษาละตินส่วนใหญ่ หรือคำอื่นๆ
สัญลักษณ์คืออักขระที่เป็นตัวอักษรและตัวเลขคละกัน 1 ตัวบนแกนเดียวกันในภาษาละตินส่วนใหญ่ หรืออักขระอื่นๆ
รูปภาพด้านล่างจะไฮไลต์ตัวอย่างของแต่ละตัวเลือกจากมากไปหาน้อย บล็อกแรกที่ไฮไลต์ด้วยสีฟ้าคือบล็อกข้อความ บล็อกไฮไลต์ชุดที่ 2 สีฟ้าคือ บรรทัดข้อความ สุดท้าย บล็อกที่ 3 ที่ไฮไลต์ใน สีน้ำเงินเข้มคือ "คำ"

สำหรับบล็อก เส้น องค์ประกอบ และสัญลักษณ์ที่ตรวจพบทั้งหมด API จะแสดงผลกรอบล้อมรอบ จุดเข้ามุม ข้อมูลการหมุน คะแนนความเชื่อมั่น ภาษาที่ระบบรู้จัก และข้อความที่รู้จัก
ตัวอย่างผลการแข่ง

รูปภาพ: Dietmar Rabich, Wikimedia Commons, "Düsseldorf, Wege der parlamentarischen Demokratie -- 2015 -- 8123", CC BY-SA 4.0
| ข้อความที่ระบุ | |
|---|---|
| ข้อความ | Wege der parlamentarischen Demokratie |
| บล็อก | (1 บล็อก) |
| บล็อก 0 | |
|---|---|
| ข้อความ | Wege Der Parlamentarischen Demokratie |
| กรอบ | (296, 665 - 796, 882) |
| จุดเข้ามุม | (296, 719), (778, 665), (796, 828), (314, 882) |
| รหัสภาษาที่รู้จัก | de |
| บรรทัด | (3 บรรทัด) |
| บรรทัด 0 | |
|---|---|
| ข้อความ | เวเก เดอร์ |
| กรอบ | (434, 678 - 670, 749) |
| จุดเข้ามุม | (434, 705), (665, 678), (670, 722), (439, 749) |
| รหัสภาษาที่รู้จัก | de |
| คะแนนความเชื่อมั่น | 0.8766741 |
| องศาการหมุน | -6.6116457 |
| องค์ประกอบ | (2 องค์ประกอบ) |
| องค์ประกอบ 0 | |
|---|---|
| ข้อความ | เวช |
| กรอบ | (434, 689 - 575, 749) |
| จุดเข้ามุม | (434, 705), (570, 689), (575, 733), (439, 749) |
| รหัสภาษาที่รู้จัก | de |
| คะแนนความเชื่อมั่น | 0.8964844 |
| องศาการหมุน | -6.6116457 |
| องค์ประกอบ | (4 องค์ประกอบ) |
| สัญลักษณ์ 0 | |
|---|---|
| ข้อความ | W |
| กรอบ | (434, 698 - 500, 749) |
| จุดเข้ามุม | (434, 706), (495, 698), (500, 741), (439, 749) |
| คะแนนความเชื่อมั่น | 0.87109375 |
| องศาการหมุน | -6.611646 |