การแบ่งกลุ่มเรื่อง

API การแบ่งกลุ่มหัวเรื่องของ ML Kit ช่วยให้นักพัฒนาซอฟต์แวร์แยกเนื้อหาหลายวิชาออกจากพื้นหลังในรูปภาพได้อย่างง่ายดาย ทำให้ใช้งานกรณีการใช้งานต่างๆ ได้ เช่น สร้างสติกเกอร์ สลับพื้นหลัง หรือใส่เอฟเฟกต์เจ๋งๆ ให้กับวัตถุ

วัตถุหมายถึงผู้คน สัตว์เลี้ยง หรือวัตถุที่อยู่เบื้องหน้าของรูปภาพ หากวัตถุ 2 วัตถุอยู่ใกล้หรือสัมผัสกันมาก จะถือว่าเป็นวัตถุเดียว

API การแบ่งกลุ่มหัวเรื่องจะถ่ายภาพอินพุตและสร้างมาสก์เอาต์พุตหรือบิตแมปสำหรับพื้นหน้า และยังมีมาสก์และบิตแมปสำหรับวัตถุแต่ละรายการที่ตรวจพบ (พื้นหน้าเท่ากับทุกวิชารวมกัน)

โดยค่าเริ่มต้น มาสก์เบื้องหน้าและบิตแมปเบื้องหน้าจะมีขนาดเท่ากับรูปภาพอินพุต (ขนาดของมาสก์และบิตแมปของแต่ละวิชาจะแตกต่างจากขนาดรูปภาพที่ป้อน) แต่ละพิกเซลของมาสก์จะได้รับการกำหนดเลขทศนิยมที่มีช่วงระหว่าง 0.0 ถึง 1.0 ยิ่งตัวเลขใกล้เคียงกับ 1.0 มากเท่าไหร่ ก็ยิ่งมีความเชื่อมั่นมากขึ้นว่าพิกเซลนั้นแสดงถึงวัตถุหนึ่งๆ และในทางกลับกันด้วย

โดยเฉลี่ยแล้วเวลาในการตอบสนองที่วัดใน Pixel 7 Pro จะอยู่ที่ประมาณ 200 มิลลิวินาที ปัจจุบัน API นี้รองรับเฉพาะภาพนิ่งเท่านั้น

Android

ความสามารถหลัก

  • การแบ่งกลุ่มหลายวิชา: มีมาสก์และบิตแมปสำหรับแต่ละวิชา แทนมาสก์และบิตแมปรายการเดียวสําหรับทุกวิชารวมกัน
  • การจดจำหัวเรื่อง: วัตถุที่จดจำคือวัตถุ สัตว์เลี้ยง และมนุษย์
  • การประมวลผลในอุปกรณ์: การประมวลผลทั้งหมดจะทำในอุปกรณ์เพื่อรักษาความเป็นส่วนตัวของผู้ใช้และไม่ต้องมีการเชื่อมต่อเครือข่าย

ตัวอย่างผลการแข่ง

รูปภาพที่ป้อน รูปภาพเอาต์พุต + มาสก์