L'API di segmentazione dei soggetti di ML Kit consente agli sviluppatori di separare facilmente più soggetti dallo sfondo in un'immagine, consentendo casi d'uso come la creazione di adesivi, lo scambio dello sfondo o l'aggiunta di effetti interessanti ai soggetti.
Per soggetti si intendono le persone, gli animali domestici o gli oggetti più in evidenza che si trovano in primo piano nell'immagine. Se due soggetti sono molto vicini o si toccano, vengono considerati come un unico soggetto.
L'API di segmentazione dei soggetti accetta un'immagine di input e genera una maschera di output o una bitmap per il primo piano. Fornisce inoltre una maschera e una bitmap per ciascuno dei soggetti rilevati (il primo piano è uguale a tutti i soggetti combinati).
Per impostazione predefinita, la maschera in primo piano e la bitmap in primo piano hanno le stesse dimensioni dell'immagine di input (le dimensioni della maschera e della bitmap di ogni singolo soggetto saranno probabilmente diverse dalle dimensioni dell'immagine di input). A ogni pixel della maschera viene assegnato un numero decimale con un intervallo compreso tra 0.0
e 1.0
. Più il numero è vicino a 1.0
, maggiore
è la certezza che il pixel rappresenti un soggetto e viceversa.
In media, la latenza misurata su Pixel 7 Pro è di circa 200 ms. Al momento questa API supporta solo immagini statiche.
Funzionalità chiave
- Segmentazione di più soggetti: fornisce maschere e bitmap per ogni singolo soggetto, anziché una singola maschera e bitmap per tutti i soggetti combinati.
- Riconoscimento dei soggetti:i soggetti riconosciuti sono oggetti, animali domestici e persone.
- Elaborazione sul dispositivo: tutta l'elaborazione viene eseguita sul dispositivo, preservando la privacy dell'utente e senza richiedere connettività di rete.
Risultati di esempio
Immagine di input | Immagine di output + maschera |
---|---|