Con le API di etichettatura delle immagini di ML Kit puoi rilevare ed estrarre informazioni sulle entità in un'immagine in un ampio gruppo di categorie. Il modello di etichettatura delle immagini predefinito può identificare oggetti generici, luoghi, attività, specie animali, prodotti e altro ancora.
Puoi anche usare un modello di classificazione delle immagini personalizzato per adattare il rilevamento a un caso d'uso specifico. Per ulteriori informazioni, consulta Utilizzo di un modello TensorFlow Lite personalizzato.
Funzionalità chiave
- Un potente classificatore di base per uso generico Riconosce oltre 400 categorie che descrivono gli oggetti più comuni nelle foto.
- Personalizzazione in base al tuo caso d'uso con i modelli personalizzati Utilizza altri modelli preaddestrati di TensorFlow Hub o il tuo modello personalizzato addestrato con TensorFlow, AutoML Vision Edge o TensorFlow Lite Model Maker.
- API di alto livello facili da utilizzare Non devi preoccuparti di input/output di modelli di basso livello, pre- e post-elaborazione delle immagini o creazione di una pipeline di elaborazione. ML Kit estrae le etichette dal modello TensorFlow Lite e le fornisce come descrizione testuale.
Tieni presente che questa API è destinata ai modelli di classificazione delle immagini che descrivono l'immagine completa. Per classificare uno o più oggetti in un'immagine, come scarpe o mobili, l'API Object Detection & Tracking potrebbe essere più adatta.
Modelli di classificazione delle immagini supportati
Le API Image Labeling supportano diversi modelli di classificazione delle immagini:
Modelli di classificazione delle immagini supportati | |
---|---|
Modello base | Per impostazione predefinita, l'API utilizza un potente modello di etichettatura delle immagini per uso generico che riconosce oltre 400 entità che coprono i concetti più comuni nelle foto. |
Modelli TensorFlow Lite personalizzati | Per scegliere come target concetti specifici per l'applicazione, l'API accetta modelli di classificazione delle immagini personalizzati da un'ampia gamma di origini. Possono essere modelli preaddestrati scaricati da TensorFlow Hub o modelli personalizzati addestrati con AutoML Vision Edge, TensorFlow Lite Model Maker o lo stesso TensorFlow. I modelli possono essere abbinati alla tua app oppure ospitati con Firebase Machine Learning e scaricati in fase di runtime. |
Utilizzo del modello di base
Il modello di base di ML Kit restituisce un elenco di entità che identificano persone, cose, luoghi, attività e così via. Ogni entità è dotata di un punteggio che indica il livello di affidabilità del modello ML nella sua pertinenza. Con queste informazioni puoi eseguire attività come la generazione automatica di metadati e la moderazione dei contenuti. Il modello predefinito fornito con ML Kit riconosce più di 400 entità diverse.
Etichette di esempio
Il modello di base nell'API Image Labeling supporta oltre 400 etichette, tra cui i seguenti esempi:
Categoria | Etichette di esempio |
---|---|
Persone | Crowd Selfie Smile |
Attività | Dancing Eating Surfing |
Cose | Car Piano Receipt |
Animali | Bird Cat Dog |
Piante | Flower Fruit Vegetable |
Luoghi | Beach Lake Mountain |
Risultati di esempio
Ecco un esempio delle entità riconosciute nella foto associata.
Etichetta 0 | |
---|---|
Testo | Stadio |
Sicurezza di sé | 0,9205354 |
Etichetta 1 | |
Testo | Sport |
Sicurezza di sé | 0,7531109 |
Etichetta 2 | |
Testo | Evento |
Sicurezza di sé | 0,66905296 |
Etichetta 3 | |
Testo | Tempo libero |
Sicurezza di sé | 0,59904146 |
Etichetta 4 | |
Testo | Calcio |
Sicurezza di sé | 0,56384534 |
Etichetta 5 | |
Testo | Netta |
Sicurezza di sé | 0,54679185 |
Etichetta 6 | |
Testo | Pianta |
Sicurezza di sé | 0,524364 |
Utilizzo di un modello TensorFlow Lite personalizzato
Il modello di etichettatura delle immagini di base di ML Kit è stato creato per un uso generico. È addestrato a riconoscere 400 categorie che descrivono gli oggetti più comuni nelle foto. La tua app potrebbe aver bisogno di un modello specializzato di classificazione delle immagini che riconosca in maggiore dettaglio un numero minore di categorie, ad esempio un modello che distingua specie di fiori o tipi di alimenti.
Questa API ti consente di adattare il sistema a un caso d'uso particolare supportando modelli di classificazione delle immagini personalizzati da un'ampia gamma di origini. Per saperne di più, consulta Modelli personalizzati con ML Kit. I modelli personalizzati possono essere abbinati alla tua app o scaricati dinamicamente dal cloud utilizzando il servizio di deployment dei modelli di Firebase Machine Learning.
Pre-elaborazione dell'immagine di input
Se necessario, Image Labeling utilizza il ridimensionamento e lo stiramento dell'immagine bilineare per regolare le dimensioni e le proporzioni dell'immagine di input in modo che si adattino ai requisiti del modello sottostante.