Invia richieste personalizzate a Gemini Nano con l'API GenAI Prompt

Con l'API GenAI Prompt di ML Kit, puoi inviare richieste in linguaggio naturale sul dispositivo a Gemini Nano. L'API GenAI Prompt accetta un input di testo o un input combinato di immagine e testo ed emette un output di testo.

Puoi utilizzare l'API GenAI Prompt per una serie di casi d'uso, tra cui i seguenti:

Caso d'uso

Esempio

Comprensione delle immagini

Analisi delle foto per la classificazione, ad esempio "animali domestici", "cibo" o "viaggi".

Traduzioni brevi

Traduzione di messaggi brevi tra un autista addetto alle consegne e un cliente.

Riepilogo guidato

Riassumere le recensioni di un ristorante in base a un interesse specifico dell'utente.

Estrazione di entità

Estrazione di dettagli importanti su un evento imminente da un thread email.

Ispirazione per la generazione di contenuti

Suggerire prompt per una voce del journal.

Scansione intelligente dei documenti

Estrazione e classificazione degli articoli da un'immagine della ricevuta.

Classificazione del testo

Classificare le recensioni dei clienti in una categoria positiva, neutra o negativa.

API Prompt e API specifiche per funzionalità

Le API ML Kit GenAI esistenti supportano i casi d'uso Riepilogo, Correzione bozza, Riscrittura e Descrizione immagine, supportati anche dall'API Prompt. La tabella seguente illustra i vantaggi di ciascuna opzione:

Considerazione

API Prompt

API specifiche per funzionalità

Impegno richiesto per l'integrazione

Alto.

Richiede più impegno per l'implementazione, a causa dell'ingegneria dei prompt e del controllo qualità.

stress.

Richiedono meno impegno, in quanto queste API sono già ottimizzate per casi d'uso specifici. Non è necessario interagire direttamente con l'LLM.

Flessibilità

Maggiore flessibilità, in quanto puoi personalizzare il prompt.

Meno flessibilità. Ogni API ha un affinamento predefinito e un prompt integrato con le seguenti caratteristiche:

  • I riepiloghi possono essere solo in 1-3 punti elenco.
  • La descrizione dell'immagine è generica e breve.
  • La riscrittura supporta solo gli stili predefiniti.

Come regola generale, utilizza l'API Prompt quando hai bisogno di maggiore personalizzazione e flessibilità e utilizza le API specifiche delle funzionalità per le attività standard che non richiedono una logica complessa.

Codice di esempio