As APIs GenAI do Kit de ML aproveitam o poder do Gemini Nano para ajudar seus apps a realizar tarefas. Essas APIs oferecem qualidade pronta para uso em casos de uso populares por meio de uma interface de alto nível. As APIs GenAI do ML Kit são criadas com base no AICore, um serviço do sistema Android que permite a execução no dispositivo de modelos de fundação de IA generativa para facilitar recursos como funcionalidade aprimorada de apps e melhor privacidade do usuário ao processar dados localmente.
Os Termos de Serviço adicionais da API GenAI do ML Kit se aplicam ao uso das APIs GenAI. Os desenvolvedores são os únicos responsáveis pela segurança do cliente da API e pela experiência do usuário do app.
Principais recursos
As APIs GenAI do ML Kit são compatíveis com os seguintes recursos:
- Resumo: resuma artigos ou conversas em chat como uma lista com marcadores.
- Revisão: melhore conteúdos curtos refinando a gramática e corrigindo erros de ortografia.
- Reescrita: reescreva mensagens curtas em diferentes tons ou estilos.
- Descrição da imagem: gere uma breve descrição de uma determinada imagem.
- Comando: gere conteúdo de texto com base em um comando personalizado somente de texto ou multimodal.
Benefícios das APIs de IA generativa
Assim como outros recursos do Kit de ML, as APIs GenAI são executadas totalmente no dispositivo e, portanto, oferecem os seguintes benefícios:
- Os dados de entrada, inferência e saída são processados localmente
- A funcionalidade permanece a mesma sem uma conexão de Internet confiável
- Sem custo adicional de servidor incorrido para cada chamada de API
Além disso, como as APIs de IA generativa são criadas com base no AICore e usam o Gemini Nano, todos os apps podem usar o modelo compartilhado do Gemini Nano no dispositivo. Isso evita a necessidade de esperar o download de um modelo se ele já existir em um dispositivo e, por sua vez, economiza espaço de armazenamento. Saiba mais sobre como o AICore isola solicitações para proteger a privacidade.
Streaming x não streaming
As APIs GenAI do Kit de ML oferecem opções de streaming e sem streaming para receber resultados. A API de streaming entrega respostas de forma incremental à medida que são geradas, fornecendo um fluxo contínuo de dados. Em contraste, a API não de streaming aguarda até que toda a resposta seja concluída antes de retorná-la como um único bloco.
Escolha a API de streaming para respostas longas, já que ela permite um feedback inicial mais rápido. A API não de streaming é mais adequada para respostas curtas ou quando o processamento resulta em lotes.
Suporte do dispositivo
As APIs específicas de recursos da IA generativa (resumo, revisão, reescrita e descrição de imagens) têm suporte a dispositivos diferente da API de comandos, conforme descrito nas seções a seguir.
Suporte a dispositivos da API específico para recursos
As APIs Summarization, Proofreading, Rewriting e Image Description estão disponíveis nos seguintes dispositivos, com planos de expandir o suporte para outros dispositivos:
- Google: Pixel 10, Pixel 10 Pro, Pixel 10 Pro XL, Pixel 10 Pro Fold, Pixel 9, Pixel 9 Pro, Pixel 9 Pro XL, Pixel 9 Pro Fold
- Honor: Honor 400 Pro, Magic 6 Pro, Magic 6 RSR, Magic 7, Magic 7 Pro, Magic V3, Magic V5
- iQOO: iQOO 13
- Motorola: Razr 60 Ultra
- OnePlus: OnePlus 13, OnePlus 13s, OnePlus Pad 3
- OPPO: Find N5, Find X8, Find X8 Pro, Reno 14 Pro
- POCO: POCO F7 Ultra, POCO X7 Pro
- realme: realme GT 7 Pro, realme GT 7T
- Samsung: Galaxy S25, Galaxy S25+, Galaxy S25 Ultra, Galaxy Z Fold7
- vivo: vivo X200, vivo X200 Pro, vivo X Fold3 Pro, vivo X Fold5
- Xiaomi: Xiaomi 15 Ultra, Xiaomi 15, Xiaomi 15T Pro, Xiaomi 15T, Xiaomi Pad mini
A disponibilidade de suporte a idiomas específicos pode variar dependendo da configuração do dispositivo e dos modelos baixados nele.
Suporte a dispositivos da API Prompt
No momento, a API Prompt é compatível com os seguintes dispositivos:
nano-v2 |
|
nano-v3 |
|
Recuperar a versão do Gemini Nano
Diferentes versões do Gemini Nano são executadas em dispositivos diferentes. Para retornar a versão do Gemini Nano em um dispositivo, use getBaseModelName().
Cota por aplicativo
O AICore impõe uma cota de inferência por app. Fazer muitas
solicitações da API GenAI em um curto período vai resultar em uma resposta
ErrorCode.BUSY. Ao receber um erro desse tipo, considere usar a espera exponencial para
tentar a solicitação de novo. Além disso, ErrorCode.PER_APP_BATTERY_USE_QUOTA_EXCEEDED pode ser retornado se um app exceder uma cota de longa duração (por exemplo, cota diária).
Uso em segundo plano
A inferência da API de IA generativa só é permitida quando o app é o aplicativo em primeiro plano principal. Usar a API quando o app não está em primeiro plano, incluindo
o uso de um serviço em primeiro plano, vai resultar em uma resposta
ErrorCode.BACKGROUND_USE_BLOCKED.
Código de amostra
Para conferir esse código, confira os exemplos a seguir: