Envía solicitudes personalizadas a Gemini Nano con la API de GenAI Prompt

Con la API de GenAI Prompt de ML Kit, puedes enviar solicitudes en lenguaje natural en el dispositivo a Gemini Nano. La API de GenAI Prompt acepta una entrada de texto o una entrada combinada de imagen y texto, y emite una salida de texto.

Puedes usar la API de GenAI Prompt para una variedad de casos de uso, incluidos los siguientes:

Caso práctico

Ejemplo

Comprensión de imágenes

Analizar fotos para clasificarlas, por ejemplo, como "mascotas", "comida" o "viajes"

Traducciones breves

Traducir mensajes cortos entre un conductor de reparto y un cliente

Resúmenes guiados

Resumir opiniones sobre un restaurante según el interés específico de un usuario

Extracción de entidades

Extraer detalles importantes sobre un próximo evento de un hilo de correo electrónico

Inspiración para la generación de contenido

Sugerir mensajes para una entrada de diario

Escaneo inteligente de documentos

Extraer y categorizar elementos de la imagen de un recibo

Clasificación de texto

Clasificar las opiniones de los clientes en una categoría positiva, neutral o negativa

Comparación entre la API de Prompt y las APIs específicas para funciones

Las APIs de IA generativa existentes de ML Kit admiten los casos de uso de resumen, corrección de pruebas, reescritura y descripción de imágenes, que también admite la API de Prompt. En la siguiente tabla, se describen los beneficios de cada una:

Consideración

API de Prompt

APIs específicas de funciones

Esfuerzo de integración

Alta.

Requiere más esfuerzo para implementarse debido a la ingeniería de instrucciones y el control de calidad.

tan llevaderos

Requieren menos esfuerzo, ya que estas APIs ya están ajustadas para casos de uso específicos. No es necesario trabajar directamente con el LLM.

Flexibilidad

Mayor flexibilidad, ya que puedes diseñar la instrucción de forma personalizada.

Menos flexibilidad Cada API tiene un ajuste fino fijo y una instrucción integrada con las siguientes características:

  • Los resúmenes solo pueden tener entre 1 y 3 viñetas.
  • La descripción de la imagen es genérica y breve.
  • La reescritura solo admite estilos predefinidos.

Como regla general, usa la API de Prompt cuando necesites más personalización y flexibilidad, y usa las APIs específicas de la función para tareas estándar que no requieren lógica compleja.

Código de muestra