Wysyłanie niestandardowych żądań do Gemini Nano za pomocą interfejsu GenAI Prompt API

Za pomocą interfejsu GenAI Prompt API w ML Kit możesz wysyłać żądania w języku naturalnym na urządzeniu do Gemini Nano. Interfejs GenAI Prompt API akceptuje dane wejściowe w postaci tekstu lub połączonych obrazów i tekstu, a generuje dane wyjściowe w postaci tekstu.

Interfejs GenAI Prompt API możesz wykorzystać w różnych przypadkach użycia, w tym:

Przypadek użycia

Przykład

Rozpoznawanie obrazów

analizowanie zdjęć pod kątem klasyfikacji, np. „zwierzęta”, „jedzenie” lub „podróże”;

Krótkie tłumaczenia

tłumaczenie krótkich wiadomości między kierowcą dostarczającym przesyłkę a klientem;

Podsumowanie z przewodnikiem

Podsumowywanie opinii o restauracji na podstawie konkretnych zainteresowań użytkownika.

Ekstrakcja encji

wyodrębnianie ważnych informacji o nadchodzącym wydarzeniu z wątku e-mail;

Inspiracje do generowania treści

sugerowanie promptów do wpisu w dzienniku,

Inteligentne skanowanie dokumentów

wyodrębnianie i kategoryzowanie pozycji z obrazu paragonu;

Klasyfikacja tekstu

klasyfikowanie opinii klientów jako pozytywnych, neutralnych lub negatywnych;

Interfejs Prompt API a interfejsy API poszczególnych funkcji

Obecne interfejsy ML Kit GenAI API obsługują przypadki użycia podsumowywania, korekty, przekształcaniaopisu obrazu, które są też obsługiwane przez Prompt API. W tabeli poniżej znajdziesz korzyści wynikające z każdej z nich:

Rozważanie zakupu

Prompt API

Interfejsy API dotyczące konkretnych funkcji

Trudność integracji

Wysoki.

Wymaga więcej wysiłku w realizacji ze względu na inżynierię promptów i zapewnienie jakości.

Niski.

Wymaga mniej wysiłku, ponieważ te interfejsy API są już dostosowane do konkretnych przypadków użycia. Nie musisz bezpośrednio korzystać z LLM.

Elastyczność

Większa elastyczność, ponieważ możesz dostosować prompt.

Mniejsza elastyczność. Każdy interfejs API ma stałe dostrajanie i wbudowany prompt o tych cechach:

  • Podsumowanie może zawierać tylko 1–3 punkty.
  • Opis obrazu jest ogólny i krótki.
  • Przeredagowywanie obsługuje tylko wstępnie zdefiniowane style.

Ogólnie rzecz biorąc, używaj interfejsu Prompt API, gdy potrzebujesz większego dostosowania i elastyczności, a interfejsów API konkretnych funkcji do standardowych zadań, które nie wymagają złożonej logiki.

Przykładowy kod