الفهرس
EmbeddedAssistant
(واجهة)AssistConfig
(رسالة)AssistRequest
(رسالة)AssistResponse
(رسالة)AssistResponse.EventType
(تعداد)AudioInConfig
(رسالة)AudioInConfig.Encoding
(تعداد)AudioOut
(رسالة)AudioOutConfig
(رسالة)AudioOutConfig.Encoding
(تعداد)DebugConfig
(رسالة)DebugInfo
(رسالة)DeviceAction
(رسالة)DeviceConfig
(رسالة)DeviceLocation
(رسالة)DialogStateIn
(رسالة)DialogStateOut
(رسالة)DialogStateOut.MicrophoneMode
(تعداد)ScreenOut
(رسالة)ScreenOut.Format
(تعداد)ScreenOutConfig
(رسالة)ScreenOutConfig.ScreenMode
(تعداد)SpeechRecognitionResult
(رسالة)
EmbeddedAssistant
خدمة تنفّذ Google Assistant API
تمريرة حاسمة | |
---|---|
بدء محادثة أو مواصلتها باستخدام "خدمة مساعد Google" المضمّنة. تُجري كل مكالمة جولة ذهاب وعودة واحدة، ويتم إرسال طلب صوتي إلى الخدمة وتلقّي الردّ الصوتي. تستخدم هذه الميزة البث ثنائي الاتجاه لتلقّي النتائج، مثل حدث المحادثة هي عبارة عن اتصال واحد أو أكثر من اتصالات gRPC، يتكون كل منها من عدة طلبات وردود يتم بثها. على سبيل المثال، يسأل المستخدم إضافة إلى قائمة التسوّق، فيردّ "مساعد Google" على السؤال ماذا تريد أن تضيف؟. يمكن أن يكون تسلسل الطلبات والاستجابات التي يتم بثها في رسالة gRPC الأولى على النحو التالي:
يقول المستخدم بعد ذلك كعكة البيغل، ويردّ "مساعد Google" بعبارة حسنًا، لقد أضفت كعكة البيغل إلى قائمة التسوّق. يتم إرسال هذا الإجراء كطلب ربط آخر في gRPC إلى طريقة
على الرغم من أنّ الترتيب الدقيق للردود غير مضمون، ستحتوي رسائل
|
AssistConfig
تحدِّد هذه السمة كيفية معالجة رسائل AssistRequest
.
الحقول | ||
---|---|---|
audio_out_config |
مطلوبة لتحديد كيفية تنسيق المقطع الصوتي الذي سيتم عرضه. |
|
screen_out_config |
اختيارية: تحدِّد هذه السمة التنسيق المطلوب استخدامه عندما يعرض الخادم استجابة مرئية على الشاشة. |
|
dialog_state_in |
مطلوب يمثل حالة مربع الحوار الحالية. |
|
device_config |
إعدادات الجهاز التي تُعرِّف جهازًا معيّنًا بشكل فريد. |
|
debug_config |
اختياري معلمات تصحيح الأخطاء لاستدعاء إجراء عن بُعد (RPC) لـ |
|
حقل الاتحاد يمكن أن تكون السمة " |
||
audio_in_config |
تحدِّد هذه السياسة كيفية معالجة المقطع الصوتي الوارد التالي. هذه السمة مطلوبة في حال توفير |
|
text_query |
إدخال النص الذي سيتم إرساله إلى "مساعد Google" يمكن تعبئة هذا الحقل من واجهة نصية في حال عدم توفّر إدخال الصوت. |
AssistRequest
رسالة المستوى الأعلى التي أرسلها العميل. على العملاء إرسال رسالتَين على الأقل من رسائل AssistRequest
، إضافةً إلى عدة رسائل. يجب أن تحتوي الرسالة الأولى على رسالة config
وألا تحتوي على بيانات audio_in
. يجب أن تحتوي جميع الرسائل اللاحقة على بيانات audio_in
ويجب ألا تحتوي على رسالة config
.
الحقول | ||
---|---|---|
حقل الاتحاد type يجب تحديد حقل واحد من هذه الحقول في كل AssistRequest . يمكن أن تكون السمة "type " واحدة فقط مما يلي: |
||
config |
توفّر رسالة |
|
audio_in |
البيانات الصوتية المطلوب التعرّف عليها يتم إرسال المقاطع الصوتية التسلسلية في رسائل |
AssistResponse
رسالة المستوى الأعلى التي يتلقّاها العميل. يتم بث سلسلة تتكون من رسالة AssistResponse
واحدة أو أكثر إلى العميل.
الحقول | |
---|---|
event_type |
الإخراج فقط يشير إلى نوع الحدث. |
audio_out |
إخراج فقط: المقطع الصوتي الذي يتضمن رد "مساعد Google" على طلب البحث. |
screen_out |
إخراج فقط يحتوي على استجابة "مساعد Google" المرئية لطلب البحث. |
device_action |
الإخراج فقط يحتوي على الإجراء الذي تم تشغيله من خلال طلب البحث مع الحمولات المناسبة والتحليل الدلالي. |
speech_results[] |
إخراج فقط تحتوي هذه القائمة المتكررة على قيمة صفرية أو أكثر من نتائج التعرف على الكلام التي تتطابق مع الأجزاء المتتالية من الصوت الذي تتم معالجته حاليًا، بدءًا من الجزء المقابل للصوت الأقدم (والجزء الأكثر ثباتًا) وحتى الجزء المقابل لآخر صوت. يمكن إنشاء تسلسل للسلاسل لعرض الاستجابة الكاملة قيد التقدم. عند اكتمال التعرف على الكلام، ستحتوي هذه القائمة على عنصر واحد مع |
dialog_state_out |
النتائج فقط: يحتوي على مخرجات ذات صلة بطلب بحث المستخدم. |
debug_info |
النتائج فقط معلومات تصحيح الأخطاء لمطوّر البرامج لا يتم عرضه إلا إذا تم ضبط الطلب |
EventType
تشير هذه السمة إلى نوع الحدث.
عمليات التعداد | |
---|---|
EVENT_TYPE_UNSPECIFIED |
لم يتم تحديد أي حدث. |
END_OF_UTTERANCE |
يشير هذا الحدث إلى أنّ الخادم قد اكتشف نهاية الكلام المنطوق للمستخدم ولا يتوقع أي كلام إضافي. لذلك، لن يعالج الخادم الصوت الإضافي (مع أنه قد يعرض نتائج إضافية لاحقًا). على العميل إيقاف إرسال بيانات صوتية إضافية، وإغلاق اتصال gRPC بشكل نصفي، وانتظار أي نتائج إضافية إلى أن يغلق الخادم اتصال gRPC. |
AudioInConfig
تُحدِّد كيفية معالجة بيانات audio_in
التي سيتم تقديمها في الطلبات اللاحقة. للاطّلاع على الإعدادات المقترَحة، راجِع أفضل الممارسات لحزمة تطوير البرامج (SDK) لخدمة "مساعد Google".
الحقول | |
---|---|
encoding |
مطلوب ترميز البيانات الصوتية المرسلة في جميع رسائل |
sample_rate_hertz |
مطلوب معدّل العينة (بالهيرتز) للبيانات الصوتية التي تم إرسالها في جميع رسائل |
الترميز
الترميز الصوتي للبيانات المُرسَلة في الرسالة الصوتية يجب أن يكون الصوت بقناة واحدة (أحادية).
عمليات التعداد | |
---|---|
ENCODING_UNSPECIFIED |
غير محدَّد. ستعرض النتيجة google.rpc.Code.INVALID_ARGUMENT . |
LINEAR16 |
عينات صغيرة ذات علامة 16 بت غير مضغوطة (PCM الخطي). لا يتضمن هذا الترميز أي عنوان، بل يشمل وحدات بايت الصوت الأولية فقط. |
FLAC |
FLAC (برنامج ترميز الصوت المجاني بدون فقدان البيانات) هو الترميز الموصى به لأنّه لا يؤدي إلى فقدان البيانات، وبالتالي لا يتم اختراق ميزة التعرّف على الصوت، ولا يتطلّب سوى نصف معدّل نقل البيانات لـ LINEAR16 . يتضمّن هذا الترميز عنوان البث FLAC متبوعًا بالبيانات الصوتية. ويتيح هذا الإصدار استخدام نماذج 16 بت و24 بت، إلا أنّ بعض الحقول في STREAMINFO غير متوافقة. |
AudioOut
الصوت الذي يتضمّن ردّ "مساعد Google" على الطلب يتم تلقّي مقاطع متسلسلة من البيانات الصوتية في رسائل AssistResponse
تسلسلية.
الحقول | |
---|---|
audio_data |
إخراج فقط: البيانات الصوتية التي تحتوي على رد "مساعد Google" على طلب البحث يتم تلقّي مقاطع متسلسلة من البيانات الصوتية في رسائل |
AudioOutConfig
تحدِّد هذه السياسة التنسيق المطلوب الذي يستخدمه الخادم عند عرض رسائل audio_out
.
الحقول | |
---|---|
encoding |
مطلوب ترميز البيانات الصوتية التي سيتم عرضها في جميع رسائل |
sample_rate_hertz |
مطلوب يشير إلى معدّل العينة بالهرتز للبيانات الصوتية التي يتم عرضها في |
volume_percentage |
مطلوب الإعداد الحالي لمستوى الصوت لإخراج الصوت في الجهاز. تتراوح القيم الصالحة بين 1 و100 (ما يعادل 1% إلى 100%). |
الترميز
الترميز الصوتي للبيانات المعروضة في الرسالة الصوتية. جميع الترميزات هي وحدات بايت للصوت غير معدَّل بدون عنوان، باستثناء ما هو موضّح أدناه.
عمليات التعداد | |
---|---|
ENCODING_UNSPECIFIED |
غير محدَّد. ستعرض النتيجة google.rpc.Code.INVALID_ARGUMENT . |
LINEAR16 |
عينات صغيرة ذات علامة 16 بت غير مضغوطة (PCM الخطي). |
MP3 |
ترميز الصوت MP3 يتم تشفير معدل العينة في الحمولة. |
OPUS_IN_OGG |
ملف صوتي بترميز Opus ملفوف في حاوية بتنسيق ogg. وستكون النتيجة ملفًا يمكن تشغيله محليًا على Android وفي بعض المتصفحات (مثل Chrome). جودة الترميز أعلى بكثير من MP3 في حين تستخدم معدل نقل البيانات نفسه. يتم تشفير معدل العينة في الحمولة. |
DebugConfig
تصحيح أخطاء الطلب الحالي
الحقول | |
---|---|
return_debug_info |
وعند ضبط هذا الحقل على "صحيح"، قد تتم تعبئة الحقل |
DebugInfo
معلومات تصحيح الأخطاء لمطوّر البرامج لا يتم عرضه إلا إذا تم ضبط الطلب return_debug_info
على "صحيح".
الحقول | |
---|---|
aog_agent_to_assistant_json |
استجابة JSON الأصلية من وكيل Action-on-Google إلى خادم Google يُرجى الاطّلاع على AppResponse. لن تتم تعبئته إلا إذا كان صانع الطلب يملك مشروع AoG وكان مشروع AoG في وضع المعاينة. |
DeviceAction
يتم عرض الاستجابة إلى الجهاز إذا شغّل المستخدم أحد إجراءات الجهاز. على سبيل المثال، سيتلقّى الجهاز الذي يتوافق مع طلب البحث Turn on thelight DeviceAction
مع حمولة JSON تحتوي على دلالات الطلب.
الحقول | |
---|---|
device_request_json |
ملف JSON يحتوي على استجابة أوامر الجهاز التي تم إنشاؤها من قواعد إجراءات الجهاز التي تم تفعيلها، ويتم تحديد التنسيق من خلال هدف |
DeviceConfig
مطلوبة الحقول التي تتعرّف على الجهاز بالنسبة إلى "مساعد Google"
انظر أيضًا:
الحقول | |
---|---|
device_id |
المعرّف الفريد مطلوب للجهاز. يجب ألا يزيد طول المعرّف عن 128 حرفًا. على سبيل المثال: DBCDW098234. يجب أن يتطابق هذا المعرّف مع قيمة device_id التي تم إرجاعها من عملية تسجيل الجهاز. ويُستخدَم معرّف الجهاز هذا للمطابقة مع أجهزة المستخدم المسجَّلة للبحث عن سمات هذا الجهاز وإمكاناته المتوافقة. ومن المفترض ألّا تتغيّر هذه المعلومات على مستوى عمليات إعادة تشغيل الجهاز. ومع ذلك، يجب عدم حفظها من خلال عمليات إعادة الضبط على الإعدادات الأصلية. |
device_model_id |
المعرّف الفريد مطلوب لطراز الجهاز. ويجب أن يكون الجمع بين device_model_id وdevice_id مرتبطًا في السابق من خلال تسجيل الجهاز. |
DeviceLocation
هناك ثلاثة مصادر للمواقع الجغرافية. يتم استخدامها مع هذه الأولوية:
- يتم استخدام
DeviceLocation
هذا بشكل أساسي للأجهزة الجوّالة المزوّدة بنظام تحديد المواقع العالمي (GPS). - الموقع الذي يحدده المستخدم أثناء إعداد الجهاز؛ هذا لكل مستخدم على كل جهاز. ويتم استخدام هذا الموقع الجغرافي إذا لم يتم تحديد
DeviceLocation
. - الموقع الجغرافي الذي تم استنتاجه استنادًا إلى عنوان IP. ولا يتم استخدام هذا إلا إذا لم يتم تحديد أيٍّ مما سبق.
الحقول | |
---|---|
coordinates |
خط العرض وخط الطول للجهاز. |
DialogStateIn
يوفّر هذا الخيار معلومات عن حالة مربّع الحوار الحالية.
الحقول | |
---|---|
conversation_state |
مطلوب يجب ضبط هذا الحقل دائمًا على قيمة |
language_code |
مطلوبة لغة الطلب في بنية IETF BCP 47 (على سبيل المثال، "en-US"). يُرجى الاطّلاع على دعم اللغة للحصول على مزيد من المعلومات. إذا اخترت لغة لجهاز |
device_location |
اختياري: يشير إلى موقع الجهاز الذي نشأ منه طلب البحث. |
is_new_conversation |
اختيارية إذا كانت القيمة true، سيتعامل الخادم مع الطلب كمحادثة جديدة ولن يستخدم حالة من الطلب السابق. اضبط هذا الحقل على "صحيح" عندما يجب إعادة تشغيل المحادثة، مثلاً بعد إعادة تشغيل الجهاز، أو بعد انقضاء فترة زمنية كبيرة منذ طلب البحث السابق. |
DialogStateOut
حالة مربّع الحوار الناتجة عن طلب بحث المستخدم قد يتم تلقّي العديد من هذه الرسائل.
الحقول | |
---|---|
supplemental_display_text |
نص العرض التكميلي للإخراج فقط من "مساعد Google" قد يكون هذا المحتوى مماثلاً للكلام المنطوق في |
conversation_state |
معلومات الحالة للإخراج فقط لاستدعاء الإجراء عن بُعد لـ |
microphone_mode |
الإخراج فقط: تحدّد هذه السمة وضع الميكروفون بعد معالجة متوسط عائد النقرة |
volume_percentage |
إخراج فقط تم تحديث مستوى الصوت. ستكون القيمة 0 أو سيتم إسقاطها (مع الإشارة إلى عدم حدوث أي تغيير) ما لم يتم التعرّف على طلب صوتي، مثل رفع مستوى الصوت أو ضبط مستوى الصوت 4، وفي هذه الحالة ستكون القيمة بين 1 و100 (يتوافق مع مستوى الصوت الجديد بين 1% و100%). عادةً ما يستخدم العميل مستوى الصوت هذا عند تشغيل بيانات |
MicrophoneMode
الحالات المحتملة للميكروفون بعد اكتمال Assist
RPC.
عمليات التعداد | |
---|---|
MICROPHONE_MODE_UNSPECIFIED |
لم يتم تحديد أي وضع. |
CLOSE_MICROPHONE |
لا تتوقّع الخدمة سؤال متابعة من المستخدم. يجب أن يبقى الميكروفون متوقفًا إلى أن يُعيد المستخدم تفعيله. |
DIALOG_FOLLOW_ON |
تتوقّع الخدمة سؤال متابعة من المستخدم. يجب إعادة فتح الميكروفون عند اكتمال تشغيل AudioOut (عن طريق بدء مكالمة Assist جديدة حول RPC لإرسال الصوت الجديد). |
ScreenOut
استجابة "مساعد Google" المرئية لطلب البحث تم التفعيل من قِبل "screen_out_config
".
الحقول | |
---|---|
format |
الإخراج فقط: تنسيق بيانات الشاشة المقدَّمة |
data |
الإخراج فقط: هي بيانات الشاشة الأولية التي سيتم عرضها كنتيجة لطلب بحث "مساعد Google". |
التنسيق
التنسيقات المحتملة لبيانات الشاشة.
عمليات التعداد | |
---|---|
FORMAT_UNSPECIFIED |
لم يتم تحديد أي تنسيق. |
HTML |
ستحتوي البيانات على تنسيق HTML5 كامل التنسيق تم ترميزه بترميز UTF-8، مثل <html><body><div>...</div></body></html> . ويجب أن يتم عرضه مع الاستجابة الصوتية. لاحظ أنه يجب تضمين HTML5 DOCTYPE في بيانات HTML الفعلية. |
ScreenOutConfig
تحدِّد هذه السياسة التنسيق المطلوب الذي يستخدمه الخادم عند عرض استجابة screen_out
.
الحقول | |
---|---|
screen_mode |
وضع الشاشة المرئي الحالي للجهاز أثناء إصدار طلب البحث |
ScreenMode
الأوضاع الممكنة لإخراج الشاشة المرئي على الجهاز.
عمليات التعداد | |
---|---|
SCREEN_MODE_UNSPECIFIED |
لم يتم تحديد أي وضع للفيديو. قد يستجيب "مساعد Google" كما لو كان في وضع OFF . |
OFF |
الشاشة مطفأة (أو تم ضبط درجة السطوع أو إعدادات أخرى على درجة منخفضة جدًا لدرجة لا يمكن رؤيتها). لن يعرض "مساعد Google" عادةً استجابة من الشاشة في هذا الوضع. |
PLAYING |
سيعرض "مساعد Google" عادةً استجابة جزئية للشاشة في هذا الوضع. |
SpeechRecognitionResult
النص المقدَّر للعبارة التي قالها المستخدم. قد يكون ذلك مقطعًا واحدًا أو التخمين الكامل لطلب البحث الشفهي للمستخدم.
الحقول | |
---|---|
transcript |
للإخراج فقط نص النص الذي يمثل الكلمات التي قالها المستخدم. |
stability |
الإخراج فقط: تقدير لاحتمالية عدم تغيير "مساعد Google" لتخمينه بشأن هذه النتيجة. تتراوح القيم من 0.0 (غير مستقر تمامًا) إلى 1.0 (ثابتة ونهائية تمامًا). القيمة التلقائية 0.0 هي قيمة مُرسَلة تشير إلى أنّه لم يتم ضبط |