對話動作已於 2023 年 6 月 13 日淘汰。詳情請參閱「對話動作已淘汰」。

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

音訊的最佳做法

本頁麵包含如何將語音資料提供給 Google 助理 API 的建議。這些指南旨在提高效率與準確性，並加快服務回應時間。

音訊預先處理

建議使用品質良好且位置適當的麥克風，以提供盡可能清晰的音訊。但是，在將音訊傳送至服務之前，對音訊進行雜訊抑制訊號處理通常會降低辨識準確性。服務主要是用來處理吵雜音訊。

為確保最佳成效：

理想情況：

如果可以，請將音訊來源的取樣率設為 16000 Hz。否則，請將 sample_rate_hertz 設為與音訊來源的原生取樣率相符 (而非重新取樣)。

Google 助理會在從麥克風擷取即時音訊時辨識即時音訊。音訊串流必須分割為影格，並以連續 AssistRequest 訊息傳送。任何影格大小都可接受。影格越大，效率就越佳，但會增加延遲。建議使用 100 毫秒的影格大小，做為延遲與效率之間的理想取捨。