借助 Google 助理 SDK,您可以将语音控制、自然语言理解和 Google 智能工具添加到您的点子中。您的项目会捕获语音内容(语音音频请求,例如“我的日历上有什么安排?”),将其发送给 Google 助理,并在语音的原始文本之外接收语音音频响应。
Google 助理服务
Google 助理服务公开了一个低级别 API,可让您直接操控 Google 助理请求和响应的音频字节。您可以针对支持 gRPC 的所有平台,针对 Node.js、Go、C++、Java 等语言生成此 API 的绑定。
Python 中提供了用于音频捕获、音频播放和对话状态管理的参考代码。
兼容性和功能支持
下表总结了 Google 助理服务的平台兼容性要求:
Google 助理服务 | ||
---|---|---|
支持的架构 | 所有 gRPC 平台 | |
支持的语言 | 所有 gRPC 语言 | |
免触摸激活 (Ok Google) |
否 | |
音频捕获和播放 | 已提供参考代码 | |
对话状态管理 | 已提供参考代码 | |
计时器和闹钟 | 否 | |
播放播客和新闻 | 否 | |
广播语音消息 | 否 | |
Google 助理回应的视觉输出 (HTML5) | 是 |
开始构建项目的步骤
借助该 SDK,您可以嵌入 Google 助理,然后借助 Actions on Google 添加独特的功能,从而快速构建项目:
- 使用 gRPC API 构建项目。
- 了解后续步骤进行自定义设置。
- 阅读隐私和安全以及音频配置的最佳实践,完善您的项目。