用量限额

由于 Google Chat API 是一项共享服务,因此我们会设置配额和限制,以确保所有用户都能公平地使用该服务,并保护 Google Workspace 的整体性能。

如果超出配额,您将收到 429: Too many requests HTTP 状态代码响应。Chat 后端的其他速率限制检查也可能会生成相同的错误响应。如果发生此错误,您应使用指数退避算法,然后稍后重试。只要您不超出下表中列出的每分钟配额,每天可以发出的请求数量就没有限制。

Chat API 方法适用两种配额类型:按聊天室配额和按项目配额。

每个聊天室的配额

每个聊天室的配额会限制给定聊天室中的查询速率,并且会在该聊天室中执行操作的所有 Chat 应用之间共享,这些应用会针对每个配额调用所列的 Chat API 方法。

下表详细说明了每个聊天室的查询限制:

每个聊天室的配额

Chat API 方法

限制(每 60 秒,
在聊天室中的所有 Chat 应用之间共享)

每分钟读取次数

media.download

spaces.get

spaces.members.get

spaces.members.list

spaces.messages.get

spaces.messages.list

spaces.messages.attachments.get

spaces.messages.reactions.list

900

每分钟写入次数

media.upload

spaces.delete

spaces.patch

spaces.messages.create传入的网络钩子另有限制)

spaces.messages.delete

spaces.messages.patch

spaces.messages.reactions.create

spaces.messages.reactions.delete

60

每个项目的配额

按项目配额会限制 Google Cloud 项目的查询速率,因此适用于针对每个配额调用指定 Chat API 方法的单个 Chat 应用。

下表详细介绍了每个项目的查询限制。您还可以在配额页面上找到这些限制。

每个项目的配额

Chat API 方法

限制(每 60 秒)

每分钟消息写入次数

spaces.messages.create

spaces.messages.patch

spaces.messages.delete

3000

每分钟消息读取次数

spaces.messages.get

spaces.messages.list

3000

每分钟会员写入次数

spaces.members.create

spaces.members.delete

300

每分钟会员资格读取次数

spaces.members.get

spaces.members.list

3000

每分钟聊天室写入次数

spaces.setup

spaces.create

spaces.patch

spaces.delete

60

每分钟聊天室读取次数

spaces.get

spaces.list

spaces.findDirectMessage

3000

每分钟附件写入次数

media.upload

600

每分钟附件读取次数

spaces.messages.attachments.get

media.download

3000

每分钟回应写入次数

spaces.messages.reactions.create

spaces.messages.reactions.delete

600

每分钟回应读取次数

spaces.messages.reactions.list

3000

其他用量限制

创建类型为 GROUP_CHATSPACE 的聊天室(使用 spaces.createspaces.setup 方法)还有额外的配额限制。每分钟创建此类聊天室不超过 35 个,每小时创建此类聊天室不超过 800 个。类型为 DIRECT_MESSAGE 的聊天室不受这些额外配额限制的约束。

以同一聊天室为目标的大量 API 流量可能会触发配额页面中未显示的其他内部限制。

解决基于时间的配额错误

对于所有基于时间的错误(每 X 分钟最多发出 N 个请求),我们建议您的代码捕获异常并使用截断的对数回退,以确保您的设备不会产生过多负载。

指数退避算法是网络应用的标准错误处理策略。指数退避算法以指数方式重试请求(不断增加各次请求之间的等待时间,直到达到最大退避时间)。如果请求仍未成功,请务必让请求之间的延迟时间随着时间的推移而增加,直到请求成功为止。

示例算法

指数退避算法以指数方式重试请求(不断增加各次重试之间的等待时间,直到达到最大退避时间)。例如:

  1. 向 Google Chat API 发出请求。
  2. 如果请求失败,请等待 1 + random_number_milliseconds 秒后再重试请求。
  3. 如果请求失败,请等待 2 + random_number_milliseconds 秒后再重试请求。
  4. 如果请求失败,请等待 4 + random_number_milliseconds 秒后再重试请求。
  5. 依此类推,等待时间上限为 maximum_backoff
  6. 继续等待并重试,直至达到重试次数上限,但不会增加重试之间的等待时间。

其中:

  • 等待时间为 min(((2^n)+random_number_milliseconds), maximum_backoff),其中,n 会在每次迭代(请求)后增加 1。
  • random_number_milliseconds 是一个小于或等于 1,000 的随机毫秒数。这有助于避免出现以下情况:许多客户端在某些情况下全部同步进行处理并同时执行重试操作,导致同步发送每一波请求。每次重试请求后,系统都会重新计算 random_number_milliseconds 值。
  • maximum_backoff 通常为 32 或 64 秒。最适当的值取决于用例。

客户端在达到 maximum_backoff 时间后可以继续重试。此后执行的重试不需要继续增加退避时间。例如,如果客户端使用的 maximum_backoff 时间为 64 秒,则在达到此值后,客户端可以每 64 秒重试一次。到了特定时间点后,客户端应停止无限重试。

重试之间的等待时间和重试次数取决于您的用例和网络条件。

申请提高每个项目的配额

根据项目的资源使用情况,您可能需要申请增加配额。服务账号的 API 调用会被视为使用单个账号。我们无法保证您的增加配额请求一定会得到批准。而增加大量配额的请求可能需要更长时间才能获得批准。

并非所有项目的配额都完全相同。随着您的 Google Cloud 使用量逐步增加,您可能需要增加配额。如果您预计自己的用量即将显著增加,可以在 Google Cloud 控制台的配额页面中主动申请调整配额

如需了解详情,请参阅以下资源: