由于 Google Chat API 是一项共享服务,因此我们会应用配额和限制,以确保所有用户都能公平地使用该服务,并保护 Google Workspace 的整体性能。
如果您超出配额,则会收到 429: Too many requests HTTP 状态代码响应。聊天后端上的其他速率限制检查也可能会生成相同的错误响应。如果发生此错误,您应使用指数退避算法,稍后再试。只要您不超过下表中列出的每分钟配额,每天可以发出的请求数量就没有限制。
多种配额类型可能适用于 Chat API 方法:每项目配额、每空间配额和每用户配额。
每个项目的配额
每个项目的配额限制了 Google Cloud 项目的查询速率,因此适用于调用指定 Chat API 方法的单个 Chat 应用。
下表详细列出了每个项目的查询限制。您还可以在配额页面上找到这些限制。
每个项目的配额  | 
    Chat API 方法  | 
    限制(每 60 秒)  | 
  
|---|---|---|
每分钟消息写入次数  | 
    
 
 
  | 
    3000  | 
  
每分钟消息读取次数  | 
    
 
  | 
    3000  | 
  
每分钟会员资格写入次数  | 
    
 
  | 
    300  | 
  
每分钟会员资格读取次数  | 
    
 
  | 
    3000  | 
  
每分钟空间写入次数  | 
    
 
  | 
    60  | 
  
每分钟空间读取次数  | 
    
 
 
  | 
    3000  | 
  
每分钟附件写入次数  | 
    
  | 
    600  | 
  
每分钟附件读取次数  | 
    
 
  | 
    3000  | 
  
每分钟反应写入次数  | 
    
 
  | 
    600  | 
  
每分钟反应读取次数  | 
    
  | 
    3000  | 
  
每个空间的配额
每个聊天室的配额限制了指定聊天室中的查询速率,并且由在该聊天室中运行的所有 Chat 应用共享,这些应用会针对每个配额调用列出的 Chat API 方法。
下表详细列出了每个空间的查询限制:
每个空间的配额  | 
    Chat API 方法  | 
    限制(每秒)  | 
  
|---|---|---|
每秒读取次数  | 
    
       
 
 
 
 
 
 
 
  | 
    15  | 
  
每秒写入次数  | 
    
       
 
 
 
 
 
 
  | 
    1  | 
  
每秒创建的 Reaction 写入次数  | 
    
       
  | 
    
       5  | 
  
将数据导入到 Google Chat 时每秒的消息写入次数  | 
    
       
  | 
    
       10  | 
  
每位用户的配额
每位用户的配额会限制 Google Chat 用户的查询速率。查询涉及所有代表用户(使用用户身份验证)调用 Chat API 方法的 Chat 应用。
下表详细列出了每个用户的查询限制:
每位用户的配额  | 
    Chat API 方法  | 
    限制(每秒)  | 
  
|---|---|---|
每秒读取次数  | 
    
       
 
  | 
    15  | 
  
每秒写入次数  | 
    
       
 
  | 
    1  | 
  
其他用量限额
创建类型为 GROUP_CHAT 或 SPACE 的聊天室(使用 spaces.create 或 spaces.setup 方法)还有其他配额限制。每分钟创建的此类聊天室数量少于 35 个,每小时创建的此类聊天室数量少于 800 个。类型为 DIRECT_MESSAGE 的空间不受这些额外配额限制的约束。
如果针对同一空间的 API 流量过高,可能会触发配额页面中未显示的额外内部限制。
解决基于时间的配额错误
对于所有基于时间的错误(每 X 分钟最多 N 个请求),我们建议您的代码捕获异常并使用截断指数退避,以确保设备不会产生过大的负载。
指数退避算法是网络应用的标准错误处理策略。指数退避算法以指数方式重试请求(不断增加各次请求之间的等待时间,直到达到最大退避时间)。如果请求仍然失败,请务必确保请求之间的延迟时间会随着时间的推移而增加,直到请求成功为止。
示例算法
指数退避算法以指数方式重试请求(不断增加各次重试之间的等待时间,直到达到最大退避时间)。例如:
- 向 Google Chat API 发出请求。
 - 如果请求失败,请等待 1 + 
random_number_milliseconds秒后再重试请求。 - 如果请求失败,请等待 2 + 
random_number_milliseconds秒后再重试请求。 - 如果请求失败,请等待 4 + 
random_number_milliseconds秒后再重试请求。 - 依此类推,等待时间上限为 
maximum_backoff。 - 继续等待并重试,直至达到重试次数上限,但不会增加重试之间的等待时间。
 
其中:
- 等待时间为 
min(((2^n)+random_number_milliseconds), maximum_backoff),其中,n会在每次迭代(请求)后增加 1。 random_number_milliseconds是小于或等于 1,000 的毫秒数(随机值)。这有助于避免出现以下情况:许多客户端在某些情况下全部同步进行处理并同时执行重试操作,导致同步发送每一波请求。每次重试请求后,系统都会重新计算random_number_milliseconds值。maximum_backoff通常为 32 或 64 秒。哪个值更为适当,这取决于用例。
  客户端在达到 maximum_backoff 时间后可以继续重试。
  此后执行的重试不需要继续增加退避时间。例如,如果客户端使用的 maximum_backoff 时间为 64 秒,则在达到此值后,客户端可以每 64 秒重试一次。到了特定时间点后,客户端应停止无限重试。
重试之间的等待时间和重试次数取决于您的用例和网络条件。
申请提高每个项目的配额
根据项目的资源用量,您可能需要申请调整配额。服务账号的 API 调用被视为使用单个账号。我们无法保证您的调整配额请求一定会得到批准。如果配额调整请求会大幅增加配额值,则可能需要更长时间才能获得批准。
并非所有项目的配额都完全相同。随着您对 Google Cloud 的使用量逐步增加,您可能需要增加配额值。如果您预计用量即将显著增加,可以在 Google Cloud 控制台的“配额”页面中主动申请调整配额。
如需了解详情,请参阅以下资源: