Limites de uso

Como a API Google Chat é um serviço compartilhado, aplicamos cotas e limitações para garantir que ela seja usada de forma justa por todos os usuários e para proteger o desempenho geral do Google Workspace.

Se você exceder uma cota, vai receber uma resposta com o código de status HTTP 429: Too many requests. Outras verificações de limitação de taxa no back-end do Chat também podem gerar a mesma resposta de erro. Se esse erro ocorrer, use um algoritmo de espera exponencial e tente de novo mais tarde. Desde que você respeite as cotas por minuto listadas nas tabelas a seguir, não há limite para o número de solicitações que podem ser feitas por dia.

Vários tipos de cota podem ser aplicados aos métodos da API Chat: por projeto, por espaço e por usuário.

Cotas por projeto

As cotas por projeto limitam a taxa de consultas para um projeto do Google Cloud e, portanto, se aplicam a um único app do Chat que chama os métodos especificados da API Chat para cada cota.

A tabela a seguir detalha os limites de consultas por projeto. Você também pode encontrar esses limites na página Cotas.

Cota por projeto	Métodos da API Chat	Limite (a cada 60 segundos)
Gravações de mensagens por minuto	`spaces.messages.create` `spaces.messages.patch` `spaces.messages.delete`	3000
Leituras de mensagens por minuto	`spaces.messages.get` `spaces.messages.list`	3000
Gravações de assinaturas por minuto	`spaces.members.create` `spaces.members.delete`	300
Leituras de assinaturas por minuto	`spaces.members.get` `spaces.members.list`	3000
Gravações de espaços por minuto	`spaces.setup` `spaces.create` `spaces.patch` `spaces.delete`	60
Leituras de espaço por minuto	`spaces.get` `spaces.list` `spaces.findDirectMessage`	3000
Gravações de anexos por minuto	`media.upload`	600
Leituras de anexos por minuto	`spaces.messages.attachments.get` `media.download`	3000
Gravações de reações por minuto	`spaces.messages.reactions.create` `spaces.messages.reactions.delete`	600
Leituras de reações por minuto	`spaces.messages.reactions.list`	3000

Cotas por espaço

As cotas por espaço limitam a taxa de consultas em um determinado espaço e são compartilhadas entre todos os apps do Chat que atuam nesse espaço e chamam os métodos listados da API Chat para cada cota.

A tabela a seguir detalha os limites de consultas por espaço:

Cota por espaço	Métodos da API Chat	Limite (por segundo)
Leituras por segundo	`media.download` `spaces.get` `spaces.members.get` `spaces.members.list` `spaces.messages.get` `spaces.messages.list` `spaces.messages.attachments.get` `spaces.messages.reactions.list`	15
Gravações por segundo	`media.upload` `spaces.delete` `spaces.patch` `spaces.messages.create` (outros limites se aplicam aos webhooks de entrada) `spaces.messages.delete` `spaces.messages.patch` `spaces.messages.reactions.delete`	1
Gravações de criação de reações por segundo	`spaces.messages.reactions.create`	5
Gravações de mensagens por segundo durante a importação de dados para o Google Chat	`spaces.messages.create`	10

Cotas por usuário

As cotas por usuário limitam a taxa de consultas para um usuário do Google Chat. As consultas se referem a todos os apps de chat que chamam um método da API Chat em nome de um usuário (usando a autenticação de usuário).

A tabela a seguir detalha os limites de consultas por usuário:

Cota por usuário	Métodos da API Chat	Limite (por segundo)
Leituras por segundo	`customEmojis.get` `customEmojis.list`	15
Gravações por segundo	`customEmojis.create` `customEmojis.delete`	1

Cota por usuário

Métodos da API Chat

Limite (por segundo)

Leituras por segundo

customEmojis.get

customEmojis.list

Gravações por segundo

customEmojis.create

customEmojis.delete

Outros limites de uso

Um tráfego alto de API direcionado ao mesmo espaço pode acionar limites internos adicionais que não estão visíveis na página Cotas.

Resolver erros de cota com base no tempo

Para todos os erros baseados em tempo (máximo de N solicitações por X minutos), recomendamos que seu código capture a exceção e use um backoff exponencial truncado para garantir que seus dispositivos não gerem carga excessiva.

A espera exponencial é uma estratégia padrão de tratamento de erros para aplicativos de rede. Um algoritmo de espera exponencial repete solicitações usando tempos de espera exponencialmente crescentes entre as solicitações, até um tempo máximo de espera. Se as solicitações ainda não forem bem-sucedidas, é importante que os atrasos entre elas aumentem com o tempo até que a solicitação seja bem-sucedida.

Exemplo de algoritmo

Um algoritmo de espera exponencial repete solicitações exponencialmente, aumentando o tempo de espera entre novas tentativas até um tempo máximo de espera. Exemplo:

Faça uma solicitação para a API Google Chat.
Se a solicitação falhar, aguarde 1 + random_number_milliseconds e tente de novo.
Se a solicitação falhar, aguarde 2 + random_number_milliseconds segundos e tente de novo.
Se a solicitação falhar, aguarde 4 + random_number_milliseconds e tente de novo.
E assim por diante, até um tempo maximum_backoff.
Continue aguardando e tentando novamente até um número máximo de novas tentativas, sem aumentar o tempo de espera entre elas.

em que:

O tempo de espera é min(((2^n)+random_number_milliseconds), maximum_backoff), com n incrementado em 1 para cada iteração (solicitação).
random_number_milliseconds é um número aleatório de milissegundos menor ou igual a 1.000. Isso ajuda a evitar casos em que muitos clientes são sincronizados por alguma situação e todos tentam novamente ao mesmo tempo, enviando solicitações em ondas sincronizadas. O valor de random_number_milliseconds é recalculado após cada nova tentativa de solicitação.
maximum_backoff costuma ser 32 ou 64 segundos. O valor adequado depende do caso de uso.

O cliente pode continuar tentando novamente depois de maximum_backoff. As novas tentativas após esse ponto não precisam continuar aumentando o tempo de espera. Por exemplo, se um cliente usar um tempo maximum_backoff de 64 segundos, depois de atingir esse valor, ele poderá tentar novamente a cada 64 segundos. Em algum momento, os clientes precisam ser impedidos de tentar novamente infinitas vezes.

O tempo de espera entre novas tentativas e o número de novas tentativas depende do seu caso de uso e das condições da rede.

Solicitar um aumento de cota por projeto

Dependendo do uso de recursos do seu projeto, talvez seja necessário solicitar um ajuste de cota. As chamadas de API feitas por uma conta de serviço são consideradas como se usassem uma única conta. Solicitar uma cota ajustada não garante a aprovação. As solicitações de ajuste de cota que aumentam significativamente o valor da cota podem levar mais tempo para serem aprovadas.

Nem todos os projetos têm as mesmas cotas. À medida que você usa mais o Google Cloud, os valores das cotas podem precisar aumentar. Caso espere um aumento de uso significativo, solicite o ajuste das cotas na página "Cotas" do console do Google Cloud.

Para saber mais, consulte os seguintes recursos:

Limites de uso Mantenha tudo organizado com as coleções Salve e categorize o conteúdo com base nas suas preferências.