Límites de frecuencia
La API de Google Ads agrupa las solicitudes de límite de frecuencia por consultas por segundo (QPS) por ID de cliente (CID) y token de desarrollador, lo que significa que la medición se aplica independientemente de los CID y de los tokens de desarrollador. La API de Google Ads utiliza un algoritmo de bucket de tokens para medir las solicitudes y determinar un límite de QPS apropiado, por lo que el límite exacto variará según la carga general del servidor en cualquier momento.
El propósito de imponer límites de frecuencia es evitar que un usuario interrumpa el servicio a otros usuarios, ya sea de manera intencional o no intencional, abriendo los servidores de la API de Google Ads con un gran volumen de solicitudes.
Las solicitudes que infrinjan los límites de frecuencia se rechazarán con el siguiente error:
RESOURCE_TEMPORARILY_EXHAUSTED
.
Puedes tomar el control de tu app y mitigar los límites de frecuencia si reduces de forma activa la cantidad de solicitudes y limitas las QPS del lado del cliente.
Existen varias formas de reducir las probabilidades de exceder el límite de frecuencia. Familiarizarte con los conceptos de los patrones de integración empresarial (EIP), como la mensajería, el reenvío y la regulación, puede ayudarte a compilar una app cliente más sólida.
Las siguientes prácticas recomendadas ordenadas por complejidad, con estrategias más simples en la parte superior y arquitecturas más sólidas pero sofisticadas después:
Limita las tareas simultáneas
Una causa raíz del exceso de límites de frecuencia es que la app cliente genera una cantidad excesiva de tareas paralelas. Si bien no limitamos la cantidad de solicitudes paralelas que puede tener una app cliente, esto puede exceder fácilmente el límite de solicitudes por segundo a nivel del token de desarrollador.
Se recomienda configurar un límite superior razonable para la cantidad total de tareas simultáneas que generarán solicitudes (en todos los procesos y máquinas) y ajustarlo de forma ascendente para optimizar la capacidad de procesamiento sin exceder el límite de frecuencia.
Además, puedes considerar limitar las QPS del cliente (consulta Regulación y límites de frecuencia).
Agrupación de solicitudes en lotes
Considera agrupar varias operaciones en una sola solicitud. Esto se aplica sobre todo en las llamadas a MutateFoo
. Por ejemplo, si actualizas el estado de varias instancias de AdGroupAd
, en lugar de llamar a MutateAdGroupAds
una vez para cada AdGroupAd
, puedes llamar a MutateAdGroupAds
una vez y pasar varias operations
. Consulta nuestra guía sobre operaciones por lotes para obtener algunos ejemplos adicionales.
Si bien agrupar las solicitudes en lotes reduce la cantidad total de solicitudes y mitiga el límite de frecuencia de solicitudes por minuto, puede activar el límite de frecuencia de operaciones por minuto si realizas una gran cantidad de operaciones en una sola cuenta.
Limitación y limitadores de frecuencia
Además de limitar la cantidad total de subprocesos en tu aplicación cliente, también puedes implementar limitadores de frecuencia en el lado del cliente. Esto puede garantizar que todos los subprocesos de los procesos o clústeres se rijan por un límite de QPS específico del lado del cliente.
Puedes consultar el Limitador de frecuencia de Guava o implementar tu propio algoritmo basado en bucket de tokens para un entorno de clúster. Por ejemplo, podrías generar tokens y almacenarlos en un almacenamiento transaccional compartido, como una base de datos, y cada cliente tendría que adquirir y consumir un token antes de procesar la solicitud. Si los tokens se hubieran agotado, el cliente tendría que esperar hasta que se genere el siguiente lote de tokens.
Agregar a una cola
Una cola de mensajes es la solución para la distribución de la carga de operaciones, a la vez que controla las tarifas de solicitudes y consumidores. Hay una serie de opciones de cola de mensajes disponibles (algunas de código abierto, otras de propiedad) y muchas de ellas pueden funcionar con diferentes lenguajes.
Cuando usas colas de mensajes, puedes tener varios productores que envían mensajes a la cola y varios consumidores que los procesan. Los límites se pueden implementar en el lado del consumidor si se limita la cantidad de consumidores simultáneos, o se implementan limitadores de frecuencia o reguladores para los productores o consumidores.
Por ejemplo, si un consumidor de mensajes encuentra un error de límite de frecuencia, ese consumidor puede devolver la solicitud a la cola para que se vuelva a intentar. Al mismo tiempo, ese consumidor también puede notificar a todos los demás consumidores que detengan el procesamiento durante varios segundos para recuperarse del error.