Cuando se agrupan informes agregables, es importante optimizar las estrategias de agrupación para que no se superen los límites de privacidad. A continuación, se incluyen algunas estrategias recomendadas para enviar lotes de informes al servicio de agregación.
Recopila informes
Cuando recopiles informes para incluirlos en un lote, ten en cuenta lo siguiente:
Cómo informar las cargas que se vuelven a intentar
Nota: Los criterios de reintento están sujetos a cambios. En ese caso, se actualizará la información de esta sección.
Tanto en la plataforma web como en la del SO, una plataforma intentará enviar el informe tres veces, pero no se enviará si el informe no se puede enviar después del tercer intento. El valor original de scheduled_report_time
se conserva sin importar cuándo se pueda enviar el informe. El cronograma para los reintentos es diferente según la plataforma:
- Un navegador web enviará informes cuando esté en línea. Si el informe no se envía, esperará cinco minutos para el segundo reintento y, luego, 15 minutos para el tercero. Si el navegador se desconecta, el siguiente reintento se realizará un minuto después de que vuelva a estar en línea. No hay una demora máxima para enviar informes en la Web. Esto significa que, si el navegador se desconecta, independientemente de cuánto tiempo haya transcurrido desde que se generó el informe, una vez que el navegador vuelva a conectarse, intentará enviarlo de acuerdo con la política de reintentos.
- Un teléfono Android tiene una conexión de red coherente. Por lo tanto, ejecutará la tarea para enviar informes una vez por hora. Esto significa que, si no se envía un informe, se volverá a intentar la próxima hora y, luego, en la hora posterior. Si el dispositivo no tiene conexión, volverá a intentar enviar el informe con el próximo trabajo de informe que se ejecute después de que el dispositivo se vuelva a conectar a la red. El retraso máximo es de 28 días, lo que significa que el dispositivo no enviará un informe que se haya generado hace más de 28 días.
Espera los informes
Se recomienda esperar a que lleguen los informes tardíos cuando se recopilen informes para el procesamiento por lotes. Para determinar los informes tardíos, verifica el valor de scheduled_report_time
en el momento en que se recibió el informe. La diferencia de tiempo entre esos informes te ayudará a determinar cuánto tiempo deberías esperar para los informes que llegan tarde. Por ejemplo, a medida que se recopilan informes retrasados, revisa el campo scheduled_report_time
y anota el retraso en horas, ya que se reciben el 90%, el 95% y el 99% de los informes. Esos datos se pueden usar para determinar cuánto tiempo esperar los informes tardíos.
Los informes agregados instantáneos se pueden usar para reducir las probabilidades de que se generen informes retrasados.
En la siguiente imagen, se muestran los informes que llegan tarde almacenados en los lotes correspondientes según el horario de informe programado. El lote T representa scheduled_report_time
y T+X representa el tiempo de espera para los informes retrasados. Esto genera un informe de resumen que incluye la mayoría de los informes que se incluyen en el lote que corresponde a su hora de informe programada.
Contabilidad de informes agregables
El servicio de agregación mantiene una regla de “sin duplicados”. Esta regla establece que todos los informes agregables con el mismo ID compartido se deben incluir en el mismo lote.
Después de recopilar los informes, deben agruparse en lotes, de modo que todos los informes con el mismo ID compartido formen parte de un lote.
Si un informe ya se procesó en otro lote, el procesamiento puede dar como resultado un error de presupuesto de privacidad agotado. La creación de informes por lotes de forma correcta ayuda a evitar que se rechacen los lotes debido a la regla "sin duplicados".
Un ID compartido es una clave que se genera para cada informe para realizar un seguimiento de la contabilidad de informes agregables. El ID compartido garantiza que los informes con el mismo ID compartido contribuyan a un solo informe de resumen. Esto significa que los informes que se asignan a un ID compartido deben incluirse en un solo lote. Por ejemplo, si el informe X y el informe Y tienen el mismo ID compartido, se deben incluir en el mismo lote para evitar que se descarten los informes por duplicación.
En la siguiente imagen, se muestran los componentes shared_info
con hash juntos para generar un ID compartido.
En la siguiente imagen, se muestra cómo dos informes diferentes pueden tener el mismo ID compartido:
Nota: scheduled_report_time
se trunca por hora y source_registration_time
se trunca por día. Además, report_id
no se usa en la creación de IDs compartidos. Es posible que la granularidad del tiempo se actualice en el futuro.
Informes duplicados dentro de los lotes
El campo shared_info
de un informe agregable contiene un UUID en el campo report_id
, que se usa para identificar informes duplicados dentro de un lote. Si hay más de un informe con el mismo
report_id
en un lote, solo se agregará el primero, y los demás se considerarán duplicados y se descartarán en silencio. La agregación se realizará con normalidad y no se enviarán errores.
Aunque no es obligatorio, la tecnología publicitaria puede esperar ver algunos aumentos de rendimiento si filtra los informes duplicados con los mismos IDs de informes antes de la agregación.
El report_id
es único para cada informe.
Informes duplicados en los lotes
A cada informe se le asigna un ID compartido, que es un ID generado a partir de datos combinados que provienen del campo shared_info
del informe. Varios informes pueden tener el mismo ID compartido, y cada lote puede contener varios IDs compartidos. Todos los informes con el mismo ID compartido deben ir en el mismo lote. Si los informes con el mismo ID compartido terminan en varios lotes, solo se aceptará el primero, y los demás se rechazarán como duplicados. Para evitar esto, los lotes deben crearse de forma adecuada.
En la siguiente imagen, se muestra un ejemplo en el que los informes con el mismo ID compartido en varios lotes pueden causar que el lote posterior falle. En la imagen, puedes ver que dos o más informes con el mismo ID compartido e679aa
se agrupan en diferentes lotes #1 y #2. Dado que el presupuesto para todos los informes con el ID compartido e679aa
se consume durante la generación del informe de resumen del lote 1, no se permite el lote 2 y se produce un error.
Informes por lotes
Las siguientes son formas recomendadas de generar informes por lotes para evitar duplicados y optimizar la contabilización de informes agregados.
Lote por anunciante
Nota: Esta estrategia solo se recomienda para la agregación de Attribution Reporting.
La agregación privada no tiene un campo attribution_destination
, que es el anunciante. Se recomienda crear lotes por anunciante, es decir, incluir informes que pertenezcan a un solo anunciante en el mismo lote, para evitar alcanzar el límite de la cuenta de informes agregables para cada lote. El anunciante es un campo que se considera en la generación de IDs compartidos, por lo que los informes con el mismo anunciante también podrían tener el mismo ID compartido, lo que requeriría que estén en el mismo lote para evitar errores.
Por lotes por hora
Se recomienda tener en cuenta la hora de informe programada (shared_info.scheduled_report_time
) del informe cuando se procesan por lotes. El tiempo del informe programado se trunca a la hora en la generación del ID compartido, por lo que, como mínimo, los informes se deben agrupar en intervalos de horas, lo que significa que todos los informes con tiempo de informe programado en la misma hora deben ir en el mismo lote para evitar tener informes con el mismo ID compartido en varios lotes, lo que generará errores de trabajo.
Frecuencia y ruido de lotes
Se recomienda tener en cuenta el impacto del ruido en la frecuencia con la que se procesan los informes agregables. Si los informes agregables se agrupan en lotes con más frecuencia, por ejemplo, los informes se procesan una vez que se incluyen menos eventos de conversión una hora, y el ruido tendrá un impacto relativo mayor. Si la frecuencia se reduce y los informes se procesan una vez a la semana, el ruido tendrá un impacto relativo más pequeño. Para comprender mejor el impacto del ruido en los lotes, experimenta con Noise Lab.