Datos a nivel geográfico y nacional

Meridian ofrece la opción de modelar datos a nivel geográfico o nacional. Los datos a nivel geográfico son aquellos que se desglosan en regiones geográficas mutuamente exclusivas, como estados, ciudades, DMA o incluso varios países. Por lo general, estas regiones se encuentran dentro de una región geográfica más grande, como un país. Los datos a nivel nacional son aquellos que se proporcionan para una sola región geográfica, que suele ser un país entero. Los datos a nivel nacional son básicamente datos de una sola ubicación geográfica.

Los datos a nivel geográfico ofrecen varias ventajas y, por lo tanto, se recomiendan cuando es posible. Si los datos a nivel geográfico están disponibles para la mayoría de los canales de medios, pero no para todos, te recomendamos que imputes los datos a nivel nacional a nivel geográfico y que ejecutes un modelo geográfico. Para obtener más información sobre la imputación, consulta Medios a nivel nacional en un modelo a nivel geográfico. Para obtener más información sobre el modelo nacional, consulta Modelado a nivel nacional.

Ventajas del modelo a nivel geográfico

El modelado estadístico se basa en los patrones de los datos. Los patrones repetibles son más comunes en los datos a nivel geográfico que en los datos a nivel nacional.

A continuación, se incluyen otras ventajas de los datos a nivel geográfico:

  • Aumentan el tamaño de la muestra efectiva, ya que agrupan los datos de las distintas ubicaciones geográficas en el modelado geográfico.
  • Proporcionan intervalos creíbles más precisos, siempre que las ubicaciones geográficas sean similares en lo que respecta al mecanismo de impacto de los medios, tal como lo supone el modelo. Para obtener más información, consulta Geo-level Bayesian Hierarchical Media Mix Modeling (Modelado jerárquico bayesiano de combinación de medios a nivel geográfico).
  • Mejoran las estimaciones de los efectos temporales (como la tendencia y la estacionalidad), ya que incluye varias observaciones por período.
  • Pueden admitir el uso de más nudos (knots) para modelar el \(\mu_t\) parámetro. Los datos a nivel nacional tienen menos grados de libertad para los efectos del tiempo. Por ejemplo, un nudo por período satura el modelo a nivel nacional por completo.
  • Muestran una mayor variabilidad en la inversión de marketing, lo que es fundamental para estimar los efectos no lineales, como la saturación (parámetros de la función de Hill).
  • Reducen el sesgo de variables omitidas debido a la falta de factores de confusión, ya que disminuyen la correlación entre la inversión en medios y los factores de confusión. Para obtener más información, consulta la sección 4.3 de Geo-level Bayesian Hierarchical Media Mix Modeling (Modelado jerárquico bayesiano de combinación de medios a nivel geográfico).

Selección de ubicaciones geográficas

Cuando selecciones las ubicaciones geográficas, ten en cuenta las siguientes indicaciones:

  • Primero, quita las ubicaciones geográficas más pequeñas según el KPI total. Las ubicaciones geográficas más pequeñas tienen una menor contribución al ROI, pero pueden tener una gran influencia en el ajuste del modelo, en particular cuando hay una sola varianza residual para todos los grupos (unique_sigma_for_each_geo = False de ModelSpec).

  • Para los anunciantes de EE.UU. que usan el área de mercado designada (DMA) como unidad geográfica, una guía aproximada es modelar las principales 50 a 100 DMA por tamaño de población. Por lo general, esto incluye la gran mayoría de las unidades de KPI, mientras que excluye la mayoría de las DMA pequeñas con más información irrelevante que podrían afectar el ajuste y la convergencia del modelo.

  • Cuando cada ubicación geográfica tiene su propia varianza residual (unique_sigma_for_each_geo = True de ModelSpec), las ubicaciones geográficas con más información irrelevante tienen menos impacto en el ajuste del modelo. Sin embargo, esta opción puede dificultar la convergencia para algunos conjuntos de datos, ya que agrega mucha flexibilidad al modelo. Si el muestreo del método de MCMC converge con esta opción, podría ser conveniente trazar un gráfico comparativo del tamaño de la población geográfica y la desviación estándar residual promedio (parámetro sigma). En la mayoría de los casos, solo verás un patrón bastante monótono. Si no ves este patrón, es posible que sea mejor establecer unique_sigma_for_each_geo = False y usar un subconjunto más pequeño de ubicaciones geográficas.

Si deseas asegurarte de que el modelo represente el 100% de tus unidades de KPI, puedes agregar ubicaciones geográficas más pequeñas a regiones más grandes. Sin embargo, esta opción tiene varias advertencias:

  • El modelado a nivel geográfico proporciona una ventaja significativa, aunque este beneficio se reduce cuando hay relativamente pocas ubicaciones geográficas. Puede ser mejor ajustar un modelo con un nivel de detalle geográfico más preciso y excluir las ubicaciones geográficas más pequeñas, en lugar de agregar las ubicaciones geográficas a un nivel más general.

  • Los diferentes métodos de agrupación de agregación de ubicaciones geográficas pueden generar resultados diferentes del MMM.

  • Por lo general, las variables de ejecución de medios, como las impresiones o el costo, se pueden sumar en todas las ubicaciones geográficas. Sin embargo, algunas variables de control, como la temperatura, pueden ser menos sencillas de agregar.

Medios a nivel nacional en un modelo a nivel geográfico

Cuando la mayoría de los medios están disponibles a nivel geográfico, pero uno o dos solo están disponibles a nivel nacional, te recomendamos que atribuyas a nivel geográfico estos últimos y que ejecutes un modelo geográfico. Un método de imputación ingenuo es aproximar la variable de medios a nivel geográfico a partir de su valor a nivel nacional, con la proporción de la población en la ubicación geográfica en relación con la población total. Aunque es preferible tener datos precisos a nivel geográfico para que no sea necesaria la imputación, esta puede proporcionar información útil sobre los parámetros del modelo. Para obtener más información, consulta la sección 4.4 de Geo-level Bayesian Hierarchical Media Mix Modeling (Modelado jerárquico bayesiano de combinación de medios a nivel geográfico).