Únete a la comunidad recientemente lanzada de
Discord para participar en debates en tiempo real, obtener asistencia de otros miembros y comunicarte directamente con el equipo de Meridian.
Datos a nivel geográfico y nacional
Organiza tus páginas con colecciones
Guarda y categoriza el contenido según tus preferencias.
Meridian ofrece la opción de modelar datos a nivel geográfico o nacional. Los datos a nivel geográfico son aquellos que se desglosan en regiones geográficas mutuamente exclusivas, como estados, ciudades, DMA o incluso varios países. Por lo general, estas regiones se encuentran dentro de una región geográfica más grande, como un país. Los datos a nivel nacional son aquellos que se proporcionan para una sola región geográfica, que suele ser un país entero. Los datos a nivel nacional son básicamente datos de una sola ubicación geográfica.
Los datos a nivel geográfico ofrecen varias ventajas y, por lo tanto, se recomiendan cuando es posible. Si los datos a nivel geográfico están disponibles para la mayoría de los canales de medios, pero no para todos, te recomendamos que imputes los datos a nivel nacional a nivel geográfico y que ejecutes un modelo geográfico. Para obtener más información sobre la imputación, consulta Medios a nivel nacional en un modelo a nivel geográfico. Para obtener más información sobre el modelo nacional, consulta Modelado a nivel nacional.
Ventajas del modelo a nivel geográfico
El modelado estadístico se basa en los patrones de los datos. Los patrones repetibles son más comunes en los datos a nivel geográfico que en los datos a nivel nacional.
A continuación, se incluyen otras ventajas de los datos a nivel geográfico:
- Aumentan el tamaño de la muestra efectiva, ya que agrupan los datos de las distintas ubicaciones geográficas en el modelado geográfico.
- Proporcionan intervalos creíbles más precisos, siempre que las ubicaciones geográficas sean similares en lo que respecta al mecanismo de impacto de los medios, tal como lo supone el modelo. Para obtener más información, consulta Geo-level Bayesian Hierarchical Media Mix Modeling (Modelado jerárquico bayesiano de combinación de medios a nivel geográfico).
- Mejoran las estimaciones de los efectos temporales (como la tendencia y la estacionalidad), ya que incluye varias observaciones por período.
- Pueden admitir el uso de más nudos (
knots
) para modelar el \(\mu_t\) parámetro. Los datos a nivel nacional tienen menos grados de libertad para los efectos del tiempo. Por ejemplo, un nudo por período satura el modelo a nivel nacional por completo.
- Muestran una mayor variabilidad en la inversión de marketing, lo que es fundamental para estimar los efectos no lineales, como la saturación (parámetros de la función de Hill).
- Reducen el sesgo de variables omitidas debido a la falta de factores de confusión, ya que disminuyen la correlación entre la inversión en medios y los factores de confusión. Para obtener más información, consulta la sección 4.3 de Geo-level Bayesian Hierarchical Media Mix Modeling (Modelado jerárquico bayesiano de combinación de medios a nivel geográfico).
Selección de ubicaciones geográficas
Cuando selecciones las ubicaciones geográficas, ten en cuenta las siguientes indicaciones:
Primero, quita las ubicaciones geográficas más pequeñas según el KPI total. Las ubicaciones geográficas más pequeñas tienen una menor contribución al ROI, pero pueden tener una gran influencia en el ajuste del modelo, en particular cuando hay una sola varianza residual para todos los grupos (unique_sigma_for_each_geo = False
de ModelSpec
).
Para los anunciantes de EE.UU. que usan el área de mercado designada (DMA) como unidad geográfica, una guía aproximada es modelar las principales 50 a 100 DMA por tamaño de población.
Por lo general, esto incluye la gran mayoría de las unidades de KPI, mientras que excluye la mayoría de las DMA pequeñas con más información irrelevante que podrían afectar el ajuste y la convergencia del modelo.
Cuando cada ubicación geográfica tiene su propia varianza residual (unique_sigma_for_each_geo =
True
de ModelSpec
), las ubicaciones geográficas con más información irrelevante tienen menos impacto en el ajuste del modelo. Sin embargo, esta opción puede dificultar la convergencia para algunos conjuntos de datos, ya que agrega mucha flexibilidad al modelo. Si el muestreo del método de MCMC converge con esta opción, podría ser conveniente trazar un gráfico comparativo del tamaño de la población geográfica y la desviación estándar residual promedio (parámetro sigma
). En la mayoría de los casos, solo verás un patrón bastante monótono. Si no ves este patrón, es posible
que sea mejor establecer unique_sigma_for_each_geo = False
y usar
un subconjunto más pequeño de ubicaciones geográficas.
Si deseas asegurarte de que el modelo represente el 100% de tus unidades de KPI, puedes agregar ubicaciones geográficas más pequeñas a regiones más grandes. Sin embargo, esta opción tiene varias advertencias:
El modelado a nivel geográfico proporciona una ventaja significativa, aunque este beneficio se reduce cuando hay relativamente pocas ubicaciones geográficas. Puede ser mejor ajustar un modelo con un nivel de detalle geográfico más preciso y excluir las ubicaciones geográficas más pequeñas, en lugar de agregar las ubicaciones geográficas a un nivel más general.
Los diferentes métodos de agrupación de agregación de ubicaciones geográficas pueden generar resultados diferentes del MMM.
Por lo general, las variables de ejecución de medios, como las impresiones o el costo, se pueden sumar en todas las ubicaciones geográficas. Sin embargo, algunas variables de control, como la temperatura, pueden ser menos sencillas de agregar.
Medios a nivel nacional en un modelo a nivel geográfico
Cuando la mayoría de los medios están disponibles a nivel geográfico, pero uno o dos solo están disponibles a nivel nacional, te recomendamos que atribuyas a nivel geográfico estos últimos y que ejecutes un modelo geográfico. Un método de imputación ingenuo es aproximar la variable de medios a nivel geográfico a partir de su valor a nivel nacional, con la proporción de la población en la ubicación geográfica en relación con la población total. Aunque es preferible tener datos precisos a nivel geográfico para que no sea necesaria la imputación, esta puede proporcionar información útil sobre los parámetros del modelo. Para obtener más información, consulta la sección 4.4 de Geo-level Bayesian Hierarchical Media Mix Modeling (Modelado jerárquico bayesiano de combinación de medios a nivel geográfico).
Salvo que se indique lo contrario, el contenido de esta página está sujeto a la licencia Atribución 4.0 de Creative Commons, y los ejemplos de código están sujetos a la licencia Apache 2.0. Para obtener más información, consulta las políticas del sitio de Google Developers. Java es una marca registrada de Oracle o sus afiliados.
Última actualización: 2025-08-28 (UTC)
[null,null,["Última actualización: 2025-08-28 (UTC)"],[[["\u003cp\u003ePrioritize modeling larger geos based on total KPI, as smaller geos have less ROI contribution and can negatively impact model fit.\u003c/p\u003e\n"],["\u003cp\u003eFor US advertisers, modeling the top 50-100 DMAs by population generally captures significant KPI units while excluding noisy smaller DMAs.\u003c/p\u003e\n"],["\u003cp\u003eWhen using national-level media in a geo-level model, impute national data to the geo-level, preferably using accurate geo-level data if available.\u003c/p\u003e\n"],["\u003cp\u003eAggregating smaller geos into larger regions can be an option to represent 100% of KPI units, but consider the potential impact on model results and interpretation.\u003c/p\u003e\n"],["\u003cp\u003eAvoid redundant national-level variables when \u003ccode\u003eknots = n_times\u003c/code\u003e by either adjusting \u003ccode\u003eknots\u003c/code\u003e or carefully selecting variables based on interpretation goals.\u003c/p\u003e\n"]]],["When selecting geos, prioritize dropping smaller geos with lower KPI contribution first, especially if using a single residual variance. For US DMAs, model the top 50-100 by population. If each geo has unique residual variance, smaller geos matter less, but convergence may be difficult. National-level media can be imputed to the geo level using population proportions. Avoid national-level controls when each time period has its own parameter, as they create redundancy.\n"],null,["# Geo-level and national-level data\n\nMeridian offers the option to model geo-level or national level-data. Geo-level\ndata is when data is broken down into mutually exclusive geographic regions such\nas states, cities, DMAs, or even multiple countries. These regions are typically\nall within a larger geographic region, such as a country. National-level data is\nwhen data is provided for a single geographic region, typically an entire\ncountry. National-level data is essentially single-geo data.\n\nGeo-level data offers several advantages and is thus recommended when\npossible. If geo-level data is available for most, but not all, media channels,\nthen we recommend imputing the national-level data at the geo-level, and running\na geo-model. For more information on imputation,\nsee [National-level media in a geo-level model](#national-imputation). For more\ninformation on the national model,\nsee [National-level modeling](/meridian/docs/basics/national-models).\n\nGeo-level model advantages\n--------------------------\n\nStatistical modeling relies on patterns in the data. Repeatable patterns\nare more common in geo-level data than national-level data.\n\nHere are some other advantages of geo-level data:\n\n- Increases the effective sample size, by pooling data across geos in geo-modeling.\n- Provides tighter credible intervals, provided the geos are similar in terms of the media impact mechanism as the model assumes. For more information, see [Geo-level Bayesian Hierarchical Media Mix\n Modeling](//research.google/pubs/geo-level-bayesian-hierarchical-media-mix-modeling/).\n- Improves estimates for time-effects (such as trend and seasonality), since there are multiple observations per time period.\n- Can support the use of more `knots` to model the \\\\(\\\\mu_t\\\\) parameter. National-level data has fewer degrees of freedom for time-effects. For example, one knot per time period completely saturates the national-level model.\n- Shows greater variability in marketing spend, which is crucial for estimating non-linear effects, like saturation (Hill function parameters).\n- Reduces omitted variable bias due to missing confounders, by reducing the correlation between media spend and confounders. See section 4.3 of [Geo-level Bayesian Hierarchical Media Mix\n Modeling](//research.google/pubs/geo-level-bayesian-hierarchical-media-mix-modeling/) for more information.\n\nGeo selection\n-------------\n\nWhen you are selecting geos, consider the following guidance:\n\n- Drop the smallest geos by total KPI first. Smaller geos have less\n contribution to ROI, yet they can still have a high influence on model fit,\n particularly when there is a single residual variance for all groups\n (`unique_sigma_for_each_geo = False` of `ModelSpec`).\n\n- For US advertisers using designated market area (DMA) as the geographical\n unit, a rough guideline is to model the top 50-100 DMAs by population size.\n This generally includes the vast majority of the KPI units, while excluding\n most of the noisier small DMAs that might impact model fit and convergence.\n\n- When each geo has its own residual variance (`unique_sigma_for_each_geo =\n True` of `ModelSpec`), noisier geos have less impact on model fit. However,\n this option can make convergence difficult for some datasets because it adds\n so much flexibility to the model. If MCMC sampling does converge under this\n option, it might be worth plotting the geo population size versus the mean\n residual standard deviation (`sigma` parameter) - in most cases, you would\n expect to see a fairly monotone pattern. If you don't see this pattern, then\n it might be better to set `unique_sigma_for_each_geo = False` and use a\n smaller subset of geos.\n\nIf you want to make sure the model represents 100% of your KPI units, you\ncan aggregate smaller geos into larger regions. However, this option comes\nwith several caveats:\n\n- Geo-level modeling provides a significant advantage, although this benefit is\n reduced when there are relatively few geos. It may be better to fit a model at a\n finer geo granularity and exclude the smallest geos, rather than aggregating\n geos to a coarser level.\n\n- Different geo aggregation grouping methods can lead to different MMM results.\n\n- Media execution variables, such as impressions or cost, can usually be\n summed across geos. However, some control variables, such as\n temperature, can be less straightforward to aggregate.\n\nNational-level media in a geo-level model\n-----------------------------------------\n\nWhen most media are available at the geo-level, but one or two are only\navailable at the national level, we recommend imputing the national-level\nmedia at a geo-level and running a geo-model. One naive imputation method is\nto approximate the geo-level media variable from its national level value,\nusing the proportion of the population in the geo relative to the total\npopulation. Although it is preferable to have accurate geo-level data so that\nimputation isn't necessary, imputation can still yield useful information\nabout the model parameters. For more information, see section 4.4 of\n[Geo-level Bayesian Hierarchical Media Mix Modeling](//research.google/pubs/geo-level-bayesian-hierarchical-media-mix-modeling/)."]]