Participe da nova comunidade do
Discord para discussões em tempo real, suporte de colegas e interação direta com a equipe do Meridian.
Dados geográficos e nacionais
Mantenha tudo organizado com as coleções
Salve e categorize o conteúdo com base nas suas preferências.
O Meridian oferece a opção de modelar dados geográficos ou nacionais. Os dados geográficos são divididos em regiões mutuamente exclusivas, como estados, cidades, DMAs (áreas designadas do mercado) ou até mesmo vários países. Essas regiões costumam ficar dentro de uma região geográfica maior, como um país. Os dados nacionais são fornecidos para uma única região geográfica, geralmente um país inteiro.
Os dados geográficos oferecem várias vantagens e, portanto, são recomendados sempre que possível. Se eles estiverem disponíveis para a maioria, mas não para todos os canais de mídia, recomendamos imputar os dados nacionais no nível geográfico e executar um modelo geográfico. Para mais informações sobre imputação, consulte Mídia nacional em um modelo geográfico. Para mais informações sobre o modelo nacional, consulte Modelagem nacional.
Vantagens do modelo geográfico
A modelagem estatística depende de padrões nos dados. Padrões repetíveis são mais comuns em dados geográficos do que nos nacionais.
Confira outras vantagens dos dados geográficos:
- Aumentam o tamanho da amostra efetiva, reunindo dados de várias regiões na modelagem geográfica.
- Fornecem intervalos confiáveis mais curtos, desde que as regiões sejam semelhantes no mecanismo do impacto de mídia, como o modelo presume. Para mais informações, consulte Modelagem geográfica de mix de mídia hierárquico bayesiano.
- Melhoram as estimativas de efeitos temporais (como tendência e sazonalidade), já que há várias observações por período.
- Podem ser compatíveis com o uso de mais
knots
para modelar o parâmetro \(\mu_t\) . Os dados nacionais têm menos liberdade para efeitos temporais. Por exemplo, um nó por período satura completamente o modelo nacional.
- Mostram maior variabilidade nos gastos com marketing, o que é crucial para estimar efeitos não lineares, como saturação (parâmetros da função de Hill).
- Reduzem o viés de variável omitida devido a fatores de confusão ausentes, diminuindo a correlação entre o gasto de mídia e esses fatores. Consulte a seção 4.3 de Modelagem geográfica de mix de mídia hierárquico bayesiano para mais informações.
Seleção geográfica
Orientações para selecionar regiões geográficas:
Primeiro, exclua as regiões com menor KPI total. Embora contribuam menos para o ROI, elas ainda podem ter uma grande influência no ajuste do modelo, principalmente quando há uma única variância residual para todos os grupos (unique_sigma_for_each_geo = False
de ModelSpec
).
Para anunciantes dos EUA que usam DMA (área designada do mercado) como unidade geográfica, a orientação é modelar as 50 a 100 DMAs com maior população.
Isso geralmente inclui a grande maioria das unidades de KPI e exclui a maior parte das DMAs pequenas e imprecisas que podem afetar o ajuste e a convergência do modelo.
Quando cada região geográfica tem sua própria variância residual (unique_sigma_for_each_geo =
True
de ModelSpec
), as regiões imprecisas têm menos impacto no ajuste do modelo. No entanto, essa opção pode dificultar a convergência para alguns conjuntos de dados porque adiciona muita flexibilidade ao modelo. Se houver convergência da amostragem de MCMC nessa opção, vale a pena representar o tamanho da população geográfica em relação ao desvio padrão residual médio (parâmetro sigma
). Na maioria dos casos, o resultado é um padrão bastante monótono. Se o padrão não for assim, talvez seja melhor definir unique_sigma_for_each_geo = False
e usar um subconjunto menor de regiões.
Para garantir que o modelo represente 100% das unidades de KPI, é possível agrupar regiões menores dentro de maiores. No entanto, essa opção tem várias ressalvas:
A modelagem geográfica oferece uma vantagem significativa, mas esse benefício é reduzido quando há poucas regiões. É melhor ajustar um modelo com uma granularidade geográfica mais refinada e excluir as regiões geográficas menores do que agregar regiões a um nível mais amplo.
Diferentes métodos de agrupamento de agregação geográfica podem gerar resultados diferentes da MMM.
As variáveis de execução de mídia, como impressões ou custo, geralmente podem ser somadas nas regiões. No entanto, algumas variáveis de controle, como temperatura, podem ser menos simples de agregar.
Mídia nacional em um modelo geográfico
Quando a maior parte da mídia está disponível no nível geográfico, mas umas poucas estão disponíveis apenas nacionalmente, recomendamos imputar a mídia nacional no nível de região e executar um modelo geográfico. Um método simples de imputação é aproximar a variável de mídia geográfica do valor nacional usando a proporção da população na região em relação ao total. O ideal é ter dados precisos no nível geográfico, mas com a imputação ainda é possível gerar informações úteis sobre os parâmetros do modelo. Para mais informações, consulte a seção 4.4 de Modelagem hierárquica bayesiana de mix de mídia no nível geográfico.
Exceto em caso de indicação contrária, o conteúdo desta página é licenciado de acordo com a Licença de atribuição 4.0 do Creative Commons, e as amostras de código são licenciadas de acordo com a Licença Apache 2.0. Para mais detalhes, consulte as políticas do site do Google Developers. Java é uma marca registrada da Oracle e/ou afiliadas.
Última atualização 2025-08-28 UTC.
[null,null,["Última atualização 2025-08-28 UTC."],[[["\u003cp\u003ePrioritize modeling larger geos based on total KPI, as smaller geos have less ROI contribution and can negatively impact model fit.\u003c/p\u003e\n"],["\u003cp\u003eFor US advertisers, modeling the top 50-100 DMAs by population generally captures significant KPI units while excluding noisy smaller DMAs.\u003c/p\u003e\n"],["\u003cp\u003eWhen using national-level media in a geo-level model, impute national data to the geo-level, preferably using accurate geo-level data if available.\u003c/p\u003e\n"],["\u003cp\u003eAggregating smaller geos into larger regions can be an option to represent 100% of KPI units, but consider the potential impact on model results and interpretation.\u003c/p\u003e\n"],["\u003cp\u003eAvoid redundant national-level variables when \u003ccode\u003eknots = n_times\u003c/code\u003e by either adjusting \u003ccode\u003eknots\u003c/code\u003e or carefully selecting variables based on interpretation goals.\u003c/p\u003e\n"]]],["When selecting geos, prioritize dropping smaller geos with lower KPI contribution first, especially if using a single residual variance. For US DMAs, model the top 50-100 by population. If each geo has unique residual variance, smaller geos matter less, but convergence may be difficult. National-level media can be imputed to the geo level using population proportions. Avoid national-level controls when each time period has its own parameter, as they create redundancy.\n"],null,["# Geo-level and national-level data\n\nMeridian offers the option to model geo-level or national level-data. Geo-level\ndata is when data is broken down into mutually exclusive geographic regions such\nas states, cities, DMAs, or even multiple countries. These regions are typically\nall within a larger geographic region, such as a country. National-level data is\nwhen data is provided for a single geographic region, typically an entire\ncountry. National-level data is essentially single-geo data.\n\nGeo-level data offers several advantages and is thus recommended when\npossible. If geo-level data is available for most, but not all, media channels,\nthen we recommend imputing the national-level data at the geo-level, and running\na geo-model. For more information on imputation,\nsee [National-level media in a geo-level model](#national-imputation). For more\ninformation on the national model,\nsee [National-level modeling](/meridian/docs/basics/national-models).\n\nGeo-level model advantages\n--------------------------\n\nStatistical modeling relies on patterns in the data. Repeatable patterns\nare more common in geo-level data than national-level data.\n\nHere are some other advantages of geo-level data:\n\n- Increases the effective sample size, by pooling data across geos in geo-modeling.\n- Provides tighter credible intervals, provided the geos are similar in terms of the media impact mechanism as the model assumes. For more information, see [Geo-level Bayesian Hierarchical Media Mix\n Modeling](//research.google/pubs/geo-level-bayesian-hierarchical-media-mix-modeling/).\n- Improves estimates for time-effects (such as trend and seasonality), since there are multiple observations per time period.\n- Can support the use of more `knots` to model the \\\\(\\\\mu_t\\\\) parameter. National-level data has fewer degrees of freedom for time-effects. For example, one knot per time period completely saturates the national-level model.\n- Shows greater variability in marketing spend, which is crucial for estimating non-linear effects, like saturation (Hill function parameters).\n- Reduces omitted variable bias due to missing confounders, by reducing the correlation between media spend and confounders. See section 4.3 of [Geo-level Bayesian Hierarchical Media Mix\n Modeling](//research.google/pubs/geo-level-bayesian-hierarchical-media-mix-modeling/) for more information.\n\nGeo selection\n-------------\n\nWhen you are selecting geos, consider the following guidance:\n\n- Drop the smallest geos by total KPI first. Smaller geos have less\n contribution to ROI, yet they can still have a high influence on model fit,\n particularly when there is a single residual variance for all groups\n (`unique_sigma_for_each_geo = False` of `ModelSpec`).\n\n- For US advertisers using designated market area (DMA) as the geographical\n unit, a rough guideline is to model the top 50-100 DMAs by population size.\n This generally includes the vast majority of the KPI units, while excluding\n most of the noisier small DMAs that might impact model fit and convergence.\n\n- When each geo has its own residual variance (`unique_sigma_for_each_geo =\n True` of `ModelSpec`), noisier geos have less impact on model fit. However,\n this option can make convergence difficult for some datasets because it adds\n so much flexibility to the model. If MCMC sampling does converge under this\n option, it might be worth plotting the geo population size versus the mean\n residual standard deviation (`sigma` parameter) - in most cases, you would\n expect to see a fairly monotone pattern. If you don't see this pattern, then\n it might be better to set `unique_sigma_for_each_geo = False` and use a\n smaller subset of geos.\n\nIf you want to make sure the model represents 100% of your KPI units, you\ncan aggregate smaller geos into larger regions. However, this option comes\nwith several caveats:\n\n- Geo-level modeling provides a significant advantage, although this benefit is\n reduced when there are relatively few geos. It may be better to fit a model at a\n finer geo granularity and exclude the smallest geos, rather than aggregating\n geos to a coarser level.\n\n- Different geo aggregation grouping methods can lead to different MMM results.\n\n- Media execution variables, such as impressions or cost, can usually be\n summed across geos. However, some control variables, such as\n temperature, can be less straightforward to aggregate.\n\nNational-level media in a geo-level model\n-----------------------------------------\n\nWhen most media are available at the geo-level, but one or two are only\navailable at the national level, we recommend imputing the national-level\nmedia at a geo-level and running a geo-model. One naive imputation method is\nto approximate the geo-level media variable from its national level value,\nusing the proportion of the population in the geo relative to the total\npopulation. Although it is preferable to have accurate geo-level data so that\nimputation isn't necessary, imputation can still yield useful information\nabout the model parameters. For more information, see section 4.4 of\n[Geo-level Bayesian Hierarchical Media Mix Modeling](//research.google/pubs/geo-level-bayesian-hierarchical-media-mix-modeling/)."]]