Dados geográficos e nacionais

O Meridian oferece a opção de modelar dados geográficos ou nacionais. Os dados geográficos são divididos em regiões mutuamente exclusivas, como estados, cidades, DMAs (áreas designadas do mercado) ou até mesmo vários países. Essas regiões costumam ficar dentro de uma região geográfica maior, como um país. Os dados nacionais são fornecidos para uma única região geográfica, geralmente um país inteiro.

Os dados geográficos oferecem várias vantagens e, portanto, são recomendados sempre que possível. Se eles estiverem disponíveis para a maioria, mas não para todos os canais de mídia, recomendamos imputar os dados nacionais no nível geográfico e executar um modelo geográfico. Para mais informações sobre imputação, consulte Mídia nacional em um modelo geográfico. Para mais informações sobre o modelo nacional, consulte Modelagem nacional.

Vantagens do modelo geográfico

A modelagem estatística depende de padrões nos dados. Padrões repetíveis são mais comuns em dados geográficos do que nos nacionais.

Confira outras vantagens dos dados geográficos:

  • Aumentam o tamanho da amostra efetiva, reunindo dados de várias regiões na modelagem geográfica.
  • Fornecem intervalos confiáveis mais curtos, desde que as regiões sejam semelhantes no mecanismo do impacto de mídia, como o modelo presume. Para mais informações, consulte Modelagem geográfica de mix de mídia hierárquico bayesiano.
  • Melhoram as estimativas de efeitos temporais (como tendência e sazonalidade), já que há várias observações por período.
  • Podem ser compatíveis com o uso de mais knots para modelar o parâmetro \(\mu_t\) . Os dados nacionais têm menos liberdade para efeitos temporais. Por exemplo, um nó por período satura completamente o modelo nacional.
  • Mostram maior variabilidade nos gastos com marketing, o que é crucial para estimar efeitos não lineares, como saturação (parâmetros da função de Hill).
  • Reduzem o viés de variável omitida devido a fatores de confusão ausentes, diminuindo a correlação entre o gasto de mídia e esses fatores. Consulte a seção 4.3 de Modelagem geográfica de mix de mídia hierárquico bayesiano para mais informações.

Seleção geográfica

Orientações para selecionar regiões geográficas:

  • Primeiro, exclua as regiões com menor KPI total. Embora contribuam menos para o ROI, elas ainda podem ter uma grande influência no ajuste do modelo, principalmente quando há uma única variância residual para todos os grupos (unique_sigma_for_each_geo = False de ModelSpec).

  • Para anunciantes dos EUA que usam DMA (área designada do mercado) como unidade geográfica, a orientação é modelar as 50 a 100 DMAs com maior população. Isso geralmente inclui a grande maioria das unidades de KPI e exclui a maior parte das DMAs pequenas e imprecisas que podem afetar o ajuste e a convergência do modelo.

  • Quando cada região geográfica tem sua própria variância residual (unique_sigma_for_each_geo = True de ModelSpec), as regiões imprecisas têm menos impacto no ajuste do modelo. No entanto, essa opção pode dificultar a convergência para alguns conjuntos de dados porque adiciona muita flexibilidade ao modelo. Se houver convergência da amostragem de MCMC nessa opção, vale a pena representar o tamanho da população geográfica em relação ao desvio padrão residual médio (parâmetro sigma). Na maioria dos casos, o resultado é um padrão bastante monótono. Se o padrão não for assim, talvez seja melhor definir unique_sigma_for_each_geo = False e usar um subconjunto menor de regiões.

Para garantir que o modelo represente 100% das unidades de KPI, é possível agrupar regiões menores dentro de maiores. No entanto, essa opção tem várias ressalvas:

  • A modelagem geográfica oferece uma vantagem significativa, mas esse benefício é reduzido quando há poucas regiões. É melhor ajustar um modelo com uma granularidade geográfica mais refinada e excluir as regiões geográficas menores do que agregar regiões a um nível mais amplo.

  • Diferentes métodos de agrupamento de agregação geográfica podem gerar resultados diferentes da MMM.

  • As variáveis de execução de mídia, como impressões ou custo, geralmente podem ser somadas nas regiões. No entanto, algumas variáveis de controle, como temperatura, podem ser menos simples de agregar.

Mídia nacional em um modelo geográfico

Quando a maior parte da mídia está disponível no nível geográfico, mas umas poucas estão disponíveis apenas nacionalmente, recomendamos imputar a mídia nacional no nível de região e executar um modelo geográfico. Um método simples de imputação é aproximar a variável de mídia geográfica do valor nacional usando a proporção da população na região em relação ao total. O ideal é ter dados precisos no nível geográfico, mas com a imputação ainda é possível gerar informações úteis sobre os parâmetros do modelo. Para mais informações, consulte a seção 4.4 de Modelagem hierárquica bayesiana de mix de mídia no nível geográfico.