O modelo padrão do Meridian é um modelo hierárquico no nível geográfico com transformações paramétricas não lineares nas variáveis de mídia. Os coeficientes aleatórios representam a heterogeneidade nas regiões geográficas.
Recomendamos o uso de dados geográficos porque eles fornecem estimativas mais confiáveis. Um modelo nacional, essencialmente um modelo geográfico único, está disponível para casos em que os dados geográficos não estão disponíveis. Consulte a modelagem nacional para mais detalhes.
O modelo do Meridian é uma extensão dos modelos bayesianos propostos anteriormente (Jin et al., 2017 e Sun et al., 2017). As extensões incluem o uso de dados de alcance e frequência (Zhang et al., 2023), a inclusão de termos de interceptação variáveis com o tempo para modelar tendências e sazonalidade (relacionada à modelagem de tendências e sazonalidade por Ng et al., 2021) e a adição de variáveis de mídia orgânica e de tratamentos não relacionados a mídia.
O modelo é representado da seguinte forma:
Informações básicas
As informações básicas são:
Variáveis de índice, conforme definido em Dados de entrada:
- \(g=1,\ldots,G\) indexa as unidades geográficas
- \(t=1,\ldots,T\) indexa as unidades de tempo
- \(i=1,\ldots,N_C\) indexa as variáveis de controle
- \(i=1,\ldots,N_N\) indexa os tratamentos não relacionados à mídia
- \(i=1,\ldots,N_M\) indexa os canais de mídia paga sem dados de alcance e frequência
- \(i=1,\ldots, N_{OM}\) indexa os canais de mídia orgânica sem dados de alcance e frequência
- \(i=1,\ldots,N_{RF}\) indexa os canais de mídia paga com dados de alcance e frequência
- \(i=1,\ldots, N_{ORF}\) indexa os canais de mídia orgânica com dados de alcance e frequência
\(\tau_b = 0\) para a capacidade de identificação de alguns dados geográficos de valor de referência \(b\). Qualquer região geográfica pode ser definida como o valor de referência usando o argumento
baseline_group
.\(\{q_{t-s}\}^L_{s=0}\) indica o vetor\((q_t, q_{t-1}, \ldots, q_{t-L})\). Essa notação é usada para indicar os valores de entrada da função de Adstock.
O valor inteiro \(L\) é a duração máxima de defasagem da mídia, como a duração máxima do efeito de mídia. Esse parâmetro pode ser definido usando o argumento
max_lag
.Observe o seguinte sobre as funções \(\text{Hill}()\) e \(\text{Adstock}()\): Para mais informações, consulte Saturação e defasagem de mídia.
$$ \text{Adstock} \left( \left\{ q_{t-s} \right\}^L_{s=0},\ \alpha \right) = \dfrac{\sum\limits^{L}_{s=0}\ \alpha^s q_{t-s} }{\sum\limits^L_{s=0}\ \alpha^s} $$Em que:
- \(q>0,\ 0 \leq \alpha \leq 1\)
- \(\alpha \) é a taxa de decaimento geométrico.
$$ \text{Hill} \left( q, ec, \text{slope} \right) = \left( 1 + \left( \dfrac{q}{ec} \right)^{- \text{slope} } \right)^{-1} $$Em que:
- \(q>0,\ ec>0,\ \text{slope} > 0\)
- \(ec, \text{slope}\) são parâmetros de forma e inclinação da função Hill.
A função \(\text{HillAdstock}()\) depende do argumento
hill_before_adstock
.- Se o padrão for
hill_before_adstock = False
, então\(\text{HillAdstock}(q;\ \alpha, ec, \text{slope}) = \text{Hill}(\text{Adstock}(q;\ \alpha);\ ec, \text{slope})\) - Se
hill_before_adstock = True
, então\(\text{HillAdstock}(q;\ \alpha, ec, \text{slope}) = \text{Adstock}(\text{Hill}(q;\ ec, \text{slope}); \alpha)\)
- Se o padrão for
Parâmetros\( \mu_t \)
Os parâmetros \(\mu_t\) são interceptações que variam com o tempo e contribuem com um componente de tendência e sazonalidade para o modelo:
\(\mu_t\) são determinados por uma série de parâmetros
knot
\(b_1,b_2,\dots,b_K\) localizados nos pontos de tempo correspondentes\(s_1,s_2,\dots,s_K\).Os pontos de tempo $s_1,\dots,s_K$ estão localizados entre \(1\) e \(T\) e são especificados pelo argumento
knots
.É possível especificar uma lista de locais de nós ou apenas o número de nós.
Se o número for especificado, eles serão espaçados uniformemente com dois dos nós nos endpoints ($s_1=1$ e $s_K=T$).
Quando há várias regiões geográficas (\(G>1\)), o padrão coloca um nó em cada ponto de tempo ($s_1=1,s_2=2,\dots,s_K=T$, em que $K=T$).
Quando \(G=1\) (como um modelo nacional) é usado, o padrão é um único nó, que é uma interseção comum entre todos os períodos.
Os valores \(\mu_t\) são uma média ponderada dos dois nós vizinhos mais próximos, com mais peso atribuído ao nó mais próximo. Por exemplo, imagine que existem nós no tempo 9 e no tempo 18. A estimativa de $\mu_{16}$ será influenciada pelos nós no tempo 9 e 18, com mais peso atribuído ao nó no tempo 18. O cálculo do peso preciso é feito da seguinte maneira. Para qualquer \(t\), defina o seguinte:
$\ell(t)$ e $u(t)$ representam os índices de nó dos nós vizinhos mais próximos. Normalmente, $\ell(t) < u(t)$, mas observe que $\ell(t) = u(t)$ se $t$ for precisamente um dos locais de nó ou se $t$ estiver antes do primeiro ou após o último nó (como pode ser o caso quando são definidos locais de nó personalizados ou se apenas um nó é usado).
\(\ell(t) = \max \{\{1\} \cup \{k: s_k \leq t\}\}\)
- Observação: $\ell(t) = 1$ se $t < s_1$.
\(u(t) = \min \{\{K\} \cup \{k: s_k > t\}\}\)
- Observação: $u(t) = K$ se $t > s_K$.
\(w(t) = 1\) se \(\ell(t) = u(t)\) ; caso contrário, \(w(t) = \dfrac{s_{u(t)}-t}{s_{u(t)}-s_{\ell(t)}}\).
\(\mu_t = w(t)b_{\ell(t)} + (1-w(t))b_{u(t)}\)
Os valores de nó \(b_1,b_2,\dots,b_K\) têm uma distribuição a priori especificada pelo usuário.
Essa metodologia se baseia no modelo bayesiano de coeficiente variável com o tempo com aplicativos para Modelagem de Marketing Mix, com algumas diferenças importantes, incluindo uma função de peso diferente, distribuições a priori distintas, a ausência de regressão automática, entre outras.
Para mais informações sobre como definir nós, consulte Como o argumento knots
funciona.
Outras distribuições de parâmetros
Outras distribuições de parâmetros são:
Lembre-se de que o Meridian cria parâmetros para a distribuição normal em termos de média e desvio padrão.
- \(\gamma_{g,i}^{[C]} \sim \text{Normal}(\gamma_i^{[C]},\xi_i^{[C]})\)
- \(\gamma_{g,i}^{[N]} \sim \text{Normal}(\gamma_i^{[N]},\xi_i^{[N]})\)
As distribuições \(\beta\) dependem do argumento
media_effects_dist
, conforme mostrado abaixo:- \(log(\beta_{g,i}^{[M]})\sim \text{Normal}( \beta_i^{[M]},\eta_i^{[M]})\)
- \(log(\beta_{g,i}^{[OM]})\sim \text{Normal}( \beta_{i}^{[OM]},\eta_{i}^{[OM]})\)
- \(log(\beta_{g,i}^{[RF]})\sim \text{Normal}( \beta_{i}^{[RF]},\eta_{i}^{[RF]})\)
\(log(\beta_{g,i}^{[ORF]})\sim \text{Normal}( \beta_{i}^{[ORF]},\eta_{i}^{[ORF]})\)
Se
media_effects_dist = LOG_NORMAL
\(\beta_{g,i}^{[M]} \sim \text{Normal}( \beta_i^{[M]},\eta_i^{[M]})\)
\(\beta_{g,i}^{[OM]} \sim \text{Normal}( \beta_{i}^{[OM]},\eta_{i}^{[OM]})\)
\(\beta_{g,i}^{[RF]} \sim \text{Normal}( \beta_{i}^{[RF]},\eta_{i}^{[RF]})\)
\(\beta_{g,i}^{[ORF]} \sim \text{Normal}( \beta_{i}^{[ORF]},\eta_{i}^{[ORF]})\)
Se
media_effects_dist = NORMAL
\(\epsilon_{g,t}\sim \text{Normal}(0,\sigma_g)\):
Os resíduos são independentes uns dos outros, de todas as variáveis de mídia e controle e de todos os parâmetros do modelo.
Se
unique_sigma_for_each_geo = False
(que é o padrão), então\(\sigma_1=\sigma_2=\cdots=\sigma_G=\sigma\).
Todos os outros parâmetros têm distribuições a priori especificadas pelo usuário:
\( \{\gamma_i^{[C]}\}, \{\gamma_i^{[N]}\}, \{\xi_i^{[C]}\}, \{\xi_i^{[N]}\}, \)
\( \{\beta_i^{[M]}\}, \{ \beta_{i}^{[OM]} \}, \{ \beta_{i}^{[RF]} \}, \{ \beta_{i}^{[ORF]} \}, \)
\( \{\eta_i^{[M]}\}, \{ \eta_{i}^{[OM]} \}, \{\eta_{i}^{[RF]}\}, \{ \eta_{i}^{[ORF]} \}, \)
\( \{\alpha_i^{[M]}\}, \{ \alpha_{i}^{[OM]} \}, \{\alpha_{i}^{[RF]}\}, \{ \alpha_{i}^{[ORF]} \}, \)
\( \{ec_i^{[M]}\}, \{ ec_{i}^{[OM]} \}, \{ec_{i}^{[RF]}\}, \{ ec_{i}^{[ORF]} \}, \)
\( \{slope_i^{[M]}\}, \{ slope_{i}^{[OM]} \}, \{slope_{i}^{[RF]}\}, \{ slope_{i}^{[ORF]} \}, \)
\( \{\tau_g\}, \{\sigma_g\}. \)
É possível mudar alguns aspectos da especificação do modelo com base nas opções de modelagem abordadas nas seções a seguir: Saturação e defasagem de mídia, Alcance e frequência, Pesquisa paga e Distribuições a priori de ROI para calibragem. Também é possível personalizar as distribuições a priori padrão.