El modelo Meridian estándar es un modelo jerárquico a nivel geográfico con transformaciones paramétricas no lineales en las variables de medios. Los coeficientes aleatorios tienen en cuenta la heterogeneidad en las diferentes regiones geográficas.
Te recomendamos que uses datos a nivel geográfico, ya que te permiten obtener estimaciones más confiables. Se puede utilizar un modelo nacional, que es básicamente un modelo de una sola ubicación geográfica, en los casos en los que no hay datos a nivel geográfico disponibles. Consulta Modelado a nivel nacional para obtener más detalles.
El modelo de Meridian es una extensión de los modelos bayesianos propuestos anteriormente (Jin et al., 2017 y Sun et al., 2017). Las extensiones incluyen el uso de datos de alcance y frecuencia (Zhang et al., 2023), la incorporación de términos de interceptos variables en el tiempo para modelar la tendencia y la estacionalidad (lo que se relaciona con el modelado de tendencias y estacionalidad de Ng et al., 2021), y la inclusión de variables de medios orgánicos y de tratamientos no relacionados con los medios.
El modelo se representa de la siguiente manera:
Detalles básicos
Estos son los detalles básicos:
Variables de indexación, como se define en Datos de entrada:
- \(g=1,\ldots,G\) indexa las unidades geográficas.
- \(t=1,\ldots,T\) indexa las unidades de tiempo.
- \(i=1,\ldots,N_C\) indexa las variables de control.
- \(i=1,\ldots,N_N\) indexa los tratamientos no relacionados con los medios.
- \(i=1,\ldots,N_M\) Indexa los canales de medios pagados sin datos de alcance y frecuencia.
- \(i=1,\ldots, N_{OM}\) indexa los canales de medios orgánicos sin datos de alcance y frecuencia.
- \(i=1,\ldots,N_{RF}\) indexa los canales de medios pagados con datos de alcance y frecuencia.
- \(i=1,\ldots, N_{ORF}\) indexa los canales de medios orgánicos con datos de alcance y frecuencia.
\(\tau_b = 0\) para la identificación de una ubicación geográfica \(b\)de referencia. Se puede establecer cualquier ubicación geográfica como referencia con el argumento
baseline_group
.\(\{q_{t-s}\}^L_{s=0}\) denota el vector\((q_t, q_{t-1}, \ldots, q_{t-L})\). Esta notación se usa para indicar los valores de entrada de la función de Adstock.
El valor entero \(L\) es la duración máxima del rezago de los medios, como la duración máxima del efecto de los medios. Este parámetro se puede configurar con el argumento
max_lag
.Ten en cuenta lo siguiente sobre las funciones \(\text{Hill}()\) y \(\text{Adstock}()\). Para obtener más información, consulta Saturación y rezago de los medios.
$$ \text{Adstock} \left( \left\{ q_{t-s} \right\}^L_{s=0},\ \alpha \right) = \dfrac{\sum\limits^{L}_{s=0}\ \alpha^s q_{t-s} }{\sum\limits^L_{s=0}\ \alpha^s} $$Donde:
- \(q>0,\ 0 \leq \alpha \leq 1\)
- \(\alpha \) es la tasa de decaimiento geométrico.
$$ \text{Hill} \left( q, ec, \text{slope} \right) = \left( 1 + \left( \dfrac{q}{ec} \right)^{- \text{slope} } \right)^{-1} $$Donde:
- \(q>0,\ ec>0,\ \text{slope} > 0\)
- \(ec, \text{slope}\) son los parámetros de forma y pendiente de la función de Hill
La función \(\text{HillAdstock}()\) depende del argumento
hill_before_adstock
.- Si el valor predeterminado es
hill_before_adstock = False
, entonces\(\text{HillAdstock}(q;\ \alpha, ec, \text{slope}) = \text{Hill}(\text{Adstock}(q;\ \alpha);\ ec, \text{slope})\) - Si
hill_before_adstock = True
, entonces\(\text{HillAdstock}(q;\ \alpha, ec, \text{slope}) = \text{Adstock}(\text{Hill}(q;\ ec, \text{slope}); \alpha)\)
- Si el valor predeterminado es
Parámetros\( \mu_t \)
Los parámetros \(\mu_t\) son interceptos que varían con el tiempo y que aportan un componente de tendencia y estacionalidad al modelo:
Los valores de\(\mu_t\) se determinan mediante una serie de parámetros
knot
(\(b_1,b_2,\dots,b_K\) ) ubicados en los puntos temporales correspondientes (\(s_1,s_2,\dots,s_K\)).Los puntos temporales ($s_1,\dots,s_K$) se ubican entre \(1\) y \(T\) , y se especifican mediante el argumento
knots
.Puedes especificar una lista de las ubicaciones de los nudos o simplemente la cantidad de nudos.
Si se especifica la cantidad de nudos, estos se espaciarán de forma uniforme, con dos de los nudos en los extremos ($s_1=1$ y $s_K=T$).
Cuando hay varias ubicaciones geográficas (\(G>1\)), la configuración predeterminada coloca un nudo en cada punto temporal ($s_1=1,s_2=2,\dots,s_K=T$, where $K=T$).
Si \(G=1\) (como en un modelo a nivel nacional), la configuración predeterminada contiene un solo nudo, que es, en efecto, un intercepto común en todos los períodos.
Los valores de \(\mu_t\) son un promedio ponderado de los dos nudos adyacentes más cercanos, en el que se le da más peso al más próximo. Por ejemplo, supongamos que hay nudos en los puntos temporales 9 y 18. La estimación de $\mu_{16}$ se verá influenciada tanto por el nudo en el punto temporal 9 como por el nudo en el punto temporal 18, pero se otorgará más peso a este último. A continuación, se incluye el cálculo exacto de la ponderación. Para cualquier \(t\), define lo siguiente:
$\ell(t)$ y $u(t)$ representan los índices de nudo de los nudos adyacentes más cercanos. Por lo general, $\ell(t) < u(t)$, pero ten en cuenta que $\ell(t) = u(t)$ si $t$ es precisamente una de las ubicaciones de nudos, o si $t$ está antes del primer nudo o después del último (como puede ser el caso cuando se establecen ubicaciones de nudos personalizadas o si solo se usa un nudo).
\(\ell(t) = \max \{\{1\} \cup \{k: s_k \leq t\}\}\)
- Nota: $\ell(t) = 1$ si $t < s_1$.
\(u(t) = \min \{\{K\} \cup \{k: s_k > t\}\}\)
- Nota: $u(t) = K$ si $t > s_K$.
\(w(t) = 1\) si \(\ell(t) = u(t)\) ; de lo contrario,\(w(t) = \dfrac{s_{u(t)}-t}{s_{u(t)}-s_{\ell(t)}}\).
\(\mu_t = w(t)b_{\ell(t)} + (1-w(t))b_{u(t)}\)
Los valores de nudo \(b_1,b_2,\dots,b_K\) tienen una distribución a priori especificada por el usuario.
Esta metodología se basa en Bayesian Time Varying Coefficient Model with Applications to Marketing Mix Modeling (Modelo bayesiano de coeficientes variables en el tiempo con aplicaciones en el Marketing Mix Modeling), con algunas diferencias clave, como el uso de una función de ponderación diferente, distribuciones a priori distintas y la ausencia de autorregresión, entre otras.
Para obtener más información sobre cómo configurar nudos, consulta Cómo funciona el argumento knots
.
Otras distribuciones de parámetros
Estas son otras distribuciones de parámetros:
Ten en cuenta que aquí Meridian parametriza la distribución normal en términos de su desviación media y estándar.
- \(\gamma_{g,i}^{[C]} \sim \text{Normal}(\gamma_i^{[C]},\xi_i^{[C]})\)
- \(\gamma_{g,i}^{[N]} \sim \text{Normal}(\gamma_i^{[N]},\xi_i^{[N]})\)
La distribución \(\beta\) depende del argumento
media_effects_dist
, como se indica a continuación:- \(log(\beta_{g,i}^{[M]})\sim \text{Normal}( \beta_i^{[M]},\eta_i^{[M]})\)
- \(log(\beta_{g,i}^{[OM]})\sim \text{Normal}( \beta_{i}^{[OM]},\eta_{i}^{[OM]})\)
- \(log(\beta_{g,i}^{[RF]})\sim \text{Normal}( \beta_{i}^{[RF]},\eta_{i}^{[RF]})\)
\(log(\beta_{g,i}^{[ORF]})\sim \text{Normal}( \beta_{i}^{[ORF]},\eta_{i}^{[ORF]})\)
si
media_effects_dist = LOG_NORMAL
\(\beta_{g,i}^{[M]} \sim \text{Normal}( \beta_i^{[M]},\eta_i^{[M]})\)
\(\beta_{g,i}^{[OM]} \sim \text{Normal}( \beta_{i}^{[OM]},\eta_{i}^{[OM]})\)
\(\beta_{g,i}^{[RF]} \sim \text{Normal}( \beta_{i}^{[RF]},\eta_{i}^{[RF]})\)
\(\beta_{g,i}^{[ORF]} \sim \text{Normal}( \beta_{i}^{[ORF]},\eta_{i}^{[ORF]})\)
si
media_effects_dist = NORMAL
\(\epsilon_{g,t}\sim \text{Normal}(0,\sigma_g)\):
Los residuales son independientes entre sí, de todas las variables de medios y control, y de todos los parámetros del modelo.
Si
unique_sigma_for_each_geo = False
(que es el valor predeterminado), entonces\(\sigma_1=\sigma_2=\cdots=\sigma_G=\sigma\).
Todos los parámetros restantes tienen distribuciones a priori especificadas por el usuario:
\( \{\gamma_i^{[C]}\}, \{\gamma_i^{[N]}\}, \{\xi_i^{[C]}\}, \{\xi_i^{[N]}\}, \)
\( \{\beta_i^{[M]}\}, \{ \beta_{i}^{[OM]} \}, \{ \beta_{i}^{[RF]} \}, \{ \beta_{i}^{[ORF]} \}, \)
\( \{\eta_i^{[M]}\}, \{ \eta_{i}^{[OM]} \}, \{\eta_{i}^{[RF]}\}, \{ \eta_{i}^{[ORF]} \}, \)
\( \{\alpha_i^{[M]}\}, \{ \alpha_{i}^{[OM]} \}, \{\alpha_{i}^{[RF]}\}, \{ \alpha_{i}^{[ORF]} \}, \)
\( \{ec_i^{[M]}\}, \{ ec_{i}^{[OM]} \}, \{ec_{i}^{[RF]}\}, \{ ec_{i}^{[ORF]} \}, \)
\( \{slope_i^{[M]}\}, \{ slope_{i}^{[OM]} \}, \{slope_{i}^{[RF]}\}, \{ slope_{i}^{[ORF]} \}, \)
\( \{\tau_g\}, \{\sigma_g\}. \)
Puedes cambiar algunos aspectos de la especificación del modelo, según las opciones de modelado que se describen en las siguientes secciones: Saturación y retraso de los medios, Alcance y frecuencia, Búsqueda pagada y Distribuciones a priori del ROI para la calibración. También puedes personalizar las distribuciones a priori predeterminadas.