Oszacowanie przyrostowego wyniku za pomocą regresji

Zgodnie z założeniami zastępowalności i spójności oczekiwaną wartość warunkową dowolnego potencjalnego wyniku ( \(\overset \sim Y_{g,t}^{ \left(\left\{ x_{g,t,i}^{(\ast)} \right\}\right) }\) ) można zapisać w formie oczekiwanej wartości warunkowej, którą można oszacować za pomocą modelu regresji, gdzie\(x_{g,t,i}^{(\ast)}\) reprezentuje zbiór zmiennych interwencji: mediów, bezpłatnych mediów i interwencji bez udziału mediów. Na potrzeby demonstracji zakładamy, że płatne i bezpłatne kanały mediów są oparte na wyświetleniach, ale podane niżej informacje dotyczą też kanałów opartych na zasięgu i częstotliwości.

Na podstawie definicji w sekcji Dane wejściowe można zapisać to w ten sposób:

$$ \begin{align*} \overset \sim Y_{g,t} &= u_{g,t}^{[Y]} \overset {\cdot \cdot} Y_{g,t} \\ &= u_{g,t}^{[Y]}L_{g,t}^{[Y]-1}(Y_{g,t}) \end{align*} $$

Meridian korzysta też z tego, że funkcja przekształcenia KPI przed modelowaniem ( \(L_{g,t}^{[Y]}(\cdot)\) ) jest liniowa, a więc można ją przekazać poza operator oczekiwania warunkowego. W efekcie otrzymujemy tę równość, w której wynik jest wielkością, którą można oszacować na podstawie modelu regresji, takiego jak model Meridian:

$$ \begin{align*} E\left(\overset \sim Y_{g,t}^{(\left\{ x_{g,t,i}^{(\ast)} \right\})} \Big| \bigl\{ z_{g,t,i} \bigr\} \right) &= E\left( \overset \sim Y_{g,t} \Big| \bigl\{x_{g,t,i}^{(\ast)}\bigr\}, \bigl\{z_{g,t,i}\bigr\} \right) \\ &= E\left( u_{g,t}^{[Y]}L_{g,t}^{[Y]-1}(Y_{g,t}) \Big| \bigl\{ x_{g,t,i}^{(\ast)} \bigr\}, \bigl\{z_{g,t,i}\bigr\} \right) \\ &= u_{g,t}^{[Y]}L_{g,t}^{[Y]-1} E\left( Y_{g,t} \Big| \bigl\{ x_{g,t,i}^{(\ast)} \bigr\}, \bigl\{z_{g,t,i}\bigr\} \right) \end{align*} $$

Na tej podstawie regresji można używać do szacowania przyrostowego wyniku pomiędzy dowolnymi 2 sytuacjami sprzecznymi \(\left\{ x_{g,t,i}^{(1)} \right\}\)i  \(\left\{ x_{g,t,i}^{(0)} \right\}\):

$$ \begin{align*} \text{IncrementalOutcome} \left( \bigl\{ x_{g,t,i}^{(1)} \bigr\}, \bigl\{ x_{g,t,i}^{(0)} \bigr\} \right) &= E\left( \sum\limits_{g,t}\left( \overset \sim Y_{g,t}^{ \left( \left\{ x_{g,t,i}^{(1)} \right\} \right) } - \overset \sim Y_{g,t}^{ \left( \left\{ x_{g,t,i}^{(0)} \right\} \right) } \right) \Bigg| \bigl\{ z_{g,t,i} \bigr\} \right) \\ &= \sum\limits_{g,t}u_{g,t}^{[Y]}L_g^{[Y]-1} \left( E\left( Y_{g,t} \Big| \bigl\{ x_{g,t,i}^{(1)} \bigr\}, \bigl\{ z_{g,t,i} \bigr\} \right)\right) - \sum\limits_{g,t}u_{g,t}^{[Y]}L_{g,t}^{[Y]-1} \left( E\left( Y_{g,t} \Big| \bigl\{ x_{g,t,i}^{(0)} \bigr\}, \bigl\{ z_{g,t,c} \bigr\} \right) \right) \end{align*} $$

W specyfikacji modelu Meridian:

$$ \begin{align*} E\left( Y_{g,t} \Big| \bigl\{ x_{g,t,i}^{(\ast)} \bigr\}, \bigl\{ z_{g,t,i} \bigr\} \right) = \mu_t &+ \tau_g + \sum\limits_{i=1}^{N_C} \gamma^{[C]}_{g,i}z_{g,t,i} \\ &+ \sum\limits_{i=1}^{N_N} \gamma^{[N]}_{g,i}x^{[N] (\ast)}_{g,t,i} \\ &+ \sum\limits_{i=1}^{N_M} \beta^{[M]}_{g,i} \text{HillAdstock} \left( \bigl\{ x^{[M] (\ast)}_{g,t-s,i} \bigr\}^L_{s=0};\ \alpha^{[M]}_i, ec^{[M]}_i, \text{slope}^{[M]}_i \right) \\ &+ \sum\limits_{i=1}^{N_{OM}} \beta^{[OM]}_{g,i} \text{HillAdstock} \left( \bigl\{ x^{[OM] (\ast)}_{g,t-s,i} \bigr\}^L_{s=0};\ \alpha^{[OM]}_i, ec^{[OM]}_i, \text{slope}^{[OM]}_i \right) \end{align*} $$

Ta wielkość jest funkcją parametrów modelu, a zatem ma rozkład warunkowy, który Meridian może próbkować za pomocą łańcucha Markowa Monte Carlo (MCMC). Wartości ROI, mROI i krzywych odpowiedzi można obliczyć na podstawie definicji przyrostowego wyniku, a każda z nich ma też rozkład warunkowy.