Definizione di esito incrementale

Risultato è la metrica principale di interesse su cui Meridian misura l'effetto causale delle variabili del trattamento. In genere si tratta di entrate, ma quando il KPI non è costituito da entrate e i dati revenue_per_kpi non sono disponibili, Meridian definisce il risultato come il KPI stesso.

In termini colloquiali, puoi definire il ritorno sull'investimento (ROI) come il risultato incrementale generato da un canale media diviso per il suo costo. Ciò implica che la media ha un effetto causale sul risultato che vuoi stimare. Per farlo in modo coerente, devi definire il risultato incrementale utilizzando il linguaggio dell'inferenza causale.

A scopo dimostrativo, prendiamo in considerazione il caso in cui nessun canale media organico o a pagamento abbia dati su copertura e frequenza. Utilizzando la notazione dei dati di input, hai un array osservato di unità media trasformate \(\{x^{[M]}_{g,t,i}\}\), unità media organiche\(\{x^{[OM]}_{g,t,i}\}\)e trattamenti non media \(\{x^{[N]}_{g,t,i}\}\), il cui insieme è indicato da \(\{x_{g,t,i}\}\). Questo insieme include valori per tutti i canali media a pagamento e organici e per i trattamenti non media per tutte le \(g=1,\dots G \) e \(t=-\infty,\dots,T \), anche se in pratica devi solo preoccuparti di \(t=1-L,2-L,\dots T\) dove \(L\) è il ritardo massimo assunto degli effetti dei media. Ai fini di questa discussione, fai riferimento alle unità sulla scala trasformata \(x_{g,t,i}\) anziché sulla scala non elaborata \(\overset{\cdot \cdot}{x}_{g,t,m}\). Esiste una corrispondenza uno a uno tra le unità non elaborate e quelle trasformate, quindi non fa alcuna differenza pratica.

Anche se l'esecuzione effettiva di un inserzionista è stata \(\{x_{g,t,i}\}\), puoi immaginare quale potrebbe essere stato il risultato se l'inserzionista avesse eseguito un array di media diverso, ad esempio \(\{x^{(\ast)}_{g,t,i}\}\). Puoi indicare questo risultato come l'insieme di variabili casuali \(\{ \overset \sim Y_{g,t}^{ (\{ x_{g,t,i}^{(\ast)} \}) }\}\). Nella letteratura sull'inferenza causale, \(\{ \overset \sim Y_{g,t}^{ (\{ x_{g,t,i}^{(\ast)} \}) }\}\) \(\{ x^{(\ast)}_{g,t,i} \}\) si chiamano risultati potenziali e l'insieme di valori \(\{ x^{(\ast)}_{g,t,i} \}\) si chiama scenario controfattuale.

Nella letteratura sull'inferenza causale, è comune trovare notazioni come \(Y^{(1)}\) e \(Y^{(0)}\) che rappresentano i potenziali risultati in scenari controfattuali di trattamento e controllo. L'MMM è simile, ma leggermente più complesso perché i potenziali risultati sono un array bidimensionale di valori e il trattamento è un array tridimensionale di valori. Tieni presente che non ogni potenziale risultato nell'array \(\{ \overset \sim Y_{g,t}^{ (\{ x_{g,t,i}^{(\ast)} \}) }\}\) dipende effettivamente da tutti i valori nell'array \(\{ x^{(\ast)}_{g,t,i} \}\). Ad esempio, i contenuti multimediali in un determinato periodo di tempo non possono influire sulle vendite passate. Tuttavia, questa notazione è preferita perché è più semplice che cercare di indicare esattamente su quali valori mediali si basa ogni potenziale risultato per ogni periodo di tempo.

Sebbene per qualsiasi coppia di scenari multimediali controfattuali, come \(\{ x^{(1)}_{g,t,i} \}\) e \(\{ x^{(0)}_{g,t,i} \}\), tu possa definire il risultato incrementale effettivo come:

$$ \sum\limits _{g,t} \left( \overset \sim Y_{g,t}^{ \left( \left\{ x_{g,t,i}^{(1)} \right\} \right) } - \overset \sim Y_{g,t}^{ \left( \left\{ x_{g,t,i}^{(0)} \right\} \right) } \right) $$

Tuttavia, questa quantità non è stimabile perché i dati non possono fornire informazioni sulla distribuzione congiunta di \(\overset \sim Y_{g,t}^{ (\{ x_{g,t,i}^{(1)} \}) }\) e \(\overset \sim Y_{g,t}^{ (\{ x_{g,t,i}^{(0)} \}) }\). È possibile osservare un solo potenziale risultato, ovvero \(\overset \sim Y_{g,t}^{ \left( \left\{ x_{g,t,i} \right\}\right) }\). Tieni presente che, intuitivamente, quando \(\{ x^{(1)}_{g,t,i} \}\) si avvicina arbitrariamente a \(\{ x^{(0)}_{g,t,i} \}\), i potenziali risultati \(\overset \sim Y_{g,t}^{ (\{ x_{g,t,i}^{(1)} \}) }\) e \(\overset \sim Y_{g,t}^{ (\{ x_{g,t,i}^{(0)} \}) }\) dovrebbero tendere allo stesso valore, ma questa intuizione non è sufficiente per specificare la distribuzione congiunta in modo più generale.

Invece, per qualsiasi coppia di scenari multimediali controfattuali, \(\{ x^{(1)}_{g,t,i} \}\) e \(\{ x^{(0)}_{g,t,i} \}\), definisci il risultato incrementale come:

$$ \text{IncrementalOutcome} \left( \left\{ x^{(1)}_{g,t,i} \right\}, \left\{ x^{(0)}_{g,t,i} \right\} \right) = E \left( \sum\limits_{g,t} \left( \overset \sim Y_{g,t}^{ \left(\left\{ x_{g,t,i}^{(1)} \right\}\right) } - \overset \sim Y_{g,t}^{ \left(\left\{ x_{g,t,i}^{(0)} \right\}\right) } \right) \Bigg| \left\{ z_{g,t,i} \right\} \right) $$

dove \(\{z_{g,t,i}\}\) indica i valori osservati per un insieme di variabili di controllo. Questa notazione abbreviata viene utilizzata per indicare che l'aspettativa è condizionata all'assunzione di questi valori da parte delle variabili casuali di controllo. Utilizzando un modello di regressione MMM e un insieme di variabili di controllo accuratamente selezionate, questa aspettativa condizionale è stimabile. Per ulteriori informazioni, consulta ROI, mROI e curve di risposta.

In genere, la somma viene presa in considerazione per \(g=1,\dots G\) e \(t=1,\dots T\), tuttavia, puoi anche definire il risultato incrementale per qualsiasi sottoinsieme di questi valori.