投资回报率参数化

Meridian 可重新形参化,使每个付费媒体渠道的投资回报率都成为一个模型形参。这样,您就可以纳入先验投资回报率信息,如增量实验、行业基准或其他领域知识。或者,您也可以使用信息量较少的先验。投资回报率先验提供了一种平等对待所有媒体渠道的方式。此外,如果需要通过正则化来提高模型的收敛性或拟合优度,投资回报率先验可提供一种在不同渠道间应用同等正则化的方式。如需详细了解此校准方法,请参阅“Media Mix Model Calibration with Bayesian Priors”(使用贝叶斯先验进行媒体组合模型校准)一文。如需获取有关设置投资回报率先验的实际建议,请参阅投资回报率先验和校准

您可以选择对 \(\text{ROI}_i\)形参或 \(\beta^{[M]}_i\) 形参设置先验分布。PriorDistribution 对象有这两个形参的实参,但只会使用其中一个,具体取决于 ModelSpec 中布尔型实参 use_roi_prior 的值。在 use_roi_prior=True(这是默认值,强烈建议使用此值)的情形下,就会进行重新形参化。

对于任何媒体渠道 \(i\),由该渠道带来的增量 KPI 为

$$ \begin{align} \text{IncrementalKPI}_i &= \sum\limits_{g,t} u_{g,t}^{[Y]} p_g s \beta^{[M]}_{g,i} \text{HillAdstock}\left( \{x^{[M]}_{g,t-\ell,i}\}_{\ell=0}^L;\ \alpha^{[M]}_i, ec^{[M]}_i, \text{slope}_i \right) \\ &= \sum\limits_{g,t}\beta^{[M]}_{g,i} M_{g,t,i}\ , \end{align} $$

其中,$M_{g,t,i}$ 一词的定义如下

$$ M_{g,t,i} =\ u_{g,t}^{[Y]} p_g s \text{HillAdstock}\left( \{x^{[M]}_{g,t-\ell,i}\}_{\ell=0}^L;\ \alpha^{[M]}_i, ec^{[M]}_i, \text{slope}^{[M]}_i \right) \ , $$

\(s^{[Y]} = \sqrt{\frac{1}{GT-1} \sum\limits_{g,t} \left( y^\dagger_{g,t}-m^{[Y]} \right)^2}\) 是按人口比例调整的 KPI 值(具体定义见输入数据)的标准差。

$\beta^{[M]}_{g,i}$ 与 $\text{ROI}_i$ 之间的关系可用以下等式表示:

$$ \begin{align*} \sum\limits_{g,t}\beta^{[M]}_{g,i} M_{g,t,i} &= \text{IncrementalKPI}_i \\ &= \text{ROI}_i \cdot \text{Cost}_i \\ &= \text{ROI}_i \sum\limits_{g,t} \overset \sim x^{[M]}_{g,t,i} \ . \end{align*} $$

现在,$\beta^{[M]}_{g,i}$ 可以重新形参化为

$$ \begin{align*} \beta^{[M]}_{g,i} &= \begin{cases} \text{exp}(\beta_i^{[M]} + \eta_i^{[M]} Z_{g,i}) &,\ \text{if}\ \texttt{media_effects_dist} = \texttt{LogNormal} \\ \beta^{[M]}_i + \eta_i^{[M]} Z_{g,i} &,\ \text{if}\ \texttt{media_effects_dist} = \texttt{Normal} \ , \end{cases} \end{align*} $$

其中 \(Z_{g,i}\) 具有与所有其他模型形参无关的标准正态先验分布。将此表达式代入\(\beta^{[M]}_{g,i}\) 后,可得出以下等式:

$$ \begin{align*} \beta^{[M]}_i &= \begin{cases} \text{log}\left( \text{ROI}_i\sum\limits_{g,t} \overset \sim x^{[M]}_{g,t,i} \right) - \text{log}\left( \sum\limits_{g,t}exp\left( \eta^{[M]}_i Z_{g,i} \right) M_{g,t,i}\right) &, \text{if}\ \texttt{media_effects_dist} = \texttt{LogNormal} \\ \dfrac{ \text{ROI}_i \sum\limits_{g,t} \overset \sim x^{[M]}_{g,t,i} - \eta^{[M]}_i \sum\limits_{g,t}Z_{g,i}M_{g,t,i} }{ \sum\limits_{g,t} M_{g,t,i} } &, \text{if}\ \texttt{media_effects_dist} = \texttt{Normal} \ . \end{cases} \\ \end{align*} $$

因此,$\beta^{[M]}_i$ 是 \((\text{ROI}^{[M]}_i, \alpha^{[M]}_i, \text{slope}^{[M]}_i, ec^{[M]}_i, \{Z_{g,i}\}^G_{g=1})\)的函数。如果所有其他值都是固定的,则 $\beta^{[M]}_i$ 与 $\text{ROI}^{[M]}_i$ 之间存在一一对应关系。因此,可以用 $\text{ROI}^{[M]}_i$ 代替 $\beta^{[M]}_i$ 来对模型进行重新形参化。请注意以下几个要点:

  • $\text{ROI}^{[M]}_i$ 形参可以采用用户指定的任何先验分布。
  • 尽管 $\beta^{[M]}_i$ 不再是模型形参,但由于它是其他形参的函数,因此仍可以针对每个马尔可夫链蒙特卡洛 (MCMC) 先验或后验抽样来计算它。
  • media_effects_dist = Normal 时,$\text{ROI}^{[M]}_i$ 可以取 \((-\infty, +\infty)\)中的任意值。当 media_effects_dist = LogNormal 时,$\text{ROI}^{[M]}_i$ 可以取 \((0, +\infty)\)中的任意值。

根据投资回报率对模型重新形参化,只是改变了模型的先验分布定义方式。使用投资回报率形参化时,独立先验分布将置于\((\text{ROI}^{[M]}_i, \alpha^{[M]}_i, \text{slope}^{[M]}_i, ec^{[M]}_i)\)(而非 \((\beta^{[M]}_i, \alpha^{[M]}_i, \text{slope}^{[M]}_i, ec^{[M]}_i)\))上。在这两种情况下, \(\{Z_{g,i}\}^G_{g=1}\) 形参都会分配到标准正态先验,这些先验相互独立,且与所有其他模型形参无关。投资回报率形参化会隐式地对 \(\beta_m\)引入先验分布;不过,此分布不再独立于 \((\alpha^{[M]}_i, \text{slope}^{[M]}_i, ec^{[M]}_i, \{Z_{g,i}\}^G_{g=1})\)。

默认情况下,Meridian 将投资回报率先验分子 $IncrementalOutcome_i$ 定义为所有地理位置和时间段的总增量效果。不过,也可以使用 roi_calibration_periodrf_roi_calibration_period 实参将其定义为某个时间段子集期间的总增量效果。在某些特殊情况下,最好只考虑一个子集,例如,在使用涵盖 MMM 建模窗口内特定时间窗口的实验来校准投资回报率先验时。如需了解详情,请参阅 Media Mix Model Calibration with Bayesian Priors(使用贝叶斯先验进行媒体组合模型校准)的第 3.4 节。在大多数情况下,我们建议定义所有时间段的先验,并在制定更全面的策略时将所有可用的实验结果作为决策因素,如投资回报率先验和校准中所述。

您可以通过进行如下设置,对具有覆盖面和频次数据的渠道进行相同的重新形参化:

$$ M_{g,t,i} = u_{g,t}^{[Y]} p_g s \text{Adstock}\left( \left\{ r^{[RF]}_{g,t-\ell,i} \cdot \text{Hill}\left( f^{[RF]}_{g,t-\ell,n};\ ec^{[RF]}_i, \text{slope}^{[RF]}_i \right) \right\}^L_{\ell=0}\ ;\ \alpha^{[RF]}_i \right) \ . $$

其他一切都相同,因此这里不再重复推导过程。