Meridian verwendet ein bayessches Regressionsmodell, das Vorwissen mit aus Daten gewonnenen Signalen kombiniert, um Media-Effekte zu schätzen und Unsicherheiten zu quantifizieren. Vorwissen wird mithilfe von Prior-Verteilungen in das Modell eingebunden. Diese können auf Testdaten, Branchenerfahrung oder früheren Media-Mix-Modellen beruhen.
Mithilfe von bayesschen Markow-Chain-Monte-Carlo-Methoden (MCMC) zur Stichprobenerhebung werden alle Modellkoeffizienten und ‑parameter gemeinsam geschätzt. Dazu gehören auch Parameter der nicht linearen Media-Transformationsfunktionen wie Adstock-Effekt und abnehmende Ertragskurven. Alle Parameter und die entsprechende Unsicherheit werden bei der Berechnung von Punktschätzungen und glaubwürdigen Intervallen für den ROI und andere wichtige Statistiken berücksichtigt.
Satz von Bayes
Der Satz von Bayes beschreibt, wie Sie anhand von beobachtbaren Daten Rückschlüsse auf nicht beobachtbare Parameter ziehen können. Es lässt sich durch die folgende Gleichung ausdrücken:
Dabei gilt:
- \(\theta\) ist der nicht beobachtbare Parameter von Interesse.
- \(P(\theta|data)\) ist der Posterior und die Ausgabe der bayesschen Gleichung.
- \(P(data|\theta)\) ist die Likelihood.
- \(P(\theta)\) ist der Prior.
Likelihood und Prior müssen angegeben werden, um Rückschlüsse auf den Posterior zu ziehen.
Likelihood, Priors und Posteriors
Die Likelihood ist die Modellspezifikation. Sie gibt an, wie wahrscheinlich es ist, dass die beobachteten Daten bei bestimmten Werten der Modellparameter\(\theta\)auftreten. Nach der bayesschen Analyse werden Rückschlüsse und Schätzungen zu den Parametern \(\theta\)vorgenommen. Likelihoods können sehr unterschiedlich komplex sein. Die Likelihood von Meridian beruht auf einem hierarchischen Regressionsmodell. Weitere Informationen zur Likelihood von Meridian finden Sie in der Modellspezifikation.
Ein Prior stellt die Annahme über die Wahrscheinlichkeitsverteilung eines Parameters dar, bevor Daten berücksichtigt wurden. Für den bayesschen Ansatz zur Quantifizierung von Unsicherheit muss vorhandenes Wissen einbezogen werden. In Meridian stellt die Prior-Verteilung die Annahmen zu den Auswirkungen von Marketingkanälen dar, bevor die Daten betrachtet werden. Informative Priors drücken eine hohe Sicherheit in Bezug auf \(\theta\)aus. Um diese Annahme zu widerlegen, sind viele Daten erforderlich. Bei einem nicht informativen Prior gibt es nur eine sehr vage Vorstellung vom Wert von \(\theta\) . Hier hat der Prior nur einen geringen Einfluss. Das Meridian-Modell bietet fundierte Priors mit Standardwerten. Sie können die Priors anpassen, z. B. für die ROI-Abstimmung.
Der Posterior ist eine Verteilung, die angibt, wie stark der Glaube an die verschiedenen möglichen Werte von \(\theta\) ist, nachdem die Daten berücksichtigt wurden. Er basiert auf dem Prior, den Daten und der Likelihood gemäß dem Satz von Bayes. Wenn die Daten nur wenige Informationen enthalten, wird der Posterior stärker in Richtung der Priors gewichtet. Enthalten die Daten umfangreiche Informationen, wird er stärker in Richtung der Daten gewichtet.
Das Meridian-Modell generiert die gemeinsame Posterior-Verteilung für alle Modellparameter sowie für alle geschätzten Messwerte wie ROI, Grenz-ROI und Reaktionskurven. Die Posterior-Verteilung stellt die aktualisierten Annahmen zu den Auswirkungen von Marketingkanälen unter Berücksichtigung der beobachteten Daten dar.
MCMC-Konvergenz
Bei Verwendung von Markow-Chain-Monte-Carlo-Verfahren (MCMC) konvergiert die Posterior-Stichprobenerhebung zu einer Zielverteilung. Um die Modellkonvergenz zu bewerten, können Sie mehrere MCMC-Ketten ausführen und überprüfen, ob alle Ketten dieselbe Zielverteilung erreichen.
Meridian verwendet die MCMC-Methode zur Stichprobenerhebung No U-Turn Sampler (NUTS). Die Parameterwerte stammen aus einer Wahrscheinlichkeitsverteilung, bei der die Verteilung des aktuellen Werts von den Werten der vorherigen Iteration abhängt. Die Werte bilden eine Kette, wobei jede Iteration einen vollständigen Satz von Modellparameterwerten darstellt. Mehrere Ketten werden unabhängig voneinander ausgeführt, um die Konvergenz zu bewerten. Wenn die Konvergenz erreicht ist, stellt jede Kette eine Stichprobe aus der Ziel-Posterior-Verteilung dar. Die Ketten können dann für die Posterior-Inferenz zusammengeführt werden.
Sie müssen die R-hat-Werte untersuchen, um die MCMC-Konvergenz zu bewerten. Diese Werte werden im Rahmen der Modellausgabe bereitgestellt. Für alle Parameter sollte ein R-hat-Wert von weniger als 1,2 erreicht werden. Dies ist jedoch kein zwingender Schwellenwert. Sind die R-hat-Werte etwas größer, lässt sich die Konvergenz in der Regel durch längere Ketten erreichen. Wenn die R-hat-Werte viel größer sind (z. B. 2,0 oder höher), kann die Konvergenz möglicherweise durch längere Ketten erreicht werden. Allerdings können Rechenzeit und Arbeitsspeicherbeschränkungen ein Hindernis darstellen. Das Modell muss dann unter Umständen angepasst werden, um Konvergenz zu erreichen.