Daten auf geografischer und Länderebene

Mit Meridian können Sie Daten auf geografischer oder Länderebene modellieren. Auf geografischer Ebene werden Daten in klar abgegrenzte Regionen unterteilt, etwa nach Bundesstaaten, Städten, Designated Market Areas (DMAs) oder auch Ländergruppen. Diese Regionen befinden sich in der Regel alle in einer größeren geografischen Region, z. B. einem Land. Auf Länderebene beziehen sich die Daten hingegen auf eine einzelne geografische Einheit, in der Regel ein gesamtes Land.

Daten auf geografischer Ebene bieten mehrere Vorteile und sollten daher nach Möglichkeit genutzt werden. Sind Daten auf geografischer Ebene für fast alle Media-Channels verfügbar, empfehlen wir, die Länderdaten daraus abzuleiten und ein geografisches Modell zu verwenden. Weitere Informationen hierzu finden Sie im Abschnitt Media auf Länderebene in einem Modell auf geografischer Ebene. Weitere Informationen zum Modell auf Länderebene sind unter Modellierung auf Länderebene verfügbar.

Vorteile von Modellen auf geografischer Ebene

Die statistische Modellierung stützt sich auf Muster in den Daten. Solche Muster treten auf geografischer Ebene häufiger auf als auf Länderebene.

Weitere Vorteile von Daten auf geografischer Ebene:

  • Die effektive Stichprobengröße wird erhöht, indem Daten aus verschiedenen geografischen Einheiten in einem gemeinsamen Geo-Modell zusammengeführt werden.
  • Daten auf geografischer Ebene bieten engere glaubwürdige Intervalle, sofern die geografischen Einheiten hinsichtlich des Mechanismus der Media-Wirkung ähnlich sind, wie im Modell angenommen. Weitere Informationen sind unter Geo-level Bayesian Hierarchical Media Mix Modeling verfügbar.
  • Die Schätzungen für Zeiteffekte (z. B. Trend und Saisonalität) werden verbessert, da mehrere Beobachtungen pro Zeitraum zur Verfügung stehen.
  • Es können mehr knots zur Modellierung des \(\mu_t\) Parameters verwendet werden. Bei Daten auf Länderebene gibt es weniger Freiheitsgrade für Zeiteffekte. Ein Knoten pro Zeitraum würde das Modell beispielsweise vollständig sättigen.
  • Die Variabilität bei den Marketingausgaben ist größer, was für die Schätzung nicht linearer Effekte wie der Sättigung (Hill-Funktionsparameter) entscheidend ist.
  • Der Bias durch ausgelassene Variablen wird verringert, da die Korrelation zwischen Media-Ausgaben und Störfaktoren reduziert wird. Weitere Informationen finden Sie unter Geo-level Bayesian Hierarchical Media Mix Modeling im Abschnitt 4.3.

Auswahl von geografischen Einheiten

Berücksichtigen Sie bei der Auswahl von geografischen Einheiten Folgendes:

  • Schließen Sie als Erstes die geografischen Einheiten mit dem niedrigsten Gesamt-KPI aus. Kleinere geografische Einheiten tragen zwar weniger zum ROI bei, können aber dennoch einen großen Einfluss auf die Anpassung des Modells haben, insbesondere wenn für alle Gruppen eine einheitliche Residualvarianz verwendet wird (unique_sigma_for_each_geo = False von ModelSpec).

  • Für Werbetreibende in den USA, die DMAs (Designated Market Areas) als geografische Einheit verwenden, ist es eine gute Faustregel, die 50 bis 100 DMAs mit der höchsten Bevölkerungszahl zu modellieren. Dazu gehören in der Regel die meisten KPI-Einheiten, während die meisten kleinen DMAs mit mehr Datenrauschen ausgeschlossen werden, die sich auf die Modellanpassung und ‑konvergenz auswirken könnten.

  • Wenn jede geografische Einheit eine eigene Residualvarianz (unique_sigma_for_each_geo = True von ModelSpec) hat, haben geografische Einheiten mit mehr Rauschen weniger Auswirkungen auf die Modellanpassung. Diese Option kann jedoch die Konvergenz für einige Datensätze erschweren, da sie das Modell so viel flexibler macht. Wenn die MCMC-Stichprobenerhebung unter dieser Option konvergiert, könnte es sinnvoll sein, die geografische Bevölkerungsgröße gegen die mittlere Residualstandardabweichung (sigma-Parameter) darzustellen. In den meisten Fällen wäre ein relativ monotones Muster zu erwarten. Wenn Sie dieses Muster nicht sehen, ist es möglicherweise besser, unique_sigma_for_each_geo = False festzulegen und eine kleinere Teilmenge von geografischen Einheiten zu verwenden.

Wenn Sie sicherstellen möchten, dass das Modell 100 % Ihrer KPI-Einheiten abdeckt, können Sie kleinere geografische Einheiten in größeren aggregieren. Diese Option hat jedoch einige Einschränkungen:

  • Die Modellierung auf geografischer Ebene bietet erhebliche Vorteile, verliert jedoch an Wirkung, wenn nur wenige geografische Einheiten verfügbar sind. Unter Umständen ist es sinnvoller, ein Modell mit einem höheren geografischen Detaillierungsgrad zu verwenden und die kleinsten Einheiten auszuschließen, anstatt geografische Einheiten auf einer gröberen Ebene zu kombinieren.

  • Unterschiedliche Methoden zur Aggregation von geografischen Einheiten können zu unterschiedlichen MMM-Ergebnissen führen.

  • Variablen für die Media-Ausführung wie Impressionen oder Kosten können in der Regel über geografische Einheiten hinweg summiert werden. Einige Kontrollvariablen wie die Temperatur lassen sich jedoch nicht so einfach aggregieren.

Media auf Länderebene in einem Modell auf geografischer Ebene

Wenn die meisten Media auf geografischer Ebene verfügbar sind, ein oder zwei aber nur auf Länderebene, empfehlen wir, die Media auf Länderebene auf geografischer Ebene zu schätzen und ein geografisches Modell auszuführen. Eine naive Methode zum Schätzen dieser Daten besteht darin, die Media-Variable auf geografischer Ebene aus dem Wert auf Länderebene abzuleiten. Dabei wird der Anteil der Bevölkerung in der geografischen Einheit im Verhältnis zur Gesamtbevölkerung verwendet. Idealerweise liegen genaue Daten auf geografischer Ebene vor, damit keine Schätzung erforderlich ist, sie kann aber dennoch nützliche Informationen zu den Modellparametern liefern. Weitere Informationen finden Sie unter Geo-level Bayesian Hierarchical Media Mix Modeling im Abschnitt 4.4.