Treten Sie der neuen
Discord-Community bei. Sie können sich dort in Echtzeit austauschen, Unterstützung von anderen Nutzern erhalten und direkt mit dem Meridian-Team interagieren.
Daten auf geografischer und Länderebene
Mit Sammlungen den Überblick behalten
Sie können Inhalte basierend auf Ihren Einstellungen speichern und kategorisieren.
Mit Meridian können Sie Daten auf geografischer oder Länderebene modellieren. Auf geografischer Ebene werden Daten in klar abgegrenzte Regionen unterteilt, etwa nach Bundesstaaten, Städten, Designated Market Areas (DMAs) oder auch Ländergruppen. Diese Regionen befinden sich in der Regel alle in einer größeren geografischen Region, z. B. einem Land. Auf Länderebene beziehen sich die Daten hingegen auf eine einzelne geografische Einheit, in der Regel ein gesamtes Land.
Daten auf geografischer Ebene bieten mehrere Vorteile und sollten daher nach Möglichkeit genutzt werden. Sind Daten auf geografischer Ebene für fast alle Media-Channels verfügbar, empfehlen wir, die Länderdaten daraus abzuleiten und ein geografisches Modell zu verwenden. Weitere Informationen hierzu finden Sie im Abschnitt Media auf Länderebene in einem Modell auf geografischer Ebene. Weitere Informationen zum Modell auf Länderebene sind unter Modellierung auf Länderebene verfügbar.
Vorteile von Modellen auf geografischer Ebene
Die statistische Modellierung stützt sich auf Muster in den Daten. Solche Muster treten auf geografischer Ebene häufiger auf als auf Länderebene.
Weitere Vorteile von Daten auf geografischer Ebene:
- Die effektive Stichprobengröße wird erhöht, indem Daten aus verschiedenen geografischen Einheiten in einem gemeinsamen Geo-Modell zusammengeführt werden.
- Daten auf geografischer Ebene bieten engere glaubwürdige Intervalle, sofern die geografischen Einheiten hinsichtlich des Mechanismus der Media-Wirkung ähnlich sind, wie im Modell angenommen. Weitere Informationen sind unter Geo-level Bayesian Hierarchical Media Mix Modeling verfügbar.
- Die Schätzungen für Zeiteffekte (z. B. Trend und Saisonalität) werden verbessert, da mehrere Beobachtungen pro Zeitraum zur Verfügung stehen.
- Es können mehr
knots
zur Modellierung des \(\mu_t\) Parameters verwendet werden. Bei Daten auf Länderebene gibt es weniger Freiheitsgrade für Zeiteffekte. Ein Knoten pro Zeitraum würde das Modell beispielsweise vollständig sättigen.
- Die Variabilität bei den Marketingausgaben ist größer, was für die Schätzung nicht linearer Effekte wie der Sättigung (Hill-Funktionsparameter) entscheidend ist.
- Der Bias durch ausgelassene Variablen wird verringert, da die Korrelation zwischen Media-Ausgaben und Störfaktoren reduziert wird. Weitere Informationen finden Sie unter Geo-level Bayesian Hierarchical Media Mix Modeling im Abschnitt 4.3.
Auswahl von geografischen Einheiten
Berücksichtigen Sie bei der Auswahl von geografischen Einheiten Folgendes:
Schließen Sie als Erstes die geografischen Einheiten mit dem niedrigsten Gesamt-KPI aus. Kleinere geografische Einheiten tragen zwar weniger zum ROI bei, können aber dennoch einen großen Einfluss auf die Anpassung des Modells haben, insbesondere wenn für alle Gruppen eine einheitliche Residualvarianz verwendet wird (unique_sigma_for_each_geo = False
von ModelSpec
).
Für Werbetreibende in den USA, die DMAs (Designated Market Areas) als geografische Einheit verwenden, ist es eine gute Faustregel, die 50 bis 100 DMAs mit der höchsten Bevölkerungszahl zu modellieren.
Dazu gehören in der Regel die meisten KPI-Einheiten, während die meisten kleinen DMAs mit mehr Datenrauschen ausgeschlossen werden, die sich auf die Modellanpassung und ‑konvergenz auswirken könnten.
Wenn jede geografische Einheit eine eigene Residualvarianz (unique_sigma_for_each_geo =
True
von ModelSpec
) hat, haben geografische Einheiten mit mehr Rauschen weniger Auswirkungen auf die Modellanpassung. Diese Option kann jedoch die Konvergenz für einige Datensätze erschweren, da sie das Modell so viel flexibler macht. Wenn die MCMC-Stichprobenerhebung unter dieser Option konvergiert, könnte es sinnvoll sein, die geografische Bevölkerungsgröße gegen die mittlere Residualstandardabweichung (sigma
-Parameter) darzustellen. In den meisten Fällen wäre ein relativ monotones Muster zu erwarten. Wenn Sie dieses Muster nicht sehen, ist es möglicherweise besser, unique_sigma_for_each_geo = False
festzulegen und eine kleinere Teilmenge von geografischen Einheiten zu verwenden.
Wenn Sie sicherstellen möchten, dass das Modell 100 % Ihrer KPI-Einheiten abdeckt, können Sie kleinere geografische Einheiten in größeren aggregieren. Diese Option hat jedoch einige Einschränkungen:
Die Modellierung auf geografischer Ebene bietet erhebliche Vorteile, verliert jedoch an Wirkung, wenn nur wenige geografische Einheiten verfügbar sind. Unter Umständen ist es sinnvoller, ein Modell mit einem höheren geografischen Detaillierungsgrad zu verwenden und die kleinsten Einheiten auszuschließen, anstatt geografische Einheiten auf einer gröberen Ebene zu kombinieren.
Unterschiedliche Methoden zur Aggregation von geografischen Einheiten können zu unterschiedlichen MMM-Ergebnissen führen.
Variablen für die Media-Ausführung wie Impressionen oder Kosten können in der Regel über geografische Einheiten hinweg summiert werden. Einige Kontrollvariablen wie die Temperatur lassen sich jedoch nicht so einfach aggregieren.
Media auf Länderebene in einem Modell auf geografischer Ebene
Wenn die meisten Media auf geografischer Ebene verfügbar sind, ein oder zwei aber nur auf Länderebene, empfehlen wir, die Media auf Länderebene auf geografischer Ebene zu schätzen und ein geografisches Modell auszuführen. Eine naive Methode zum Schätzen dieser Daten besteht darin, die Media-Variable auf geografischer Ebene aus dem Wert auf Länderebene abzuleiten. Dabei wird der Anteil der Bevölkerung in der geografischen Einheit im Verhältnis zur Gesamtbevölkerung verwendet. Idealerweise liegen genaue Daten auf geografischer Ebene vor, damit keine Schätzung erforderlich ist, sie kann aber dennoch nützliche Informationen zu den Modellparametern liefern. Weitere Informationen finden Sie unter Geo-level Bayesian Hierarchical Media Mix Modeling im Abschnitt 4.4.
Sofern nicht anders angegeben, sind die Inhalte dieser Seite unter der Creative Commons Attribution 4.0 License und Codebeispiele unter der Apache 2.0 License lizenziert. Weitere Informationen finden Sie in den Websiterichtlinien von Google Developers. Java ist eine eingetragene Marke von Oracle und/oder seinen Partnern.
Zuletzt aktualisiert: 2025-08-28 (UTC).
[null,null,["Zuletzt aktualisiert: 2025-08-28 (UTC)."],[[["\u003cp\u003ePrioritize modeling larger geos based on total KPI, as smaller geos have less ROI contribution and can negatively impact model fit.\u003c/p\u003e\n"],["\u003cp\u003eFor US advertisers, modeling the top 50-100 DMAs by population generally captures significant KPI units while excluding noisy smaller DMAs.\u003c/p\u003e\n"],["\u003cp\u003eWhen using national-level media in a geo-level model, impute national data to the geo-level, preferably using accurate geo-level data if available.\u003c/p\u003e\n"],["\u003cp\u003eAggregating smaller geos into larger regions can be an option to represent 100% of KPI units, but consider the potential impact on model results and interpretation.\u003c/p\u003e\n"],["\u003cp\u003eAvoid redundant national-level variables when \u003ccode\u003eknots = n_times\u003c/code\u003e by either adjusting \u003ccode\u003eknots\u003c/code\u003e or carefully selecting variables based on interpretation goals.\u003c/p\u003e\n"]]],["When selecting geos, prioritize dropping smaller geos with lower KPI contribution first, especially if using a single residual variance. For US DMAs, model the top 50-100 by population. If each geo has unique residual variance, smaller geos matter less, but convergence may be difficult. National-level media can be imputed to the geo level using population proportions. Avoid national-level controls when each time period has its own parameter, as they create redundancy.\n"],null,["# Geo-level and national-level data\n\nMeridian offers the option to model geo-level or national level-data. Geo-level\ndata is when data is broken down into mutually exclusive geographic regions such\nas states, cities, DMAs, or even multiple countries. These regions are typically\nall within a larger geographic region, such as a country. National-level data is\nwhen data is provided for a single geographic region, typically an entire\ncountry. National-level data is essentially single-geo data.\n\nGeo-level data offers several advantages and is thus recommended when\npossible. If geo-level data is available for most, but not all, media channels,\nthen we recommend imputing the national-level data at the geo-level, and running\na geo-model. For more information on imputation,\nsee [National-level media in a geo-level model](#national-imputation). For more\ninformation on the national model,\nsee [National-level modeling](/meridian/docs/basics/national-models).\n\nGeo-level model advantages\n--------------------------\n\nStatistical modeling relies on patterns in the data. Repeatable patterns\nare more common in geo-level data than national-level data.\n\nHere are some other advantages of geo-level data:\n\n- Increases the effective sample size, by pooling data across geos in geo-modeling.\n- Provides tighter credible intervals, provided the geos are similar in terms of the media impact mechanism as the model assumes. For more information, see [Geo-level Bayesian Hierarchical Media Mix\n Modeling](//research.google/pubs/geo-level-bayesian-hierarchical-media-mix-modeling/).\n- Improves estimates for time-effects (such as trend and seasonality), since there are multiple observations per time period.\n- Can support the use of more `knots` to model the \\\\(\\\\mu_t\\\\) parameter. National-level data has fewer degrees of freedom for time-effects. For example, one knot per time period completely saturates the national-level model.\n- Shows greater variability in marketing spend, which is crucial for estimating non-linear effects, like saturation (Hill function parameters).\n- Reduces omitted variable bias due to missing confounders, by reducing the correlation between media spend and confounders. See section 4.3 of [Geo-level Bayesian Hierarchical Media Mix\n Modeling](//research.google/pubs/geo-level-bayesian-hierarchical-media-mix-modeling/) for more information.\n\nGeo selection\n-------------\n\nWhen you are selecting geos, consider the following guidance:\n\n- Drop the smallest geos by total KPI first. Smaller geos have less\n contribution to ROI, yet they can still have a high influence on model fit,\n particularly when there is a single residual variance for all groups\n (`unique_sigma_for_each_geo = False` of `ModelSpec`).\n\n- For US advertisers using designated market area (DMA) as the geographical\n unit, a rough guideline is to model the top 50-100 DMAs by population size.\n This generally includes the vast majority of the KPI units, while excluding\n most of the noisier small DMAs that might impact model fit and convergence.\n\n- When each geo has its own residual variance (`unique_sigma_for_each_geo =\n True` of `ModelSpec`), noisier geos have less impact on model fit. However,\n this option can make convergence difficult for some datasets because it adds\n so much flexibility to the model. If MCMC sampling does converge under this\n option, it might be worth plotting the geo population size versus the mean\n residual standard deviation (`sigma` parameter) - in most cases, you would\n expect to see a fairly monotone pattern. If you don't see this pattern, then\n it might be better to set `unique_sigma_for_each_geo = False` and use a\n smaller subset of geos.\n\nIf you want to make sure the model represents 100% of your KPI units, you\ncan aggregate smaller geos into larger regions. However, this option comes\nwith several caveats:\n\n- Geo-level modeling provides a significant advantage, although this benefit is\n reduced when there are relatively few geos. It may be better to fit a model at a\n finer geo granularity and exclude the smallest geos, rather than aggregating\n geos to a coarser level.\n\n- Different geo aggregation grouping methods can lead to different MMM results.\n\n- Media execution variables, such as impressions or cost, can usually be\n summed across geos. However, some control variables, such as\n temperature, can be less straightforward to aggregate.\n\nNational-level media in a geo-level model\n-----------------------------------------\n\nWhen most media are available at the geo-level, but one or two are only\navailable at the national level, we recommend imputing the national-level\nmedia at a geo-level and running a geo-model. One naive imputation method is\nto approximate the geo-level media variable from its national level value,\nusing the proportion of the population in the geo relative to the total\npopulation. Although it is preferable to have accurate geo-level data so that\nimputation isn't necessary, imputation can still yield useful information\nabout the model parameters. For more information, see section 4.4 of\n[Geo-level Bayesian Hierarchical Media Mix Modeling](//research.google/pubs/geo-level-bayesian-hierarchical-media-mix-modeling/)."]]