地域レベルと全国レベルのデータ

メリディアンでは、地域レベルや全国レベルのデータをモデル化できます。地域レベルのデータとは、州、都市、DMA、複数の国など、相互に排他的な地理的地域に分割されているデータです。通常、これらの地域はすべて、より広い地理的地域(国など)の中にあります。国レベルのデータとは、1 つの地理的地域(通常は国全体)について提供されているデータです。全国レベルのデータは、本質的に単一地域のデータです。

地域レベルのデータには複数の利点があるため、可能な場合には使うことが推奨されます。一部を除くほとんどのメディア チャネルで地域レベルのデータが利用できる場合は、地域レベルの欠損データを全国レベルのデータで補完したうえで、地域モデルを実行することをおすすめします。欠損データの補完について詳しくは、地域レベルのモデルにおける全国レベルのメディアをご覧ください。全国モデルについて詳しくは、全国レベルのモデリングをご覧ください。

地域レベルのモデルのメリット

統計モデリングはデータのパターンに依存します。再現性のあるパターンは、全国レベルよりも地域レベルのデータで多く出現します。

地域レベルのデータには、他にも次のようなメリットがあります。

  • 地域モデリングでさまざまな地域のデータがプールされるため、有効なサンプルサイズが増えます。
  • 地域ごとのメディア効果のメカニズムが似ているとモデルが推定した場合は、信頼区間が狭まります。詳しくは、地域レベルの階層ベイズのメディア ミックス モデリングをご覧ください。
  • 期間ごとに複数の観測値があるため、傾向や季節性といった時間効果の推定精度が高まります。
  • より多くの knots を使って \(\mu_t\) パラメータをモデル化できます。全国レベルのデータでは、時間効果を柔軟に推定する余地が少なくなります。たとえば、全国レベルのモデルは、各期間ごとに 1 つずつノットを置くと完全に飽和状態になってしまいます。
  • マーケティング支出のばらつきが大きくなります。これは、飽和(Hill 関数のパラメータ)などの非線形効果を推定するうえで重要です。
  • メディア費用と交絡因子の相関関係が下がることで、交絡因子の欠落による脱落変数バイアスが軽減されます。詳しくは、地域レベルの階層ベイズのメディア ミックス モデリングのセクション 4.3 をご覧ください。

地域の選択

地域を選択する際のガイダンスは次のとおりです。

  • 最初に、KPI の合計が最も少ない地域を除外します。小規模な地域は費用対効果への貢献度が低くなりますが、特にすべてのグループに単一の残差分散(ModelSpecunique_sigma_for_each_geo = False)がある場合は、モデルの適合度に大きく影響する可能性があります。

  • 米国の広告主様が指定マーケット エリア(DMA)を地域単位として使用している場合、おおまかなガイドラインとして、人口上位 50~100 の DMA をモデル化することをおすすめします。通常、これには KPI ユニットの大部分が含まれますが、モデルの適合度と収束に影響する可能性があるノイズの多い小規模な DMA のほとんどは除外されます。

  • 各地域に残差分散(ModelSpecunique_sigma_for_each_geo = True)がある場合、ノイズの多い地域はモデルの適合度に与える影響が少なくなります。ただし、この方法を使用するとモデルの柔軟性が大幅に増加するため、一部のデータセットでは収束が難しくなる可能性があります。この方法で MCMC サンプリングが収束する場合は、地域の人口規模と平均残差標準偏差(sigma パラメータ)をプロットすることをおすすめします。ほとんどの場合、かなり単調なパターンになります。そうしたパターンになっていない場合は、unique_sigma_for_each_geo = False を設定して、地域のより小さなサブセットを使用することをおすすめします。

モデルで KPI 単位の 100% を表現するには、小さい地域を大きな地域に統合することもできます。ただし、この方法にはいくつか注意点があります。

  • 地域レベルのモデリングには大きなメリットがありますが、地域数が比較的に少ない場合、そのメリットは小さくなります。モデリングを行う際は、地域を粗いレベルでまとめるよりも、より細かい地域単位で扱って、特に規模の小さい地域だけを除外するほうがよいでしょう。

  • 地域データの集約方法が変わると、マーケティング ミックス モデリングの結果も変わる可能性があります。

  • インプレッション数や費用などのメディア マーケティング変数は、通常、地域全体で合算できます。ただし、気温などのコントロール変数は、集計が簡単ではない場合があります。

地域レベルのモデルにおける全国レベルのメディア

ほとんどのメディアが地域レベルで利用できるものの、全国レベルでしか利用できないメディアが 1 つか 2 つ場合は、全国レベルのメディアを地域レベルで代入し、地域モデルを実行することをおすすめします。簡単な代入方法の 1 つは、地域の人口が全人口に占める割合を基に、地域レベルのメディア変数を全国レベルの値から近似値を求める方法です。代入が不要になるように、正確な地域レベルのデータを用意することが望ましいですが、代入でもモデル パラメータに関する有用な情報を得ることができます。詳細については、地域レベルの階層ベイズのメディア ミックス モデリングの 4.4 をご確認ください。