探索的データ分析を実施する

データを収集したら、探索的データ分析(EDA)を行ってデータ品質の問題を特定し、対処します。これは、マーケティング ミックス モデリング(MMM)の重要なステップです。このステップでデータを評価することで、マーケティング活動、顧客の反応、その他の関連指標をデータが正確に表していることを確かめられるからです。EDA プロセスで発見した問題を修正することで、モデル出力の信頼性を高めることができます。

EDA を行う基本的な流れは次のとおりです。

  1. データの確認を行って、欠落しているデータや不完全なデータを特定します。
  2. 未加工の入力ファイル内の欠損値を修正します。
  3. データの精度を評価します。
  4. データの異常値、外れ値、不正確な部分を修正します。
  5. KPI、メディア、制御変数の間の相関関係を確認します。

EDA にはさまざまな方法があるため、Meridian ではこのプロセスの可視化は提供されていません。詳細な分析を徹底的に行えば信頼性は高まりますが、詳細な分析情報は得られなくても大まかなデータをすばやく確認することが効果的なケースもあります。ニーズに合った適切なバランスを見つけることをおすすめします。

EDA に役立つ独自の可視化を行う際は、次のガイドラインを考慮してください。

  • データの完全性を確認する: データに欠損値がないかを確認します。各変数(チャネル)についてデータの完全性の割合を示すグラフを作成すると、不完全なものとして示された変数を調査できます。

    EDA を精緻化するには、年、月、週、平日 1 日ごとの観測回数を示す可視化を行います。任意の期間について、予想外に低い観測値がないかを確認します。

  • データの精度を確認する: データが正確であり、結果を歪める可能性のある異常値や外れ値が含まれていないことを確認します。精度を確認するために可視化データを作成すると、各チャネルのメディア費用の割合を比較したり、チャネルの傾向を確認して異常を特定したりできます。また、こうした可視化データをメディアプランと比較することも、マーケティング チームと連携してデータが十分に正確かつ詳細かどうかを明らかにすることもできます。

  • チャネルの規模を確認する: チャネルの支出額シェアを確認します。支出額シェアが非常に小さいチャネルは、予測が難しくなることがあります。他のチャネルと組み合わせることをおすすめします。

  • チャネルのメディア施策の変動性を確認する:メディア施策(インプレッション数、クリック数など)の変動性が低いチャネルは、予測が難しくなることがあります。関連情報がある場合は、カスタムの事前分布の使用を検討してください。

  • 変数間の相関関係を確認する: KPI、メディア、制御変数の間の相関関係は必須ではありませんが、相関関係を確認するために可視化を行うと、以下のユースケースで役立つことがあります。

    • メディア変数と制御変数の相関を測定し、予想外の関係がないかを確認する。これは、メディア変数や制御変数を保持するか削除するかを判断する際に役立ちます。

    • 多重共線性の特定。メディア変数と制御変数のうち 2 つ以上の変数に高い相関があると、多重共線性が生じ、回帰モデルで共線性変数の影響を計算することが難しくなる場合があります。データの確認で多重共線性を特定することで、モデルに含める変数と除外する変数を決定できます。

データが正確かつ完全であることを確認したら、サポートされている形式でデータを読み込みモデルを作成することができます。