新しく開設された
Discord コミュニティに参加して、リアルタイムのディスカッション、ユーザー同士のサポート、メリディアン チームとの直接の交流をお楽しみください。
探索的データ分析を実施する
コレクションでコンテンツを整理
必要に応じて、コンテンツの保存と分類を行います。
データを収集したら、探索的データ分析(EDA)を行ってデータ品質の問題を特定し、対処します。これは、マーケティング ミックス モデリング(MMM)の重要なステップです。このステップでデータを評価することで、マーケティング活動、顧客の反応、その他の関連指標をデータが正確に表していることを確かめられるからです。EDA プロセスで発見した問題を修正することで、モデル出力の信頼性を高めることができます。
EDA を行う基本的な流れは次のとおりです。
- データの確認を行って、欠落しているデータや不完全なデータを特定します。
- 未加工の入力ファイル内の欠損値を修正します。
- データの精度を評価します。
- データの異常値、外れ値、不正確な部分を修正します。
- KPI、メディア、制御変数の間の相関関係を確認します。
EDA にはさまざまな方法があるため、Meridian ではこのプロセスの可視化は提供されていません。詳細な分析を徹底的に行えば信頼性は高まりますが、詳細な分析情報は得られなくても大まかなデータをすばやく確認することが効果的なケースもあります。ニーズに合った適切なバランスを見つけることをおすすめします。
EDA に役立つ独自の可視化を行う際は、次のガイドラインを考慮してください。
データの完全性を確認する: データに欠損値がないかを確認します。各変数(チャネル)についてデータの完全性の割合を示すグラフを作成すると、不完全なものとして示された変数を調査できます。
EDA を精緻化するには、年、月、週、平日 1 日ごとの観測回数を示す可視化を行います。任意の期間について、予想外に低い観測値がないかを確認します。
データの精度を確認する: データが正確であり、結果を歪める可能性のある異常値や外れ値が含まれていないことを確認します。精度を確認するために可視化データを作成すると、各チャネルのメディア費用の割合を比較したり、チャネルの傾向を確認して異常を特定したりできます。また、こうした可視化データをメディアプランと比較することも、マーケティング チームと連携してデータが十分に正確かつ詳細かどうかを明らかにすることもできます。
チャネルの規模を確認する: チャネルの支出額シェアを確認します。支出額シェアが非常に小さいチャネルは、予測が難しくなることがあります。他のチャネルと組み合わせることをおすすめします。
チャネルのメディア施策の変動性を確認する:メディア施策(インプレッション数、クリック数など)の変動性が低いチャネルは、予測が難しくなることがあります。関連情報がある場合は、カスタムの事前分布の使用を検討してください。
変数間の相関関係を確認する: KPI、メディア、制御変数の間の相関関係は必須ではありませんが、相関関係を確認するために可視化を行うと、以下のユースケースで役立つことがあります。
メディア変数と制御変数の相関を測定し、予想外の関係がないかを確認する。これは、メディア変数や制御変数を保持するか削除するかを判断する際に役立ちます。
多重共線性の特定。メディア変数と制御変数のうち 2 つ以上の変数に高い相関があると、多重共線性が生じ、回帰モデルで共線性変数の影響を計算することが難しくなる場合があります。データの確認で多重共線性を特定することで、モデルに含める変数と除外する変数を決定できます。
データが正確かつ完全であることを確認したら、サポートされている形式でデータを読み込み、モデルを作成することができます。
特に記載のない限り、このページのコンテンツはクリエイティブ・コモンズの表示 4.0 ライセンスにより使用許諾されます。コードサンプルは Apache 2.0 ライセンスにより使用許諾されます。詳しくは、Google Developers サイトのポリシーをご覧ください。Java は Oracle および関連会社の登録商標です。
最終更新日 2025-08-29 UTC。
[null,null,["最終更新日 2025-08-29 UTC。"],[[["\u003cp\u003eExploratory data analysis (EDA) is a crucial step in marketing mix modeling (MMM) to assess and confirm the accuracy of data related to marketing efforts and customer responses.\u003c/p\u003e\n"],["\u003cp\u003eThe EDA process involves reviewing data for completeness, fixing missing values, evaluating accuracy, correcting anomalies, and checking the correlation between key performance indicators (KPIs) and other variables.\u003c/p\u003e\n"],["\u003cp\u003eEDA visualizations should check data completeness by identifying missing values and evaluating the number of observations over time.\u003c/p\u003e\n"],["\u003cp\u003eEDA visualizations should also check data accuracy by comparing media spend across channels and examining trends to detect anomalies or outliers.\u003c/p\u003e\n"],["\u003cp\u003eChecking correlation between variables, including media and control variables, can help identify unexpected relationships and multicollinearity issues that could affect the accuracy of the regression model.\u003c/p\u003e\n"]]],["Exploratory data analysis (EDA) is crucial for marketing mix modeling (MMM). Key actions include: reviewing data for completeness, fixing missing values, evaluating data accuracy, and correcting anomalies. Checking the correlation between KPI, media, and control variables can reveal unexpected relationships or multicollinearity. Visualizations, showing data completeness, accuracy, and correlation are helpful. The EDA process ensures data quality before loading data and building a model.\n"],null,["After you collect your data, perform an exploratory data analysis (EDA) to find\nand address any data quality issues. This is a critical step in the marketing\nmix modeling (MMM) process because it lets you assess the data to confirm that\nit accurately represents the marketing efforts, customer responses, and other\nrelevant metrics. By correcting issues discovered through the EDA process, you\ncan improve the reliability of the model output.\n\nThe basic process for performing an EDA is:\n\n1. Run a data review to identify any missing or incomplete data.\n2. Fix missing values in your raw input files.\n3. Evaluate the accuracy of the data.\n4. Correct any anomalies, outliers, or inaccuracies in the data.\n5. Check the correlation between your KPI, media, and control variables.\n\nThere are many ways to approach EDA, and so Meridian doesn't provide the\nvisualizations for this process. We recommend that you find the right balance\nfor your needs between running a thorough granular analysis for greater\nconfidence and a quick check of high-level data that gives less detailed\ninsight.\n\nConsider these guidelines as you produce your own visualizations to assist with\nyour EDA:\n\n- **Checking data completeness:** Check for missing values in the data.You can\n create charts that show the percentage of data completeness for each\n variable (channel), then investigate the variables that show as incomplete.\n\n To further refine your EDA, you can create visualizations that show the\n number of observations by year, month, week, and weekday. Look for\n unexpectedly lower observations for any time period.\n- **Checking data accuracy:** Ensure that data is accurate and free from\n anomalies or outliers that could skew results. Creating visualizations to\n check for accuracy can include comparing the share of media spend for each\n channel and checking the trend of a channel to identify anything unusual.\n You can compare these visualizations against the media plan or work with the\n marketing team to help identify whether the data is accurate and granular\n enough.\n\n- **Checking channels size:** look at the channel's share of spend.\n Channels with very small share of spend might be difficult to estimate.\n You might want to combine them with other channels.\n\n- **Checking variability of channels' media execution:** Channels with low\n variability in media execution (impressions, clicks, etc.) might be\n difficult to estimate. Consider using a custom prior, if you have relevant\n information for it.\n\n- **Checking correlation between variables:** Though correlation between\n KPI, media, and control variables is not required, creating visualizations\n to check for correlation can be helpful in the following use cases:\n\n - Measuring the correlation between media and control variables to see if\n there is any unexpected relationship. This can help you decide\n whether to keep or remove any media or control variable.\n\n - Identifying multicollinearity. When two or more variables in the media\n and control variables are highly correlated with each other, they create\n multicollinearity, which can cause regression models to have difficulty\n calculating the impact of the collinear variables. By identifying\n multicollinearity in your data review, you can decide which variables to\n include or exclude from your model.\n\nAfter you have confidence that your data is accurate and complete, you can [load\nthe data using a supported\nformat](/meridian/docs/user-guide/supported-data-types-formats), and then\n[create your model](/meridian/docs/user-guide/modeling-overview)."]]