Rejoignez la nouvelle communauté
Discord pour discuter en temps réel, obtenir l'aide de vos pairs et communiquer directement avec l'équipe Meridian.
Effectuer une analyse exploratoire des données
Restez organisé à l'aide des collections
Enregistrez et classez les contenus selon vos préférences.
Une fois que vous avez collecté vos données, effectuez une analyse exploratoire des données pour identifier et résoudre les problèmes de qualité des données. Il s'agit d'une étape essentielle du processus de Marketing Mix Modeling (MMM), car elle vous permet d'évaluer les données pour confirmer qu'elles représentent de manière précise les efforts marketing, les réponses des clients et d'autres métriques pertinentes. En corrigeant les problèmes détectés lors de l'analyse exploratoire des données, vous pouvez améliorer la fiabilité de la sortie du modèle.
Le processus de base pour effectuer une analyse exploratoire des données est le suivant :
- Examinez les données afin d'identifier les données manquantes ou incomplètes.
- Corrigez les valeurs manquantes dans vos fichiers d'entrée bruts.
- Évaluez l'exactitude des données.
- Corrigez les anomalies, les données aberrantes ou les imprécisions dans les données.
- Vérifiez la corrélation entre vos KPI et vos variables média et de contrôle.
Il existe de nombreuses façons d'aborder l'analyse exploratoire des données. C'est pourquoi Meridian ne fournit pas de visualisations pour ce processus. Nous vous recommandons de trouver le juste équilibre, en fonction de vos besoins, entre une analyse détaillée et précise pour plus de confiance et une vérification rapide des données de haut niveau qui fournit des insights moins détaillés.
Lorsque vous créez vos propres visualisations, suivez ces consignes qui vous aideront à effectuer l'analyse exploratoire des données :
Vérifiez la complétude des données : recherchez les valeurs manquantes dans les données. Vous pouvez créer des graphiques indiquant le pourcentage de données complètes pour chaque variable (canal), puis examiner les variables qui apparaissent comme incomplètes.
Pour affiner davantage votre analyse exploratoire des données, vous pouvez créer des visualisations qui montrent le nombre d'observations par année, mois, semaine et jour de la semaine. Recherchez des niveaux d'observations anormalement plus faibles pour une période donnée.
Vérifiez l'exactitude des données : assurez-vous que les données sont exactes et qu'elles ne présentent pas d'anomalies ou de valeurs aberrantes qui pourraient fausser les résultats. La création de visualisations pour vérifier l'exactitude des données peut inclure la comparaison de la part des dépenses média pour chaque canal et la vérification de la tendance d'un canal afin d'identifier tout élément inhabituel.
Vous pouvez comparer ces visualisations au plan média ou collaborer avec l'équipe marketing pour déterminer si les données sont suffisamment précises et détaillées.
Vérifiez la taille des canaux : examinez la part des dépenses du canal.
Il peut être difficile d'estimer les canaux dont la part des dépenses est très faible.
Vous pouvez choisir de les combiner avec d'autres canaux.
Vérifiez la variabilité de l'exécution média des canaux : il peut être difficile d'estimer les canaux dont la variabilité de l'exécution média (impressions, clics, etc.) est faible. Envisagez d'utiliser un a priori personnalisé si vous disposez d'informations pertinentes.
Vérifiez la corrélation entre les variables : bien que la corrélation entre les KPI et les variables média et de contrôle ne soit pas obligatoire, il peut être utile de créer des visualisations pour vérifier la corrélation dans les cas d'utilisation suivants :
Mesurer la corrélation entre les variables média et de contrôle pour voir s'il existe une relation inattendue. Cela peut vous aider à décider de conserver ou de supprimer une variable média ou de contrôle spécifique.
Identifier la multicolinéarité Lorsqu'au moins deux variables média et de contrôle sont fortement corrélées entre elles, elles créent une multicolinéarité, ce qui peut entraîner des difficultés pour les modèles de régression lorsqu'ils calculent l'impact des variables colinéaires. En identifiant la multicolinéarité lors de votre analyse des données, vous pouvez décider des variables à inclure dans votre modèle ou à en exclure.
Une fois que vous êtes certain que vos données sont exactes et complètes, vous pouvez charger les données dans un format compatible, puis créer votre modèle.
Sauf indication contraire, le contenu de cette page est régi par une licence Creative Commons Attribution 4.0, et les échantillons de code sont régis par une licence Apache 2.0. Pour en savoir plus, consultez les Règles du site Google Developers. Java est une marque déposée d'Oracle et/ou de ses sociétés affiliées.
Dernière mise à jour le 2025/08/29 (UTC).
[null,null,["Dernière mise à jour le 2025/08/29 (UTC)."],[[["\u003cp\u003eExploratory data analysis (EDA) is a crucial step in marketing mix modeling (MMM) to assess and confirm the accuracy of data related to marketing efforts and customer responses.\u003c/p\u003e\n"],["\u003cp\u003eThe EDA process involves reviewing data for completeness, fixing missing values, evaluating accuracy, correcting anomalies, and checking the correlation between key performance indicators (KPIs) and other variables.\u003c/p\u003e\n"],["\u003cp\u003eEDA visualizations should check data completeness by identifying missing values and evaluating the number of observations over time.\u003c/p\u003e\n"],["\u003cp\u003eEDA visualizations should also check data accuracy by comparing media spend across channels and examining trends to detect anomalies or outliers.\u003c/p\u003e\n"],["\u003cp\u003eChecking correlation between variables, including media and control variables, can help identify unexpected relationships and multicollinearity issues that could affect the accuracy of the regression model.\u003c/p\u003e\n"]]],["Exploratory data analysis (EDA) is crucial for marketing mix modeling (MMM). Key actions include: reviewing data for completeness, fixing missing values, evaluating data accuracy, and correcting anomalies. Checking the correlation between KPI, media, and control variables can reveal unexpected relationships or multicollinearity. Visualizations, showing data completeness, accuracy, and correlation are helpful. The EDA process ensures data quality before loading data and building a model.\n"],null,["After you collect your data, perform an exploratory data analysis (EDA) to find\nand address any data quality issues. This is a critical step in the marketing\nmix modeling (MMM) process because it lets you assess the data to confirm that\nit accurately represents the marketing efforts, customer responses, and other\nrelevant metrics. By correcting issues discovered through the EDA process, you\ncan improve the reliability of the model output.\n\nThe basic process for performing an EDA is:\n\n1. Run a data review to identify any missing or incomplete data.\n2. Fix missing values in your raw input files.\n3. Evaluate the accuracy of the data.\n4. Correct any anomalies, outliers, or inaccuracies in the data.\n5. Check the correlation between your KPI, media, and control variables.\n\nThere are many ways to approach EDA, and so Meridian doesn't provide the\nvisualizations for this process. We recommend that you find the right balance\nfor your needs between running a thorough granular analysis for greater\nconfidence and a quick check of high-level data that gives less detailed\ninsight.\n\nConsider these guidelines as you produce your own visualizations to assist with\nyour EDA:\n\n- **Checking data completeness:** Check for missing values in the data.You can\n create charts that show the percentage of data completeness for each\n variable (channel), then investigate the variables that show as incomplete.\n\n To further refine your EDA, you can create visualizations that show the\n number of observations by year, month, week, and weekday. Look for\n unexpectedly lower observations for any time period.\n- **Checking data accuracy:** Ensure that data is accurate and free from\n anomalies or outliers that could skew results. Creating visualizations to\n check for accuracy can include comparing the share of media spend for each\n channel and checking the trend of a channel to identify anything unusual.\n You can compare these visualizations against the media plan or work with the\n marketing team to help identify whether the data is accurate and granular\n enough.\n\n- **Checking channels size:** look at the channel's share of spend.\n Channels with very small share of spend might be difficult to estimate.\n You might want to combine them with other channels.\n\n- **Checking variability of channels' media execution:** Channels with low\n variability in media execution (impressions, clicks, etc.) might be\n difficult to estimate. Consider using a custom prior, if you have relevant\n information for it.\n\n- **Checking correlation between variables:** Though correlation between\n KPI, media, and control variables is not required, creating visualizations\n to check for correlation can be helpful in the following use cases:\n\n - Measuring the correlation between media and control variables to see if\n there is any unexpected relationship. This can help you decide\n whether to keep or remove any media or control variable.\n\n - Identifying multicollinearity. When two or more variables in the media\n and control variables are highly correlated with each other, they create\n multicollinearity, which can cause regression models to have difficulty\n calculating the impact of the collinear variables. By identifying\n multicollinearity in your data review, you can decide which variables to\n include or exclude from your model.\n\nAfter you have confidence that your data is accurate and complete, you can [load\nthe data using a supported\nformat](/meridian/docs/user-guide/supported-data-types-formats), and then\n[create your model](/meridian/docs/user-guide/modeling-overview)."]]