Participe da nova comunidade do
Discord para discussões em tempo real, suporte de colegas e interação direta com a equipe do Meridian.
Fazer análise de dados detalhada
Mantenha tudo organizado com as coleções
Salve e categorize o conteúdo com base nas suas preferências.
Depois de coletar seus dados, faça uma análise de dados detalhada (EDA, na sigla em inglês) para encontrar e resolver problemas de qualidade de dados. Essa é uma etapa fundamental no processo de Modelagem de Marketing Mix (MMM), porque permite avaliar os dados para confirmar se eles representam com precisão os esforços de marketing, as respostas dos clientes e outras métricas relevantes. Ao corrigir os problemas detectados pelo processo de EDA, é possível melhorar a confiabilidade da saída do modelo.
Processo básico da EDA:
- Faça uma análise para identificar dados ausentes ou incompletos.
- Corrija valores ausentes nos arquivos de entrada.
- Avalie a precisão dos dados.
- Corrija anomalias, outliers ou imprecisões nos dados.
- Verifique a correlação entre as variáveis de KPI, mídia e controle.
Como há muitas maneiras de abordar a EDA, e o Meridian não fornece as visualizações para esse processo. Recomendamos que você encontre o equilíbrio certo para suas necessidades entre uma análise granular completa, que oferece maior confiança, e uma verificação rápida geral dos dados, que proporciona insights menos detalhados.
Diretrizes na criação das suas próprias visualizações para ajudar com a EDA:
Verifique a totalidade dos dados: para saber há valores ausentes, crie gráficos que mostram a porcentagem do total de dados para cada variável (canal) e investigue aquelas que aparecem como incompletas.
Para refinar ainda mais a EDA, crie visualizações que mostram o número de observações por ano, mês, semana e dia da semana. Procure observações inesperadamente mais baixas em qualquer período.
Verifique a acurácia dos dados: eles devem ser precisos e livres de anomalias ou outliers que possam distorcer os resultados. As visualizações para verificar a precisão podem incluir comparar a parcela do gasto de mídia de cada canal e acompanhar a tendência de um canal para identificar algo incomum.
É possível comparar essas visualizações com o plano de mídia ou trabalhar com a equipe de marketing para identificar se os dados são precisos e têm detalhes suficientes.
Confira o tamanho dos canais: analise a porcentagem de gastos.
É difícil fazer estimativas se o canal gasta pouco.
Talvez seja melhor combinar esses canais com outros.
Verifique a variabilidade da execução de mídia dos canais: em canais com baixa variabilidade na execução de mídia (impressões, cliques etc.), é mais difícil fazer estimativas. Use uma distribuição a priori personalizada se tiver informações relevantes para o canal.
Verifique a correlação entre variáveis: embora a correlação entre variáveis de KPI, mídia e controle não seja obrigatória, essas visualizações podem ajudar nestes casos de uso:
Medir a correlação entre as variáveis de mídia e controle para identificar alguma relação inesperada. Isso ajuda você a decidir se deve manter ou remover alguma variável de mídia ou controle.
Identificar a multicolinearidade. Quando duas ou mais variáveis de média e controle têm alta correlação entre si, elas criam multicolinearidade. Com isso, os modelos de regressão têm dificuldade para calcular o impacto das variáveis colineares. Ao identificar a multicolinearidade na análise de dados, você pode decidir quais variáveis incluir ou excluir do modelo.
Quando tiver certeza de que as informações estão completas e são precisas, você pode carregar os dados usando um formato compatível e criar seu modelo.
Exceto em caso de indicação contrária, o conteúdo desta página é licenciado de acordo com a Licença de atribuição 4.0 do Creative Commons, e as amostras de código são licenciadas de acordo com a Licença Apache 2.0. Para mais detalhes, consulte as políticas do site do Google Developers. Java é uma marca registrada da Oracle e/ou afiliadas.
Última atualização 2025-08-29 UTC.
[null,null,["Última atualização 2025-08-29 UTC."],[[["\u003cp\u003eExploratory data analysis (EDA) is a crucial step in marketing mix modeling (MMM) to assess and confirm the accuracy of data related to marketing efforts and customer responses.\u003c/p\u003e\n"],["\u003cp\u003eThe EDA process involves reviewing data for completeness, fixing missing values, evaluating accuracy, correcting anomalies, and checking the correlation between key performance indicators (KPIs) and other variables.\u003c/p\u003e\n"],["\u003cp\u003eEDA visualizations should check data completeness by identifying missing values and evaluating the number of observations over time.\u003c/p\u003e\n"],["\u003cp\u003eEDA visualizations should also check data accuracy by comparing media spend across channels and examining trends to detect anomalies or outliers.\u003c/p\u003e\n"],["\u003cp\u003eChecking correlation between variables, including media and control variables, can help identify unexpected relationships and multicollinearity issues that could affect the accuracy of the regression model.\u003c/p\u003e\n"]]],["Exploratory data analysis (EDA) is crucial for marketing mix modeling (MMM). Key actions include: reviewing data for completeness, fixing missing values, evaluating data accuracy, and correcting anomalies. Checking the correlation between KPI, media, and control variables can reveal unexpected relationships or multicollinearity. Visualizations, showing data completeness, accuracy, and correlation are helpful. The EDA process ensures data quality before loading data and building a model.\n"],null,["After you collect your data, perform an exploratory data analysis (EDA) to find\nand address any data quality issues. This is a critical step in the marketing\nmix modeling (MMM) process because it lets you assess the data to confirm that\nit accurately represents the marketing efforts, customer responses, and other\nrelevant metrics. By correcting issues discovered through the EDA process, you\ncan improve the reliability of the model output.\n\nThe basic process for performing an EDA is:\n\n1. Run a data review to identify any missing or incomplete data.\n2. Fix missing values in your raw input files.\n3. Evaluate the accuracy of the data.\n4. Correct any anomalies, outliers, or inaccuracies in the data.\n5. Check the correlation between your KPI, media, and control variables.\n\nThere are many ways to approach EDA, and so Meridian doesn't provide the\nvisualizations for this process. We recommend that you find the right balance\nfor your needs between running a thorough granular analysis for greater\nconfidence and a quick check of high-level data that gives less detailed\ninsight.\n\nConsider these guidelines as you produce your own visualizations to assist with\nyour EDA:\n\n- **Checking data completeness:** Check for missing values in the data.You can\n create charts that show the percentage of data completeness for each\n variable (channel), then investigate the variables that show as incomplete.\n\n To further refine your EDA, you can create visualizations that show the\n number of observations by year, month, week, and weekday. Look for\n unexpectedly lower observations for any time period.\n- **Checking data accuracy:** Ensure that data is accurate and free from\n anomalies or outliers that could skew results. Creating visualizations to\n check for accuracy can include comparing the share of media spend for each\n channel and checking the trend of a channel to identify anything unusual.\n You can compare these visualizations against the media plan or work with the\n marketing team to help identify whether the data is accurate and granular\n enough.\n\n- **Checking channels size:** look at the channel's share of spend.\n Channels with very small share of spend might be difficult to estimate.\n You might want to combine them with other channels.\n\n- **Checking variability of channels' media execution:** Channels with low\n variability in media execution (impressions, clicks, etc.) might be\n difficult to estimate. Consider using a custom prior, if you have relevant\n information for it.\n\n- **Checking correlation between variables:** Though correlation between\n KPI, media, and control variables is not required, creating visualizations\n to check for correlation can be helpful in the following use cases:\n\n - Measuring the correlation between media and control variables to see if\n there is any unexpected relationship. This can help you decide\n whether to keep or remove any media or control variable.\n\n - Identifying multicollinearity. When two or more variables in the media\n and control variables are highly correlated with each other, they create\n multicollinearity, which can cause regression models to have difficulty\n calculating the impact of the collinear variables. By identifying\n multicollinearity in your data review, you can decide which variables to\n include or exclude from your model.\n\nAfter you have confidence that your data is accurate and complete, you can [load\nthe data using a supported\nformat](/meridian/docs/user-guide/supported-data-types-formats), and then\n[create your model](/meridian/docs/user-guide/modeling-overview)."]]