Únete a la comunidad recientemente lanzada de
Discord para participar en debates en tiempo real, obtener asistencia de otros miembros y comunicarte directamente con el equipo de Meridian.
Cómo realizar un análisis de datos exploratorio
Organiza tus páginas con colecciones
Guarda y categoriza el contenido según tus preferencias.
Después de recopilar los datos, realiza un análisis de datos exploratorio (EDA) para encontrar y abordar cualquier problema de calidad de los datos. Este es un paso fundamental en el proceso de modelado de combinación de marketing (MMM), ya que te permite evaluar los datos para confirmar que representan con precisión las iniciativas de marketing, las respuestas de los clientes y otras métricas pertinentes. Si corriges los problemas detectados a través del proceso de EDA, puedes mejorar la confiabilidad del resultado del modelo.
El proceso básico para realizar un EDA es el siguiente:
- Ejecuta una revisión de datos para identificar si hay datos faltantes o incompletos.
- Agrega los valores que falten en tus archivos de entrada sin procesar.
- Evalúa la precisión de los datos.
- Corrige las anomalías, los valores atípicos o las imprecisiones en los datos.
- Verifica la correlación entre las variables de control, medios y KPI.
Existen muchas formas de abordar el EDA, por lo que Meridian no proporciona visualizaciones para este proceso. Te recomendamos que, según tus necesidades, encuentres el equilibrio adecuado entre un análisis detallado y exhaustivo para tener más confianza, y una verificación rápida de los datos generales que brinde estadísticas menos detalladas.
Ten en cuenta estos lineamientos cuando crees tus propias visualizaciones para el EDA:
Verifica que los datos estén completos: Revisa si faltan valores en los datos. Puedes crear gráficos que muestren el porcentaje de completitud de los datos para cada variable (canal) y, luego, analizar las variables que se muestran como incompletas.
Para definir mejor tu EDA, puedes crear visualizaciones que muestren la cantidad de observaciones por año, mes, semana y día de la semana. Busca observaciones inesperadamente más bajas en algún período.
Verifica la precisión de los datos: Asegúrate de que los datos sean precisos y no contengan anomalías ni valores atípicos que puedan sesgar los resultados. Las visualizaciones para verificar la precisión pueden servir para comparar el porcentaje de la inversión en medios de cada canal y verificar la tendencia de un canal para identificar algo inusual.
Puedes comparar esas visualizaciones con el plan de medios o trabajar con el equipo de marketing para identificar si los datos son lo suficientemente precisos y detallados.
Verifica el tamaño de los canales: Observa el porcentaje de la inversión de cada canal.
Es posible que sea difícil estimar los canales con un porcentaje de inversión muy bajo.
Es posible que desees combinarlos con otros canales.
Verifica la variabilidad de la ejecución de medios de los canales: Es posible que los canales con poca variabilidad en la ejecución de medios (impresiones, clics, etc. sean difíciles de estimar. Considera usar una distribución a priori personalizada si tienes información pertinente para ello.
Verifica la correlación entre las variables: Si bien no es necesario que haya una correlación entre las variables de KPI, medios y control, crear visualizaciones para verificar la correlación puede ser útil en los siguientes casos de uso:
Medir la correlación entre las variables de control y de medios para ver si hay alguna relación inesperada. Esto puede ayudarte a decidir si debes conservar o quitar alguna variable de control o de medios.
Identifica la multicolinealidad. Cuando dos o más variables de medios y de control están altamente correlacionadas entre sí, crean multicolinealidad, lo que puede generar que los modelos de regresión tengan dificultades para calcular el impacto de las variables colineales. Si identificas alguna multicolinealidad cuando revisas tus datos, puedes decidir qué variables incluir o excluir en tu modelo.
Una vez que tengas la seguridad de que tus datos son precisos y están completos, puedes cargarlos con un formato compatible y, luego, crear tu modelo.
Salvo que se indique lo contrario, el contenido de esta página está sujeto a la licencia Atribución 4.0 de Creative Commons, y los ejemplos de código están sujetos a la licencia Apache 2.0. Para obtener más información, consulta las políticas del sitio de Google Developers. Java es una marca registrada de Oracle o sus afiliados.
Última actualización: 2025-08-28 (UTC)
[null,null,["Última actualización: 2025-08-28 (UTC)"],[[["\u003cp\u003eExploratory data analysis (EDA) is a crucial step in marketing mix modeling (MMM) to assess and confirm the accuracy of data related to marketing efforts and customer responses.\u003c/p\u003e\n"],["\u003cp\u003eThe EDA process involves reviewing data for completeness, fixing missing values, evaluating accuracy, correcting anomalies, and checking the correlation between key performance indicators (KPIs) and other variables.\u003c/p\u003e\n"],["\u003cp\u003eEDA visualizations should check data completeness by identifying missing values and evaluating the number of observations over time.\u003c/p\u003e\n"],["\u003cp\u003eEDA visualizations should also check data accuracy by comparing media spend across channels and examining trends to detect anomalies or outliers.\u003c/p\u003e\n"],["\u003cp\u003eChecking correlation between variables, including media and control variables, can help identify unexpected relationships and multicollinearity issues that could affect the accuracy of the regression model.\u003c/p\u003e\n"]]],["Exploratory data analysis (EDA) is crucial for marketing mix modeling (MMM). Key actions include: reviewing data for completeness, fixing missing values, evaluating data accuracy, and correcting anomalies. Checking the correlation between KPI, media, and control variables can reveal unexpected relationships or multicollinearity. Visualizations, showing data completeness, accuracy, and correlation are helpful. The EDA process ensures data quality before loading data and building a model.\n"],null,["After you collect your data, perform an exploratory data analysis (EDA) to find\nand address any data quality issues. This is a critical step in the marketing\nmix modeling (MMM) process because it lets you assess the data to confirm that\nit accurately represents the marketing efforts, customer responses, and other\nrelevant metrics. By correcting issues discovered through the EDA process, you\ncan improve the reliability of the model output.\n\nThe basic process for performing an EDA is:\n\n1. Run a data review to identify any missing or incomplete data.\n2. Fix missing values in your raw input files.\n3. Evaluate the accuracy of the data.\n4. Correct any anomalies, outliers, or inaccuracies in the data.\n5. Check the correlation between your KPI, media, and control variables.\n\nThere are many ways to approach EDA, and so Meridian doesn't provide the\nvisualizations for this process. We recommend that you find the right balance\nfor your needs between running a thorough granular analysis for greater\nconfidence and a quick check of high-level data that gives less detailed\ninsight.\n\nConsider these guidelines as you produce your own visualizations to assist with\nyour EDA:\n\n- **Checking data completeness:** Check for missing values in the data.You can\n create charts that show the percentage of data completeness for each\n variable (channel), then investigate the variables that show as incomplete.\n\n To further refine your EDA, you can create visualizations that show the\n number of observations by year, month, week, and weekday. Look for\n unexpectedly lower observations for any time period.\n- **Checking data accuracy:** Ensure that data is accurate and free from\n anomalies or outliers that could skew results. Creating visualizations to\n check for accuracy can include comparing the share of media spend for each\n channel and checking the trend of a channel to identify anything unusual.\n You can compare these visualizations against the media plan or work with the\n marketing team to help identify whether the data is accurate and granular\n enough.\n\n- **Checking channels size:** look at the channel's share of spend.\n Channels with very small share of spend might be difficult to estimate.\n You might want to combine them with other channels.\n\n- **Checking variability of channels' media execution:** Channels with low\n variability in media execution (impressions, clicks, etc.) might be\n difficult to estimate. Consider using a custom prior, if you have relevant\n information for it.\n\n- **Checking correlation between variables:** Though correlation between\n KPI, media, and control variables is not required, creating visualizations\n to check for correlation can be helpful in the following use cases:\n\n - Measuring the correlation between media and control variables to see if\n there is any unexpected relationship. This can help you decide\n whether to keep or remove any media or control variable.\n\n - Identifying multicollinearity. When two or more variables in the media\n and control variables are highly correlated with each other, they create\n multicollinearity, which can cause regression models to have difficulty\n calculating the impact of the collinear variables. By identifying\n multicollinearity in your data review, you can decide which variables to\n include or exclude from your model.\n\nAfter you have confidence that your data is accurate and complete, you can [load\nthe data using a supported\nformat](/meridian/docs/user-guide/supported-data-types-formats), and then\n[create your model](/meridian/docs/user-guide/modeling-overview)."]]