Cómo realizar un análisis de datos exploratorio

Después de recopilar los datos, realiza un análisis de datos exploratorio (EDA) para encontrar y abordar cualquier problema de calidad de los datos. Este es un paso fundamental en el proceso de modelado de combinación de marketing (MMM), ya que te permite evaluar los datos para confirmar que representan con precisión las iniciativas de marketing, las respuestas de los clientes y otras métricas pertinentes. Si corriges los problemas detectados a través del proceso de EDA, puedes mejorar la confiabilidad del resultado del modelo.

El proceso básico para realizar un EDA es el siguiente:

  1. Ejecuta una revisión de datos para identificar si hay datos faltantes o incompletos.
  2. Agrega los valores que falten en tus archivos de entrada sin procesar.
  3. Evalúa la precisión de los datos.
  4. Corrige las anomalías, los valores atípicos o las imprecisiones en los datos.
  5. Verifica la correlación entre las variables de control, medios y KPI.

Existen muchas formas de abordar el EDA, por lo que Meridian no proporciona visualizaciones para este proceso. Te recomendamos que, según tus necesidades, encuentres el equilibrio adecuado entre un análisis detallado y exhaustivo para tener más confianza, y una verificación rápida de los datos generales que brinde estadísticas menos detalladas.

Ten en cuenta estos lineamientos cuando crees tus propias visualizaciones para el EDA:

  • Verifica que los datos estén completos: Revisa si faltan valores en los datos. Puedes crear gráficos que muestren el porcentaje de completitud de los datos para cada variable (canal) y, luego, analizar las variables que se muestran como incompletas.

    Para definir mejor tu EDA, puedes crear visualizaciones que muestren la cantidad de observaciones por año, mes, semana y día de la semana. Busca observaciones inesperadamente más bajas en algún período.

  • Verifica la precisión de los datos: Asegúrate de que los datos sean precisos y no contengan anomalías ni valores atípicos que puedan sesgar los resultados. Las visualizaciones para verificar la precisión pueden servir para comparar el porcentaje de la inversión en medios de cada canal y verificar la tendencia de un canal para identificar algo inusual. Puedes comparar esas visualizaciones con el plan de medios o trabajar con el equipo de marketing para identificar si los datos son lo suficientemente precisos y detallados.

  • Verifica el tamaño de los canales: Observa el porcentaje de la inversión de cada canal. Es posible que sea difícil estimar los canales con un porcentaje de inversión muy bajo. Es posible que desees combinarlos con otros canales.

  • Verifica la variabilidad de la ejecución de medios de los canales: Es posible que los canales con poca variabilidad en la ejecución de medios (impresiones, clics, etc. sean difíciles de estimar. Considera usar una distribución a priori personalizada si tienes información pertinente para ello.

  • Verifica la correlación entre las variables: Si bien no es necesario que haya una correlación entre las variables de KPI, medios y control, crear visualizaciones para verificar la correlación puede ser útil en los siguientes casos de uso:

    • Medir la correlación entre las variables de control y de medios para ver si hay alguna relación inesperada. Esto puede ayudarte a decidir si debes conservar o quitar alguna variable de control o de medios.

    • Identifica la multicolinealidad. Cuando dos o más variables de medios y de control están altamente correlacionadas entre sí, crean multicolinealidad, lo que puede generar que los modelos de regresión tengan dificultades para calcular el impacto de las variables colineales. Si identificas alguna multicolinealidad cuando revisas tus datos, puedes decidir qué variables incluir o excluir en tu modelo.

Una vez que tengas la seguridad de que tus datos son precisos y están completos, puedes cargarlos con un formato compatible y, luego, crear tu modelo.