Fazer análise de dados detalhada

Depois de coletar seus dados, faça uma análise de dados detalhada (EDA, na sigla em inglês) para encontrar e resolver problemas de qualidade de dados. Essa é uma etapa fundamental no processo de Modelagem de Marketing Mix (MMM), porque permite avaliar os dados para confirmar se eles representam com precisão os esforços de marketing, as respostas dos clientes e outras métricas relevantes. Ao corrigir os problemas detectados pelo processo de EDA, é possível melhorar a confiabilidade da saída do modelo.

Processo básico da EDA:

  1. Faça uma análise para identificar dados ausentes ou incompletos.
  2. Corrija valores ausentes nos arquivos de entrada.
  3. Avalie a precisão dos dados.
  4. Corrija anomalias, outliers ou imprecisões nos dados.
  5. Verifique a correlação entre as variáveis de KPI, mídia e controle.

Como há muitas maneiras de abordar a EDA, e o Meridian não fornece as visualizações para esse processo. Recomendamos que você encontre o equilíbrio certo para suas necessidades entre uma análise granular completa, que oferece maior confiança, e uma verificação rápida geral dos dados, que proporciona insights menos detalhados.

Diretrizes na criação das suas próprias visualizações para ajudar com a EDA:

  • Verifique a totalidade dos dados: para saber há valores ausentes, crie gráficos que mostram a porcentagem do total de dados para cada variável (canal) e investigue aquelas que aparecem como incompletas.

    Para refinar ainda mais a EDA, crie visualizações que mostram o número de observações por ano, mês, semana e dia da semana. Procure observações inesperadamente mais baixas em qualquer período.

  • Verifique a acurácia dos dados: eles devem ser precisos e livres de anomalias ou outliers que possam distorcer os resultados. As visualizações para verificar a precisão podem incluir comparar a parcela do gasto de mídia de cada canal e acompanhar a tendência de um canal para identificar algo incomum. É possível comparar essas visualizações com o plano de mídia ou trabalhar com a equipe de marketing para identificar se os dados são precisos e têm detalhes suficientes.

  • Confira o tamanho dos canais: analise a porcentagem de gastos. É difícil fazer estimativas se o canal gasta pouco. Talvez seja melhor combinar esses canais com outros.

  • Verifique a variabilidade da execução de mídia dos canais: em canais com baixa variabilidade na execução de mídia (impressões, cliques etc.), é mais difícil fazer estimativas. Use uma distribuição a priori personalizada se tiver informações relevantes para o canal.

  • Verifique a correlação entre variáveis: embora a correlação entre variáveis de KPI, mídia e controle não seja obrigatória, essas visualizações podem ajudar nestes casos de uso:

    • Medir a correlação entre as variáveis de mídia e controle para identificar alguma relação inesperada. Isso ajuda você a decidir se deve manter ou remover alguma variável de mídia ou controle.

    • Identificar a multicolinearidade. Quando duas ou mais variáveis de média e controle têm alta correlação entre si, elas criam multicolinearidade. Com isso, os modelos de regressão têm dificuldade para calcular o impacto das variáveis colineares. Ao identificar a multicolinearidade na análise de dados, você pode decidir quais variáveis incluir ou excluir do modelo.

Quando tiver certeza de que as informações estão completas e são precisas, você pode carregar os dados usando um formato compatível e criar seu modelo.