Participe da nova comunidade do
Discord para discussões em tempo real, suporte de colegas e interação direta com a equipe do Meridian.
Observações de validação (divisão de treinamento e teste)
Mantenha tudo organizado com as coleções
Salve e categorize o conteúdo com base nas suas preferências.
A especificação do modelo do Meridian contém um argumento holdout_id
(uma matriz booleana de dimensões \(G \times T\)) que pode ser usado para especificar uma amostra de validação. Os dados de KPI das observações de validação são ignorados durante o treinamento do modelo (por exemplo, amostragem de distribuição a posteriori de MCMC) e não afetam a probabilidade ou a densidade a posteriori do modelo. Os dados de mídia dessas observações ainda são usados para o treinamento do modelo porque afetam os valores de mídia de Adstock de períodos subsequentes.
O uso principal da amostra de retenção é para calcular a qualidade fora da amostra de métricas de ajuste, como R ao quadrado. Isso é útil para comparar diferentes especificações de modelos, como as vantagens da distribuição a priori, contanto que todos os modelos comparados usem a mesma amostra de validação. Não há garantia de que o modelo com o melhor ajuste fora da amostra seja o melhor para inferência causal, mas, geralmente, um modelo com melhor adequação é preferível. Especificações incorretas do modelo que levam a um ajuste ruim também podem causar viés na inferência causal.
Recomendamos usar uma amostra de validação que seja bastante equilibrada entre as regiões geográficas e os períodos. Em outras palavras, use uma amostra que tenha aproximadamente o mesmo número de observações de validação para cada região e cada período. Amostras desequilibradas podem resultar em observações de treinamento insuficientes para estimar o efeito geográfico\(\tau_g\) de determinadas regiões ou o efeito temporal \(\mu_t\) de certos períodos. Por padrão, o Meridian não especifica uma amostra de validação. Você precisa especificá-la e garantir que ela tenha um grau razoável de equilíbrio.
Evite reter grandes blocos de dados contíguos no tempo, como no fim da janela temporal da MMM, para avaliar o erro de previsão no KPI. O Meridian não foi projetado para prever o KPI, especialmente se ele tiver tendência e sazonalidade fortes. O Meridian estima o impacto da média causal e usa a abordagem baseada em nós para modelar tendências e sazonalidade. Essa abordagem precisa de dados próximos do nó para fazer uma estimativa eficaz.
Se grandes blocos de dados contíguos no tempo forem retidos, não haverá dados próximos dos nós no período de validação. Nesse caso, a distribuição a posteriori do nó será impulsionada pela distribuição a priori, resultando em uma estimativa ruim.
Além disso, o Meridian pode ser usado para estimar o impacto da mídia histórica e futura porque supõe que os parâmetros do modelo que determinam o impacto da mídia são consistentes ao longo do tempo.
Exceto em caso de indicação contrária, o conteúdo desta página é licenciado de acordo com a Licença de atribuição 4.0 do Creative Commons, e as amostras de código são licenciadas de acordo com a Licença Apache 2.0. Para mais detalhes, consulte as políticas do site do Google Developers. Java é uma marca registrada da Oracle e/ou afiliadas.
Última atualização 2025-08-04 UTC.
[null,null,["Última atualização 2025-08-04 UTC."],[[["\u003cp\u003eThe Meridian model's \u003ccode\u003eholdout_id\u003c/code\u003e argument allows you to specify a holdout sample for calculating out-of-sample goodness of fit metrics, like R-squared, to compare different model specifications.\u003c/p\u003e\n"],["\u003cp\u003eWhile media data for holdout observations is used in training, their KPI data is excluded, ensuring the holdout sample doesn't influence model parameters.\u003c/p\u003e\n"],["\u003cp\u003eFor optimal performance, use a balanced holdout sample across geos and time periods to ensure sufficient data for accurate model estimation.\u003c/p\u003e\n"],["\u003cp\u003eAvoid holding out large, continuous time chunks as Meridian focuses on causal impact estimation, not KPI forecasting, and requires data near knots for effective trend and seasonality modeling.\u003c/p\u003e\n"],["\u003cp\u003eMeridian can be used to estimate the impact of both past and future media due to its assumption of consistent media impact parameters over time.\u003c/p\u003e\n"]]],["The `holdout_id` in the Meridian model defines a holdout sample, where KPI data is excluded from model training but media data is still used. This holdout is used to calculate out-of-sample fit metrics. It is recommended the holdout sample be balanced across geos and time periods. Avoid holding out large contiguous time blocks as this can negatively impact the estimation of knots, affecting model forecasting ability. Meridian can estimate the impact of both past and future media.\n"],null,["# Holdout observations (train and test split)\n\nThe Meridian model specification contains a `holdout_id` argument (a\nboolean array of dimensions \\\\(G \\\\times T\\\\)) that can be used to specify a\nholdout sample. The KPI data of the holdout observations is ignored during model\ntraining (for example, MCMC posterior sampling), and does not affect the model\nlikelihood or posterior density. Media data for the holdout observations is\nstill used for model training, because it affects the adstocked media values for\nsubsequent time periods.\n\nThe primary use of the holdout sample is for calculating out-of-sample goodness\nof fit metrics, such as R-squared. This is useful for comparing different model\nspecifications, such as prior distribution strengths, provided that each model\nbeing compared uses the same holdout sample. There is no guarantee that the\nmodel with the best out-of-sample model fit is the best model for causal\ninference, but generally a better fitting model is preferred. Model\nmisspecifications that lead to poor model fit can also cause bias in causal\ninference.\n\nWe recommend using a holdout sample that is fairly balanced across geos and time\nperiods. In other words, use a holdout sample that has approximately the same\nnumber of holdout observations for each geo and approximately the same number of\nholdout observations for each time period. If the holdout sample is imbalanced,\nthis can result in too few training observations to estimate the geo effect\n\\\\(\\\\tau_g\\\\) for certain geos, or the time effect \\\\(\\\\mu_t\\\\) for certain time\nperiods. By default, Meridian does not specify a holdout sample. You\nmust specify the holdout sample and ensure that it has a reasonable degree of\nbalance.\n\nAvoid holding out large, contiguous-in-time, chunks of data, such as at the end\nof the MMM time window, to assess forecast error in the KPI. Meridian\nisn't designed for forecasting the KPI, especially if there is strong trend and\nseasonality in the KPI. Instead, Meridian estimates the causal media\nimpact and uses the knot-based approach to modeling trend and seasonality. The\nknot-based approach needs data near the knot to estimate the knot effectively.\nIf large, contiguous-in-time, chunks of data are held out, there is no data near\nthe knots within the held out period. In this case, the knot's posterior\ndistribution is driven by the prior, which can result in poor forecasting.\n\nAdditionally, Meridian can be used to estimate the impact of both\nhistorical and future media because it assumes that model parameters which\ndetermine media impact are consistent over time."]]