Informazioni su questo documento
Leggendo questo documento, potrai:
- Scopri quali strategie creare prima di generare report di riepilogo.
- Illustrare Noise Lab, uno strumento che aiuta a comprendere gli effetti di vari parametri di rumore e che permette di esplorare e valutare rapidamente varie strategie di gestione del rumore.
Condividi il tuo feedback
Questo documento riassume alcuni principi su cui lavorare con i report di riepilogo, esistono diversi approcci alla gestione del rumore che potrebbero non qui. I tuoi suggerimenti, le aggiunte e le tue domande sono ben accetti.
- Per fornire un feedback pubblico sulle strategie di gestione del rumore, su all'utilità o alla privacy dell'API (epsilon) e a condividere le tue osservazioni quando di simulazione con Airflow Lab: Commenta questo problema
- Per dare un feedback pubblico su Rumore Lab (fai una domanda, segnala un bug, richiedi una funzionalità): Crea un nuovo numero qui
- Per fornire un feedback pubblico su un altro aspetto dell'API: Crea un nuovo numero qui
Prima di iniziare
- Per un'introduzione, leggi Attribution Reporting: report di riepilogo e Panoramica completa del sistema di Attribution Reporting.
- Per utilizzare al meglio questa guida, scansiona le sezioni Informazioni sul rumore e Informazioni sulle chiavi di aggregazione.
Decisioni di progettazione
Principio di base della progettazione
Esistono differenze fondamentali tra il funzionamento dei cookie di terze parti e dei report di riepilogo. Una differenza fondamentale è rumore aggiunto ai dati di misurazione nei report di riepilogo. Un altro è la pianificazione dei report.
Per accedere ai dati di misurazione dei report di riepilogo con un rapporto segnale-disturbo più elevato i report, le Demand-Side Platform (DSP) e i fornitori di servizi di misurazione degli annunci dovranno Collaboreranno con i propri inserzionisti per sviluppare strategie di gestione del rumore. Per sviluppare queste strategie, le DSP e i fornitori di servizi di misurazione devono prendere decisioni di progettazione. Queste decisioni ruotano intorno a un concetto essenziale:
Anche se i valori del rumore della distribuzione derivano, in definitiva, dipende solo da due parametri ⏤epsilon e dal budget di contributo ⏤ hai a disposizione una serie di altri controlli che avranno un impatto sul rapporto segnale-rumore dei dati di misurazione dell'output.
Anche se ci aspettiamo che un processo iterativo porterà alle decisioni migliori, ogni variante di queste decisioni portano a un'implementazione leggermente diversa, quindi queste decisioni devono essere prese prima di scrivere ogni iterazione di codice (e prima di pubblicare annunci).
Decisione: granularità delle dimensioni
Provalo in rumore di laboratorio
- Vai alla modalità Avanzata.
- Nel riquadro laterale Parametri, cerca I dati sulle conversioni.
- Osserva i parametri predefiniti. Per impostazione predefinita, i TOTAL il numero di conversioni attribuibili è 1000. La media è di circa 40 per se utilizzi la configurazione predefinita (dimensioni predefinite, numero possibili valori diversi per ogni dimensione, Strategia chiave A). Osserva che il valore è 40 nel valore di input Conteggio medio delle conversioni attribuibili PER BUCKET.
- Fai clic su Simula per eseguire una simulazione con i parametri predefiniti.
- Nel riquadro laterale Parametri, cerca Dimensioni. Rinomina Area geografica su Città e modifica il numero di possibili valori diversi in 50.
- Osserva come questo cambia la conversione media giornaliera attribuibile conteggio PER BUCKET. Ora è molto più basso. Questo perché se aumenti il numero di possibili valori all'interno di questa dimensione senza modificare altro, si aumenta il numero totale di bucket senza modificare e quanti eventi di conversione rientrano in ogni bucket.
- Fai clic su Simula.
- Osservare i rapporti di rumore della simulazione risultante: i rapporti di rumore sono superiore a quello della simulazione precedente.
Dato il principio fondamentale di progettazione, è probabile che i valori riepilogativi di piccole dimensioni siano più rumoroso rispetto ai valori di riepilogo più grandi. Di conseguenza, la scelta di configurazione influisce sul numero di eventi di conversione attribuiti che finiscono in ciascun bucket (altrimenti nota come chiave di aggregazione) e la quantità influisce sul rumore nelle report di riepilogo degli output finali.
Una decisione di progettazione che influisce sul numero di eventi di conversione attribuiti in un singolo bucket è la granularità delle dimensioni. Considera i seguenti esempi di chiavi di aggregazione e relative dimensioni:
- Metodo 1: una struttura chiave con dimensioni approssimative: Paese x Campagna pubblicitaria (o la campagna più grande) bucket di aggregazione) x Tipo di prodotto (tra 10 possibili tipi di prodotto)
- Metodo 2: una struttura chiave con dimensioni granulari: Città x ID creatività x Prodotto (su un massimo di 100 prodotti possibili)
Città è una dimensione più granulare di Paese. L'ID creatività è più granulare Campaign. e Product è più granulare di Product type. Pertanto, L'approccio 2 avrà un numero inferiore di eventi (conversioni) per bucket (= per chiave) nella sua relazione di riepilogo rispetto all'approccio 1. Dato che il rumore aggiunto l'output è indipendente dal numero di eventi nel bucket, dai dati di misurazione nei report di riepilogo sarà più rumoroso con l'Approccio 2. Per ogni inserzionista, prova diverse compromessi di granularità nella progettazione della chiave al fine di avere la massima utilità i risultati.
Decisione: strutture chiave
Provalo in rumore di laboratorio
In modalità Semplice viene utilizzata la struttura dei tasti predefinita. Nella sezione Avanzata puoi sperimentare strutture chiave diverse. Alcune dimensioni di esempio sono inclusi; puoi anche modificarle.
- Vai alla modalità Avanzata.
- Nel riquadro laterale Parametri, cerca Strategia chiave. Osservazione la strategia predefinita, denominata A nello strumento, utilizza una chiave granulare struttura che include tutte le dimensioni: Area geografica x ID campagna x Prodotto categoria.
- Fai clic su Simula.
- Osservare i rapporti di rumore della simulazione risultante.
- Cambia la strategia chiave in B. Vengono visualizzati controlli aggiuntivi per configurare la struttura delle chiavi.
- Configura la struttura della chiave, ad esempio come segue:
- Numero di strutture chiave: 2
- Struttura chiave 1 = Area geografica x Categoria di prodotto.
- Struttura della chiave 2 = ID campagna x Categoria di prodotto.
- Fai clic su Simula.
- Osserva che ora ottieni due report di riepilogo per tipo di obiettivo di misurazione (due per il numero di acquisti, due per il valore di acquisto), dato che stai utilizzando due strutture chiave distinte. Osserva i loro rapporti di rumore.
- Puoi anche fare una prova con le tue dimensioni personalizzate. A questo scopo, guarda per i dati che vuoi monitorare: le dimensioni. Valuta la possibilità di rimuovere l'esempio dimensioni personalizzate e di crearne di personalizzate mediante le opzioni Aggiungi/Rimuovi/Reimposta sotto l'ultima dimensione.
Un'altra decisione di progettazione che influirà sul numero di conversioni attribuite all'interno di un singolo bucket strutture principali che deciderai di utilizzare. Considera i seguenti esempi di chiavi di aggregazione:
- Un'unica struttura chiave per tutte le dimensioni; chiamiamo questa strategia chiave A.
- Due strutture chiave, ciascuna con un sottoinsieme di dimensioni: chiamiamolo Strategia chiave B.
La strategia A è più semplice, ma potrebbe essere necessario aggregare (somma) i valori di riepilogo che includono report di riepilogo per accedere a determinati approfondimenti. Sommando questi valori, stai anche sommando il rumore. Con la strategia B, i valori riepilogativi vengono visualizzati nel riepilogo potrebbero già fornirti le informazioni di cui hai bisogno. Ciò significa che la Strategia B porterà probabilmente a un rapporto segnale-disturbo migliore rispetto alla strategia A. Tuttavia, potrebbe essere già accettabile con la Strategia A, quindi puoi sempre decidere di favorire Strategia A per la semplicità. Scopri di più nell'esempio dettagliato che illustra queste due strategie.
La gestione delle chiavi è un argomento complesso. È possibile ricorrere a varie tecniche elaborate per migliorare il rapporto tra indicatori e rumore. Uno è descritto nella sezione Tasto avanzato dei modelli.
Decisione: frequenza di batch
Provalo in rumore di laboratorio
- Vai alla modalità Semplice (o Avanzata): entrambe le modalità funzionano allo stesso modo per quanto riguarda la frequenza di batch).
- Nel riquadro laterale Parametri, cerca La tua strategia di aggregazione > Frequenza di batching. Si riferisce alla frequenza di raggruppamento di aggregazione, elaborati con il servizio di aggregazione in un un singolo job.
- Osserva la frequenza di raggruppamento in batch predefinita: per impostazione predefinita, un raggruppamento in batch giornaliero di frequenza effettiva è simulata.
- Fai clic su Simula.
- Osservare i rapporti di rumore della simulazione risultante.
- Modifica la frequenza dei batch su settimanale.
- Osservare i rapporti di rumore della simulazione risultante: i rapporti di rumore sono inferiore (migliore) rispetto alla simulazione precedente.
Un'altra decisione di progettazione che influirà sul numero di conversioni attribuite in un singolo bucket è la frequenza di raggruppamento che decidi di utilizzare. La La frequenza dei batch è la frequenza con cui elabori i report aggregabili.
Per i report pianificati per l'aggregazione con maggiore frequenza (ad es. ogni ora), hanno meno eventi di conversione inclusi rispetto allo stesso report con una frequenza pianificazione di aggregazione (ad es. ogni settimana). Di conseguenza, il report orario includerà più informazioni.``` hanno meno eventi di conversione inclusi rispetto allo stesso report con una frequenza pianificazione di aggregazione (ad es. ogni settimana). Di conseguenza, il report orario avrà un rapporto indicatori/disturbo inferiore rispetto al report settimanale, a parità di condizioni. Fai esperimenti con i requisiti dei report a varie frequenze e valuta il rapporto segnale-rumore per ognuna.
Scopri di più in Batch e l'aggregazione in periodi di tempo più lunghi.
Decisione: variabili di campagna che influiscono sulle conversioni attribuibili
Provalo in rumore di laboratorio
Anche se questo può essere difficile da prevedere e può avere variazioni significative della oltre agli effetti della stagionalità, prova a stimare il numero di conversioni single-touch attribuibili alla potenza più vicina a 10: 10, 100, 1000, ovvero 10.000.
- Vai alla modalità Avanzata.
- Nel riquadro laterale Parametri, cerca I dati sulle conversioni.
- Osserva i parametri predefiniti. Per impostazione predefinita, i TOTAL il numero di conversioni attribuibili è 1000. La media è di circa 40 per se utilizzi la configurazione predefinita (dimensioni predefinite, numero possibili valori diversi per ogni dimensione, Strategia chiave A). Osserva che il valore è 40 nel valore di input Conteggio medio delle conversioni attribuibili PER BUCKET.
- Fai clic su Simula per eseguire una simulazione con i parametri predefiniti.
- Osservare i rapporti di rumore della simulazione risultante.
- Ora imposta il conteggio giornaliero TOTALE delle conversioni attribuibili su 100. Osserva che questo riduce il valore della media giornaliera attribuibile conteggio delle conversioni PER BUCKET.
- Fai clic su Simula.
- Osserva che ora i rapporti di rumore sono più alti: questo perché quando se hai meno conversioni per bucket, viene applicato più rumore per la manutenzione privacy.
Una distinzione importante è il numero totale di possibili conversioni per un inserzionista rispetto al numero totale di possibili conversioni attribuite. La quest'ultima è ciò che influisce sul rumore nei report di riepilogo. Attribuito le conversioni sono un sottoinsieme delle conversioni totali soggette a come il budget pubblicitario e il targeting dell'annuncio. Ad esempio, ci si aspetterebbe numero di conversioni attribuite in più per una campagna pubblicitaria da 10.000 $rispetto a un annuncio da 10.000 $ campagna, a parità di condizioni.
Tieni presente quanto segue:
- Valutare le conversioni attribuite rispetto a uno stesso dispositivo single-touch del modello di attribuzione, che rientrano nell'ambito dei report di riepilogo raccolte con l'API Attribution Reporting.
- Prendi in considerazione sia il conteggio degli scenari peggiori sia quelli dei migliori casi. per le conversioni attribuite. Ad esempio, a parità di condizioni, consideriamo i budget minimi e massimi possibili per un inserzionista, progetto le conversioni attribuibili a entrambi i risultati come input di simulazione.
- Se stai prendendo in considerazione l'utilizzo Privacy Sandbox di Android considerare le conversioni attribuite multipiattaforma nel calcolo.
Decisione: utilizzare la scalabilità
Provalo in rumore di laboratorio
- Vai alla modalità Avanzata.
- Nel riquadro laterale Parametri, cerca La tua strategia di aggregazione > Scalabilità. L'impostazione predefinita è Sì.
- Per comprendere gli effetti positivi della scalabilità sul rumore , imposta prima Scalabilità su No.
- Fai clic su Simula.
- Osservare i rapporti di rumore della simulazione risultante.
- Imposta Scalabilità su Sì. Tieni presente che rumore di fondo calcola automaticamente i fattori di scalabilità da utilizzare considerati gli intervalli (valori medi e massimi) gli obiettivi di misurazione per il tuo scenario. In un sistema reale o in una prova dell'origine è consigliabile implementare un calcolo personalizzato per i fattori di scalabilità.
- Fai clic su Simula.
- Osserva che i rapporti del rumore sono ora più bassi (migliori) in questo secondo di simulazione. perché utilizzi la scalabilità.
Dato il principio di progettazione di base, il rumore aggiunto è in funzione del budget per il contributo.
Di conseguenza, per aumentare il rapporto segnale-rumore, puoi decidere di trasformare raccolti durante un evento di conversione scalandoli rispetto budget per i contributi (e scalandoli dopo l'aggregazione). Usa la scalabilità per aumentare il rapporto tra segnale e rumore.
Decisione: numero di obiettivi di misurazione e suddivisione del budget per la privacy
Questo riguarda la scalabilità; assicurati di leggere l'articolo Utilizzare e scalabilità.
Provalo in rumore di laboratorio
Un obiettivo di misurazione è un punto dati distinto raccolto negli eventi di conversione.
- Vai alla modalità Avanzata.
- Nel riquadro laterale Parametri, cerca i Dati da monitorare: Obiettivi di misurazione. Per impostazione predefinita, hai due obiettivi di misurazione: acquisto valore e conteggio degli acquisti.
- Fai clic su Simula per eseguire una simulazione con gli obiettivi predefiniti.
- Fai clic su Rimuovi. Verrà rimosso l'ultimo obiettivo di misurazione (acquisto conta in questo caso).
- Fai clic su Simula.
- Osserva che il rapporto di rumore per il valore di acquisto è ora più basso (migliore) per questa seconda simulazione. Questo perché hai meno risorse obiettivi di misurazione, in modo che il tuo unico obiettivo di misurazione ora riceva tutte le budget per i contributi.
- Fai clic su Reimposta. Ora hai ancora due obiettivi di misurazione: l'acquisto valore e conteggio degli acquisti. Tieni presente che Airflow Lab calcola automaticamente i fattori di scalabilità da utilizzare considerati gli intervalli (valori medi e massimi) obiettivi di misurazione più adatti al tuo scenario. Per impostazione predefinita, Traffic Lab divide il budget allo stesso modo per tutti gli obiettivi di misurazione.
- Fai clic su Simula.
- Osservare i rapporti di rumore della simulazione risultante. Prendi nota delle i fattori di scalabilità visualizzati nella simulazione.
- Ora personalizziamo la suddivisione del budget per la privacy per migliorare il rapporto tra segnale e rumore.
- Modificare la % di budget assegnata a ciascun obiettivo di misurazione. Data l'impostazione predefinita parametri, l'obiettivo di misurazione 1, ovvero il valore di acquisto, ha un intervallo più ampio (tra 0 e 1000) rispetto all'obiettivo di misurazione 2, ovvero numero di acquisti (compreso tra 1 e 1, ovvero sempre uguale a 1). A causa di di cui ha bisogno di "più spazio da scalare": sarebbe l'ideale assegnare più il budget per il contributo all'obiettivo di misurazione 1 anziché all'obiettivo di misurazione 2, in modo che può essere fatto lo scale up in modo più efficiente (vedi Scalabilità) e, di conseguenza,
- Assegna il 70% del budget all'obiettivo di misurazione 1. Assegna il 30% alla misurazione obiettivo 2.
- Fai clic su Simula.
- Osservare i rapporti di rumore della simulazione risultante. In vendita valore, le proporzioni del rumore sono ora notevolmente inferiori (migliori) rispetto alla precedente di simulazione. Il numero di acquisti rimane pressoché invariato.
- Continua a modificare la suddivisione del budget tra le varie metriche. Osserva l'impatto il rumore.
Tieni presente che puoi impostare obiettivi di misurazione personalizzati con la Pulsanti Aggiungi/Rimuovi/Reimposta.
Se misuri un punto dati (obiettivo di misurazione) su un evento di conversione, ad esempio conteggio delle conversioni, quel punto dati può ricevere tutto il budget di contributo (65536). Se imposti più obiettivi di misurazione per un evento di conversione, come il conteggio delle conversioni e il valore di acquisto, questi punti dati dovranno condividi il budget per il contributo. Ciò significa che hai meno possibilità di fare lo scale up e i relativi valori.
Di conseguenza, maggiore è il numero di obiettivi di misurazione, minore è il rapporto indicatore-rumore è probabile (rumore più alto).
Un'altra decisione da prendere in merito agli obiettivi di misurazione è la suddivisione del budget. Se suddividi il budget per il contributo equamente tra due punti dati, a ogni punto dati viene assegnato budget di 65536/2 = 32768. Questo potrebbe non essere ottimale in base al massimo possibile per ogni punto dati. Ad esempio, se stai misurando numero di acquisti con un valore massimo di 1 e valore di acquisto con un minimo 1 e massimo 120, il valore di acquisto trarrebbe vantaggio dalla "più spazio" di fare lo scale up, cioè di ricevere una porzione maggiore del budget per i contributi. Vedrai se alcuni obiettivi di misurazione devono avere la priorità in relazione all'impatto del rumore.
Decisione: gestione outlier
Provalo in rumore di laboratorio
Un obiettivo di misurazione è un punto dati distinto raccolto negli eventi di conversione.
- Vai alla modalità Avanzata.
- Nel riquadro laterale Parametri, cerca La tua strategia di aggregazione > Scalabilità.
- Assicurati che Scalabilità sia impostata su Sì. Rumore Lab calcola automaticamente i fattori di scalabilità da utilizzare, in base al (valori medi e massimi) che hai specificato per gli obiettivi di misurazione.
- Supponiamo che l'acquisto più grande mai effettuato sia stato di 2000 €, ma la maggior parte degli acquisti avviene nell'intervallo compreso tra 10 $e 120 $. Vediamo innanzitutto cosa succede se utilizziamo un approccio di scalabilità letterale (non consigliato): inserisci $2000 come il valore massimo di purchaseValue.
- Fai clic su Simula.
- Osserva che i rapporti di rumore sono elevati. Questo perché la nostra scalabilità viene calcolato in base a 2000 $, quando in realtà la maggior parte i valori di acquisto saranno notevolmente inferiori.
- Ora utilizziamo un approccio di scalabilità più pragmatico. Modifica il valore massimo valore di acquisto a 120 $.
- Fai clic su Simula.
- Osserva che i rapporti del rumore sono più bassi (migliori) in questa seconda simulazione.
Per implementare la scalabilità, in genere si calcola un fattore di scala in base a il valore massimo possibile per un determinato evento di conversione Scopri di più in questo esempio.
Tuttavia, evita di utilizzare un valore letterale massimo per calcolare il fattore di scala. perché questo peggiora il rapporto segnale-rumore. Rimuovi invece i valori anomali utilizza un valore massimo pragmatico.
La gestione degli outlier è un argomento complesso. È possibile ricorrere a varie tecniche elaborate per migliorare il rapporto tra indicatori e rumore. Uno è descritto in Gestione avanzata degli outlier.
Passaggi successivi
Ora che hai valutato le varie strategie di gestione del rumore per il tuo caso d'uso, puoi iniziare a sperimentare con i report di riepilogo raccogliendo di misurazione dei dati tramite una prova dell'origine. Consulta le guide e i suggerimenti per provare l'API.
Appendice
Tour rapido di rumore di fondo
Noise Lab ti aiuta rapidamente valutare e confrontare le strategie di gestione del rumore. Utilizzalo per:
- Comprendere i principali parametri che possono influire sul rumore e l'effetto che hanno.
- Simulare l'effetto del rumore sui dati di misurazione dell'output forniti diverse decisioni di progettazione. Modifica i parametri di progettazione fino a raggiungere rapporto segnale-rumore adatto al tuo caso d'uso.
- Condividi il tuo feedback sull'utilità dei report di riepilogo: i valori dei parametri epsilon e rumore funzionano per te, quale no? Dove sono i punti di flesso?
È una fase di preparazione. Laboratorio rumore genera dati di misurazione per simulare gli output dei report di riepilogo in base ai di testo. I dati non vengono conservati né condivisi.
Ci sono due diverse modalità in rumore di laboratorio:
- Modalità semplice: comprendi le nozioni di base dei controlli a tua disposizione in base al rumore.
- Modalità avanzata: testa diverse strategie di gestione del rumore e valuta quale genera il miglior rapporto indicatore-disturbo per i tuoi casi d'uso.
Fai clic sui pulsanti nel menu in alto per passare da uno all'altro (1. nello screenshot seguente).
Modalità semplice
- Con la modalità Semplice, puoi controllare i Parametri (che si trovano sulla o 2. nello screenshot qui sotto), come Epsilon, e guarda come influiscono sul rumore.
- Ogni parametro ha una descrizione comando (un pulsante "?"). Fai clic su questi pulsanti per visualizzare spiegazione di ciascun parametro (n. 3 nello screenshot di seguito)
- Per iniziare, fai clic sul pulsante e osservare l'output come (n. 4 nello screenshot qui sotto)
- Nella sezione Output puoi vedere una serie di dettagli. Alcune accanto agli elementi è presente il carattere "?". Prenditi il tempo per fare clic su ogni "?" per vedere spiegazione delle varie informazioni.
- Nella sezione Output, fai clic sul pulsante di attivazione/disattivazione Dettagli. per visualizzare una versione espansa della tabella (n. 5 nello screenshot seguente).
- Sotto ogni tabella di dati nella sezione di output, è presente un'opzione per scaricare la tabella per l'utilizzo offline. Inoltre, nella parte inferiore nell'angolo in alto a destra c'è un'opzione per scaricare tutte le tabelle di dati (#6. nello screenshot qui sotto).
- Prova diverse impostazioni per i parametri nella sezione Parametri e fai clic su Simula per vedere come influiscono sul risultato:
Modalità avanzata
- Nella modalità Avanzata hai un maggiore controllo sui parametri. Tu puoi aggiungere dimensioni e obiettivi di misurazione personalizzati (n. 1 e n. 2 nello screenshot sotto)
- Scorri più in basso nella sezione Parametri ed esamina la chiave
Opzione della strategia. Può essere utilizzato per testare diverse strutture di chiavi
(3. nello screenshot sotto).
- .
- Per testare diverse strutture chiave, imposta la strategia chiave su "B"
- Inserisci il numero di strutture di chiavi diverse che vuoi utilizzare (il valore predefinito è "2")
- Fai clic su Genera strutture chiave
- Vedrai le opzioni per specificare le strutture della chiave facendo clic su Le caselle di controllo accanto alle chiavi da includere per ogni struttura di chiavi
- Fai clic su Simula per visualizzare l'output. di Gemini Advanced.
Metriche rumore
Concetto principale
Viene aggiunto rumore per proteggere la privacy degli utenti.
Un valore con rumore elevato indica che i bucket/le chiavi sono sparsi e Contengono contributi provenienti da un numero limitato di eventi sensibili. Fatto automaticamente da Speech Lab, per permettere alle persone di "nascondersi tra la folla", o all'interno in altre parole, protegge la sicurezza di queste persone la privacy con una quantità maggiore di rumore aggiuntivo.
Un valore con rumore ridotto indica che la configurazione dei dati è stata progettata in modo tale un modo che già permette ai singoli di "nascondersi tra la folla". Ciò significa che bucket contengono contributi da un numero sufficiente di eventi per garantire la privacy dei singoli utenti è protetta.
Questa affermazione è vera sia per l'errore percentuale medio (APE) e RMSRE_T (errore relativo del quadrato medio con una soglia).
APE (errore percentuale medio)
L'APE è il rapporto tra il rumore e il segnale, ovvero il vero valore riassuntivo.p> Valori APE più bassi indicano un rapporto segnale-disturbo migliori.
Formula
Per un determinato report di riepilogo, l'APE viene calcolata come segue:
True è il vero valore di riepilogo. APE è la media del rumore su ogni valore di riepilogo vero, calcolato sulla media di tutte le voci di un report di riepilogo. In Rumore Lab, questo valore viene poi moltiplicato per 100 per ottenere una percentuale.
Pro e contro
I bucket con dimensioni più piccole hanno un impatto sproporzionato sul valore finale delle APE. Questo potrebbe essere fuorviante nella valutazione del rumore. Questo è il motivo per cui abbiamo aggiunto un'altra metrica, RMSRE_T, progettata per mitigare questa limitazione di APE. Esamina gli esempi per i dettagli.
Codice
Esamina il codice sorgente. per il calcolo dell'APE.
RMSRE_T (errore relativo del quadrato medio della radice con una soglia)
L'RMSRE_T (errore relativo del quadrato medio della radice con una soglia) è un'altra misura del rumore.
Come interpretare RMSRE_T
Valori RMSRE_T più bassi indicano un rapporto segnale-rumore migliori.
Ad esempio, se un rapporto del rumore accettabile per il tuo caso d'uso è del 20% e l'RMSRE_T è 0,2, puoi avere la certezza che i livelli di rumore rientrino nell'intervallo accettabile.
Formula
Per un determinato report di riepilogo, l'RMSRE_T viene calcolato come segue:
Pro e contro
L'errore RMSRE_T è un po' più complesso da comprendere rispetto a APE. Tuttavia, presenta alcuni vantaggi che lo rendono in alcuni casi più adatto di APE per l'analisi del rumore nei report di riepilogo:
- RMSRE_T è più stabile. "T" è una soglia. "T" viene utilizzato per assegnare meno peso nel calcolo RMSRE_T ai bucket che hanno meno conversioni e sono quindi più sensibili al rumore a causa delle loro dimensioni ridotte. Con il valore T, la metrica non aumenta nei bucket con poche conversioni. Se T è uguale a 5, un valore del rumore inferiore a 1 in un bucket con 0 conversioni non verrà visualizzato come superiore a 1. Sarà invece limitato a 0, 2, che equivale a 1/5, poiché T è pari a 5. Assegnando meno peso ai bucket più piccoli che sono quindi più sensibili al rumore, questa metrica è più stabile e, di conseguenza, semplifica il confronto di due simulazioni.
- RMSRE_T consente una facile aggregazione. Conoscere l'RMSRE_T di più bucket, insieme ai conteggi veri, ti consente di calcolare l'RMSRE_T della somma. Questo ti consente anche di ottimizzare l'RMSRE_T per questi valori combinati.
Sebbene l'aggregazione sia possibile per APE, la formula è piuttosto complicata in quanto coinvolge il valore assoluto della somma dei rumori di Laplace. Questo rende APE più difficile da ottimizzare.
Codice
Esamina il codice sorgente per il calcolo del RMSRE_T.
Esempi
Report di riepilogo con tre bucket:
- bucket_1 = rumore: 10, trueSummaryValue: 100
- bucket_2 = rumore: 20, trueSummaryValue: 100
- bucket_3 = rumore: 20, trueSummaryValore: 200
APE = (0,1 + 0,2 + 0,1) / 3 = 13%
RMSRE_T = sqrt( ( (10/max(5,100))^2 + (20/max(5,100))^2 + (20/max(5,200))^2) / 3) = sqrt( (0.01 + 0.04 + 0.01) / 3) = 0.14
Report di riepilogo con tre bucket:
- bucket_1 = rumore: 10, trueSummaryValue: 100
- bucket_2 = rumore: 20, trueSummaryValue: 100
- bucket_3 = rumore: 20, trueSummaryValue: 20
APE = (0,1 + 0,2 + 1) / 3 = 43%
RMSRE_T = sqrt( ( (10/max(5,100))^2 + (20/max(5,100))^2 + (20/max(5,20))^2) / 3) = sqrt( (0.01 + 0.04 + 1.0) / 3) = 0.59
Report di riepilogo con tre bucket:
- bucket_1 = rumore: 10, trueSummaryValue: 100
- bucket_2 = rumore: 20, trueSummaryValue: 100
- bucket_3 = rumore: 20, trueSummaryValue: 0
APE = (0,1 + 0,2 + infinito) / 3 = infinito
RMSRE_T = sqrt( ( (10/max(5,100))^2 + (20/max(5,100))^2 + (20/max(5,0))^2) / 3) = sqrt( (0.01 + 0.04 + 16.0) / 3) = 2.31
Gestione avanzata delle chiavi
Una società di misurazione degli annunci o DSP potrebbe avere migliaia di siti clienti in più settori, valute e prezzi di acquisto potenziali. Ciò significa che la creazione e la gestione di una sola chiave di aggregazione l'inserzionista sarà probabilmente molto impraticabile. Inoltre, difficile selezionare un valore massimo aggregabile e un budget di aggregazione che possa limitare l'impatto del rumore in queste migliaia di inserzionisti globali. Invece, prendiamo in considerazione i seguenti scenari:
Strategia chiave A
Il fornitore di ad tech decide di creare e gestire una chiave in tutti i suoi clienti pubblicitari. Per tutti gli inserzionisti e in tutte le valute, l'intervallo di gli acquisti variano da basso volume, acquisti di fascia alta a volume elevato, acquisti di fascia bassa acquisti. Ciò si traduce nella seguente chiave:
Chiave (più valute) | |
---|---|
Valore massimo aggregabile | 5.000.000 |
Intervallo di valori di acquisto | [120 - 5000000] |
Strategia chiave B
Il fornitore di ad tech decide di creare e gestire due chiavi in tutti i suoi clienti pubblicitari. Decide di separare le chiavi in base alla valuta. In tutti inserzionisti e in tutte le valute, la gamma di acquisti varia a causa di un volume ridotto, dagli acquisti di fascia alta agli acquisti di fascia alta e di fascia bassa. La separazione per valuta vengono create due chiavi:
Chiave 1 ($) | Chiave 2 (¥) | |
---|---|---|
Valore massimo aggregabile | $ 40.000 | 5.000.000 ¥ |
Intervallo di valori di acquisto | [120-40.000] | [15.000-5.000.000] |
La strategia chiave B avrà un risultato inferiore rispetto alla strategia A, perché i valori delle valute non sono distribuiti uniformemente tra le valute. Ad esempio: considerare come gli acquisti denominati in ¥ si mescolano agli acquisti denominati in USD modificherà i dati sottostanti e il conseguente output rumoroso.
Strategia chiave C
Il fornitore di ad tech decide di creare e gestire quattro chiavi in tutti per i propri clienti pubblicitari e di separarli per Valuta x Inserzionista settore:
Chiave 1 (€ x inserzionisti di gioielli di fascia alta) |
Chiave 2 (¥ x inserzionisti di gioielli di fascia alta) |
Chiave 3 ($ x inserzionisti di rivenditori di abbigliamento) |
Chiave 4 (¥ x inserzionisti di rivenditori di abbigliamento) |
|
---|---|---|---|---|
Valore massimo aggregabile | $ 40.000 | 5.000.000 ¥ | 500 $ | 65.000 ¥ |
Intervallo di valori di acquisto | [10.000-40.000] | [1.250.000-5.000.000] | [120 - 500] | [15.000-65.000] |
La strategia chiave C avrà un risultato minore rispetto a quella B perché i valori di acquisto degli inserzionisti non sono distribuiti uniformemente tra gli inserzionisti. Per Ad esempio, considera come gli acquisti di gioielli di fascia alta si mescolano agli acquisti per cappelli da baseball altera i dati sottostanti e il conseguente output rumoroso.
Valuta la possibilità di creare valori aggregati massimi condivisi e fattori di scalabilità condivisi per trovare punti in comune tra più inserzionisti al fine di ridurre il rumore nel come output. Ad esempio, potresti sperimentare diverse strategie di seguito i tuoi inserzionisti:
- Una strategia separata per valuta (USD, ¥, CAD e così via)
- Una strategia distinta per settore dell'inserzionista (assicurazioni, automobili, vendita al dettaglio e così via)
- Una strategia separata da intervalli di valori di acquisto simili ([100], [1000], [10000] e così via).
Creando strategie chiave sui punti in comune con gli inserzionisti, le chiavi e il sono più facili da gestire e il rapporto segnale-disturbo diventano in alto. Sperimenta strategie diverse con inserzionisti diversi punti in comune per scoprire i punti di flesso nella massimizzazione dell'impatto del rumore rispetto al codice gestione dei dispositivi.
Gestione avanzata degli outlier
Prendiamo in considerazione uno scenario che coinvolge due inserzionisti:
- Inserzionista A:
- In tutti i prodotti sul sito dell'inserzionista A, il prezzo di acquisto le possibilità sono comprese tra [€120 - €1,000] , per un intervallo di €880.
- I prezzi di acquisto sono distribuiti uniformemente tra gli 880 $ senza outlier al di fuori di due deviazioni standard dal prezzo medio di acquisto.
- Inserzionista B:
- In tutti i prodotti sul sito dell'Inserzionista B, il prezzo di acquisto le possibilità sono comprese tra [€120 - €1,000] , per un intervallo di €880.
- I prezzi di acquisto si discostano fortemente da un intervallo di 120-500 $ con solo il 5% degli acquisti che avvengono nella fascia $500- $1,000.
Dato il requisiti del budget per i contributi e la metodologia con cui viene applicato il rumore ai risultati finali, l'Inserzionista B avrà, per impostazione predefinita, un output più rumoroso rispetto L'inserzionista A, in quanto l'inserzionista B ha un potenziale maggiore per quanto riguarda i valori anomali, i calcoli sottostanti.
È possibile mitigare questo problema con una configurazione della chiave specifica. Testare le strategie chiave che aiutano a gestire i dati outlier e a distribuire più uniformemente i valori di acquisto nell'intervallo di acquisto della chiave.
Per l'inserzionista B, potresti creare due chiavi separate per acquisire due diversi intervalli di valori di acquisto. In questo esempio, la tecnologia pubblicitaria ha notato che i valori anomali sono visualizzati sopra il valore di acquisto di 500 $. Prova a implementare due chiavi separate per Questo inserzionista:
- Struttura chiave 1 : chiave che acquisisce solo gli acquisti tra compresa tra 120 $e 500 $ (coprendo circa il 95% del volume totale di acquisto).
- Struttura chiave 2: chiave che acquisisce solo acquisti superiori a 500 $ (coprendo circa il 5% del volume totale di acquisti).
L'implementazione di questa strategia chiave dovrebbe gestire meglio il rumore per l'Inserzionista B e massimizza l'utilità dei report di riepilogo. Considerato il nuovo formato di intervalli, la chiave A e la chiave B ora dovrebbero avere una distribuzione più uniforme dei dati su ogni rispettiva chiave che per la chiave singola precedente. Ciò comporterà un minore impatto del rumore nell'output di ogni chiave rispetto a quello della precedente singola chiave.