Memahami derau dalam laporan ringkasan

Pelajari arti derau, tempat ditambahkan, dan pengaruhnya terhadap upaya pengukuran Anda.

Laporan ringkasan adalah hasil dari agregasi laporan agregat. Saat laporan agregat dikelompokkan oleh kolektor dan diproses oleh layanan agregasi, derau—jumlah data acak—akan ditambahkan ke laporan ringkasan yang dihasilkan. Derau ditambahkan untuk melindungi privasi pengguna. Tujuan mekanisme ini adalah untuk memiliki framework yang dapat mendukung pengukuran pribadi diferensial.

Derau ditambahkan di laporan ringkasan akhir.

Pengantar derau dalam laporan ringkasan

Meskipun penambahan derau biasanya bukan bagian dari pengukuran iklan saat ini, dalam banyak kasus derau yang ditambahkan tidak akan mengubah secara substansial cara Anda menafsirkan hasil.

Mungkin ada baiknya untuk memikirkannya dengan cara berikut: Apakah Anda percaya diri untuk mengambil keputusan berdasarkan data tertentu jika data tersebut tidak berisik?

Misalnya, apakah pengiklan akan percaya diri untuk mengubah strategi atau anggaran kampanye mereka, berdasarkan fakta bahwa Kampanye A memiliki 15 konversi dan Kampanye B memiliki 16 konversi?

Jika jawabannya tidak, derau tidak relevan.

Sebaiknya Anda mengonfigurasi penggunaan API sedemikian rupa sehingga:

  1. Jawaban untuk pertanyaan di atas adalah ya.
  2. Kebisingan dikelola dengan cara yang tidak secara signifikan memengaruhi kemampuan Anda untuk membuat keputusan berdasarkan data tertentu. Anda bisa melakukannya dengan cara berikut: untuk jumlah konversi minimum yang diharapkan, sebaiknya pertahankan derau dalam metrik yang dikumpulkan di bawah % tertentu.

Di bagian ini dan selanjutnya, kami akan menguraikan strategi untuk mencapai 2.

Konsep inti

Layanan agregasi menambahkan derau sekali ke setiap nilai ringkasan—yaitu, sekali per kunci—setiap kali laporan ringkasan diminta.

Nilai derau ini diambil secara acak dari distribusi probabilitas tertentu, yang dibahas di bawah.

Semua elemen yang memengaruhi derau bergantung pada dua konsep utama.

  1. Distribusi derau (detail di bawah) sama, terlepas dari nilai ringkasan, rendah atau tinggi. Oleh karena itu, semakin tinggi nilai ringkasan, kemungkinan dampak derau lebih kecil dibandingkan dengan nilai ini.

    Misalnya, asumsikan bahwa total nilai pembelian gabungan sebesar $20.000 dan total nilai pembelian gabungan sebesar $200 tunduk pada derau yang dipilih dari distribusi yang sama.

    Mari asumsikan noise dari distribusi ini bervariasi antara -100 dan +100.

    • Untuk nilai pembelian ringkasan sebesar $20.000, derau bervariasi antara 0 dan 100/20.000=0,5%.
    • Untuk nilai pembelian ringkasan sebesar $200, derau bervariasi antara 0 dan 100/200=50%.

    Oleh karena itu, derau (noise) cenderung memiliki dampak yang lebih rendah pada nilai pembelian gabungan $20.000 daripada nilai $200. Secara relatif, $20.000 cenderung tidak terlalu berisik, yang cenderung memiliki rasio sinyal-ke-noise yang lebih tinggi.

    Nilai gabungan yang lebih tinggi memiliki dampak derau yang relatif lebih rendah.

    Hal ini memiliki beberapa implikasi praktis penting yang akan diuraikan di bagian berikutnya. Mekanisme ini adalah bagian dari desain API, dan implikasi praktisnya bersifat jangka panjang. Model tersebut akan terus berperan penting saat teknologi iklan mendesain dan mengevaluasi berbagai strategi agregasi.

  2. Meskipun derau diambil dari distribusi yang sama terlepas dari nilai ringkasannya, distribusi tersebut bergantung pada beberapa parameter. Salah satu parameter ini, epsilon, dapat diubah oleh teknologi iklan selama akhir uji coba origin untuk mengevaluasi berbagai penyesuaian utilitas/privasi. Namun, pertimbangkan kemampuan untuk mengubah epsilon sebagai sementara. Kami menantikan masukan Anda tentang kasus penggunaan dan nilai-nilai epsilon yang telah berjalan dengan baik.

Meskipun perusahaan teknologi iklan tidak mengontrol langsung cara penambahan derau, hal tersebut dapat memengaruhi dampak derau pada data pengukurannya. Di bagian selanjutnya, kita akan mempelajari bagaimana derau dapat dipengaruhi dalam praktiknya.

Sebelum kita melakukannya, mari kita pelajari lebih lanjut cara derau diterapkan.

Memperbesar: cara derau diterapkan

Distribusi satu derau

Derau diambil dari Distribusi Laplace, dengan parameter berikut:

  • Rata-rata (μ) bernilai 0. Artinya, nilai derau yang paling mungkin adalah 0 (tidak ada derau yang ditambahkan), dan nilai derau cenderung lebih kecil daripada aslinya dibandingkan dengan nilai derau yang lebih besar (hal ini terkadang disebut tidak bias).
  • Parameter skala b = CONTRIBUTION_BUDGET / epsilon.
    • CONTRIBUTION_BUDGET ditentukan di browser.
    • epsilon telah diperbaiki di server agregasi.

Diagram berikut menunjukkan fungsi kepadatan probabilitas untuk distribusi Laplace dengan μ=0, b = 20:

Fungsi kepadatan probabilitas untuk distribusi Laplace dengan μ=0, b = 20

Nilai derau acak, satu distribusi derau

Mari asumsikan bahwa teknologi iklan meminta laporan ringkasan untuk dua kunci agregasi, key1 dan key2.

Layanan agregasi memilih dua nilai derau x1 dan x2, mengikuti distribusi derau yang sama. x1 ditambahkan ke nilai ringkasan untuk key1, dan x2 ditambahkan ke nilai ringkasan untuk key2.

Dalam diagram, kami akan merepresentasikan nilai derau sebagai identik. Ini adalah penyederhanaan; pada kenyataannya, nilai derau akan bervariasi, karena mereka diambil secara acak dari distribusi.

Ini menggambarkan bahwa semua nilai derau berasal dari distribusi yang sama, dan tidak bergantung pada nilai ringkasan yang diterapkan.

Properti derau lainnya

Derau diterapkan ke setiap nilai ringkasan—termasuk yang kosong (0).

Bahkan nilai ringkasan yang kosong pun dapat mengalami derau.

Misalnya, meskipun nilai ringkasan sebenarnya untuk kunci tertentu adalah 0, nilai ringkasan berisik yang akan Anda lihat dalam laporan ringkasan untuk kunci ini (kemungkinan besar) tidak akan menjadi 0.

Kebisingan bisa berupa angka positif atau negatif.

Contoh derau positif dan negatif.

Misalnya, untuk jumlah pembelian pre-noise sebesar 327.000, noise mungkin sebesar +6.000 atau -6.000 (ini adalah nilai contoh arbitrer).

Mengevaluasi derau

Menghitung simpangan baku derau

Simpangan baku derau adalah:

b*sqrt(2) = (CONTRIBUTION_BUDGET / epsilon)*sqrt(2)
Contoh

Dengan epsilon = 10, standar deviasi dari noise adalah:

b*sqrt(2) = (CONTRIBUTION_BUDGET / epsilon)*sqrt(2) = (65,536/10)*sqrt(2) = 9,267

Mengevaluasi kapan perbedaan pengukuran signifikan

Karena Anda akan mengetahui simpangan baku derau yang ditambahkan ke setiap output nilai oleh layanan agregasi, Anda dapat menentukan nilai minimum yang sesuai untuk perbandingan guna menentukan apakah perbedaan yang diamati mungkin disebabkan oleh derau.

Misalnya, jika derau yang ditambahkan ke nilai sekitar +/- 10 (diperhitungkan untuk penskalaan) dan perbedaan nilai antara dua kampanye lebih dari 100, kemungkinan dapat disimpulkan bahwa perbedaan nilai yang diukur di antara setiap kampanye bukan disebabkan oleh derau saja.

Berinteraksi dan berbagi masukan

Anda dapat berpartisipasi dan bereksperimen dengan API ini.

Langkah berikutnya