التعرّف على التشويش في التقارير التلخيصية

تعرَّف على معنى التشويش وأماكن إضافته وكيفية تأثيره على جهود القياس.

تنتج التقارير التلخيصية عن تجميع التقارير القابلة للتجميع. عندما يتم تجميع التقارير القابلة للتجميع بواسطة جامع ومعالجتها بواسطة خدمة التجميع، تتم إضافة التشويش - وهو مقدار عشوائي من البيانات - إلى التقارير الموجزة الناتجة. تتم إضافة التشويش لحماية خصوصية المستخدم. والهدف من هذه الآلية هو وضع إطار عمل يتيح القياس الخاص التفاضلي.

تتم إضافة التشويش في تقرير الملخص النهائي.

مقدّمة عن التشويش في تقارير الملخّص

على الرغم من أنّ تفاوت الأداء لا يُعد عادةً جزءًا من قياس أداء الإعلانات في الوقت الحالي، فإنّه في كثير من الحالات لن يؤدي تفاوت الأداء إلى تغيير كبير في طريقة تفسيرك للنتائج.

قد يكون من المفيد التفكير في الأمر بالطريقة التالية: هل ستكون واثقًا من اتخاذ قرار بناءً على جزء معين من البيانات إذا لم تكن هذه البيانات مزعجة؟

على سبيل المثال، هل سيكون المعلن واثقًا من تغيير استراتيجية حملته أو ميزانياته استنادًا إلى حقيقة أن الحملة (أ) سجّلت 15 إحالة ناجحة والحملة (ب) سجّلت 16 إحالة ناجحة؟

إذا كانت الإجابة لا، فإن الضوضاء غير ذات صلة.

عليك إعداد استخدام واجهة برمجة التطبيقات بالطريقة التالية:

  1. الإجابة عن السؤال أعلاه هي نعم.
  2. تتم إدارة الضوضاء بطريقة لا تؤثر بشكل كبير في قدرتك على اتخاذ قرار استنادًا إلى بيانات معينة. يمكنك التعامل مع هذا الأمر على النحو التالي: بالنسبة إلى الحد الأدنى المتوقع لعدد الإحالات الناجحة، يجب إبقاء مستوى التشويش في المقياس الذي تم جمعه أقل من نسبة معيّنة.

في هذا القسم وما يلي، سنوضّح الإستراتيجيات التي تهدف إلى تحقيق اثنين.

المفاهيم الأساسية

تضيف خدمة التجميع تشويشًا مرة واحدة إلى كل قيمة ملخّصة، أي مرة واحدة لكل مفتاح، في كل مرة يتم فيها طلب تقرير ملخص.

يتم سحب قيم التشويش هذه عشوائيًا من توزيع احتمالية معيّنة، كما هو موضَّح أدناه.

تعتمد جميع العناصر التي تؤثر على الضوضاء على مفهومين أساسيين.

  1. يختلف توزيع التشويش (التفاصيل أدناه) بغض النظر عن قيمة الملخّص، سواء كانت منخفضة أو مرتفعة. وبالتالي، كلما ارتفعت قيمة الملخّص، انخفض التأثير المحتمل للتشويش بالنسبة إلى هذه القيمة.

    على سبيل المثال، لنفترض أنّ إجمالي قيمة الشراء المجمَّعة التي تبلغ 20,000 دولار أمريكي وإجمالي قيمة الشراء المجمّعة البالغ 200 دولار أمريكي يخضعان لتفاوتات ناتجة عن التوزيع نفسه.

    لنفترض أن التشويش الناتج عن هذا التوزيع يتراوح تقريبًا بين -100 و+100.

    • بالنسبة إلى ملخّص قيمة الشراء الذي تبلغ قيمته 20,000 دولار أمريكي (أو ما يعادله بالعملة المحلية)، تتراوح نسبة التشويش بين 0 و100/20,000=0.5%.
    • بالنسبة إلى ملخّص قيمة الشراء الذي تبلغ قيمته 200 دولار أمريكي، تتفاوت نسبة التشويش بين 0 و100/200=50%.

    لذلك، من المرجّح أن يكون للتشويش تأثير أقل في قيمة الشراء المجمّعة التي تبلغ 20,000 دولار أمريكي (أو ما يعادله بالعملة المحلية) مقارنةً بقيمة 200 دولار أمريكي (أو ما يعادله بالعملة المحلية). نسبيًا، من المرجَّح أن يكون مبلغ 20,000 دولار أمريكي أقل ضجيجًا، ومن المرجّح أن تكون نسبة الإشارة إلى الضوضاء أعلى.

    ويكون للقيم المجمّعة الأعلى تأثير تشويش أقل نسبيًا.

    هذا له بعض الآثار العملية المهمة التي تم توضيحها في القسم التالي. تعتبر هذه الآلية جزءًا من تصميم واجهة برمجة التطبيقات، والآثار العملية طويلة المدى. ستستمرّ هذه الإعلانات في أداء دور مهم عندما تصمِّم تكنولوجيا الإعلان استراتيجيات مختلفة لتجميع البيانات وتقيِّمها.

  2. وعلى الرغم من الحصول على التشويش من التوزيع نفسه بغض النظر عن قيمة الملخّص، يعتمد هذا التوزيع على عدة معلَمات. يمكن تغيير إحدى هذه المَعلمات، epsilon، بواسطة تقنيات الإعلان أثناء مرحلة التجربة والتقييم النهائية لتقييم عدة تعديلات على المرافق أو الخصوصية. ومع ذلك، يمكنك مراعاة إمكانية تعديل إبسيلون بشكل مؤقت. نرحب بملاحظاتك حول حالات الاستخدام وقيم إبسيلون التي تعمل بشكل جيد.

على الرغم من أن شركة تكنولوجيا الإعلان لا تتحكم مباشرةً في طرق إضافة التشويش، يمكن أن تؤثر في تأثير التشويش على بيانات القياس. في الأقسام التالية، سنتناول كيفية تأثّر الضوضاء عمليًا.

قبل أن نناقش طريقة تطبيق التشويش.

التكبير: كيفية تطبيق التشويش

توزيع ضوضاء واحد

يتم الحصول على التشويش من توزيع لابلاس، باستخدام المَعلمات التالية:

  • المتوسط (μ) من 0. وهذا يعني أن قيمة التشويش المرجّح هي 0 (بدون إضافة تشويش)، وأن تكون القيمة الصاخبة أصغر من القيمة الأصلية بقدر ما تكون أكبر (يُسمى ذلك أحيانًا غير متحيز).
  • مَعلمة المقياس b = CONTRIBUTION_BUDGET / epsilon
    • يتم تحديد CONTRIBUTION_BUDGET في المتصفح.
    • تم إصلاح epsilon في خادم التجميع.

يوضّح المخطّط التالي دالة الكثافة الاحتمالية لتوزيع لابلاس بـ ميكرو=0، b = 20:

دالة كثافة الاحتمالية لتوزيع لابلاس بـ ميكرو=0، b = 20

قيم الضوضاء العشوائية، توزيع واحد للضوضاء

لنفترض أنّ إحدى تقنيات الإعلان تطلب تقارير موجزة عن مفتاحَي تجميع، المفتاح 1 والمفتاح 2.

تختار خدمة التجميع قيمتين للتشويش x1 وx2، مع اتّباع توزيع التشويش نفسه. تتم إضافة س1 إلى القيمة التلخيصية للمفتاح 1، وتتم إضافة س2 إلى قيمة الملخص للمفتاح 2.

سنمثل قيم التشويش في الرسوم البيانية متطابقة. هذا تبسيط؛ ففي الواقع، ستختلف قيم الضوضاء، حيث يتم رسمها عشوائيًا من التوزيع.

ويوضّح هذا أنّ قيم التشويش جميعها تأتي من التوزيع نفسه، وهي مستقلة عن قيمة الملخّص التي يتم تطبيقها عليها.

الخصائص الأخرى للضوضاء

يتم تطبيق التشويش على كل قيمة ملخّص، بما في ذلك القيم الفارغة (0).

حتى قيم الملخّص الفارغة قد تخضع للتشويش.

على سبيل المثال، حتى إذا كانت قيمة الملخص الحقيقية لمفتاح معين هي 0، فإن قيمة الملخص الصاخبة التي ستراها في تقرير الملخص لهذا المفتاح لن تكون (على الأرجح) 0.

يمكن أن يكون الضوضاء رقمًا موجبًا أو سالبًا.

أمثلة على الضوضاء الإيجابية والسلبية.

على سبيل المثال، بالنسبة إلى مبلغ الشراء قبل الضوضاء الذي يبلغ 327,000، قد يكون التشويش أكثر من 6,000 أو -6,000 (هذه أمثلة على القيم العشوائية).

تقييم التشويش

حساب الانحراف المعياري للضوضاء

الانحراف المعياري للضوضاء هو:

b*sqrt(2) = (CONTRIBUTION_BUDGET / epsilon)*sqrt(2)
مثال

عندما يكون إبسيلون = 10، يكون الانحراف المعياري للضوضاء هو:

b*sqrt(2) = (CONTRIBUTION_BUDGET / epsilon)*sqrt(2) = (65,536/10)*sqrt(2) = 9,267

التقييم عندما تكون الاختلافات في القياس كبيرة

ونظرًا لأنك ستعرف الانحراف المعياري للتشويش المضافة إلى كل ناتج قيمة من خلال خدمة التجميع، يمكنك تحديد حدود مناسبة للمقارنة لتحديد ما إذا كانت الاختلافات المرصودة قد تكون ناتجة عن التشويش أم لا.

على سبيل المثال، إذا كان التشويش المُضاف إلى قيمة 10 +/- 10 تقريبًا (مع أخذ القياس في الاعتبار) وكان الفرق في القيمة بين حملتَين أكبر من 100، من المرجّح أن نستنتج أنّ الفرق في القيمة المقيسة بين كل حملة لا يرجع إلى التشويش وحده.

互动和分享反馈

您可以参与试用并试用此 API

الخطوات التالية