เมื่อรวมรายงานแบบรวมกลุ่ม คุณต้องเพิ่มประสิทธิภาพกลยุทธ์การจัดกลุ่ม เพื่อไม่ให้เกินขีดจำกัดความเป็นส่วนตัว ต่อไปนี้คือกลยุทธ์ที่แนะนํา 2-3 ข้อในการส่งรายงานหลายรายการไปยังบริการรวบรวมข้อมูล
รวบรวมรายงาน
โปรดคำนึงถึงสิ่งต่อไปนี้เมื่อรวบรวมรายงานที่จะรวมไว้ในกลุ่ม
การลองอัปโหลดรายงานอีกครั้ง
หมายเหตุ: เกณฑ์การลองอีกครั้งอาจมีการเปลี่ยนแปลง ข้อมูลในส่วนนี้จะได้รับการอัปเดต ในกรณีนี้
ทั้งบนแพลตฟอร์มเว็บและระบบปฏิบัติการ แพลตฟอร์มจะพยายามส่งรายงาน 3 ครั้ง แต่หากส่งรายงานไม่สำเร็จหลังจากพยายามครั้งที่ 3 ระบบจะไม่ส่งรายงาน ระบบจะเก็บค่า scheduled_report_time
เดิมไว้ไม่ว่าจะส่งรายงานได้เมื่อใดก็ตาม กำหนดการของการลองใหม่จะแตกต่างกันไปในแต่ละแพลตฟอร์ม ดังนี้
- เว็บเบราว์เซอร์จะส่งรายงานเมื่อเบราว์เซอร์ออนไลน์ หากส่งรายงานไม่สำเร็จ ระบบจะรอ 5 นาทีเพื่อลองอีกครั้งที่ 2 และรอ 15 นาทีเพื่อลองครั้งที่ 3 หากเบราว์เซอร์ออฟไลน์อยู่ ระบบจะพยายามอีกครั้งในอีก 1 นาทีหลังจากที่เบราว์เซอร์กลับมาออนไลน์ การส่งรายงานบนเว็บไม่มีการเลื่อนเวลาสูงสุด ซึ่งหมายความว่าหากเบราว์เซอร์ออฟไลน์ ไม่ว่ารายงานจะสร้างขึ้นเมื่อใดก็ตาม เมื่อเบราว์เซอร์กลับมาออนไลน์อีกครั้ง ระบบจะพยายามส่งรายงานตามนโยบายการลองอีกครั้ง
- โทรศัพท์ Android มีการเชื่อมต่อเครือข่ายที่เสถียร ดังนั้น ระบบจะเรียกใช้งานเพื่อส่งรายงาน 1 ครั้งต่อชั่วโมง ซึ่งหมายความว่าหากส่งรายงานไม่สำเร็จ ระบบจะพยายามส่งรายงานอีกครั้งใน 1 ชั่วโมงถัดไป และจะส่งอีกครั้งใน 1 ชั่วโมงหลังจากนั้น หากอุปกรณ์ไม่มีการเชื่อมต่อ อุปกรณ์จะพยายามส่งรายงานอีกครั้งพร้อมกับงานการรายงานถัดไปที่ทำงานหลังจากที่อุปกรณ์เชื่อมต่อกับเครือข่ายอีกครั้ง ความล่าช้าสูงสุดคือ 28 วัน ซึ่งหมายความว่าอุปกรณ์จะไม่ส่งรายงานที่สร้างขึ้นนานกว่า 28 วันที่ผ่านมา
รอรายงาน
ขอแนะนำให้รอรายงานที่ส่งมาล่าช้าเมื่อรวบรวมรายงานสำหรับการจัดกลุ่ม คุณจะทราบรายงานที่ส่งล่าช้าได้โดยตรวจสอบค่า scheduled_report_time
เทียบกับเวลาที่ได้รับรายงาน ความแตกต่างของเวลาระหว่างรายงานเหล่านั้นจะช่วยกําหนดระยะเวลาที่อาจต้องรอรายงานที่มาถึงช้า เช่น เมื่อรวบรวมรายงานที่ล่าช้า ให้ตรวจสอบช่อง scheduled_report_time
และบันทึกเวลาหน่วงเป็นชั่วโมงเมื่อได้รับรายงาน 90%, 95% และ 99% ข้อมูลดังกล่าวสามารถใช้เพื่อกำหนดระยะเวลาที่รอรายงานที่มาถึงช้า
คุณสามารถใช้รายงานสรุปทันทีเพื่อลดโอกาสที่รายงานจะล่าช้า
ภาพต่อไปนี้แสดงรายงานที่มาถึงช้าซึ่งจัดเก็บไว้ในกลุ่มที่เหมาะสมตามเวลารายงานที่กำหนดไว้ กลุ่ม T แสดงถึง scheduled_report_time
และ T+X แสดงถึงเวลาที่รอสำหรับรายงานที่ล่าช้า การดำเนินการนี้จะส่งผลให้มีรายงานสรุปที่มีรายงานส่วนใหญ่รวมอยู่ในกลุ่ม ซึ่งสอดคล้องกับเวลารายงานที่กำหนดไว้
การจัดทำบัญชีรายงานที่รวบรวมได้
บริการรวบรวมข้อมูลจะรักษากฎ"ไม่ซ้ำกัน" กฎนี้บังคับให้รายงานที่รวบรวมข้อมูลได้ทั้งหมดซึ่งมีรหัสที่แชร์เดียวกันต้องรวมอยู่ในกลุ่มเดียวกัน
หลังจากรวบรวมรายงานแล้ว คุณควรจัดกลุ่มรายงานในลักษณะที่รายงานทั้งหมดที่มีรหัสที่แชร์เดียวกันเป็นส่วนหนึ่งของกลุ่มเดียว
หากรายงานได้รับการประมวลผลเป็นกลุ่มอื่นแล้ว การประมวลผลอาจทำให้ข้อผิดพลาดเกี่ยวกับงบประมาณความเป็นส่วนตัวหมดแล้ว การรวมรายงานอย่างถูกต้องจะช่วยป้องกันไม่ให้ระบบปฏิเสธกลุ่มเนื่องจากกฎ "ไม่ซ้ำกัน"
รหัสที่แชร์คือคีย์ที่สร้างขึ้นสำหรับแต่ละรายงานเพื่อติดตามการทำบัญชีรายงานที่รวบรวมได้ รหัสที่แชร์ช่วยให้มั่นใจว่ารายงานที่มีรหัสที่แชร์เดียวกันจะรวมอยู่ในรายงานสรุปเพียงฉบับเดียว ซึ่งหมายความว่ารายงานที่จับคู่กับรหัสที่แชร์รายการเดียวต้องรวมอยู่ในกลุ่มเดียว เช่น หากทั้งรายงาน ก และรายงาน ข มีรหัสที่แชร์เดียวกัน รายงานดังกล่าวต้องรวมอยู่ในชุดเดียวกันเพื่อหลีกเลี่ยงการยกเลิกรายงานเนื่องจากซ้ำกัน
รูปภาพต่อไปนี้แสดงองค์ประกอบ shared_info
ที่แฮชเข้าด้วยกันเพื่อสร้างรหัสที่แชร์
รูปภาพต่อไปนี้แสดงวิธีที่รายงาน 2 ฉบับมีรหัสที่แชร์เดียวกัน
หมายเหตุ: scheduled_report_time
จะถูกตัดให้สั้นลงตามชั่วโมง และ source_registration_time
จะถูกตัดออกตามวัน นอกจากนี้ ระบบจะไม่ใช้ report_id
ในการสร้างรหัสที่แชร์ ความละเอียดของเวลาอาจมีการอัปเดตในอนาคต
รายงานที่ซ้ำกันภายในกลุ่ม
ฟิลด์ shared_info
ในรายงานที่รวบรวมได้จะมี UUID ในฟิลด์ report_id
ซึ่งใช้เพื่อระบุรายงานที่ซ้ำกันภายในกลุ่ม หากมีรายงานมากกว่า 1 รายการที่มี report_id
เดียวกันในกลุ่ม ระบบจะรวมเฉพาะรายงานแรกเท่านั้น และรายงานอื่นๆ จะถือว่าเป็นรายงานที่ซ้ำกันและจะหายไปโดยไม่มีการแจ้งเตือน การรวมจะดำเนินต่อไปตามปกติและจะไม่มีการแสดงข้อผิดพลาด
แม้ว่าจะไม่ใช่สิ่งจําเป็น แต่เทคโนโลยีโฆษณาอาจเห็นประสิทธิภาพเพิ่มขึ้นบ้างจากการกรองรายงานที่ซ้ำกันซึ่งมีรหัสรายงานเดียวกันออกก่อนการรวม
report_id
เป็นข้อมูลที่ไม่ซ้ำกันในแต่ละรายงาน
รายงานที่ซ้ำกันในกลุ่มต่างๆ
รายงานแต่ละฉบับจะได้รับรหัสที่แชร์ ซึ่งเป็นรหัสที่สร้างขึ้นจากจุดข้อมูลที่รวมกันซึ่งมาจากช่อง shared_info
ของรายงาน รายงานหลายรายการอาจมีรหัสที่แชร์เดียวกันได้ และแต่ละกลุ่มอาจมีรหัสที่แชร์ได้หลายรหัส รายงานทั้งหมดที่มีรหัสที่แชร์เดียวกันต้องอยู่ในกลุ่มเดียวกัน หากรายงานที่มีรหัสที่แชร์เดียวกันอยู่ในหลายกลุ่ม ระบบจะยอมรับเฉพาะกลุ่มแรก และปฏิเสธกลุ่มอื่นๆ เนื่องจากซ้ำกัน เพื่อป้องกันปัญหานี้ คุณจะต้องสร้างกลุ่มอย่างเหมาะสม
รูปภาพต่อไปนี้แสดงตัวอย่างที่รายงานที่มีรหัสที่แชร์เดียวกันในหลายกลุ่มอาจทําให้กลุ่มที่ส่งในภายหลังไม่สําเร็จ ในภาพ คุณจะเห็นรายงานตั้งแต่ 2 รายการขึ้นไปที่มีรหัสที่แชร์เดียวกัน
e679aa
จัดกลุ่มเป็นกลุ่มที่ต่างกัน #1 และ #2 เนื่องจากงบประมาณสำหรับรายงานทั้งหมดที่มีรหัสที่แชร์e679aa
ถูกใช้ไปในระหว่างการสร้างรายงานสรุปของกลุ่มที่ 1 ระบบจึงไม่อนุญาตให้สร้างกลุ่มที่ 2 และดำเนินการไม่สำเร็จพร้อมแสดงข้อผิดพลาด
รายงานกลุ่ม
ต่อไปนี้เป็นวิธีแนะนำในการส่งรายงานเป็นกลุ่มเพื่อหลีกเลี่ยงการรายงานที่ซ้ำกันและเพิ่มประสิทธิภาพการรวมข้อมูลรายงาน
กลุ่มตามผู้ลงโฆษณา
หมายเหตุ: กลยุทธ์นี้เหมาะสำหรับการรวบรวมข้อมูลรายงานการระบุแหล่งที่มาเท่านั้น
การรวมข้อมูลส่วนตัวจะไม่มีช่อง attribution_destination
ซึ่งเป็นผู้ลงโฆษณา เราขอแนะนําให้จัดกลุ่มตามผู้ลงโฆษณา ซึ่งหมายความว่าให้รวมรายงานของผู้ลงโฆษณารายเดียวไว้ในกลุ่มเดียวกัน เพื่อไม่ให้บัญชีรายงานที่รวบรวมได้ครบตามขีดจํากัดของแต่ละกลุ่ม ผู้ลงโฆษณาเป็นช่องที่ระบบพิจารณาในการสร้างรหัสที่แชร์ ดังนั้นรายงานที่มีผู้ลงโฆษณารายเดียวกันอาจมีรหัสที่แชร์เดียวกันด้วย ซึ่งจะต้องอยู่ในกลุ่มเดียวกันเพื่อหลีกเลี่ยงข้อผิดพลาด
จัดกลุ่มตามเวลา
ขอแนะนำให้พิจารณาเวลาของรายงานที่มีการกำหนดเวลาของรายงาน
(shared_info.scheduled_report_time
) เมื่อจัดกลุ่ม ระบบจะตัดทอนเวลารายงานตามกำหนดการเป็นชั่วโมงในการสร้างรหัสที่แชร์ ดังนั้น รายงานขั้นต่ำจึงควรได้รับการจัดกลุ่มไว้เป็นช่วงชั่วโมง ซึ่งหมายความว่ารายงานทั้งหมดที่มีเวลารายงานตามกำหนดเวลาภายในชั่วโมงเดียวกันควรรวมอยู่ในชุดเดียวกันเพื่อหลีกเลี่ยงการรายงานที่มีรหัสเดียวกันในหลายๆ กลุ่ม ซึ่งจะนำไปสู่ข้อผิดพลาดของงาน
ความถี่และสัญญาณรบกวนของการทดสอบเป็นกลุ่ม
เราขอแนะนําให้พิจารณาถึงผลกระทบของสัญญาณรบกวนต่อความถี่ในการประมวลผลรายงานที่รวบรวมได้ หากมีการรวมรายงานที่รวบรวมได้เป็นกลุ่มบ่อยขึ้น เช่น ประมวลผลรายงาน 1 ครั้งต่อชั่วโมง ระบบจะรวมเหตุการณ์ Conversion น้อยลงและจะมีสัญญาณรบกวนที่มีผลกระทบมากขึ้น หากความถี่ลดลงและรายงานได้รับการประมวลผลสัปดาห์ละครั้ง สัญญาณรบกวนจะมีผลน้อยลง หากต้องการทําความเข้าใจผลกระทบของสัญญาณรบกวนต่อกลุ่มทดสอบได้ดียิ่งขึ้น ให้ลองใช้ Noise Lab