Tổng quan về Topics API cho Web

Topics API cho phép quảng cáo dựa trên mối quan tâm (IBA) mà không cần phải dùng đến cách theo dõi các trang web mà người dùng truy cập.

Trạng thái triển khai

Topics API là gì?

Topics API là một cơ chế Hộp cát về quyền riêng tư được thiết kế để bảo vệ quyền riêng tư trong khi cho phép trình duyệt chia sẻ thông tin về mối quan tâm của người dùng với bên thứ ba. Tính năng này cho phép quảng cáo dựa trên mối quan tâm (IBA) mà không cần phải dùng đến cách theo dõi các trang web mà người dùng truy cập.

Quảng cáo dựa trên mối quan tâm là một khái niệm chính trong Topics API. Đây là một dạng quảng cáo được cá nhân hoá, trong đó hệ thống chọn quảng cáo cho người dùng dựa trên mối quan tâm của họ, suy ra từ những trang web mà họ truy cập gần đây. Quảng cáo này khác với quảng cáo theo bối cảnh, nhằm mục đích so khớp quảng cáo với nội dung trên trang mà người dùng đang truy cập.

Quảng cáo dựa trên sở thích có thể giúp cả nhà quảng cáo (trang web muốn quảng cáo các sản phẩm hoặc dịch vụ của họ) và nhà xuất bản (trang web sử dụng quảng cáo để giúp kiếm tiền từ nội dung của họ):

  • IBA có thể giúp nhà quảng cáo tiếp cận khách hàng tiềm năng.
  • IBA có thể bổ sung thông tin theo ngữ cảnh để giúp nhà xuất bản sử dụng quảng cáo để tài trợ cho các trang web.

Topics API cung cấp một dạng quảng cáo mới dựa trên mối quan tâm bằng cách sử dụng các chủ đề (danh mục mối quan tâm) được chỉ định cho trình duyệt dựa trên hoạt động gần đây của người dùng. Những chủ đề này có thể bổ sung thông tin theo bối cảnh để giúp chọn quảng cáo phù hợp.

Cách hoạt động

Trước đây, cookie của bên thứ ba và các cơ chế khác đã được dùng để theo dõi hành vi duyệt web của người dùng trên các trang web nhằm suy ra những chủ đề họ quan tâm. Những cơ chế này sẽ bị loại bỏ dần.

Với Topics API, trình duyệt quan sát và ghi lại các chủ đề có vẻ đang được người dùng quan tâm, dựa trên hoạt động duyệt web của họ. Thông tin này được ghi lại trên thiết bị của người dùng. Sau đó, Topics API có thể cấp cho phương thức gọi API (chẳng hạn như các nền tảng công nghệ quảng cáo) quyền truy cập vào những chủ đề người dùng quan tâm mà không tiết lộ thêm thông tin về hoạt động duyệt web của người dùng.

Quan sát các chủ đề của đối tượng cấp trên

Kể từ Chrome 114, khi một phương thức gọi quan sát một chủ đề của người dùng trên một trang, trình duyệt cũng coi phương thức gọi đó là đã quan sát thấy toàn bộ đối tượng cấp trên của chủ đề đó.

Ví dụ: nếu trình duyệt ghi lại thấy một phương thức gọi theo dõi Shopping/Apparel/Footwear/Boots cho người dùng, thì đối tượng cấp trên của chủ đề đó cũng được coi là đã được quan sát: Shopping/Apparel/Footwear, Shopping/ApparelShopping.

Trước đây, để trình duyệt xem một phương thức gọi là đã quan sát thấy (ví dụ) Shopping/Apparel, thì API cụ thể đó phải được API trả về dưới dạng chủ đề được quan sát. Điều này có nghĩa là nếu hệ thống quan sát thấy Shopping/Apparel đối với phương thức gọi cho người dùng trên một trang và Shopping/Apparel/Footwear/Boots trên một trang khác, thì API sẽ coi Shopping/Apparel là đã được quan sát thấy trên cả hai trang.

Các thời kỳ

Tất nhiên, Topics API phải đảm bảo những chủ đề được quan tâm mà API này cung cấp luôn mới nhất. Trình duyệt dự đoán chủ đề cho người dùng dựa trên hoạt động duyệt web của họ trong một khoảng thời gian gọi là thời gian bắt đầu của hệ thống (hiện là một tuần). Mỗi người dùng có một khoảng thời gian bắt đầu của riêng họ (thời gian bắt đầu của hệ thống là "trên mỗi người dùng") và thời gian bắt đầu ban đầu được chọn ngẫu nhiên. Chủ đề được chọn cho mỗi thời gian bắt đầu của hệ thống được chọn ngẫu nhiên trong 5 chủ đề hàng đầu của người dùng trong khoảng thời gian đó. Để tăng cường hơn nữa quyền riêng tư và đảm bảo rằng tất cả các chủ đề đều có thể được trình bày, có 5% cơ hội chủ đề được chọn ngẫu nhiên từ tất cả các chủ đề có thể có trong hệ thống phân loại mối quan tâm.

Topics API có 3 nhiệm vụ chính:

  • Ánh xạ hoạt động của trình duyệt với các chủ đề quan tâm. Với thiết kế hiện tại của Topics API, chủ đề được suy ra từ tên máy chủ của các trang mà người dùng truy cập. Ví dụ: chủ đề được suy luận cho một trang web về bể cá có thể là /Thú cưng & Động vật/Thú cưng/Cá & Thuỷ cung.
  • Tính toán các chủ đề hàng đầu cho người dùng dựa trên hoạt động duyệt web gần đây của họ.
  • Cung cấp cơ chế để truy cập vào những chủ đề mà người dùng đang quan tâm để giúp chọn quảng cáo phù hợp.

Topics API cung cấp các chủ đề dễ đọc và dễ hiểu đối với con người để có thể cung cấp các chế độ kiểm soát hữu ích cho người dùng.

Cách hệ thống tuyển chọn và lựa chọn chủ đề

Các chủ đề được chọn từ một hệ thống phân loại bao gồm các danh mục phân cấp như /Nghệ thuật & Giải trí/Âm nhạc & Âm thanh/soul & R&B/Business & Công nghiệp/Nông nghiệp & Lâm nghiệp. Các chủ đề này được Chrome tuyển chọn cho mục đích thử nghiệm ban đầu, nhưng với mục tiêu là hệ thống phân loại trở thành tài nguyên do những người đóng góp đáng tin cậy cho hệ sinh thái duy trì. Cách phân loại cần phải đủ nhỏ để nhiều người dùng trình duyệt sẽ được liên kết với từng chủ đề. Hiện tại số lượng chủ đề là 469, nhưng chúng tôi dự kiến số lượng chủ đề cuối cùng sẽ nằm trong khoảng từ vài trăm đến vài nghìn.

Để tránh các danh mục nhạy cảm, chủ đề phải được công khai, do con người tuyển chọn và luôn phải mới nhất. Cách phân loại ban đầu mà Chrome đề xuất để thử nghiệm đã được con người tuyển chọn để loại trừ những danh mục thường được coi là nhạy cảm, chẳng hạn như sắc tộc hoặc khuynh hướng tính dục.

Đối với 50.000 trang web hàng đầu, hoạt động triển khai Topics API trong Chrome sẽ sử dụng một danh sách ghi đè được tuyển chọn theo cách thủ công và có thể sử dụng công khai để liên kết tên máy chủ với chủ đề. Đối với các trang web khác, Topics API sử dụng mô hình học máy để suy ra chủ đề từ tên máy chủ.

Khi Chrome triển khai Topics API, Chrome sẽ tải một tệp TensorFlow Lite xuống đại diện cho mô hình này để có thể dùng trên thiết bị của người dùng.

Bạn có thể truy cập vào tệp mô hình TensorFlow Lite và các chủ đề được dự đoán cho tên máy chủ từ chrome://topics-internals.

Sơ đồ sau đây là một ví dụ đơn giản minh hoạ cách Topics API có thể giúp nền tảng công nghệ quảng cáo chọn một quảng cáo phù hợp. Ví dụ này giả định rằng trình duyệt của người dùng đã có một mô hình để ánh xạ tên máy chủ của trang web với chủ đề.

Sơ đồ cho thấy các giai đoạn trong vòng đời của Topics API, từ một người dùng truy cập vào trang web cho đến khi hiển thị một quảng cáo.
Sơ đồ vòng đời của Topics API trình bày các giai đoạn của thao tác đối với API dưới góc nhìn tổng quan.

Phương thức gọi API chỉ nhận được các chủ đề mà chúng quan sát thấy

Mục tiêu thiết kế của Topics API là bật quảng cáo dựa trên mối quan tâm mà không cần chia sẻ thông tin với nhiều thực thể hơn mức hiện có thể thực hiện với cookie của bên thứ ba. Topics API được thiết kế để chỉ có thể trả về chủ đề cho những phương thức gọi API đã quan sát thấy chủ đề đó trong một khung thời gian giới hạn. Một phương thức gọi API được cho là đã quan sát thấy một chủ đề cho người dùng nếu phương thức này gọi phương thức document.browsingTopics() trong mã có trên một trang web mà Topics API đã liên kết với chủ đề đó.

API này chỉ trả về các chủ đề mà phương thức gọi đã quan sát thấy trong 3 khoảng thời gian bắt đầu gần đây nhất. Điều này giúp ngăn chặn việc chia sẻ thông tin về người dùng với nhiều thực thể hơn so với các công nghệ mà API đang thay thế (bao gồm cả cookie của bên thứ ba).

Số lượng chủ đề được trả về tuỳ thuộc vào số lượng chủ đề mà phương thức gọi API đã ghi nhận trước đó và số lượng chủ đề mà người dùng có sẵn (chẳng hạn như số tuần dữ liệu tích luỹ). Hệ thống có thể trả về bất kỳ chủ đề nào từ 0 đến 3 chủ đề, vì mỗi khoảng thời gian bắt đầu của hệ thống gần đây có thể chỉ định một chủ đề cho mỗi khoảng thời gian.

Để biết thêm thông tin về cách sử dụng và kiểm thử Topics API, hãy tham khảo Hướng dẫn cho nhà phát triển Topics API.

Cách API giảm tạo vân tay số

Topics API cung cấp nhiều cơ chế để giúp đảm bảo rằng rất khó để xác định lại số lượng người dùng đáng kể trên những trang web chỉ sử dụng Topics API:

  • Vì cách phân loại Chủ đề cung cấp các chủ đề tương đối chi tiết, nên mỗi chủ đề dự kiến sẽ có số lượng người dùng lớn. Trên thực tế, chúng tôi đảm bảo số người dùng tối thiểu cho mỗi chủ đề, vì 5% thời gian chủ đề được trả về là ngẫu nhiên.
  • Chủ đề được trả về ngẫu nhiên từ 5 chủ đề hàng đầu của người dùng.
  • Nếu một người dùng thường xuyên truy cập vào cùng một trang web (ví dụ: hằng tuần), thì mã chạy trên trang web đó có thể học được tối đa một chủ đề mới mỗi tuần.
  • Các trang web khác nhau sẽ nhận được các chủ đề khác nhau cho cùng một người dùng trong cùng một khoảng thời gian bắt đầu của hệ thống. Chỉ có 1/5 cơ hội chủ đề được trả về cho người dùng trên một trang web khớp với chủ đề được trả về cho họ trên một trang web khác. Điều này khiến khó xác định liệu các ứng dụng đó có phải là cùng một người dùng hay không.
  • Các chủ đề được cập nhật cho người dùng một lần mỗi tuần, nhằm giới hạn tần suất chia sẻ thông tin. Nói cách khác, API này giúp giảm thiểu phương pháp tạo vân tay số bằng cách không cập nhật chủ đề quá thường xuyên.
  • Một chủ đề sẽ chỉ được trả về cho phương thức gọi API mà gần đây đã quan sát thấy cùng một chủ đề cho cùng một người dùng. Phương pháp này giúp hạn chế khả năng các thực thể tìm hiểu (hoặc chia sẻ) thông tin về mối quan tâm của người dùng mà họ chưa trực tiếp quan sát được.

Cách API giải quyết các mối lo ngại về FLoC

Bản dùng thử theo nguyên gốc của FLoC vào năm 2021 đã nhận được nhiều ý kiến phản hồi của những người đóng góp cho hệ sinh thái web và công nghệ quảng cáo. Cụ thể, có ý kiến lo ngại rằng các nhóm thuần tập FLoC có thể được dùng làm nền tảng tạo vân tay số để xác định người dùng hoặc tiết lộ mối liên hệ của người dùng với một danh mục nhạy cảm. Ngoài ra, chúng tôi cũng đã thực hiện các cuộc gọi để làm cho FLoC minh bạch và dễ hiểu hơn đối với người dùng.

Topics API được thiết kế dựa trên ý kiến phản hồi này. Dự án này hướng đến việc khám phá những cách khác để hỗ trợ hoạt động quảng cáo dựa trên mối quan tâm, qua việc cải thiện tính minh bạch, đảm bảo quyền riêng tư hiệu quả hơn và một phương pháp tiếp cận khác cho các danh mục nhạy cảm.

Các bước tiếp theo

Tìm hiểu thêm về chủ đề là gì và cách hoạt động của chúng.

Nếu bạn là nhà phát triển công nghệ quảng cáo, hãy thử nghiệm và tham gia bằng Topics API. Đọc hướng dẫn cho nhà phát triển để biết thêm tài nguyên chuyên sâu.

Thu hút và chia sẻ ý kiến phản hồi