让广告网络能够使用与翻译相关的 Google 搜索功能
Google 搜索提供了多项与翻译相关的功能,让用户能够访问经过翻译的内容。如果您是广告网络运营方,但广告无法在已翻译的网页上正常投放,您需要按照本指南中的步骤确保广告能够正确呈现或归因。
我们的方法
当用户从搜索结果中访问由谷歌翻译提供的翻译内容时,用户点击翻译搜索结果后,Google 会从发布商处检索相应网页、重写源网址,并翻译该网页。
将谷歌翻译网址转换为原始网址
如果您运营的广告网络依赖于发布商的源网址,您需要转换谷歌翻译网址,确保广告能正常投放。请按照以下步骤解码发布商的主机名:
- 移除
.translate.goog
后缀,从主机名中提取网域前缀。 - 根据
,
(英文逗号)字符拆分_x_tr_enc
参数,并将其保存为encoding_list
。 - 将
_x_tr_hp
参数的值附加到网域前缀前面(如果存在)。 - 如果
encoding_list
包含1
且输出以1-
开头,请从第 2 步的输出中移除1-
前缀。 - 如果
encoding_list
包含0
且输出以0-
开头,请从第 3 步的输出中移除0-
前缀。如果您移除了相关前缀,请将is_idn
设为true
;否则,请将is_idn
设为false
。 - 将
/\b-\b/
(正则表达式)替换为.
(点)字符。 - 将
--
(双连字符)字符替换为-
(连字符)字符。 - 如果
is_idn
设置为true
,请添加 Punycode 前缀xn--
。 - 可选:转换为 Unicode。
JavaScript 代码示例:从谷歌翻译网址中解码出主机名
function decodeHostname(proxyUrl) { const parsedProxyUrl = new URL(proxyUrl); const fullHost = parsedProxyUrl.hostname; // 1. Extract the domain prefix from the hostname, by removing the ".translate.goog" suffix let domainPrefix = fullHost.substring(0, fullHost.indexOf('.')); // 2. Split _x_tr_enc parameter by "," (comma), save as encodingList const encodingList = parsedProxyUrl.searchParams.has('_x_tr_enc') ? parsedProxyUrl.searchParams.get('_x_tr_enc').split(',') : []; // 3. Prepend value of _x_tr_hp parameter to the domain prefix, if it exists if (parsedProxyUrl.searchParams.has('_x_tr_hp')) { domainPrefix = parsedProxyUrl.searchParams.get('_x_tr_hp') + domainPrefix; } // 4. Remove '1-' prefix from the output of step 2 if encodingList contains // '1' and the output begins with '1-'. if (encodingList.includes('1') && domainPrefix.startsWith('1-')) { domainPrefix = domainPrefix.substring(2); } // 5. Remove '0-' prefix from the output of step 3 if encodingList contains // '0' and the output begins with '0-'. // Set isIdn to true if removed, false otherwise. let isIdn = false; if (encodingList.includes('0') && domainPrefix.startsWith('0-')) { isIdn = true; domainPrefix = domainPrefix.substring(2); } // 6. Replace /\b-\b/ (regex) with '.' (dot) character. // 7. Replace '--' (double hyphen) with '-' (hyphen). let decodedSegment = domainPrefix.replaceAll(/\b-\b/g, '.').replaceAll('--', '-'); // 8. If isIdn equals true, add the punycode prefix 'xn--'. if (isIdn) { decodedSegment = 'xn--' + decodedSegment; } return decodedSegment; }
重新构建网址
- 使用原始网页的网址,将主机名替换为已解码的主机名。
- 移除所有
_x_tr_*
参数。
测试代码
您可以使用下表为代码创建单元测试。对于给定 proxyUrl
,decodeHostname
必须与预期值匹配。
下表只能用于测试主机名解码代码。您需要确保网址的路径、片段和原始参数保留原样。
proxyUrl
|
decodeHostname
|
---|---|
https://example-com.translate.goog
|
example.com
|
https://foo-example-com.translate.goog
|
foo.example.com
|
https://foo--example-com.translate.goog
|
foo-example.com
|
https://0-57hw060o-com.translate.goog/?_x_tr_enc=0
|
xn--57hw060o.com (⚡😊.com)
|
https://1-en--us-example-com/?_x_tr_enc=1
|
en-us.example.com
|
https://0-en----w45as309w-com.translate.goog/?_x_tr_enc=0
|
xn--en--w45as309w.com (en-⚡😊.com)
|
https://1-0-----16pw588q-com.translate.goog/?_x_tr_enc=0,1
|
xn----16pw588q.com (⚡-😊.com)
|
https://lanfairpwllgwyngyllgogerychwyrndrobwllllantysiliogogogoch-co-uk.translate.goog/?_x_tr_hp=l
|
llanfairpwllgwyngyllgogerychwyrndrobwllllantysiliogogogoch.co.uk
|
https://lanfairpwllgwyngyllgogerychwyrndrobwllllantysiliogogogoch-co-uk.translate.goog/?_x_tr_hp=www-l
|
www.llanfairpwllgwyngyllgogerychwyrndrobwllllantysiliogogogoch.co.uk
|
https://a--aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa-com.translate.goog/?_x_tr_hp=a--xn--xn--xn--xn--xn--------------------------a
|
a-xn-xn-xn-xn-xn-------------aa-aaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa.com
|
https://g5h3969ntadg44juhyah3c9aza87iiar4i410avdl8d3f1fuq3nz05dg5b-com.translate.goog/?_x_tr_enc=0&_x_tr_hp=0-
|
xn--g5h3969ntadg44juhyah3c9aza87iiar4i410avdl8d3f1fuq3nz05dg5b.com (💖🌲😊💞🤷♂️💗🌹😍🌸🌺😂😩😉😒😘💕🐶🐱🐭🐹🐰🐻🦊🐇😺.com)
|