यूआरएल के कैननिकल होने की जांच करना क्या होता है
यूआरएल के कैननिकल होने की जांच करने का मतलब, कॉन्टेंट के किसी हिस्से का –कैननिकल– यूआरएल चुनने से है. इसी तरह, कैननिकल यूआरएल उस पेज का यूआरएल होता है जिसे Google, डुप्लीकेट पेजों में से सबसे ज़रूरी पेज मानता है. इन्हें अक्सर डुप्लीकेट पेज कहा जाता है. इस प्रोसेस से Google को, खोज के नतीजों में डुप्लीकेट कॉन्टेंट का सिर्फ़ एक वर्शन दिखाने में मदद मिलती है.
किसी साइट पर डुप्लीकेट कॉन्टेंट होने की कई वजहें हो सकती हैं:
- देश या इलाके हिसाब से बनाए गए वर्शन: उदाहरण के लिए, अमेरिका और यूनाइटेड किंगडम के लिए कॉन्टेंट के कुछ हिस्से को अलग-अलग यूआरएल से ऐक्सेस किया जा सकता है. हालांकि, कॉन्टेंट में शामिल भाषा और कॉन्टेंट एक ही भाषा में होना चाहिए
- डिवाइस के हिसाब से वर्शन: उदाहरण के लिए, कोई ऐसा पेज जिसके मोबाइल और डेस्कटॉप, दोनों वर्शन हैं
- प्रोटोकॉल के हिसाब से वर्शन: उदाहरण के लिए, किसी साइट के एचटीटीपी और एचटीटीपीएस वर्शन
- साइट के फ़ंक्शन: उदाहरण के लिए, किसी कैटगरी पेज के फ़ंक्शन को क्रम से लगाने और फ़िल्टर करने के नतीजे
- गलती से बनी साइट: उदाहरण के लिए, साइट के डेमो वर्शन का ऐक्सेस गलती से क्रॉलर के पास हो
किसी साइट पर कुछ डुप्लीकेट कॉन्टेंट सामान्य होता है और इसे स्पैम से जुड़ी Google की नीतियों का उल्लंघन नहीं माना जाता है. हालांकि, एक ही कॉन्टेंट को अलग-अलग यूआरएल से ऐक्सेस किया जा सकता है. इससे लोगों को खराब अनुभव मिल सकता है. उदाहरण के लिए, लोगों को शायद यह सोचना पड़े कि कौनसा पेज सही है और क्या दोनों में कोई अंतर है इससे आपको यह ट्रैक करने में मुश्किल हो सकती है कि खोज नतीजों में कॉन्टेंट की परफ़ॉर्मेंस कैसी है.
Google का, कैननिकल यूआरएल को चुनने और इंडेक्स करने का तरीका
जब Google किसी पेज को इंडेक्स करता है, तो वह हर पेज के मुख्य कॉन्टेंट (या सेंटरपीस) को तय करता है. अगर Google को एक ही साइट पर एक जैसे कई पेज मिलते हैं या मुख्य कॉन्टेंट से मिलते-जुलते पेज मिलते हैं, तो वह उस पेज को चुनता है जो उसे खोज के नतीजों में सबसे ज़्यादा जानकारी देने वाला और काम का लगता है और उसे कैननिकल पेज के तौर पर मार्क करता है. ऐसा इंडेक्स करने की प्रोसेस से लिए गए डेटा (या सिग्नल) के आधार पर तय होता है. आपकी साइट के कैननिकल पेज को नियमित तौर पर क्रॉल किया जाएगा, लेकिन डुप्लीकेट पेज कभी-कभी ही क्रॉल किए जाएंगे. इससे, आपकी साइट पर क्रॉल करने से जुड़े लोड को कम करने में मदद मिलती है.
यूआरएल के कैननिकल होने की जांच इन बातों को ध्यान में रखकर की जाती है: पेज के लिए किस प्रोटोकॉल का इस्तेमाल किया गया है - एचटीटीपी या फिर एचटीटीपीएस, साइटमैप में यूआरएल की मौजूदगी, रीडायरेक्ट, और rel="canonical"
link
एनोटेशन. इन तरीकों से Google को अपनी पसंद बताएं. इसके बाद भी, Google किसी दूसरे पेज को कैननिकल पेज के तौर पर चुन सकता है. इसकी कई वजहें हो सकती हैं. इसका मतलब है कि कैननिकल पेज की प्राथमिकता बताना एक संकेत है, कोई नियम नहीं.
किसी पेज के अलग-अलग भाषाओं वाले वर्शन तभी डुप्लीकेट माने जाते हैं, जब पेज का मुख्य कॉन्टेंट एक ही भाषा में हो. इसका मतलब यह है कि पेजों के सिर्फ़ हेडर, फ़ुटर या दूसरे गै़र-ज़रूरी टेक्स्ट का तो अनुवाद किया गया हो, लेकिन मुख्य लेख एक ही भाषा में दिया गया हो. स्थानीय भाषा वाली साइटों को सेट अप करने के बारे में ज़्यादा जानें. इसके लिए, कई भाषाओं और इलाकों के हिसाब से बनाई गई साइटें मैनेज करने से जुड़ा हमारा दस्तावेज़ देखें.
Google, कॉन्टेंट और क्वॉलिटी का आकलन करने के लिए कैननिकल पेज का इस्तेमाल करता है. Google Search के नतीजों में आम तौर पर कैननिकल पेज को ही दिखाया जाता है. हालांकि, अगर किसी उपयोगकर्ता की क्वेरी के हिसाब से कोई डुप्लीकेट पेज बेहतर हो, तो कैननिकल पेज की जगह वह पेज दिखाया जाता है. उदाहरण के लिए, अगर उपयोगकर्ता किसी मोबाइल डिवाइस पर कुछ खोज रहा है, तो हो सकता है कि खोज के नतीजों में उसे पेज का मोबाइल वर्शन ही दिखाया जाए. भले ही, डेस्कटॉप वर्शन को कैननिकल पेज के तौर पर सेट किया गया हो.