إدارة الزحف إلى عناوين URL التي تتيح البحث المتعدّد الأوجه

البحث المتعدّد الأوجه هو ميزة شائعة في المواقع الإلكترونية التي تسمح لزوارها بتغيير طريقة عرض العناصر (على سبيل المثال، المنتجات أو المقالات أو الفعاليات) على إحدى الصفحات. هذه الميزة مفيدة ويكثر استخدامها، إلا أنّ طريقة تنفيذها الأكثر شيوعًا والتي تعتمد على معلَمات عنوان URL يمكن أن تنشئ مساحات URL غير محدودة، ما قد يُلحق الضرر بالموقع الإلكتروني من خلال الطريقتين التاليتين:

عمليات الزحف الزائدة: بما أنّ عناوين URL التي تم إنشاؤها لأغراض البحث المتعدّد الأوجه تبدو جديدة ولا يمكن لبرامج الزحف تحديد ما إذا كانت هذه العناوين مفيدة بدون الزحف إليها أولاً، ستصل برامج الزحف عادةً إلى عدد كبير جدًا من عناوين URL التي تتيح البحث المتعدّد الأوجه قبل أن يتبيّن من خلال عمليات المعالجة في برامج الزحف أنّ هذه العناوين عديمة الفائدة في الواقع.
بطء عمليات الزحف الاستكشافي: انطلاقًا من النقطة السابقة، إذا تم استهلاك موارد الزحف على عناوين URL غير مفيدة، يقل الوقت المتاح للزحف إلى عناوين URL جديدة ومفيدة.

ضمن أي عنوان URL نموذجي يتيح البحث المتعدّد الأوجه، قد تتوفّر معلَمات مختلفة في سلسلة طلب البحث تتعلّق بالسمات التي تتم فلترة العناصر استنادًا إليها. على سبيل المثال:

https://example.com/items.shtm?products=fish&color=radioactive_green&size=tiny

يؤدي تغيير أي معلَمة من معلَمات عنوان URL،‏ products أو color أو size، إلى عرض مجموعة مختلفة من العناصر في الصفحة الأساسية. وهذا يعني في الغالب عددًا كبيرًا جدًا من المجموعات المحتمَلة للفلاتر، ما يؤدي إلى عدد هائل من عناوين URL المحتمَلة. لتوفير الموارد، ننصحك بالتعامل مع عناوين URL هذه بإحدى الطريقتين التاليتين:

إذا كنت لا تحتاج إلى إجراء فهرسة محتمَلة لعناوين URL التي تتيح البحث المتعدّد الأوجه، يمكنك منع الزحف إلى عناوين URL هذه.
إذا كنت بحاجة إلى إجراء فهرسة محتمَلة لعناوين URL التي تتيح البحث المتعدّد الأوجه، يجب التأكد من أنّ هذه العناوين تتّبع أفضل الممارسات الموضحة في القسم التالي. وتذكَّر أنّ الزحف إلى عناوين URL المتعدّدة الأوجه يؤدي غالبًا إلى استهلاك مقدار كبير من موارد الحوسبة في المواقع الإلكترونية بسبب العدد الهائل لتلك العناوين والعمليات اللازمة لعرض تلك الصفحات.

إذا أردت توفير موارد الخادم ولم تكن بحاجة إلى ظهور عناوين URL التي تتيح البحث المتعدّد الأوجه في "بحث Google"، بإمكانك منع الزحف إلى عناوين URL هذه بإحدى الطرق التالية.

استخدِم ملف robots.txt لمنع الزحف إلى عناوين URL التي تتيح البحث المتعدّد الأوجه. في معظم الأحيان، لا يكون هناك سبب وجيه للسماح بالزحف إلى العناصر المفلترة، إذ إنّه يؤدي إلى استهلاك موارد الخادم بدون فائدة تُذكر. بدلاً من ذلك، ننصحك بالسماح بالزحف إلى الصفحات الخاصة بالسلع المحددة بالإضافة إلى صفحة بيانات مخصصة لعرض جميع المنتجات بدون تطبيق الفلاتر.
```
user-agent: Googlebot
disallow: /*?*products=
disallow: /*?*color=
disallow: /*?*size=
allow: /*?products=all$
```
استخدِم أجزاء من عناوين URL لتحديد الفلاتر. لا يتيح محرك بحث Google بشكل عام الزحف إلى عناوين URL التي تشتمل على أجزاء أو فهرسة تلك العناوين. إذا كانت طريقتك في الفلترة تعتمد على استخدام أجزاء من عناوين URL، لن يكون لذلك أي تأثير على الزحف (سواء سلبًا أو إيجابًا). على سبيل المثال، بدلاً من معلَمات عناوين URL، استخدِم أجزاء من عناوين URL:
```
https://example.com/items.shtm#products=fish&color=radioactive_green&size=tiny
```

تتوفر طريقتان أخريان، وهما استخدام العنصر rel="canonical" link وسمة علامة الارتساء rel="nofollow"، للإشارة إلى خيارك المفضّل المتعلّق بالزحف (أو عدم الزحف) إلى عناوين URL التي تتيح البحث المتعدّد الأوجه. مع ذلك، تكون هاتان الطريقتان أقل فاعلية بشكل عام على المدى البعيد مقارنةً بالطريقتين السابقتين.

إذا استخدمت rel="canonical" لتحديد النسخة الأساسية من عنوان URL الذي يتيح البحث المتعدّد الأوجه قد يؤدي ذلك بمرور الوقت إلى تقليل حجم الزحف إلى النسخة غير الأساسية من تلك العناوين. مثلاً، إذا كان لديك 3 أنواع من الصفحات المفلتَرة، ننصحك بتوجيه rel="canonical" إلى النسخة غير المفلتَرة: https://example.com/items.shtm?products=fish&color=radioactive_green&size=tiny يحدّد <link rel="canonical" href="https://example.com/items.shtm?products=fish" >.
قد يكون مفيدًا استخدام سمات rel="nofollow" على علامات الارتساء التي تشير إلى صفحات النتائج المفلتَرة، إلا أنّه يجب تضمين السمة rel="nofollow" في كل علامة ارتساء تشير إلى عنوان URL محدد لكي تكون العلامة فعّالة.

لزيادة احتمال الزحف إلى عناوين URL التي تتيح البحث المتعدّد الأوجه وفهرستها، يجب اتّباع أفضل الممارسات الموضّحة أدناه للحد من الآثار السلبية للزحف إلى عدد كبير من عناوين URL المحتمَلة على موقعك الإلكتروني:

استخدِم فاصل معلَمات عناوين URL المتَّبع في المجال "&"، إذ يصعب على برامج الزحف رصد أحرف مثل الفاصلة (,) والفاصلة المنقوطة (;) والأقواس ([ و]) باعتبارها فواصل معلمات (لأنّها لا تُشكّل فواصل في معظم الأحيان).
عند ترميز الفلاتر في مسار عنوان URL، مثل /products/fish/green/tiny، يجب التأكد من عدم تغيير الترتيب المنطقي للفلاتر مطلقًا ومن عدم تكرار أي فلاتر.
اعرض رمز حالة HTTP 404 عندما لا تؤدي مجموعة الفلاتر إلى عرض أي نتائج. إذا لم تكن هناك سمكة خضراء في مستودع الموقع الإلكتروني، سيتلقّى المستخدمون وبرامج الزاحف خطأ "لم يتم العثور على الصفحة" مع رمز حالة HTTP المناسب (404). ومن المفترض أن يحدث هذا أيضًا عندما يحتوي عنوان URL على فلاتر مكررة أو مجموعات فلاتر غير صالحة، وعناوين URL لنتائج مقسّمة على صفحات غير متاحة. وبالمثل، إذا لم تظهر نتائج لمجموعة فلاتر، يجب عدم إعادة التوجيه إلى صفحة عادية تعرض الخطأ "لم يتم العثور على الصفحة". بدلاً من ذلك، يمكن عرض خطأ "لم يتم العثور على الصفحة" مع رمز حالة HTTP 404 على عنوان URL الذي تم العثور على الخطأ فيه.
في حال كان لديك تطبيق من صفحة واحدة، قد يتعذّر تنفيذ ذلك. في تلك الحالة، ننصحك باتّباع أفضل الممارسات المتعلّقة بالتطبيقات المكوّنة من صفحة واحدة.

منع الزحف إلى عناوين URL التي تتيح البحث المتعدّد الأوجه

التأكّد من أنّ عناوين URL التي تتيح البحث المتعدّد الأوجه محسَّنة بما يلائم الويب