ความเชื่อและข้อเท็จจริงเกี่ยวกับการ Crawl

ทดสอบความรู้เกี่ยวกับการ Crawl เว็บไซต์ของ Google

การบีบอัด Sitemap ช่วยเพิ่ม Crawl Budget ได้
จริง
เท็จ
ไม่ได้เป็นเช่นนั้น ระบบจะยังคงดึงข้อมูลแผนผังเว็บไซต์แบบไฟล์ ZIP มาจากเซิร์ฟเวอร์ ดังนั้นการส่งแผนผังเว็บไซต์ที่บีบอัดจึงไม่ได้ช่วยให้ Google ใช้เวลาหรือความพยายามในการ Crawl น้อยลงแต่อย่างใด
Google ต้องการเนื้อหาที่ใหม่กว่า ฉันจึงควรปรับเปลี่ยนหน้าเว็บอยู่เสมอ
จริง
เท็จ
สำหรับ Google Search เนื้อหาได้รับการจัดประเภทตามคุณภาพโดยไม่คำนึงถึงความใหม่ สร้างและอัปเดตเนื้อหาตามที่จำเป็น อย่างไรก็ตาม การแสร้งทำเป็นว่าหน้าเว็บมีความใหม่โดยทำการเปลี่ยนแปลงที่ไม่สำคัญและอัปเดตวันที่ในหน้าเว็บไม่ถือเป็นการเพิ่มคุณค่า
Google ต้องการเนื้อหาเก่า (มีน้ำหนักมากกว่า) มากกว่าเนื้อหาใหม่
จริง
เท็จ
หน้าเว็บที่มีประโยชน์คือหน้าเว็บมีประโยชน์ไม่ว่าจะเป็นหน้าเก่าหรือใหม่
Google ต้องการ URL ที่ชัดเจนและไม่ต้องการพารามิเตอร์การค้นหา
จริง
เท็จ
เราสามารถทำการ Crawl พารามิเตอร์ได้
ยิ่งหน้าเว็บโหลดและแสดงผลเร็ว Google ก็จะทำการ Crawl ได้มากขึ้น
จริง
จริง ในแง่ที่ว่าทรัพยากรของเรามีจำกัดเนื่องด้วยทั้งเวลาและจำนวนบ็อตสำหรับทำการ Crawl หากคุณแสดงผลหน้าเว็บได้มากขึ้นภายในเวลาที่จํากัด เราก็จะทำการ Crawl หน้าเว็บได้มากขึ้น อย่างไรก็ตาม เราอาจใช้เวลาในการ Crawl เว็บไซต์ที่มีข้อมูลสำคัญนานกว่า แม้ว่าเว็บไซต์จะช้ากว่า การทำให้เว็บไซต์เร็วขึ้นสำหรับผู้ใช้อาจสำคัญกว่าการทำให้เว็บไซต์เร็วขึ้นเพื่อให้การ Crawl ครอบคลุมมากขึ้น และการช่วยให้ Google ทำการ Crawl เนื้อหาที่ถูกต้องนั้นก็ง่ายกว่าการปล่อยให้ Google ทำการ Crawl เนื้อหาทั้งหมดทุกครั้ง โปรดทราบว่าการ Crawl เว็บไซต์มีทั้งการดึงข้อมูลและการแสดงผลเนื้อหา เวลาที่ใช้ในการแสดงผลหน้าเว็บจะเท่ากับเวลาที่ใช้ขอหน้าเว็บ ดังนั้นการทําให้หน้าเว็บแสดงผลเร็วขึ้นจะเป็นการเพิ่มความเร็วในการ Crawl ด้วย
เท็จ
เว็บไซต์ขนาดเล็กไม่ได้รับการรวบรวมข้อมูลบ่อยเท่ากับเว็บไซต์ขนาดใหญ่
จริง
เท็จ
หากเว็บไซต์มีเนื้อหาสําคัญที่มีการเปลี่ยนแปลงบ่อย เราจะทำการ Crawl บ่อยครั้งโดยไม่คํานึงถึงขนาด
ยิ่งเนื้อหาใกล้เคียงกับหน้าแรกมาก Google ก็จะให้ความสําคัญมาก
จริง
จริงบางส่วน
หน้าแรกของเว็บไซต์มักเป็นหน้าที่สำคัญที่สุดในเว็บไซต์ ดังนั้นระบบอาจถือว่าหน้าที่ลิงก์กับหน้าแรกโดยตรงมีความสำคัญมากกว่า จึงทำการ Crawl บ่อยกว่า แต่ก็ไม่ได้หมายความว่าหน้าเว็บเหล่านี้จะได้รับการจัดอันดับสูงกว่าหน้าอื่นๆ ในเว็บไซต์
เท็จ
การแนะนำให้ Google รวบรวมข้อมูลหน้าเว็บอีกครั้งด้วยการกำหนดเวอร์ชัน URL นั้นเป็นวิธีที่ดี
จริง
จริงบางส่วน
การใช้ URL ของหน้าเว็บซึ่งมีการกำหนดเวอร์ชันเพื่อแนะนำให้ Google ทำการ Crawl อีกครั้งในเร็วๆ นี้อาจได้ผลก็จริง แต่มักจะไม่จำเป็น และจะทำให้สิ้นเปลืองทรัพยากรในการ Crawl หากหน้าเว็บไม่มีการเปลี่ยนแปลง หากคุณใช้ URL ที่มีการกำหนดเวอร์ชันเพื่อระบุเนื้อหาใหม่ เราขอแนะนําให้เปลี่ยน URL เฉพาะเมื่อเนื้อหาของหน้าเว็บมีการเปลี่ยนแปลงอย่างมีความหมาย
เท็จ
ความเร็วเว็บไซต์และข้อผิดพลาดมีผลต่อ Crawl Budget
จริง
การทำให้เว็บไซต์เร็วขึ้นจะช่วยปรับปรุงประสบการณ์ของผู้ใช้ไปพร้อมกับเพิ่มอัตราการ Crawl Crawler ของ Google มองว่าเว็บไซต์ที่เร็วเป็นสัญญาณของเซิร์ฟเวอร์ที่มีประสิทธิภาพ จึงรวบรวมเนื้อหาได้มากขึ้นผ่านการเชื่อมต่อจำนวนเท่ากัน ในทางกลับกัน ก็มองว่ารหัสสถานะการตอบกลับ HTTP 5xx (ข้อผิดพลาดเกี่ยวกับเซิร์ฟเวอร์) จำนวนมากหรือการเชื่อมต่อหมดเวลาเป็นสัญญาณของเซิร์ฟเวอร์ที่ไม่มีประสิทธิภาพ จึงทำการ Crawl ได้ช้าลง เราขอแนะนำให้คอยตรวจสอบรายงานสถิติการ Crawl ใน Search Console และดูแลไม่ให้มีข้อผิดพลาดเกี่ยวกับเซิร์ฟเวอร์จำนวนมาก
เท็จ
การ Crawl เป็นปัจจัยในการจัดอันดับใน Google Search
จริง
เท็จ
การปรับปรุงอัตราการ Crawl ไม่ได้หมายความว่าจะทำให้ได้อันดับที่ดีขึ้นในผลการค้นหาของ Google เสมอไป Google ใช้สัญญาณจำนวนมากในการจัดอันดับผลการค้นหา และแม้ว่าการ Crawl จะเป็นสิ่งจำเป็นที่ทำให้หน้าเว็บปรากฏในผลการค้นหา แต่ก็ไม่ได้เป็นสัญญาณการจัดอันดับ
URL ทางเลือกและเนื้อหาที่ฝังนับรวมอยู่ใน Crawl Budget
จริง
โดยทั่วไป URL ที่ Googlebot ทำการ Crawl จะนับรวมอยู่ใน Crawl Budget ของเว็บไซต์ ระบบอาจต้องทำการ Crawl URL ทางเลือกอย่างเช่น AMP หรือ hreflang ตลอดจนเนื้อหาที่ฝังอย่างเช่น CSS และ JavaScript ซึ่งรวมถึงการดึงข้อมูล XHR โดยทั้งหมดจะนับรวมอยู่ใน Crawl Budget ของเว็บไซต์
เท็จ
ฉันควบคุม Crawler ของ Google ได้ด้วยกฎ "crawl-delay"
จริง
เท็จ
Crawler ของ Google ไม่ประมวลผลกฎ robots.txt "crawl-delay" ที่ไม่เป็นมาตรฐาน
กฎ nofollow มีผลต่อ Crawl Budget
จริง
จริงบางส่วน
URL ใดๆ ที่ได้รับการ Crawl จะมีผลต่อ Crawl Budget ดังนั้นแม้ว่าหน้าเว็บจะทำเครื่องหมาย URL ว่า nofollow ระบบก็อาจยังทำการ Crawl URL นั้นอยู่หากหน้าอื่นในเว็บไซต์หรือหน้าอื่นในอินเทอร์เน็ตไม่ติดป้ายกำกับลิงก์ดังกล่าวว่า nofollow
เท็จ
ฉันใช้ noindex เพื่อควบคุม Crawl Budget
จริง
จริงบางส่วน
URL ใดๆ ที่ได้รับการ Crawl จะมีผลต่อ Crawl Budget และ Google ต้องทำการ Crawl หน้าเว็บเพื่อหากฎ noindex

อย่างไรก็ตาม noindex พร้อมช่วยคุณในการป้องกันไม่ให้มีการจัดทำดัชนี หากคุณไม่ต้องการให้หน้าเว็บเหล่านั้นอยู่ในดัชนีของ Google ก็ให้ใช้ noindex ต่อไปและไม่ต้องกังวลเกี่ยวกับ Crawl Budget โปรดทราบด้วยว่าหากคุณนำ URL ออกจากดัชนีของ Google โดยใช้ noindex หรือหาก Crawler ของ Google สามารถเน้นที่ URL อื่นๆ ในเว็บไซต์ของคุณได้ นั่นหมายความว่า ในระยะยาว noindex สามารถเพิ่ม Crawl Budget สำหรับเว็บไซต์ของคุณได้โดยอ้อม
เท็จ
หน้าที่แสดงรหัสสถานะ HTTP 4xx ใช้ Crawl Budget
จริง
เท็จ
หน้าที่แสดงรหัสสถานะ HTTP 4xx (ยกเว้น 429) ไม่ได้ใช้ Crawl Budget Google พยายามทำการ Crawl หน้าเว็บ แต่ได้รับรหัสสถานะและไม่มีเนื้อหาอื่นๆ