รายการ Crawler ทั่วไปของ Google
Crawler ทั่วไปของ Google ใช้เพื่อค้นหาข้อมูลสำหรับสร้างดัชนีการค้นหาของ Google, ทำการ Crawl เฉพาะสำหรับผลิตภัณฑ์อื่นๆ และใช้สำหรับการวิเคราะห์ Crawler ประเภทนี้จะทําตามกฎของ robots.txt เสมอเมื่อทำการ Crawl โดยอัตโนมัติ คุณสมบัติทางเทคนิคทั่วไปของ Crawler ของ Google ยังนำไปใช้กับ Crawler ทั่วไปด้วย
โดยปกติ Crawler ทั่วไปจะทำการ Crawl จากช่วง IP ที่เผยแพร่ในออบเจ็กต์ googlebot.json และมาสก์ DNS แบบย้อนกลับของชื่อโฮสต์จะตรงกับ crawl-***-***-***-***.googlebot.com หรือ geo-crawl-***-***-***-***.geo.googlebot.com
รายการต่อไปนี้แสดง Crawler ทั่วไป สตริง User Agent ของ Crawler ตามที่ปรากฏในคำขอ HTTP, โทเค็น User Agent ของ Crawler สำหรับบรรทัด User-agent: ใน robots.txt และผลิตภัณฑ์ที่ได้รับผลกระทบจากการกำหนดค่าการ Crawl สำหรับ Crawler Crawler บางตัวมีโทเค็น User Agent มากกว่า 1 รายการ คุณต้องจับคู่โทเค็น Crawler เพียง 1 รายการเท่านั้นเพื่อใช้กฎ รายการนี้เป็นเพียงตัวอย่างบางส่วนเท่านั้น โดยครอบคลุมผู้ขอซึ่งมีแนวโน้มที่จะปรากฏในไฟล์บันทึกและที่เราได้รับคำถามมา
-
Googlebot
-
User-Agentในคำขอ HTTPGooglebot Smartphone Mozilla/5.0 (Linux; Android 6.0.1; Nexus 5X Build/MMB29P) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/W.X.Y.Z Mobile Safari/537.36 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)
Googlebot Desktop Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; Googlebot/2.1; +http://www.google.com/bot.html) Chrome/W.X.Y.Z Safari/537.36
น้อยครั้ง:
Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)Googlebot/2.1 (+http://www.google.com/bot.html)
robots.txt โทเค็น User Agent ใน robots.txt Googlebotตัวอย่างกลุ่ม robots.txt user-agent: Googlebot allow: /archive/1Q84 disallow: /archive
ผลิตภัณฑ์ที่ได้รับผลกระทบ ค่ากำหนดการ Crawl ที่ส่งถึง User Agent ของ Googlebotจะส่งผลต่อ Google Search (รวมถึงฟีเจอร์สำรวจและฟีเจอร์ทั้งหมดของ Google Search) รวมถึงผลิตภัณฑ์อื่นๆ เช่น Google รูปภาพ, Google วิดีโอ, Google News และสำรวจ Googlebot Image
-
User Agent ในคําขอ HTTP Googlebot-Image/1.0
robots.txt โทเค็น User Agent ใน robots.txt Googlebot-Image
Googlebotตัวอย่างกลุ่ม robots.txt user-agent: Googlebot-Image allow: /archive/1Q84 disallow: /archive/moons.jpg
ผลิตภัณฑ์ที่ได้รับผลกระทบ ค่ากำหนดการ Crawl ที่ส่งถึง User Agent ของ Googlebot-Imageจะส่งผลต่อ Google รูปภาพ, สำรวจ, Google วิดีโอ และฟีเจอร์ทั้งหมดใน Google Search ที่แสดงรูปภาพ โลโก้ และ Favicon Googlebot Video
-
User Agent ในคําขอ HTTP Googlebot-Video/1.0
robots.txt โทเค็น User Agent ใน robots.txt Googlebot-Video
Googlebotตัวอย่างกลุ่ม robots.txt user-agent: Googlebot-Video allow: /archive/1Q84 disallow: /archive/
ผลิตภัณฑ์ที่ได้รับผลกระทบ ค่ากําหนดการ Crawl ที่ส่งถึง User Agent Googlebot-Videoจะส่งผลต่อฟีเจอร์ของ Google Search ที่เกี่ยวข้องกับวิดีโอและผลิตภัณฑ์อื่นๆ ที่อาศัยวิดีโอ Googlebot News
-
User Agent ในคําขอ HTTP Googlebot-news ไม่มีสตริง User Agent ของคำขอ HTTP แยกต่างหาก การ Crawl จะดําเนินการด้วยสตริง User Agent หลายรายการของ Googlebot robots.txt โทเค็น User Agent ใน robots.txt Googlebot-News
Googlebotตัวอย่างกลุ่ม robots.txt user-agent: Googlebot-News allow: /archive/1Q84 disallow: /archive/
ผลิตภัณฑ์ที่ได้รับผลกระทบ ค่ากำหนดการ Crawl ที่ส่งถึง User Agent ของ Googlebot-Newsจะส่งผลต่อผลิตภัณฑ์ Google News ซึ่งรวมถึง news.google.com และแอป Google News Google StoreBot
-
User Agent ในคําขอ HTTP Agent ในเดสก์ท็อป Mozilla/5.0 (X11; Linux x86_64; Storebot-Google/1.0) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/W.X.Y.Z Safari/537.36
Agent ในอุปกรณ์เคลื่อนที่ Mozilla/5.0 (Linux; Android 8.0; Pixel 2 Build/OPD3.170816.012; Storebot-Google/1.0) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/W.X.Y.Z Mobile Safari/537.36
robots.txt โทเค็น User Agent ใน robots.txt Storebot-Googleตัวอย่างกลุ่ม robots.txt user-agent: Storebot-Google allow: /archive/1Q84 disallow: /archive/konbini
ผลิตภัณฑ์ที่ได้รับผลกระทบ ค่ากำหนดการ Crawl ที่ส่งถึง User Agent Storebot-Googleจะส่งผลต่อทุกแพลตฟอร์มของ Google Shopping (เช่น แท็บ Shopping ใน Google Search และ Google Shopping) Google-InspectionTool
-
User Agent ในคําขอ HTTP Agent ในเดสก์ท็อป Mozilla/5.0 (compatible; Google-InspectionTool/1.0;)
Agent ในอุปกรณ์เคลื่อนที่ Mozilla/5.0 (Linux; Android 6.0.1; Nexus 5X Build/MMB29P) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/W.X.Y.Z Mobile Safari/537.36 (compatible; Google-InspectionTool/1.0;)
robots.txt โทเค็น User Agent ใน robots.txt Google-InspectionTool
Googlebotตัวอย่างกลุ่ม robots.txt user-agent: Google-InspectionTool allow: /archive/1Q84 disallow: /archive/
ผลิตภัณฑ์ที่ได้รับผลกระทบ ค่ากําหนดการ Crawl ที่ส่งถึง User Agent Google-InspectionToolจะส่งผลต่อเครื่องมือทดสอบต่างๆ ของ Search เช่น การทดสอบผลการค้นหาที่เป็นริชมีเดียและการตรวจสอบ URL ใน Search Console โดยไม่มีผลต่อ Google Search หรือผลิตภัณฑ์อื่นๆ GoogleOther
-
User Agent ในคําขอ HTTP Mozilla/5.0 (Linux; Android 6.0.1; Nexus 5X Build/MMB29P) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/W.X.Y.Z Mobile Safari/537.36 (compatible; GoogleOther)
Mozilla/5.0 AppleWebKit/537.36 (KHTML, like Gecko; compatible; GoogleOther) Chrome/W.X.Y.Z Safari/537.36
robots.txt โทเค็น User Agent ใน robots.txt GoogleOtherตัวอย่างกลุ่ม robots.txt user-agent: GoogleOther allow: /archive/1Q84 disallow: /archive/
ผลิตภัณฑ์ที่ได้รับผลกระทบ ค่ากําหนดการ Crawl ที่ระบุสำหรับ User Agent GoogleOtherจะไม่ส่งผลต่อผลิตภัณฑ์ใดโดยเฉพาะ GoogleOther เป็น Crawler ทั่วไปที่ทีมผลิตภัณฑ์ต่างๆ อาจใช้เพื่อดึงเนื้อหาที่เข้าถึงได้แบบสาธารณะจากเว็บไซต์ เช่น ใช้สําหรับทำการ Crawl เพียงครั้งเดียวสำหรับการค้นคว้าและพัฒนาภายใน โดยไม่มีผลต่อ Google Search หรือผลิตภัณฑ์อื่นๆ GoogleOther-Image
-
User Agent ในคําขอ HTTP GoogleOther-Image/1.0
robots.txt โทเค็น User Agent ใน robots.txt GoogleOther-Image
GoogleOtherตัวอย่างกลุ่ม robots.txt user-agent: GoogleOther-Image allow: /archive/1Q84 disallow: /archive/moon.jpg
ผลิตภัณฑ์ที่ได้รับผลกระทบ ค่ากําหนดการ Crawl ที่ส่งถึง User Agent ของ GoogleOther-Imageจะไม่ส่งผลต่อผลิตภัณฑ์ใดผลิตภัณฑ์หนึ่งโดยเฉพาะ เช่นเดียวกับ GoogleOther GoogleOther-Image คือ GoogleOther เวอร์ชันที่ได้รับการเพิ่มประสิทธิภาพสำหรับการดึงข้อมูล URL รูปภาพที่เข้าถึงได้แบบสาธารณะ GoogleOther-Video
-
User Agent ในคําขอ HTTP GoogleOther-Video/1.0
robots.txt โทเค็น User Agent ใน robots.txt GoogleOther-Video
GoogleOtherตัวอย่างกลุ่ม robots.txt user-agent: GoogleOther-Video allow: /archive/1Q84 disallow: /archive
ผลิตภัณฑ์ที่ได้รับผลกระทบ ค่ากำหนดการ Crawl ที่ส่งถึง User Agent ของ GoogleOther-Videoไม่มีผลต่อผลิตภัณฑ์ที่เฉพาะเจาะจงใดๆ ซึ่งคล้ายกับ GoogleOther GoogleOther-Video คือ GoogleOther เวอร์ชันที่ได้รับการเพิ่มประสิทธิภาพสำหรับการดึงข้อมูล URL ของวิดีโอที่เข้าถึงได้แบบสาธารณะ Google-CloudVertexBot
-
สตริงย่อย User-Agent ในคําขอ HTTP Google-CloudVertexBot
robots.txt โทเค็น User Agent ใน robots.txt Google-CloudVertexBot
Googlebotตัวอย่างกลุ่ม robots.txt user-agent: Google-CloudVertexBot allow: /archive/1Q84 disallow: /archive/
ผลิตภัณฑ์ที่ได้รับผลกระทบ ค่ากำหนดการ Crawl ที่ส่งถึง User Agent ของ Google-CloudVertexBotมีผลต่อการ Crawl ที่เจ้าของเว็บไซต์ขอ สำหรับการสร้าง Vertex AI Agent โดยไม่มีผลต่อ Google Search หรือผลิตภัณฑ์อื่นๆ Google-Extended
-
User Agent ในคําขอ HTTP Google-Extended ไม่มีสตริง User Agent ของคำขอ HTTP แยกต่างหาก การ Crawl จะดําเนินการด้วยสตริง User Agent ของ Google ที่มีอยู่ มีการใช้ โทเค็น User Agent ของ robots.txt ในความสามารถในการควบคุม robots.txt โทเค็น User Agent ใน robots.txt Google-Extendedตัวอย่างกลุ่ม robots.txt user-agent: Google-Extended allow: /archive/1Q84 disallow: /archive/
ผลิตภัณฑ์ที่ได้รับผลกระทบ Google-Extendedเป็นโทเค็นผลิตภัณฑ์แบบสแตนด์อโลนซึ่งทำหน้าที่เป็นส่วนควบคุมใหม่ที่ผู้เผยแพร่เนื้อหาบนเว็บสามารถใช้จัดการว่าจะให้ใช้เนื้อหาที่ Google ทำการ Crawl จากเว็บไซต์ของตนหรือไม่ เพื่อใช้ฝึกโมเดล Gemini รุ่นถัดไปที่ขับเคลื่อนแอป Gemini และ Vertex AI API สําหรับ Gemini รวมถึงเพื่อใช้อ้างอิง (การให้เนื้อหาจากดัชนีของ Google Search แก่โมเดลในทันทีเพื่อปรับปรุงความถูกต้องและความเกี่ยวข้อง) ในแอป Gemini และการอ้างอิงด้วย Google Search ใน Vertex AIGoogle-Extended ไม่ส่งผลต่อการรวมเว็บไซต์ใน Google Search และไม่ได้ใช้เป็นสัญญาณการจัดอันดับใน Google Search
หมายเหตุเกี่ยวกับW.X.Y.Z ใน User Agent
สตริง Chrome/W.X.Y.Z ในสตริง User Agent ในรายการคือตัวยึดตำแหน่ง ที่แสดงถึงเวอร์ชันของเบราว์เซอร์ Chrome ที่ใช้โดย User Agent ดังกล่าว เช่น 41.0.2272.96 หมายเลขเวอร์ชันนี้จะเพิ่มขึ้นเมื่อเวลาผ่านไปเพื่อจับคู่กับ Chromium เวอร์ชันที่เผยแพร่ล่าสุดซึ่ง Googlebot ใช้
หากกำลังค้นหาบันทึกหรือกรองเซิร์ฟเวอร์สำหรับ User Agent ที่มีรูปแบบนี้ ให้ใช้ไวลด์การ์ดหมายเลขเวอร์ชันแทนการระบุหมายเลขเวอร์ชันที่ถูกต้อง