Mitos dan fakta tentang crawling
Uji pengetahuan Anda tentang cara Google meng-crawl situs.
Melakukan kompresi untuk peta situs saya dapat meningkatkan anggaran crawling.
Benar
Salah
Tidak. Peta situs yang di-zip masih harus diambil dari server, sehingga Anda tidak benar-benar
menghemat banyak waktu atau upaya crawling dari pihak Google dengan mengirimkan peta situs yang dikompresi.
Google menyukai konten yang lebih baru, jadi sebaiknya saya menyesuaikan halaman saya.
Benar
Salah
Untuk Google Penelusuran, konten dinilai berdasarkan kualitas, terlepas dari usianya. Buat dan perbarui konten Anda
jika diperlukan, tetapi tidak ada nilai tambah bagi halaman yang dibuat seolah-olah tampak
baru dengan membuat perubahan kecil dan memperbarui tanggal halaman.
Google lebih memilih konten lama (lebih berbobot) daripada konten baru.
Benar
Salah
Jika halaman Anda berguna, halaman tersebut akan berguna, baik baru maupun lama.
Google lebih memilih URL yang bersih dan tidak menyukai parameter kueri.
Benar
Salah
Kami dapat meng-crawl parameter.
Semakin cepat halaman Anda dimuat dan dirender, semakin banyak yang dapat di-crawl Google.
Benar
Benar, karena resource kami dibatasi oleh kombinasi waktu dan jumlah bot
crawling. Jika Anda dapat menayangkan lebih banyak halaman dalam waktu yang terbatas, kami akan dapat
meng-crawl lebih banyak halaman. Namun, kami mungkin mengalokasikan lebih banyak waktu untuk meng-crawl situs yang memiliki informasi
yang lebih penting, meskipun situs tersebut lebih lambat. Mungkin menurut Anda, membuat situs lebih cepat bagi
pengguna lebih penting daripada membuatnya lebih cepat untuk meningkatkan cakupan crawl. Jauh
lebih mudah untuk membantu Google meng-crawl konten yang tepat dibandingkan meng-crawl semua
konten Anda setiap saat. Perhatikan bahwa meng-crawl situs melibatkan pengambilan dan rendering
konten. Waktu yang digunakan untuk proses rendering halaman dihitung sebanyak waktu yang dihabiskan untuk meminta halaman.
Jadi, membuat halaman Anda dirender lebih cepat juga akan meningkatkan kecepatan crawling.
Salah
Situs kecil tidak di-crawl sesering situs besar.
Benar
Salah
Jika situs memiliki konten penting yang sering berubah, kami akan sering meng-crawl situs tersebut, terlepas dari ukurannya.
Semakin dekat konten Anda ke halaman beranda, semakin penting konten tersebut bagi Google.
Benar
Sebagian benar
Halaman beranda situs biasanya adalah halaman yang paling penting di
situs Anda, sehingga halaman yang ditautkan langsung ke halaman beranda mungkin dianggap lebih penting
dan lebih sering di-crawl. Namun, ini tidak berarti bahwa peringkat halaman ini
akan lebih tinggi daripada halaman lain di situs Anda.
Salah
Pembuatan versi URL adalah cara yang baik untuk mendorong Google meng-crawl ulang halaman saya.
Benar
Sebagian benar
Anda dapat menggunakan URL yang diberi nomor versi agar
Google meng-crawl halaman Anda lagi secara lebih cepat. Namun, umumnya tindakan ini tidak diperlukan
dan akan menyia-nyiakan resource crawl jika halaman tidak benar-benar berubah. Jika menggunakan
URL yang diberi nomor versi untuk menunjukkan konten baru, sebaiknya hanya
ubah URL ketika konten halaman telah berubah secara signifikan.
Salah
Kecepatan situs dan error memengaruhi anggaran crawling.
Benar
Mempercepat situs akan memperbaiki pengalaman pengguna sekaligus meningkatkan frekuensi crawling. Bagi
crawler Google, situs yang cepat menunjukkan bahwa server dalam kondisi bagus, sehingga crawler dapat memperoleh lebih banyak konten dengan
jumlah koneksi yang sama. Di sisi lain, jumlah
kode status respons HTTP
5xx
(error server) atau waktu tunggu koneksi yang signifikan menandakan sebaliknya, dan
crawl akan melambat. Sebaiknya perhatikan laporan Statistik Crawling di Search
Console dan pastikan jumlah error server rendah.
Salah
Crawling adalah faktor penentu peringkat di Google Penelusuran.
Benar
Salah
Peningkatan frekuensi crawling belum tentu akan meningkatkan posisi situs pada hasil penelusuran Google.
Google menggunakan banyak sinyal untuk menentukan peringkat hasil, dan meskipun diperlukan untuk membuat
halaman muncul di hasil penelusuran, crawling bukan sinyal penentu peringkat.
URL alternatif dan konten yang disematkan memengaruhi anggaran crawling.
Benar
Umumnya, setiap URL yang di-crawl Googlebot akan memengaruhi anggaran crawling situs.
URL alternatif, seperti AMP atau hreflang, serta konten yang disematkan, seperti CSS dan
JavaScript, termasuk pengambilan XHR,
mungkin harus di-crawl dan akan menghabiskan anggaran crawling situs.
Salah
Saya dapat mengontrol crawler Google dengan aturan "crawl-delay".
Benar
Salah
Aturan robots.txt "crawl-delay" non-standar tidak diproses oleh crawler Google.
Aturan
nofollow memengaruhi anggaran crawling.Benar
Sebagian benar
URL apa pun yang di-crawl akan memengaruhi anggaran crawling, jadi meskipun jika
halaman Anda menandai URL sebagai
nofollow, URL tersebut masih dapat di-crawl apabila halaman lain
di situs Anda, atau halaman apa pun di web, tidak memberi label link sebagai nofollow.
Salah
Saya dapat menggunakan
noindex untuk mengontrol anggaran crawling.Benar
Sebagian benar
Setiap URL yang di-crawl akan memengaruhi anggaran crawling, dan Google harus meng-crawl halaman untuk
menemukan aturan
Namun,
noindex.
Namun,
noindex dapat membantu Anda mencegah pengindeksan halaman. Jika Anda
ingin memastikan bahwa halaman tersebut tidak diindeks oleh Google, terus gunakan noindex
dan jangan khawatir tentang anggaran crawling. Penting juga untuk diperhatikan bahwa jika Anda menghapus URL
dari indeks Google dengan noindex atau dengan cara lain, crawler Google dapat berfokus pada
URL lain di situs Anda, sehingga noindex dapat secara tidak langsung mengosongkan sebagian anggaran
crawling untuk situs Anda dalam jangka panjang.
Salah
Halaman yang menayangkan kode status HTTP
4xx membuang anggaran crawling.Benar
Salah
Halaman yang menayangkan kode status HTTP
4xx
(kecuali 429) tidak membuang anggaran crawling. Google mencoba
meng-crawl halaman, tetapi tidak menerima konten apa pun kecuali kode status.