Gỡ lỗi trên trang
Mẹo chung
Xin lưu ý rằng Google không thu thập dữ liệu trang của bạn ngay sau khi bạn triển khai nội dung sửa lỗi. Do đó, có thể Search Console (và Google Tìm kiếm) sẽ tiếp tục hiển thị lỗi đối với một trang mà bạn đã khắc phục cho đến khi chúng tôi thu thập lại dữ liệu trang đó. Đôi khi, bạn có thể yêu cầu thu thập dữ liệu nhanh, ví dụ như bằng cách dùng công cụ Kiểm tra URL. Nhưng trong hầu hết trường hợp, bạn phải chờ vài ngày để nhận thấy các thay đổi trên trang của mình.
Các công cụ kiểm tra hữu ích
Dưới đây là một số công cụ hữu ích để giúp bạn sửa lỗi trên các trang của mình.
Công cụ cho chủ sở hữu trang web đã xác minh
Các công cụ và báo cáo sau đây yêu cầu bạn phải là người dùng đã xác minh của trang web để có thể sử dụng công cụ này trên trang hoặc trang web đó. Điều này là do Search Console cung cấp dữ liệu trang web bí mật mà chỉ người dùng đã xác minh của trang mới có quyền truy cập.
- Search Console – Đăng ký Search Console và xác minh quyền sở hữu đối với một trang web để có quyền truy cập vào các công cụ hữu ích giúp kiểm tra và giám sát trang web, chẳng hạn như những công cụ được nêu dưới đây.
- Báo cáo trạng thái kết quả nhiều định dạng – Tìm hiểu xem Google có thể hay không thể đọc kết quả nhiều định dạng nào trên trang web của bạn, nhận thông tin khắc phục vấn đề cho các lỗi về kết quả nhiều định dạng và yêu cầu thu thập lại dữ liệu sau khi bạn khắc phục xong vấn đề nào đó. Bạn không thể kiểm tra một URL tuỳ ý bằng công cụ này.
- Công cụ kiểm tra URL – Tìm hiểu cách trang của bạn xuất hiện trong chỉ mục Google, chạy quy trình kiểm tra xem một URL đang hoạt động có trong chỉ mục hay không, xem cách Google hiển thị trang của bạn và gửi URL để lập chỉ mục.
- Báo cáo robots.txt – Kiểm tra xem liệu Google có xử lý được tệp robots.txt của bạn hay không. Bạn cũng có thể yêu cầu thu thập lại dữ liệu của tệp robots.txt trong các tình huống khẩn cấp.
- Báo cáo trạng thái AMP – Xem lỗi trang AMP mà Google đã phát hiện trên toàn bộ trang web của bạn. Google phát hiện các lỗi này trong quá trình thu thập dữ liệu định kỳ. Bạn không thể kiểm tra một URL tuỳ ý.
Công cụ ẩn danh
Bạn có thể sử dụng các công cụ này trên bất kỳ URL nào mà không cần quyền của Search Console trên trang web. Một số công cụ cũng cho phép bạn dán các đoạn mã vào chính công cụ đó.
Nếu URL của bạn bị chặn bởi tường lửa hoặc được lưu trữ trên một máy tính cục bộ, bạn có thể sử dụng giải pháp đường hầm để hiển thị trang của mình cho công cụ kiểm tra. Xem phần dưới đây để tìm hiểu cách thực hiện.
- Công cụ kiểm tra AMP – Kiểm tra tính hợp lệ của một URL AMP cụ thể theo thời gian thực.
- Công cụ kiểm tra kết quả nhiều định dạng – Kiểm tra tính hợp lệ của một khối dữ liệu có cấu trúc theo thời gian thực. Bạn có thể dán mã vào công cụ hoặc lưu trữ mã trên một trang đang hoạt động.
Các công cụ khác
Xem thêm thông tin tham khảo và giờ hỗ trợ trên trang trợ giúp của chúng tôi.
Kiểm tra các trang được lưu trữ cục bộ hoặc bị tường lửa chặn
Google cung cấp một số công cụ để kiểm tra một trang web đang hoạt động. Ví dụ: Công cụ kiểm tra AMP và Công cụ kiểm tra kết quả nhiều định dạng. Tuy nhiên, nếu trang của bạn đang chạy trên máy tính cục bộ mà không có URL công khai hoặc nếu trang được lưu trữ phía sau tường lửa, bạn vẫn có thể kiểm tra trang bằng cách hiển thị một đường hầm đến trang cho công cụ kiểm tra. Điều này có thể hữu ích nếu bạn muốn kiểm tra một trang trước khi xuất bản trang công khai trên web hoặc thậm chí là trước một bước khác trong quy trình xuất bản.
Để kiểm tra trang được lưu trữ cục bộ hoặc bị chặn bởi tường lửa, hãy sử dụng một giải pháp tạo đường hầm như ngrok
. Các công cụ như vậy cung cấp một URL công khai kết nối với một trang không công khai trên máy chủ cục bộ hoặc máy chủ bị chặn bởi tường lửa.
Trong ví dụ sau đây, trước tiên chúng tôi khởi động SimpleHTTPServer
của python để lưu trữ một trang trên máy tính cục bộ, sau đó dùng ngrok để hiển thị trang đó trên một URL có thể truy cập công khai:
Bước 1
Khởi động máy chủ HTTP cục bộ để lưu trữ trang trên một cổng nhất định. Trong ví dụ này, chúng ta đã chọn cổng 5326
.
SimpleHTTPServer
ánh xạ thư mục hiện tại làm thư mục gốc của trang.
python3 -m http.server 5326
Serving HTTP on 0.0.0.0 port 5326
...
Bước 2
Trên một thiết bị đầu cuối khác, hãy khởi động ứng dụng ngrok
cục bộ, nghe cổng 5326
mà chúng ta đã mở ở bước 1.
./ngrok http 5326 --request-header-add ngrok-skip-browser-warning:1
ngrok by @inconshreveable (Ctrl+C to quit)
Session Status online
Version 2.2.4
Region United States (us)
Web Interface http://127.0.0.1:4040
Forwarding http://ad0a5735.ngrok.io -> localhost:5326
Forwarding https://ad0a5735.ngrok.io -> localhost:5326
Connections ttl opn rt1 rt5 p50 p90
0 0 0.00 0.00 0.00 0.00
Bước 3
Chuyển URL mà ngrok đã mở đến công cụ kiểm tra mà bạn chọn.
URL gốc trong ví dụ của chúng tôi là http://ad0a5735.ngrok.io
, vì vậy nếu trang của chúng tôi được lưu
cục bộ tại ~/testwebdir/mypage.html
và chúng tôi đã khởi động máy chủ trên qua
~/testwebdir/
, thì chúng tôi có thể kiểm tra được http://ad0a5735.ngrok.io/mypage.html
.
Trong công cụ Kiểm tra kết quả nhiều định dạng, bạn trực tiếp có thể dán URL đó hoặc truy cập https://search.google.com/test/rich-results/result?url=http%3A%2F%2Fad0a5735.ngrok.io%2Fmypage.html
.
Xin lưu ý rằng các máy chủ cục bộ và giải pháp đường hầm khác nhau sẽ ánh xạ các trang của bạn theo cách khác nhau.
Ngoài ra, một số giải pháp đường hầm (không phải ngrok) sẽ tự động bảo vệ URL công khai tạm thời bằng robots.txt. Tệp này sẽ ngăn bạn chạy các quy trình kiểm tra của Google với chúng. Các công cụ kiểm tra của Google sẽ tuân theo tệp robots.txt. Hãy đọc tài liệu về giải pháp đường hầm và phần mềm lưu trữ web mà bạn sử dụng.
Gỡ lỗi truy cập
Nếu bạn gặp lỗi truy cập khi sử dụng công cụ kiểm tra của Google:
- Kiểm tra để đảm bảo rằng trang của bạn không được bảo vệ bằng tệp robots.txt và không yêu cầu đăng nhập.
- Hãy thử truy cập trang của bạn từ bên ngoài tường lửa, trên một máy tính khác hoặc dùng Chrome ở Chế độ ẩn danh.