Quản lý sơ đồ trang web bằng tệp chỉ mục sơ đồ trang web

Nếu có sơ đồ trang web vượt quá giới hạn kích thước, bạn sẽ cần chia sơ đồ trang web lớn này thành nhiều sơ đồ trang web để mỗi sơ đồ trang web mới đều dưới giới hạn kích thước. Sau khi chia nhỏ sơ đồ trang web, bạn có thể dùng một tệp chỉ mục sơ đồ trang web để gửi nhiều sơ đồ trang web cùng lúc.

Các phương pháp hay nhất về chỉ mục sơ đồ trang web

Định dạng XML của tệp chỉ mục sơ đồ trang web rất giống với định dạng XML của tệp sơ đồ trang web – được xác định theo Giao thức sơ đồ trang web. Tức là mọi yêu cầu đối với sơ đồ trang web cũng áp dụng cho tệp chỉ mục sơ đồ trang web.

Sơ đồ trang web được tham chiếu phải được lưu trữ trên cùng trang web với tệp chỉ mục sơ đồ trang web của bạn. Yêu cầu này sẽ được bỏ qua nếu bạn thiết lập tính năng gửi cho nhiều trang web.

Sơ đồ trang web được tham chiếu trong tệp chỉ mục sơ đồ trang web phải nằm cùng thư mục với tệp chỉ mục sơ đồ trang web hoặc trong một thư mục cấp thấp hơn trên sơ đồ phân cấp trang web. Ví dụ: Nếu tệp chỉ mục sơ đồ trang web nằm tại https://example.com/public/sitemap_index.xml, thì tệp đó chỉ có thể chứa sơ đồ trang web trong cùng thư mục hoặc trong thư mục cấp thấp hơn, chẳng hạn như https://example.com/public/shared/....

Bạn có thể gửi tối đa 500 tệp chỉ mục sơ đồ trang web cho mỗi trang web trong tài khoản Search Console của mình.

Ví dụ về chỉ mục sơ đồ trang web

Ví dụ sau đây minh hoạ một chỉ mục sơ đồ trang web ở định dạng XML, trong đó có liệt kê hai sơ đồ trang web:

<?xml version="1.0" encoding="UTF-8"?>
<sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">
  <sitemap>
    <loc>https://www.example.com/sitemap1.xml.gz</loc>
    <lastmod>2024-08-15</lastmod>
  </sitemap>
  <sitemap>
    <loc>https://www.example.com/sitemap2.xml.gz</loc>
    <lastmod>2022-06-05</lastmod>
  </sitemap>
</sitemapindex>

Tham chiếu đến chỉ mục sơ đồ trang web

Thẻ chỉ mục sơ đồ trang web được xác định theo cùng một không gian tên với sơ đồ trang web chung: http://www.sitemaps.org/schemas/sitemap/0.9

Để đảm bảo Google có thể sử dụng chỉ mục sơ đồ trang web của bạn, bạn phải sử dụng các thẻ bắt buộc sau đây:

Thẻ bắt buộc
sitemapindex Thẻ gốc của cây XML. Thẻ này bao gồm tất cả thẻ khác.
sitemap Thẻ mẹ cho mỗi sơ đồ trang web được liệt kê trong tệp. Đây là phần tử con trực tiếp duy nhất của thẻ sitemapindex.
loc Vị trí (URL) của sơ đồ trang web. Đây là thẻ con của thẻ sitemap. Một tệp chỉ mục sơ đồ trang web có thể có tối đa 50.000 thẻ loc.

Ngoài ra, các thẻ không bắt buộc sau đây có thể giúp Google lên lịch thu thập dữ liệu sơ đồ trang web của bạn:

Thẻ không bắt buộc
lastmod Xác định thời gian sửa đổi tệp sơ đồ trang web tương ứng. Thẻ này có thể là thẻ con của thẻ sitemap. Giá trị cho thẻ lastmod phải ở định dạng ngày giờ W3C.

Tài nguyên khác

Bạn muốn tìm hiểu thêm? Hãy tham khảo những tài nguyên sau: