Organiza tus páginas con colecciones
Guarda y categoriza el contenido según tus preferencias.
Cómo administrar el rastreo de URLs de navegación por facetas
La navegación por facetas es una función común de los sitios web que permite a los visitantes cambiar la forma en que se muestran los elementos (por ejemplo, productos, artículos o eventos) en una página. Es una función popular y útil. Sin embargo, su implementación más común, que se basa en parámetros de URL, puede generar espacios de URL infinitos que perjudican al sitio web de varias maneras:
Rastreo excesivo: Debido a que las URLs creadas para la navegación por facetas parecen ser nuevas y los rastreadores no pueden determinar si las URLs serán útiles sin rastrearlas primero, los rastreadores suelen acceder a una gran cantidad de URLs de navegación por facetas antes de que los procesos determinen que las URLs son, de hecho, inútiles.
Rastreos de descubrimiento más lentos: Como se mencionó en el punto anterior, si el rastreo se dedica a URLs que no son útiles, los rastreadores tienen menos tiempo para dedicar a las URLs nuevas y útiles.
Una URL de navegación por facetas típica puede contener varios parámetros en la cadena de consulta relacionados con las propiedades de los elementos que filtran. Por ejemplo:
Si cambias cualquiera de los parámetros de URL products, color y size, se mostrará un conjunto diferente de elementos en la página subyacente. Esto suele implicar una gran cantidad de combinaciones posibles de filtros, lo que se traduce en una gran cantidad de URLs posibles. Para ahorrar recursos, te recomendamos que trates estas URLs de una de las siguientes maneras:
Si no necesitas que las URLs de navegación por facetas se indexen, evita el rastreo de estas URLs.
Si necesitas que las URLs de navegación por facetas se indexen, asegúrate de que sigan nuestras prácticas recomendadas detalladas en la siguiente sección. Ten en cuenta que el rastreo de URLs por facetas suele costar a los sitios grandes cantidades de recursos de procesamiento debido a la gran cantidad de URLs y operaciones necesarias para renderizar esas páginas.
Evita el rastreo de URLs de navegación por facetas
Si quieres ahorrar recursos del servidor y no necesitas que tus URLs de navegación por facetas aparezcan en la Búsqueda de Google, puedes evitar el rastreo de estas URLs de una de las siguientes maneras.
Usa robots.txt para no permitir el rastreo de URLs de navegación por facetas. A menudo, no hay una buena razón para permitir el rastreo de elementos filtrados, ya que consume recursos del servidor sin ningún beneficio o con un beneficio mínimo. En su lugar, permite el rastreo solo de las páginas de los elementos individuales junto con una página de ficha dedicada que muestre todos los productos sin filtros aplicados.
Otras formas de indicar una preferencia de qué URLs de navegación por facetas rastrear (o no) es usar el elemento linkrel="canonical" y el atributo de ancla rel="nofollow". Sin embargo, estos métodos suelen ser menos eficaces a largo plazo que los métodos mencionados anteriormente.
Con el uso de rel="canonical" para especificar qué URL es la versión canónica de una URL de navegación por facetas, es posible que, con el tiempo, disminuya el volumen de rastreo de las versiones no canónicas de esas URLs. Por ejemplo, si tienes 3 tipos de páginas filtradas, considera dirigir rel="canonical" a la versión no filtrada: https://example.com/items.shtm?products=fish&color=radioactive_green&size=tiny especifica <link rel="canonical" href="https://example.com/items.shtm?products=fish" >.
Puede ser beneficioso usar atributos rel="nofollow" en los puntos de anclaje que dirigen a páginas de resultados filtrados. Sin embargo, ten en cuenta que cada punto de anclaje que dirija a una URL específica debe tener el atributo rel="nofollow" para que sea eficaz.
Asegúrate de que las URLs de navegación por facetas sean óptimas para la Web
Si necesitas que tus URLs de navegación por facetas se rastreen y indexen, asegúrate de seguir estas prácticas recomendadas para minimizar los efectos negativos del rastreo de la gran cantidad de URLs potenciales de tu sitio:
Usa el separador de parámetros de URL estándar de la industria ("&"). Los rastreadores tienen dificultades para detectar caracteres como la coma (,), el punto y coma (;) y los corchetes ([ y ]) como separadores de parámetros (porque, a menudo, no lo son).
Si codificas filtros en la ruta de URL, como /products/fish/green/tiny, asegúrate de que el orden lógico de los filtros siempre sea el mismo y de que no haya filtros duplicados.
Muestra un código de estado HTTP 404 cuando una combinación de filtros no muestra resultados.
Si no hay "peces verdes" en el inventario del sitio, los usuarios y los rastreadores deberían recibir el error de "no encontrado" con el código de estado HTTP correcto (404). Esto también debería ser el caso si la URL contiene filtros duplicados o combinaciones de filtros sin sentido, y URLs de paginación inexistentes. Del mismo modo, si una combinación de filtros no tiene resultados, no redirecciona a una página de error común de "no encontrado". En su lugar, muestra un error de "no encontrado" con el código de estado HTTP 404 en la URL en la que se encontró.
[null,null,["Última actualización: 2025-08-04 (UTC)"],[],["Faceted navigation URLs, often using parameters, can lead to overcrawling and slower discovery of new content. To manage this, prevent crawling of these URLs using `robots.txt` to disallow specific parameters or employ URL fragments instead of parameters. Alternatively, use `rel=\"canonical\"` or `rel=\"nofollow\"` to reduce crawling of these pages. If faceted URLs are needed, utilize `&` for parameters, maintain consistent filter order, and return `404` for no-result combinations.\n"],null,["# Managing crawling of faceted navigation URLs | Google Search Central\n\nManaging crawling of faceted navigation URLs\n============================================\n\n\nFaceted navigation is a common feature of websites that allows its visitors to change how items\n(for example, products, articles, or events) are displayed on a page. It's a popular and useful\nfeature, however its most common implementation, which is based on URL parameters, can generate\ninfinite URL spaces which harms the website in a couple ways:\n\n- **Overcrawling**: Because the URLs created for the faceted navigation seem to be novel and crawlers can't determine whether the URLs are going to be useful without crawling first, the crawlers will typically access a very large number of faceted navigation URLs before the crawlers' processes determine the URLs are in fact useless.\n- **Slower discovery crawls**: Stemming from the previous point, if crawling is spent on useless URLs, the crawlers have less time to spend on new, useful URLs.\n\n\nA typical faceted navigation URL may contain various parameters in the query string related to the\nproperties of items they filter for. For example: \n\n```\nhttps://example.com/items.shtm?products=fish&color=radioactive_green&size=tiny\n```\n\n\nChanging any of the URL parameters `products`, `color`, and\n`size` would show a different set of items on the underlying page. This often means a\nvery large number of possible combinations of filters, which translates to a very large number of\npossible URLs. To save your resources, we recommend dealing with these URLs one of the following\nways:\n\n- If you don't need the faceted navigation URLs potentially indexed, prevent crawling of these URLs.\n- If you need the faceted navigation URLs potentially indexed, ensure that the URLs follow our best practices outlined in the following section. Keep in mind that crawling faceted URLs tends to cost sites large amounts of computing resources due to the sheer amount of URLs and operations needed to render those pages.\n\nPrevent crawling of faceted navigation URLs\n-------------------------------------------\n\n\nIf you want to save server resources and you don't need your faceted navigation URLs to show up in\nGoogle Search, you can prevent crawling of these URLs with one of the following ways.\n\n- **Use [robots.txt](/search/docs/crawling-indexing/robots/intro) to disallow crawling of faceted navigation URLs.** Oftentimes there's no good reason to allow crawling of filtered items, as it consumes server resources for no or negligible benefit; instead, allow crawling of just the individual items' pages along with a dedicated listing page that shows all products without filters applied. \n\n ```\n user-agent: Googlebot\n disallow: /*?*products=\n disallow: /*?*color=\n disallow: /*?*size=\n allow: /*?products=all$\n ```\n- **Use URL fragments to specify filters.** [Google Search generally doesn't support URL fragments in crawling and indexing](/search/docs/crawling-indexing/url-structure#fragments). If your filtering mechanism is based on URL fragments, it will have no impact on crawling (positive or negative). For example, instead of URL parameters, use URL fragments: \n\n ```\n https://example.com/items.shtm#products=fish&color=radioactive_green&size=tiny\n ```\n\n\nOther ways to signal a preference of which faceted navigation URLs (not) to crawl is using\n`rel=\"canonical\"` `link` element and the `rel=\"nofollow\"` anchor\nattribute. However, these methods are generally less effective in the long term than the\npreviously mentioned methods.\n\n- **Using [`rel=\"canonical\"`](/search/docs/crawling-indexing/consolidate-duplicate-urls#rel-canonical-link-method)\n to specify which URL is the canonical version of a faceted navigation URL** may, over time, decrease the crawl volume of non-canonical versions of those URLs. For example, if you have 3 filtered page types, consider pointing the `rel=\"canonical\"` to the unfiltered version: `https://example.com/items.shtm?products=fish&color=radioactive_green&size=tiny` specifies `\u003clink rel=\"canonical\" href=\"https://example.com/items.shtm?products=fish\" \u003e`.\n- **Using\n [`rel=\"nofollow\"`](/search/docs/crawling-indexing/qualify-outbound-links#nofollow)\n attributes on anchors pointing to filtered results pages** may be beneficial, however keep in mind that every anchor pointing to a specific URL must have the `rel=\"nofollow\"` attribute in order for it to be effective.\n\nEnsure the faceted navigation URLs are optimal for the web\n----------------------------------------------------------\n\n\nIf you need your faceted navigation URLs to be potentially crawled and indexed, ensure you're\nfollowing these best practices to minimize the negative effects of crawling the large number of\npotential URLs on your site:\n| Keep in mind that having these URLs crawled means an increased resource usage on your server and, potentially, slower discovery of new URLs on your site.\n\n1. **Use the industry standard URL parameter separator '`&`'.** Characters like comma (`,`), semicolon (`;`), and brackets (`[` and `]`) are hard for crawlers to detect as parameter separators (because most often they're not separators).\n2. If you're encoding filters in the URL path, such as `/products/`**fish** `/`**green** `/`**tiny**, ensure that the logical order of the filters always stays the same and that no duplicate filters can exist.\n3. **Return an HTTP `404` status code when a filter combination doesn't return\n results.** If there are no green fish in the site's inventory, users as well as crawlers should receive a \"not found\" error with the proper HTTP status code (`404`). This should also be the case if the URL contains duplicate filters or otherwise nonsensical filter combinations, and nonexistent pagination URLs. Similarly, if a filter combination has no results, don't redirect to a common \"not found\" error page. Instead, serve a \"not found\" error with the `404` HTTP status code under the URL where it was encountered. If [you have a single-page app](/search/docs/crawling-indexing/javascript/javascript-seo-basics#avoid-soft-404s) this might not be possible. Follow the best practices for single page apps."]]