Ahora estamos en LinkedIn: Para obtener noticias y recursos de la Búsqueda de Google sobre cómo hacer que tu sitio sea visible,
síguenos en LinkedIn.
Gestión de contenido duplicado legítimo entre dominios
Organízate con las colecciones
Guarda y clasifica el contenido según tus preferencias.
miércoles, 17 de febrero de 2010
Anteriormente ya hablamos de
cómo gestionar el contenido duplicado dentro de un mismo sitio web
. Hoy abordaremos una situación similar, pero entre diferentes sitios web, en diferentes dominios. Algunos sitios disponen de razones legítimas por las que se duplica contenido entre ellos. Por ejemplo, cuando se realiza la migración a un nuevo nombre de dominio utilizando un servidor web que no puede crear redirecciones. Para ayudar con los problemas que surgen en estos casos, anunciamos nuestro apoyo al
atributo rel="canonical" entre dominios
.
Cómo gestionar el contenido duplicado entre dominios:
-
Elige el dominio preferido
Cuando te enfrentas al contenido duplicado, los motores de búsqueda en general van a escoger una versión y filtrará las demás. Esto también puede ocurrir entre varios nombres de dominio. Así que, mientras los motores de búsqueda son en general bastante buenos a la hora de hacer una elección razonable, muchos webmasters prefieren tomar esa decisión ellos mismos.
-
Reduce el contenido duplicado en tu web
Antes de comenzar con cuestiones de contenido duplicado entre dominios, asegúrate de que te haces cargo debidamente del
contenido duplicado de tu web
en primer lugar.
-
Habilita el rastreo y el uso de redirecciones 301 siempre que sea posible
Cuando sea posible, lo más importante será utilizar
redirecciones 301
. Estas redirecciones envían a tus visitantes y a los rastreadores de los motores de búsqueda a tu dominio preferido y dejan muy claro la URL que debería indexarse. Este suele ser el método preferido, ya que da una orientación clara a todos los que acceden al contenido. Ten en cuenta que, para que los rastreadores de motores de búsqueda descubran estas redirecciones, ninguna de las URL en la cadena de redirección tiene que estar bloqueada con un
archivo robots.txt
. No te olvides de señalar si prefieres con www o sin www, haciendo las correspondientes redirecciones y
marcando la opción de las Herramientas para webmasters
.
-
Utiliza rel="canonical" entre dominios
Hay situaciones en las que no es fácil crear redirecciones. Por ejemplo, cuando migras tu sitio web desde un servidor que no realiza redirecciones. En una situación como ésta,
puedes utilizar
rel="canonical"
entre dominios
, para especificar la URL exacta del dominio preferido para la indexación. Aunque se considera una sugerencia y no una directriz, hacemos todo lo posible para seguirlo cuando sea posible.
¿Todavía tienes preguntas?
P:
¿Tienen que ser idénticas las páginas?
R:
No, pero deben ser similares. Si hay una ligera diferencia está bien.
P:
Por razones técnicas no puedo incluir una relación 1:1 para la asignación de las URL de mis sitios. ¿Puedo simplemente dirigir el rel ="canonical" a la página principal de mi sitio preferido?
R:
No, esto podría ocasionar problemas. Proporcionar la antigua dirección URL y la nueva URL para cada página es la mejor manera de utilizar el rel="canonical".
P:
Distribuyo mi contenido/mis descripciones de productos. ¿Necesitan mis editores utilizar el rel ="canonical"?
R:
Dejamos esto a tu elección y a la de tus editores. Si el contenido es bastante similar, puede tener sentido utilizar el atributo, si ambas partes están de acuerdo.
P:
Mi servidor no puede hacer una redirección 301 (permanente). ¿Puedo utilizarlo para mover mi sitio?
R:
Si es posible, debes trabajar con tu alojamiento web o tu servidor web para hacer una redirección 301. Ten en cuenta que lo consideramos una sugerencia y puede que otros motores de búsqueda lo manejen de manera diferente. Pero si una redirección 301 es imposible por alguna razón, entonces esto puede valerte. Para obtener información adicional, consulta nuestras
directrices sobre cambios de ubicación de sitios
.
P:
¿Debo usar metaetiquetas
noindex en las páginas con este atributo?
R:
No, ya que esas páginas no serían equivalentes en cuanto a indexación. Se permitiría una y se bloquearía la otra. Además, es importante que no es excluyan estas páginas del rastreo con un archivo robots.txt ya que, de lo contrario, los rastreadores de los motores de búsqueda no serán capaces de descubrir el rel="canonical".
Esperamos que esto facilite la gestión de contenido duplicado. ¿Todavía hay lugares en los que crees que el contenido duplicado causa problemas? ¡Háznoslo saber en nuestro
Foro de para webmasters
!
Publicado por John Mueller, Webmaster Trends Analyst. Traducido por Cristina, equipo de Calidad de búsqueda.
A menos que se indique lo contrario, el contenido de esta página está sujeto a la licencia Reconocimiento 4.0 de Creative Commons y las muestras de código están sujetas a la licencia Apache 2.0. Para obtener más información, consulta las políticas del sitio web de Google Developers. Java es una marca registrada de Oracle o sus afiliados.
Última actualización: 2010-02-01 (UTC).
[null,null,["Última actualización: 2010-02-01 (UTC)."],[[["\u003cp\u003eThis post explains how to handle duplicate content across different websites, focusing on the cross-domain \u003ccode\u003erel="canonical"\u003c/code\u003e link element.\u003c/p\u003e\n"],["\u003cp\u003eSearch engines often choose one version of duplicate content and filter others, but webmasters can influence this choice using redirects or the \u003ccode\u003erel="canonical"\u003c/code\u003e tag.\u003c/p\u003e\n"],["\u003cp\u003eUsing 301 redirects is the preferred method for consolidating duplicate content across domains as it provides clear signals for both users and search engines.\u003c/p\u003e\n"],["\u003cp\u003eThe cross-domain \u003ccode\u003erel="canonical"\u003c/code\u003e link element can be used when redirects are not feasible, allowing webmasters to specify the preferred domain for indexing.\u003c/p\u003e\n"],["\u003cp\u003eWhile \u003ccode\u003erel="canonical"\u003c/code\u003e is a hint rather than a directive, Google tries to follow it to consolidate duplicate content for a better user experience.\u003c/p\u003e\n"]]],["To manage cross-domain content duplication, utilize the cross-domain `rel=\"canonical\"` link element to specify the preferred URL for indexing when `301` redirects are not feasible. Prioritize reducing in-site duplication first. Ensure crawlers can access pages with `rel=\"canonical\"` by not blocking them in `robots.txt` files. While pages don't need to be identical, they should be similar. The `rel=\"canonical\"` method is a hint and may be handled differently by other search engines.\n"],null,["# Handling legitimate cross-domain content duplication\n\n| It's been a while since we published this blog post. Some of the information may be outdated (for example, some images may be missing, and some links may not work anymore). Specifically, `rel=\"canonical\"` is no longer recommended for [syndicated content](/search/docs/crawling-indexing/canonicalization-troubleshooting#syndicated-content).\n\nTuesday, December 15, 2009\n\n\nWe've recently discussed several ways of\n[handling duplicate content on a single website](/search/blog/2009/10/reunifying-duplicate-content-on-your);\ntoday we'll look at ways of handling similar duplication across different websites, across\ndifferent domains. For some sites, there are legitimate reasons to duplicate content across\ndifferent websites---for instance, to migrate to a new domain name using a web server that\ncannot create server-side redirects. To help with issues that arise on such sites, we're\nannouncing our support of the\n**cross-domain `rel=\"canonical\"` link element**.\n\nWays of handling cross-domain content duplication:\n--------------------------------------------------\n\n- **Choose your preferred domain** \n When confronted with duplicate content, search engines will generally take one version and filter the others out. This can also happen when multiple domain names are involved, so while search engines are generally pretty good at choosing something reasonable, many webmasters prefer to make that decision themselves.\n- **Reduce in-site duplication** \n Before starting on cross-site duplicate content questions, make sure to [handle duplication within your site](/search/docs/crawling-indexing/consolidate-duplicate-urls) first.\n- **Enable crawling and use `301` (permanent) redirects where possible** Where possible, the most important step is often to use appropriate [`301` redirects](/search/docs/crawling-indexing/301-redirects). These redirects send visitors and search engine crawlers to your preferred domain and make it very clear which URL should be indexed. This is generally the preferred method as it gives clear guidance to everyone who accesses the content. Keep in mind that in order for search engine crawlers to discover these redirects, none of the URLs in the redirect chain can be disallowed via a [robots.txt file](/search/docs/crawling-indexing/robots/intro). Don't forget to handle your www / non-www preference with appropriate redirects and in [Webmaster Tools](https://www.google.com/support/webmasters/bin/answer.py?answer=44231).\n- **Use the cross-domain `rel=\"canonical\"` link element** \n There are situations where it's not easily possible to set up redirects. This could be the case when you need to move your website from a server that does not feature server-side redirects. In a situation like this, **you can use the\n [`rel=\"canonical\"` link element](/search/docs/crawling-indexing/consolidate-duplicate-urls)\n across domains** to specify the exact URL of whichever domain is preferred for indexing. While the `rel=\"canonical\"` link element is seen as a hint and not an absolute command, we do try to follow it where possible.\n\nStill have questions?\n---------------------\n\n\n**Do the pages have to be identical?** \n\nNo, but they should be similar. Slight differences are fine.\n\n\n**For technical reasons I can't include a 1:1 mapping for the URLs on my sites. Can I just\npoint the `rel=\"canonical\"` at the home page of my preferred site?** \n\nNo; this could result in problems. A mapping from old URL to new URL for each URL on the old site\nis the best way to use `rel=\"canonical\"`.\n\n\n**I'm offering my content / product descriptions for syndication. Do my publishers need to use\n`rel=\"canonical\"`?** \n\nWe leave this up to you and your publishers. If the content is similar enough, it might make\nsense to use `rel=\"canonical\"`, if both parties agree.\n\n\n**My server can't do a `301` (permanent) redirect. Can I use\n`rel=\"canonical\"` to move my site?** \n\nIf it's at all possible, you should work with your webhost or web server to do a\n`301` redirect. Keep in mind that we treat `rel=\"canonical\"` as a hint,\nand other search engines may handle it differently. But if a `301` redirect is\nimpossible for some reason, then a `rel=\"canonical\"` may work for you. For more\ninformation, see our\n[guidelines on moving your site](/search/docs/crawling-indexing/site-move-no-url-changes).\n\n\n**Should I use a `noindex` robots\n[`meta` tag](/search/docs/advanced/crawling/special-tags)\non pages with a `rel=\"canonical\"` link element?** \n\nNo, since those pages would not be equivalent with regards to indexing---one would be allowed\nwhile the other would be blocked. Additionally, it's important that these pages are not\ndisallowed from crawling through a robots.txt file, otherwise search engine crawlers will not\nbe able to discover the `rel=\"canonical\"` link element.\n\n\nWe hope this makes it easier for you to handle duplicate content in a user-friendly way. Are\nthere still places where you feel that duplicate content is causing your sites problems? Let us\nknow in the\n[Webmaster Help Forum](https://support.google.com/webmasters/community/thread?tid=07603d23e8071644)!\n\n\nPosted by\n[John Mueller](https://twitter.com/JohnMu),\nWebmaster Trends Analyst, Google Zürich"]]