Sesiones de consulta sobre SEO de Google, septiembre de 2023

Esta es la transcripción de la edición de septiembre de 2023 de las sesiones de consulta sobre SEO de Google. Para obtener ayuda específica sobre un sitio, te recomendamos que publiques una pregunta en la Comunidad de ayuda de la Central de la Búsqueda de Google.

¿Google indexa incorrectamente la versión www de mi sitio web?

John: Wan pregunta: ¿Google indexa incorrectamente la versión de www de mi sitio web? Se supone que la página correcta debe ser HTTP y el nombre de dominio debe ser .my, sin www.

Hola, Wan. Estuve revisando tus páginas y parece que tu servidor redirecciona automáticamente de la versión sin www a la versión con www, y configura el elemento canónico rel del vínculo correctamente. A primera vista, si usas Chrome, puede parecer que no hay www al principio, pero debes hacer clic dos veces en la URL de la parte superior del navegador para ver la URL completa con www. En la práctica, no hay problema, porque tanto la versión de un sitio con www como la que no tiene www son totalmente aceptables en la Búsqueda de Google. ¡Cuántas www!

¿Por qué los datos filtrados suman más que los generales en Search Console?

Gary: Ornella pregunta: ¿Por qué los datos filtrados suman más que los datos generales en Search Console? No tiene sentido.

Antes que nada, quiero decir que me encanta esta pregunta, pero probablemente sea por el motivo equivocado. La respuesta breve es que hacemos un uso intensivo de algo llamado filtros Bloom porque necesitamos controlar una gran cantidad de datos, y estos filtros pueden ahorrarnos mucho tiempo y almacenamiento. La respuesta larga sigue siendo que usamos mucho los filtros Bloom porque necesitamos manejar una gran cantidad de datos, pero también quiero decir algo sobre estos filtros: cuando se maneja una gran cantidad de elementos en un conjunto (miles de millones o hasta billones de elementos), las búsquedas rápidas son muy difíciles. Para eso sirven los filtros Bloom: permiten consultar un conjunto diferente que contiene un hash de elementos posibles en el conjunto principal y puedes buscar los datos allí. Como primero se buscan los hashes, el proceso es bastante rápido, pero a veces se genera una pérdida de datos (intencional o no) y eso es lo que estás experimentando: con menos datos para analizar, las predicciones sobre si algo existe o no en el conjunto principal son más precisas. Básicamente, los filtros Bloom aceleran las búsquedas porque predicen si algo existe en un conjunto de datos, pero esto afecta negativamente la exactitud. Cuanto menor sea el conjunto de datos, más exactas serán las predicciones.

¿Por qué no se indexan correctamente las páginas de mi sitio web de Google Sites?

John: Se envió una pregunta en francés que, básicamente, consulta por qué las páginas de un sitio web de Google Sites no se indexaron correctamente.

Es genial recibir preguntas en otros idiomas. Para empezar, es importante saber que los sitios web creados en Google Sites pueden indexarse en la Búsqueda de Google y, de hecho, se indexan. Sin embargo, es un poco difícil hacer un seguimiento de las URLs que se usan en Google Sites, ya que la versión pública puede ser diferente de la URL que ves al acceder. En pocas palabras, si bien el sitio web es técnicamente indexable, esto no es ideal para los fines de SEO y el seguimiento puede ser complejo en Search Console. Si la SEO es tu consideración principal, tal vez valga la pena explorar otras opciones y, antes de usarlas, verificar las ventajas y desventajas. Para realizar un seguimiento del rendimiento en Search Console, también puedes usar tu propio nombre de dominio para el contenido de Google Sites. Usar tu propio nombre de dominio facilita la migración (en caso de que decidas hacerla) y te permite verificar la propiedad de todo el dominio para Search Console.

Gary: Sarabjit pregunta: Nuestro sitio web tiene varios botones y, cuando se hace clic en ellos, se obtienen vínculos a otras páginas. ¿Podrá Google rastrear estos vínculos?

En general, Googlebot no hace clic en botones.

¿Una "publicación de invitado" (para obtener un vínculo externo) infringe los lineamientos de Google si estoy redactando contenido valioso?

John: Brooke pregunta: Actualmente, la mayoría de los sitios web solo ofrecen la opción de comprarles una "publicación de invitado" (para obtener un vínculo externo). ¿Esto infringe los lineamientos de Google si estoy redactando contenido valioso?

Hola, Brooke, gracias por publicar tu pregunta. Efectivamente, tu razonamiento es correcto. El uso de las publicaciones de invitados para crear vínculos infringe nuestras políticas de spam. Lo importante es que estos vínculos estén calificados de una manera que indique que no afectan los resultados de la búsqueda. Puedes hacer esto con los atributos rel=nofollow o rel=sponsored en los vínculos. Es correcto usar publicidad para promocionar tu sitio, pero los vínculos deben bloquearse con el método que te explico.

¿Es valioso el contenido de una página de categoría de comercio electrónico para mejorar las clasificaciones generales?

Gary: Brooke pregunta: ¿Es valioso el contenido de una página de categoría de comercio electrónico para mejorar las clasificaciones generales?

Puedes agregar el contenido que desees a tus páginas; después de todo, son tuyas. Sin embargo, te pedimos que no incluyas texto de baja calidad generado automáticamente que se repita una y otra vez en todas tus páginas de categorías. Cualquier persona lo considera absurdo. Si necesitas contenido para tus páginas, agrega contenido que a los usuarios realmente les resulte útil, en lugar de agregar contenido porque podría servir para la búsqueda o algo así. Consulta también nuestras recomendaciones de comercio electrónico.

¿Las etiquetas semánticas incorrectas hacen que Google comprenda de forma deficiente el contenido del sitio web?

John: ¿Las etiquetas semánticas incorrectas hacen que Google tenga una comprensión general más deficiente del contenido del sitio web y, por lo tanto, una menor capacidad para asignarlo a una rama? Específicamente, las etiquetas <hr> indican un cambio de tema, pero es posible que solo las use por motivos de diseño.

Es una pregunta interesante. En general, el uso correcto de las etiquetas HTML semánticas puede ayudar a los motores de búsqueda a comprender mejor el contenido de una página y su contexto. Por ejemplo, si marcas encabezados en una página, es una señal clara de que crees que el contenido se ajusta a ese encabezado. No es un camino secreto para llegar a los primeros lugares de las clasificaciones, pero si tenemos problemas para entender lo que quieres decir en el texto, brindar un resumen claro en forma de encabezados puede ayudar. Debido a que se trata de un detalle sutil que depende de cuánto entendamos la página de otra forma, sería una buena práctica asegurarte de abarcarlo todo. La cuestión de las etiquetas HTML semánticas correctas e incorrectas también es algo muy sutil. ¿Los motores de búsqueda siguen entendiendo tu página? Entonces, probablemente no notarás una diferencia en la forma en que la entienden. ¿El significado se vuelve confuso? Entonces, quizá te convenga usar una estructura semántica para aclararlo. Con respecto al ejemplo específico de las etiquetas <hr>, no se me ocurre una situación en la que podría haber una diferencia en la comprensión de una página por usarlas de manera incorrecta. Hay muchas maneras de cometer errores, pero los que imagino que un diseñador podría experimentar con etiquetas <hr> no son nada graves. Todo este texto se resume en una palabra: "depende".

En Google Search Console, el informe de las páginas de 404 incluye muchas URLs que parecen ser de JSON o JavaScript. ¿Deberíamos ignorar esto?

Gary: Reza pregunta: En Google Search Console, el informe de las páginas de 404 está lleno de URLs que parecen haberse recopilado por error en algún código JSON o JavaScript. ¿Deberíamos ignorar esto?

Puedes ignorarlas o solo agregar un encabezado HTTP noindex.

John: Dhruv pregunta: ¿Puede el archivo de índice de mapa del sitio tener vínculos a archivos de mapas de sitios en otros dominios?

Hola, Dhruv, tu pregunta es muy interesante. La respuesta de Google es un absoluto "quizás", así que te sugiero que no uses una configuración como esa. Puedes enviar mapas de sitios de URLs que no estén en el mismo dominio en dos situaciones: enviando el mapa del sitio mediante robots.txt o verificando la propiedad de todos los dominios en Search Console. Específicamente, la propiedad de Search Console puede ser sutil y no visible de inmediato cuando analizas el sitio web, por lo que es fácil olvidar esa conexión. Si estás trabajando en archivos de mapas de sitios y decides usar una configuración como esta, te sugerimos que agregues un comentario XML al archivo del mapa del sitio para que recuerdes estos requisitos y no lo rompas por error en el futuro. Dado que Search Console es específico de Google, te recomendamos que verifiques los requisitos que otros motores de búsqueda podrían tener al respecto.

¿Cómo se reduce la probabilidad de que Google elija sus propias metadescripciones para los sitios web?

Gary: Sam Bowers pregunta: ¿Cómo se reduce la probabilidad de que Google elija sus propias metadescripciones para los sitios web?

Buena pregunta. Aunque no ocurre siempre, nuestros algoritmos suelen usar la metadescripción cuando no hay mucho contenido en la página o cuando la metadescripción es más relevante para la búsqueda de un usuario que el contenido real de la página. Obtén más información sobre las descripciones y los fragmentos.

¿Hay alguna manera de especificar que los bots de motores de búsqueda no rastreen determinadas secciones de una página?

John: ¿Hay alguna manera de especificar que los bots de motores de búsqueda no rastreen determinadas secciones de una página? (la página está habilitada para el rastreo y la indexación). Además, este usuario tiene muchos duplicados en los "megamenús" y le gustaría bloquearlos.

Sí, hay medidas que puedes tomar para evitar la indexación de partes de una página. Sin embargo, no hace falta bloquear elementos para que no se indexen, especialmente elementos comunes como encabezados, menús, barras laterales o pies de página. Los motores de búsqueda se ocupan de la Web tal como está y, a veces, hay megamenús gigantes o pies de página excesivos, y eso está bien. Para otros contenidos de una página, puedes usar un iframe con una fuente no permitida por robots.txt o incorporar contenido con JavaScript que también esté bloqueado por robots.txt. Si solo deseas evitar que se muestre algo en un fragmento, una buena manera de hacerlo es usar el atributo data-nosnippet. Repito: No es necesario complejizar tanto las cosas solo para ocultar un menú. La complejidad innecesaria aumenta el riesgo de errores inesperados, por lo que conviene limitarla a los casos en los que realmente sea necesaria.

¿Recomiendas el desplazamiento infinito en las páginas web? ¿Hay alguna consecuencia para el tráfico orgánico o Googlebot?

Gary: Jeethu pregunta: ¿Recomiendas el desplazamiento infinito en las páginas web? ¿Hay alguna consecuencia para el tráfico orgánico o Googlebot si agrego esa función?

Depende de cómo implementes el desplazamiento infinito. Si también es posible acceder a cada parte o página virtual y se puede encontrar a través de una URL única, por lo general, no debería haber problemas con el desplazamiento infinito.

John: Ryan pregunta: Si una página principal tiene vínculos que se muestran en la versión para dispositivos móviles, pero están ocultos detrás de un botón de activación de JavaScript en computadoras de escritorio y no se incluyen en el código HTML a menos que se haga clic en ellos, ¿les reducirá Google el valor?

Hola, Ryan. Con la indexación centrada en dispositivos móviles, usamos la versión para dispositivos móviles de una página como base para la indexación y la detección de vínculos. Si la versión para dispositivos móviles tiene todo el contenido, no hace falta nada más. Me sorprendió que haya menos contenido en la versión para computadoras, pero supongo que tendrás tus motivos.

¿Google indexa los archivos PDF que se guardan en Google Drive y que no están alojados en un sitio web?

Gary: Anónimo pregunta: ¿Google indexa los archivos PDF que se guardan en Google Drive y que no están alojados en un sitio web? Si es así, ¿cuánto tiempo demora?

Sí, Google puede indexar archivos PDF públicos alojados en Google Drive, pues se trata de una URL más. Al igual que con cualquier URL, la indexación de estos PDF pude demorar desde unos pocos segundos hasta la eternidad.

¿Cómo rastrea Google el contenido de Scrolljacking? ¿Afecta las clasificaciones este enfoque de la UX?

John: Matt envió una pregunta que dice: "Scrolljacking" es cada vez más popular en la Web. En general, se considera una experiencia del usuario deficiente. ¿Cómo rastrea Google este contenido? ¿Afecta las clasificaciones este enfoque de la UX? También agregó un vínculo a un artículo sobre el scrolljacking que vincularé en la transcripción.

Hola, Matt, tu pregunta es muy interesante. No sabía que se llamaba "scrolljacking", gracias por el vínculo. No creo que esta configuración sea abusiva, por lo que no habrá consecuencias directas. Sin embargo, quizá observes consecuencias técnicas de segundo orden. Por ejemplo, Google renderiza páginas cargándolas en un dispositivo móvil que, en teoría, es muy grande. Si la página no muestra el contenido allí debido a manipulaciones con los eventos de desplazamiento, es posible que nuestros sistemas den por sentado que el contenido no se ve correctamente. En resumen, lo vería más como un posible problema de renderización que de calidad.

¿Por qué está indexada la URL a pesar de estar bloqueada mediante robots.txt en mi Google Search Console?

Gary: Deniz Can Aral pregunta ¿Por qué una URL está indexada a pesar de estar bloqueada mediante robots.txt en mi Google Search Console?

Esta es una pregunta relativamente común: Google puede indexar la URL (solo la URL, no el contenido) incluso si el rastreo de esa URL se bloquea mediante robots.txt. Sin embargo, la cantidad de URLs de este tipo en nuestro índice es menor, porque este fenómeno ocurre solo si la URL bloqueada es muy buscada en Internet. Si esto te trae problemas, permite el rastreo de la URL y usa una regla noindex en los encabezados HTTP o una etiqueta <meta>.

Tenemos contenido de IA no deseado. ¿Cómo puedo corregirlo o quitarlo de mi sitio web?

John: Sonia pregunta: Contratamos a algunos redactores de contenido, pero nos dieron contenido de IA. ¿Cómo puedo solucionar el problema? ¿Simplemente borro el contenido de IA? ¿Lo reemplazo con contenido nuevo? ¿Borro todo y creo otro sitio web con una URL nueva? ¿Qué puedo hacer?

Sonia, no sé qué decirte. ¿Publicaste a ciegas contenido de autores externos sin revisarlo? Me parece una mala idea, incluso aunque no hubiera problemas con el contenido de IA. Sin importar los motivos ni la fuente, si publicaste contenido de baja calidad en tu sitio web y ya no quieres que te asocien a él, puedes quitarlo o corregirlo. Te recomiendo que analices toda la situación: ¿Falta este tipo de contenido en la Web y tu sitio podría agregar un valor significativo para los usuarios en general? ¿O se trata de contenido con codificación hash que ya existe en el resto de la Web? También puedes pensarlo de esta manera: Si tu contenido es básicamente el mismo que ya existe en otros lugares, ¿por qué los motores de búsqueda deberían indexarlo y, más aún, mostrarlo en las primeras posiciones de los resultados de la búsqueda? Además, crear un sitio web de calidad requiere más que buenos artículos: se necesita una estrategia clara y procesos que garanticen que todos estén al tanto de tus objetivos.

Las URLs indexadas aumentaron mucho de un día para el otro. ¿Cuáles son los motivos?

Gary: Lorenzo pregunta: Las URLs indexadas aumentaron mucho de un día para el otro. ¿Cuáles son los motivos?

Quizás conseguimos más discos duros, liberamos espacio o simplemente descubrimos esas nuevas URL. Es difícil saberlo. Como sea, son excelentes noticias. ¡A celebrar!

¿Puede Google usar varios tamaños de archivo en un archivo de ícono de página?

John: Dave pregunta: ¿Puede Google usar varios tamaños de archivo en un solo archivo de ícono de página? ¿Comprende varios íconos marcados con el atributo de tamaño y elige uno adecuado?

Hola, Dave. Técnicamente, el formato de archivo .ico te permite proporcionar archivos en varias resoluciones. Sin embargo, cada vez se usan más tamaños para diversos fines. En general, creo que es mejor especificar los tamaños y los archivos de forma individual. Google admite varios tamaños de íconos de página en HTML; por lo tanto, te recomiendo esa opción si hay tamaños específicos que quieras definir.

¿Google juzga las partes de un sitio web de forma diferente según el CMS que usen?

Gary: Vivienne pregunta: ¿Google juzga las partes de un sitio web de forma diferente según el CMS que usen?

No.

En la Búsqueda de Google, nuestro sitio web muestra una descarga de PDF como página principal. ¿Se puede cambiar el resultado de la búsqueda?

John: Anna pregunta: El resultado de la Búsqueda de Google del sitio web de nuestra fundación debe volver a rastrearse, ya que muestra una descarga en PDF como página principal. Nuestro sitio web es de una fundación holandesa de derechos humanos. ¿Se puede cambiar el resultado de la búsqueda?

Hola, Anna. Revisé tu sitio web y el motivo por el que se muestran otras páginas en lugar de tu página principal es que la página principal tiene una etiqueta noindex robots <meta>. Esta etiqueta <meta> impide la indexación de esa página. Una vez que la quites, el problema debería solucionarse.

Cuando busco mi sitio web en la Búsqueda de Google, el primer resultado es una página de producto y no mi página de bienvenida. ¿Por qué?

John: Julien pregunta: Cuando busco mi sitio web en la Búsqueda de Google, el primer resultado es una página de producto y no mi página de bienvenida. ¿A qué se debe? La página de producto ni siquiera está preparada con la SEO, pero mi página de bienvenida sí lo está.

Hola, Julien. Google utiliza una serie de factores para intentar averiguar qué páginas podrían ser las más relevantes para los usuarios en búsquedas específicas. En la recuperación de información, uno de los conceptos se basa en la intención percibida del usuario. En resumen, qué intentaba hacer el usuario cuando realizó la búsqueda. ¿Busca más información sobre un producto o una empresa? ¿O está buscando comprar el producto ahora mismo? Con el tiempo, esto también puede cambiar para la misma consulta. En resumen, incluso cuando una página no esté preparada para la SEO, puede ocurrir que aparezca en la búsqueda si los sistemas creen que es relevante en ese momento. En la práctica, mi recomendación es comprender las diferentes formas en las que los usuarios pueden llegar a tu sitio y tratar de satisfacer sus necesidades de forma adecuada. Así, independientemente del lugar al que lleguen, tendrán una buena experiencia.

Recibí una alerta de Search Console para mejorar los problemas de INP. ¿Cómo hago el cálculo y qué solución es la más sencilla?

John: Alejandro envió una pregunta: Hola a John y al equipo de Google. Hoy recibí una alerta de Search Console para mejorar los problemas de INP. ¿Cómo se calculan estos datos y cuál es la forma más fácil de corregirlos?

No tengo una respuesta completa para darte, pero hay bastante documentación sobre Interaction to Next Paint (INP) en el sitio web.dev. Te recomendamos revisar esa información si te interesa mejorar las puntuaciones de tu sitio. Ten en cuenta que INP todavía no forma parte de las Métricas web esenciales y que estas son solo uno de los diversos aspectos que afectan nuestra experiencia de página y nuestros sistemas de contenido útil. Si bien mejorar el INP sin dudas afectará positivamente la experiencia del usuario, no esperaría que cambie mucho la clasificación de búsqueda.

¿Cómo quito 30,000 URLs de Google Search Console después de un hackeo de palabras clave japonesas?

John: Heather pregunta: ¿Cómo quito 30,000 URLs de GSC después de un hackeo de palabras clave japonesas?

Hola, Heather. Lamentamos que te hayan hackeado. Esperamos que ya hayas podido resolver el problema, pero tenemos algo de contenido sobre este tipo de hackeo en web.dev. Lo vincularé desde la transcripción. Ten en cuenta que este hackeo tiende a ocultarle a Google el contenido hackeado, por lo que es posible que necesites ayuda para verificar que se haya quitado por completo. En cuanto a los resultados de la búsqueda, debido a la cantidad de páginas involucradas, te recomendamos empezar por las páginas más visibles y resolver el problema manualmente quitándolas o reindexándolas. El resto se irá solucionando solo. Si buscas de forma explícita el contenido hackeado, seguirás encontrándolo durante bastante tiempo. Sin embargo, el usuario promedio buscará tu sitio y el objetivo es que los resultados de esas búsquedas sean correctos.

¿Por qué se quitan del índice mis páginas después de enviarlas para que se indexen en Search Console? Ya me ha pasado varias veces.

John: Grace pregunta: ¿Por qué se quitan del índice mis páginas después de enviarlas para que se indexen en Search Console? Ya me ha pasado varias veces.

Hola, Grace. No puedo decir mucho sin conocer las páginas en cuestión, pero podría ser que nuestros sistemas no estén convencidos sobre el valor de tu sitio y su contenido. Casi nunca indexamos todas las páginas de un sitio web, así que eso no debería sorprenderte. Es posible que logres la indexación una vez y que, con el paso del tiempo, nuestros sistemas vuelvan a evaluar el contenido y el sitio web, y decidan descartar esas páginas. Lo mejor es no seguir intentando forzar la indexación de esas páginas, sino hacer que nuestros sistemas estén convencidos de la calidad general de tu sitio web, el valor único que agrega a la Web y la coincidencia con lo que buscan los usuarios. Si haces esto, seremos nosotros quienes indexemos el contenido.