jueves, 3 de febrero de 2011
El mes de enero trajo una
avalancha
de
historias
sobre la calidad de búsqueda de Google. Al leer algunos de los artículos recientes, uno se puede preguntar si nuestra calidad de búsqueda ha empeorado. En pocas palabras y según las evaluaciones métricas que hemos perfeccionado durante más de una década, la calidad de búsqueda de Google es mejor que nunca en cuanto a relevancia, actualidad y exhaustividad. Hoy en día, el spam en inglés de los resultados de Google es menos de la mitad de lo que era hace cinco años, y el spam en otros idiomas es incluso más bajo que en inglés. No obstante, hemos observado un pequeño aumento del nivel de spam en los últimos meses y, aunque ya hemos tomado medidas al respecto, hemos iniciado nuevas estrategias para continuar mejorando nuestra calidad de búsqueda.
Sólo a modo de recordatorio. El spam en la web es la basura que ves en los resultados de búsqueda cuando algunos sitios web intentan colarse en las posiciones superiores de los resultados de búsquedas o infringen las directrices de calidad del motor de búsqueda. Hace una década, la situación del spam en la web era tan mala que los motores de búsqueda ofrecían de forma regular spam que no tenía relación con las diversas búsquedas. Google ha conseguido reducir la mayor parte de ese tipo de "spam en le web puro", incluso aunque algunos spammers hayan recurrido a tácticas furtivas o hasta ilegales como piratear sitios web .
Al haber aumentado nuestro tamaño y la actualidad del contenido en los últimos meses, lógicamente hemos indexado una gran cantidad de contenido de buena calidad y también algo de spam. Para responder a este desafío, hemos lanzado recientemente un nuevo clasificador que actúa a nivel de documento y que dificulta a las páginas que contienen spam aparecer en las primeras posiciones de los resultados de búsqueda. Este nuevo clasificador es mejor para detectar spam en páginas web individuales, como por ejemplo, para detectar las palabras spam repetidas, que son los tipos de frases que se suelen ver en los comentarios de blog basura, automatizados y de promoción personal. También hemos mejorado de forma radical nuestra capacidad de detectar sitios pirateados, que eran una gran fuente de spam en 2010. Además, estamos evaluando diversos cambios que podrían reducir aún más los niveles de spam, incluido un cambio que afecta principalmente a los sitios que copian el contenido de otros y sitios con bajo nivel de contenido original. Vamos a seguir explorando formas de reducir el spam, así como nuevas maneras para que los usuarios nos envíen información más explícita sobre sitios spam y de baja calidad.
Como el "spam en la web puro" ha disminuido a lo largo del tiempo, la atención se ha trasladado a las "granjas de contenido", que son sitios de contenido pobre o de baja calidad. En 2010, lanzamos dos cambios importantes en los algoritmos que estaban centrados en los sitios de baja calidad . Sin embargo, el mensaje de la web es alto y claro: la gente quiere que se tomen acciones aún más firmes en cuanto a las granjas de contenido y los sitios que consisten principalmente en contenido spam o de baja calidad. Estamos orgullosos de la búsqueda de Google y nos esforzamos para que cada una de las búsquedas sea perfecta. La realidad es que no somos perfectos, lo que combinado con las grandes expectativas que los usuarios tienen puestas en Google, la percepción de estas imperfecciones se magnifica. No obstante, podemos y debemos hacer las cosas mejor.
Una idea equivocada que hemos observado en las últimas semanas es que Google no toma acciones lo suficientemente firmes en cuanto a los contenidos spam de nuestro índice si esos sitios publican anuncios de Google. Para dejar las cosas muy claras:
Estos principios siempre han sido aplicables, pero es importante confirmar que siguen estando vigentes.
La gente se preocupa lo suficiente por Google como para decirnos, a veces con gran pasión, en lo que necesitamos mejorar. Valoramos esta información enormemente. Junto con nuestras propias evaluaciones científicas, los comentarios de los usuarios nos ayudan a explorar cada oportunidad como una posible mejora. Por favor, no dudéis en decirnos cómo podemos hacer las cosas mejor, y seguiremos trabajando para conseguir un Google mejor.
Sólo a modo de recordatorio. El spam en la web es la basura que ves en los resultados de búsqueda cuando algunos sitios web intentan colarse en las posiciones superiores de los resultados de búsquedas o infringen las directrices de calidad del motor de búsqueda. Hace una década, la situación del spam en la web era tan mala que los motores de búsqueda ofrecían de forma regular spam que no tenía relación con las diversas búsquedas. Google ha conseguido reducir la mayor parte de ese tipo de "spam en le web puro", incluso aunque algunos spammers hayan recurrido a tácticas furtivas o hasta ilegales como piratear sitios web .
Al haber aumentado nuestro tamaño y la actualidad del contenido en los últimos meses, lógicamente hemos indexado una gran cantidad de contenido de buena calidad y también algo de spam. Para responder a este desafío, hemos lanzado recientemente un nuevo clasificador que actúa a nivel de documento y que dificulta a las páginas que contienen spam aparecer en las primeras posiciones de los resultados de búsqueda. Este nuevo clasificador es mejor para detectar spam en páginas web individuales, como por ejemplo, para detectar las palabras spam repetidas, que son los tipos de frases que se suelen ver en los comentarios de blog basura, automatizados y de promoción personal. También hemos mejorado de forma radical nuestra capacidad de detectar sitios pirateados, que eran una gran fuente de spam en 2010. Además, estamos evaluando diversos cambios que podrían reducir aún más los niveles de spam, incluido un cambio que afecta principalmente a los sitios que copian el contenido de otros y sitios con bajo nivel de contenido original. Vamos a seguir explorando formas de reducir el spam, así como nuevas maneras para que los usuarios nos envíen información más explícita sobre sitios spam y de baja calidad.
Como el "spam en la web puro" ha disminuido a lo largo del tiempo, la atención se ha trasladado a las "granjas de contenido", que son sitios de contenido pobre o de baja calidad. En 2010, lanzamos dos cambios importantes en los algoritmos que estaban centrados en los sitios de baja calidad . Sin embargo, el mensaje de la web es alto y claro: la gente quiere que se tomen acciones aún más firmes en cuanto a las granjas de contenido y los sitios que consisten principalmente en contenido spam o de baja calidad. Estamos orgullosos de la búsqueda de Google y nos esforzamos para que cada una de las búsquedas sea perfecta. La realidad es que no somos perfectos, lo que combinado con las grandes expectativas que los usuarios tienen puestas en Google, la percepción de estas imperfecciones se magnifica. No obstante, podemos y debemos hacer las cosas mejor.
Una idea equivocada que hemos observado en las últimas semanas es que Google no toma acciones lo suficientemente firmes en cuanto a los contenidos spam de nuestro índice si esos sitios publican anuncios de Google. Para dejar las cosas muy claras:
- Desde luego que Google toma acciones en sitios que infringen nuestras directrices de calidad independientemente de si contienen anuncios con tecnología de Google o no.
- Publicar anuncios de Google no beneficia a la clasificación de un sitio en Google.
- Comprar anuncios de Google no aumenta la posición de un sitio en los resultados de búsqueda de Google.
Estos principios siempre han sido aplicables, pero es importante confirmar que siguen estando vigentes.
La gente se preocupa lo suficiente por Google como para decirnos, a veces con gran pasión, en lo que necesitamos mejorar. Valoramos esta información enormemente. Junto con nuestras propias evaluaciones científicas, los comentarios de los usuarios nos ayudan a explorar cada oportunidad como una posible mejora. Por favor, no dudéis en decirnos cómo podemos hacer las cosas mejor, y seguiremos trabajando para conseguir un Google mejor.