La Búsqueda de Google, desbordada por un ataque masivo de spam
- Los resultados de búsqueda de Google han estado bajo ataque de spam durante los últimos días y la situación está completamente fuera de control.
- Muchos dominios están posicionando para cientos de miles de palabras clave cada uno, por lo que la magnitud de este ataque podría alcanzar millones de frases de palabras clave.
Cómo puede explotarse el algoritmo de Google
- Los sitios de spam parecen estar aprovechando al menos tres oportunidades en la forma en que Google clasifica los sitios web.
- Las consultas de búsqueda en las que los sitios de spam logran posicionarse tienen baja competencia, por lo que es más fácil clasificarlas.
- Hay oportunidades relacionadas con el algoritmo de búsqueda local, las palabras clave long tail y los dominios recién registrados.
- Los sitios nuevos tienen la ventaja de poder posicionarse temporalmente para ciertas consultas mientras el algoritmo de Google todavía está intentando entender el sitio.
Los enlaces ayudan a Google a encontrar sitios de spam
- Esto se supo gracias a una publicación de Bill Hartzer, quien usó la herramienta de backlinks de Majestic para revelar la red de enlaces de varios sitios de spam.
- Aunque se invirtió mucho esfuerzo en crear una red de backlinks, los enlaces no son en realidad los responsables directos del alto posicionamiento.
- Los enlaces ayudan a Google a descubrir, rastrear y finalmente posicionar nuevos sitios de spam.
Spam fuera de control en los SERPs de Google
- Varios sitios están posicionando para frases long tail fáciles de clasificar y para frases con componentes de búsqueda local.
- El concepto de long tail existe desde hace casi 20 años y fue popularizado por el libro "The Long Tail", publicado en 2006.
- Los sitios de spam pueden posicionarse para frases con poca competencia, y aprovechan esto para clasificar cientos de miles de palabras clave en poco tiempo.
Cómo se ven las páginas de spam
- No es posible visitar las páginas de spam directamente desde un navegador.
- Los sitios de spam redirigen automáticamente a otros dominios.
- Se usó el probador de Rich Results de Google para visitar los sitios de spam y registrar el HTML de la página.
Un dominio posiciona para más de 300,000 palabras clave
- La hoja de cálculo enviada por Bill incluía una lista de frases de palabras clave para las que un sitio de spam estaba posicionando.
- Un sitio de spam llegó a posicionarse para más de 300,000 frases de palabras clave.
Por qué esta técnica de spam funciona
- La búsqueda local usa un algoritmo distinto al algoritmo no local.
- El algoritmo de búsqueda local es más permisivo para que sitios de tipo local puedan posicionarse.
- Google conoce este problema de spam al menos desde el 19 de diciembre, según se confirmó a través de un tuit de Danny Sullivan.
Opinión de GN⁺
- Lo más importante de este artículo es que los resultados de búsqueda de Google son vulnerables a ataques masivos de spam, lo que podría afectar la confiabilidad del motor de búsqueda.
- La razón por la que este ataque de spam es efectivo es que explota vulnerabilidades específicas del algoritmo de Google, lo que subraya la necesidad de que Google mejore su algoritmo.
- Este texto resulta interesante no solo por el aspecto técnico, sino también porque muestra que incluso una gran empresa tecnológica como Google puede seguir enfrentando problemas inesperados.
7 comentarios
Documento web de reporte de spam de Google: cuando vayan a reportar spam, si es un dominio como
abc.abc.uk/trashasda, repórtenlo comoabc.uk, y si ponenabc.abc.uk/sitemap.xmlen la búsqueda que mejor permita identificar el problema, podrán hacer el reporte. Parece que es un sitio ya consolidado como solución, pero con una estructura en la que, cuando un usuario común accede, vuelve a generar de inmediato documentos derivados. La forma correcta de responder es hacer reportes activamente, y cada vez que se hace clic en Google se vuelven a crear páginas de spam; además, hay un proceso en el que se hace que el bot acceda mediante cosas comogoogle.com/url,image.google.com/urlo redirecciones de Naver para volver a llevarlo a la página de spamgenerada, así que no hagan clic: solo copien el enlace y repórtenlo. Mientras no se elimine el algoritmo de redirección que aparece indicado comogoogle.com/url, parece que el problema actual seguirá produciéndose.(reporte de spam y de documentos web spam)
Si reportan documentos web que correspondan a la solución de spam anterior, lo correcto es poner en el primero de los 5 campos el dominio principal, y en las 4 URL adicionales escribir la lista de documentos derivados creados a partir de este. También es recomendable poner el sitemap de ese dominio en el campo de búsqueda. Si abren el sitemap, verán que usan una estrategia para generar páginas apenas se accede, como
/new/asdasd, así que si reportan documentos individuales, al final hacen que Google genere además más páginas señuelo cuando las revisa. Por eso, como es un caso muy bien armado, deben reportar el dominio completo.En mi caso
(h lo cambié por x y / por |)
xttp:||baddomain.com
xttp:||baddomain.com/blogs
xttp:||baddomain.com/blogs/asdasd1
xttp:||baddomain.com/asdasd1
xttp:||baddomain.com/asdasd2
Después de redactar el reporte así,
si es uno de esos casos donde empezó a pudrirse desde los subdominios, envío el reporte con la palabra clave
site:*baddomain.comde esta manera.Luego, si el sitio en sí es completamente spam, también mando el formulario de reporte de phishing.
Irónicamente, el software de esos sitios web de spam tiene integrados tag managers y, aun usando sitios como https://picsum.photos, siguen siendo indexados con normalidad. Eso también significa que Google no los revisa. Incluso cuando ya sobrepasan lo que podría considerarse una actividad de spam normal, si las páginas web spam además tienen anuncios de AdWords activos, por más que se reporten, los documentos derivados se generan más rápido en proporción al tráfico que entra por la publicidad. Lo más inquietante es que los sitios web de spam estén usando tag managers de forma totalmente normal.
Llevo un mes enviando reportes de spam; si también lo reportan como documento de spam o documento fraudulento y lo envían junto con la página para denunciar sitios de phishing, se limpia más rápido. También agrego esa página, pero si el dominio de nivel superior es
abc.abc.uk, deben ingresarabc.ukpara ayudar a limpiar el dominio en sí. Se ha vuelto una tarea cotidiana para los webmasters.De por sí, desde hace tiempo ya se notaba que la calidad de los resultados de búsqueda de Google venía bajando en general, así que si recibe ataques masivos en poco tiempo de esta manera, mucha gente terminará confiando aún menos en los resultados de búsqueda de Google.
Opiniones de Hacker News
Los sitios spam verifican la dirección IP de Googlebot
Experiencia de un usuario que se cambió al motor de búsqueda Kagi
Aumento de sitios que ofrecen cantidades excesivas de texto para responder preguntas simples
Observación sobre el deterioro en la calidad de los resultados de búsqueda de Google
Cuestionamientos sobre los motores de búsqueda
Señalamientos sobre cambios en el algoritmo del motor de búsqueda de Google
Afirmación de que Google ha abandonado la búsqueda orgánica
Señalamientos sobre las limitaciones del motor de búsqueda de Google
Compartiendo la experiencia de cambiarse a Bing
Críticas al comportamiento de Google como empresa publicitaria