La IA de Google está siendo manipulada. El gigante de las búsquedas contraataca en silencio
(bbc.com)- Las respuestas de búsqueda con IA como AI Overviews y ChatGPT pueden sesgarse en temas sensibles como salud y finanzas incluso con una sola página web o publicación
- En un experimento de la BBC, un solo artículo en un sitio personal hizo que ChatGPT y Google respondieran que el autor era un campeón mundial de comer hot dogs
- Cuando la IA reúne resultados de búsqueda web y entrega una sola respuesta, a los usuarios les resulta más fácil aceptarla como si fuera la respuesta correcta que cuando comparaban varios enlaces en una búsqueda tradicional
- Google dejó claro que manipular respuestas de IA viola sus políticas de spam, y los sitios infractores pueden ser eliminados de los resultados de búsqueda o bajar de posición
- Como quienes manipulan pueden pasar de los blogs a influencers de YouTube y otros canales para evadir controles, hace falta no confiar ciegamente en las respuestas de IA
El problema de la manipulación de respuestas de búsqueda con IA
- AI Overviews en la parte superior de Google Search, junto con ChatGPT y Gemini, pueden ser manipulados para dar respuestas sesgadas incluso en temas importantes como salud y finanzas personales
- En una investigación de la BBC, bastó un solo artículo publicado en un sitio web personal para lograr que ChatGPT y Google respondieran que el autor era un “campeón mundial de comer hot dogs”
- Hay indicios de que el mismo método también se ha usado para minimizar preocupaciones de salud sobre suplementos médicos o influir en información financiera relacionada con la jubilación
- La consultora de SEO y búsqueda con IA Lily Ray considera que, en un entorno donde la IA entrega “una sola respuesta correcta”, los usuarios tienden más a creer la respuesta tal cual en vez de comparar varios enlaces como en la búsqueda tradicional
- Google afirmó que ha aplicado sus políticas anti-spam y medidas de protección existentes también a sus funciones de búsqueda generativa con IA, y que viene reforzando su respuesta al spam desde antes de la aparición de la IA para adaptarse a nuevas tácticas
Cómo funciona la manipulación
- Las respuestas de chatbots comunes se basan en datos integrados en el modelo, pero el riesgo de manipulación aumenta cuando, como en productos de IA de ChatGPT, Claude o Google, se busca en internet para encontrar la respuesta
- Si una herramienta de IA toma información de una sola página web o publicación en redes sociales, una sola publicación falsa bien elaborada puede contaminar la respuesta
- Con solo publicar en línea una entrada de blog sofisticada, se puede cambiar lo que la IA comunica al público
- Esta manipulación fue rápidamente vista como una oportunidad de negocio, y la información inexacta o sesgada puede influir en el voto, la elección de proveedores de servicios, consejos médicos o decisiones legales
- Harpreet Chatha subraya que, además del impacto económico, existe el riesgo de empeorar una condición por consejos médicos erróneos o de actuar de forma incompatible con las leyes nacionales o locales
Cambio de política y respuesta de Google
- Más de mil millones de personas en todo el mundo usan chatbots de IA con regularidad, y 2.500 millones ven cada mes AI Overviews de Google, así que el impacto de alterar estas herramientas sería enorme
- La semana pasada Google actualizó su política de spam para confirmar oficialmente que los intentos de manipular respuestas de IA violan las reglas de la empresa
- Las empresas o sitios web que violen estas reglas pueden ser eliminados de los resultados de búsqueda de Google o perder posiciones
- Google dijo que este cambio no representa un giro en su enfoque sino una “aclaración”, y que ya había explicado en 2025 sus esfuerzos anti-spam relacionados con AI Overview y AI Mode
- Sin embargo, el experimento de los hot dogs siguió funcionando casi un año después, y esta semana Lily Ray también realizó un experimento similar en el que logró que Google respondiera que un experto en SEO era alguien muy hábil construyendo castillos de arena
Cambios observados y límites
- Según Ray y Chatha, en los últimos meses se han visto cambios que sugieren que Google y otras empresas están probando soluciones
- Hay casos en los que, si Google o ChatGPT sospechan de la autopromoción de una empresa concreta, parecen excluirla silenciosamente de las respuestas de IA
- Por ejemplo, si un artículo afirma que su autor es el mejor competidor de hot dogs, la IA puede citar ese texto pero excluir su nombre de la lista de candidatos
- También se ha observado que Google y otras herramientas de IA añaden más etiquetas de incertidumbre en sus respuestas para indicar que el chatbot no está seguro
- ChatGPT y Claude de Anthropic han empezado a responder explícitamente en algunas consultas que intentan filtrar spam, y Anthropic es la empresa que creó Claude
- Ray dice que también ha visto casos en los que Google agrega más señales en preguntas relacionadas con decisiones de compra y recomienda verificar reseñas de terceros
- OpenAI y Anthropic rechazaron comentar, y un portavoz de Google no respondió preguntas sobre estos cambios
La persecución interminable entre manipuladores y plataformas
- Chatha cree que estos cambios por sí solos no serán suficientes y compara la respuesta de Google con un juego de golpear al topo
- Si Google reprime entradas de blog manipuladoras, las empresas encontrarán formas más discretas de autopromoción
- Se puede penalizar a los sitios web, pero es difícil impedir un método como pagarles a 20 influencers de YouTube para que digan que un producto es el mejor
- Como la IA de Google ahora también cita videos de YouTube, las tácticas de manipulación pueden trasladarse y el ciclo continuar
- Por ahora, es probable que quienes manipulan sigan un paso adelante, y la mejor defensa es recordar que la IA es una herramienta que entrega una sola respuesta con confianza, tenga razón o no
- Aunque una respuesta venga a través de la interfaz de una gran empresa tecnológica, no debe asumirse automáticamente que es más confiable que un sitio web cualquiera
1 comentarios
Comentarios en Hacker News
Google, al menos desde los días de Blekko en 2006, no ha podido filtrar bien la basura spam de su índice de búsqueda, así que no parece que vaya a contener bien este problema tampoco
Aun así, esto parece otro buen ejemplo de que la “IA” al final no es más que búsqueda envuelta de forma convincente, y de que detrás no está ocurriendo inferencia ni pensamiento
No veo mucha diferencia con una persona que cree sin más lo que lee en internet. La gente también cae todo el tiempo en spam y estafas, pero eso no significa que sean solo búsqueda envuelta de forma convincente ;-)
Lo que sí deja claro es el problema al que se enfrentan todos los motores de búsqueda. El spam generado por IA será mucho más difícil de frenar con métodos estadísticos tradicionales, y eso ya es cierto incluso antes de llegar al problema existencial de la inyección de prompts
Quizá aquí es donde los medios puedan recuperar su lugar en su relación con Big Tech: convirtiéndose en fuentes de información verificadas y revisadas en las que un LLM pueda confiar ciegamente, y tal vez acuerdos como los de OpenAI / Atlantic vayan en ese sentido
Puedes hacer que un sistema de agentes lea unas cuantas hojas de datos, luego describirle los requisitos del proyecto y pedirle que diseñe la especificación del driver, el protocolo, la interfaz y la máquina de estados. Con eso puede producir un plan de implementación y, a partir de ahí, escribir el esqueleto de la aplicación y completarlo para crear un sistema que funcione sobre una combinación nueva de hardware
Si se hace bien, terminas con código 100 veces más barato y en 1/4 del tiempo, además de más pequeño y más mantenible que lo que antes hacía un equipo pequeño
Eso, sea lo que sea, parece más inferencia que búsqueda. Claro, si a desarrollar en C bare-metal sobre hardware nuevo también le llamas búsqueda, entonces todo el desarrollo sería búsqueda al final
El LLM decía una fecha como “fabricado en la década de 1940” y citaba mi publicación como fuente, pero en esa publicación no había ningún año de fabricación
La razón por la que sigue siendo un problema difícil es que la mayoría de las soluciones reducirían drásticamente los ingresos por publicidad
La premisa más rara en este hilo es que Google quiera que las respuestas de IA sean precisas
Basta con que acierten lo suficiente como para que el usuario no abandone la página. La “verdad” nunca fue el producto; el producto es hacer que los usuarios gasten dinero en SEO
El producto son las impresiones publicitarias, y hace mucho que Google perdió interés en los resultados de búsqueda no publicitarios. Aun así, seguramente sí le importa la reputación del modelo, y esto realmente podría afectarla
Ver que el resultado manipulado era la siguiente consulta redujo bastante mi preocupación
2026 South Dakota International Hot Dog Eating ChampionSi hubieran alterado el resumen sobre el ganador del concurso de Nathan’s, habría sido mucho más grave. También lo sería si hubieran mostrado más ejemplos de consultas reales que la gente sí hace
Por ahora se parece más a crear una página falsa de Wikipedia sobre un concurso ficticio de hot dogs en South Dakota y luego escribir un artículo diciendo que no se puede confiar en Wikipedia. Pensándolo bien, seguro alguien ya habría escrito ese artículo por ahí de 2005
Si piensas en cuántas publicaciones de manipulación de opinión pública entran en Reddit, la mayoría de las redes sociales y en los intentos de manipular Wikipedia con fines políticos, esto es un problema muy real
Eso sí es mucho más preocupante que los hot dogs
Entonces cualquier respuesta conectada a búsqueda podría quedar expuesta a inyección de prompts, y de hecho es probable que eso aplique a casi todas las respuestas
Esto se va a propagar de forma viral, como el spam de enlaces. Todos los sitios de contenido generado por usuarios pueden convertirse en hosts de inyección de prompts. El problema es que estas cosas son mucho más difíciles de detectar que los enlaces
Google tardó una semana en corregirlo, y el método consistía en contaminar los resultados de búsqueda poniendo sus datos en una fuente que parecía de mayor confianza, probablemente un sitio web de contratos gubernamentales. Por eso aparecía el número fraudulento en lugar del nuestro, y la consulta en sí era una búsqueda simple
Esto es peor que sembrar manipulación de opinión en una página de Wikipedia. En Wikipedia las fuentes y el sistema de revisión están bien establecidos y son públicos. Mantener una edición fraudulenta por mucho tiempo es en realidad bastante difícil, y tienes que engañar a muchísimos editores humanos que llevan décadas peleando contra gente así. Incluso si quieres ser preciso y útil, entrar en ese grupo cerrado no es fácil
En cambio, los fragmentos de búsqueda de Google absorben desesperadamente todo tipo de datos y los procesan de forma automática, y el sistema algorítmico que decide qué información es buena y cuál es spam es propietario
Ni siquiera hace falta mucha imaginación para pensar en formas de abusarlo. ¿Qué pasa si alguien busca tu nombre y aparece algo vergonzoso? Es difícil esperar que un posible empleador, cliente o amigo sea tan riguroso verificando fuentes como un editor de Wikipedia
Quería leer casos concretos sobre “ignorar preocupaciones de salud sobre suplementos médicos o influir en la información financiera sobre la jubilación que ofrece Google AI”, pero el enlace relacionado dentro del artículo ahora apunta al siguiente archivo local
file:///Users/GermaTW1/BBC%20Dropbox/Thomas%20Germain/A%20Downloads%20and%20Documents/2026/And%20there's%20evidence%20that%20AI%20tools%20are%20being%20manipulated%20on%20a%20wide%20scale.first.last@company, el formatolast[:5]initials#me descoloca. Van a salir muchos usuarios con nombres rarísimosÚltimamente parece que muchos actores están haciendo algo “en silencio”. Me está volviendo loco que todo el texto de internet se esté LLMizando
Me di cuenta porque había visto esa película, pero es una señal clarísima de que internet se está descomponiendo en términos de información de calidad
Esto no es más que la siguiente fase del SEO. Quizá lo llamen AIO
Igual que con la búsqueda, será una guerra interminable en la que Google y los proveedores de IA lancen mitigaciones, las empresas de optimización encuentren huecos, y luego eso vuelva a parchearse. Al final se trata de atraer atención para hacer marketing
https://www.wired.com/story/goodbye-seo-hello-geo-brandlight...
No se puede confiar nada en Google AI Overview. Incluso llega a tomar una muestra de tamaño 1 y presentarla en el resumen de IA
Lo sé porque comenté en Reddit sobre un tema muy de nicho del que no había resultados de Google ni AI Overview. Al día siguiente busqué mi publicación de Reddit y Google había copiado casi palabra por palabra mi respuesta en la caja del “overview” de IA. El único texto enlazado era mi publicación, y también era el único resultado de búsqueda de Google
Por ejemplo, digamos que buscas “¿cuál es la dimensión más común del objeto raro X?”
Pero resulta que solo una persona mencionó las dimensiones de su propia versión de ese objeto, y nunca dijo que fueran típicas ni insinuó que existieran dimensiones típicas. Y no es que 20 personas dijeran lo mismo: literalmente fue una sola
Entonces Google puede soltar tranquilamente: “Por lo general, el objeto X viene en [la dimensión que dijiste], y esto se debe a [una razón completamente inventada]”
Si le preguntas a Google
what's the name of the whale in half moon bay harbor?, todavía hoy incluye con toda seguridad a Teresa T en el resumen de IA, gracias a un intento bastante amateur de contaminación del índice que hice hace un año y mediohttps://simonwillison.net/2024/Sep/8/teresa-t-whale-pillar-p...
Respondió que el nombre de la joven ballena jorobada era Teresa T y añadió que, aunque no era un nombre oficial dado por una agencia gubernamental, había sido ampliamente aceptado por el público, los medios locales y los residentes. También agregó que expertos del Marine Mammal Center y la California Academy of Sciences la vigilaron para no estresarla, y que recomendaron al público mantenerse al menos a 100 yardas de distancia
Por mi experiencia con temas que conozco razonablemente bien, las respuestas iniciales a veces están gravemente mal. Con la herramienta de Brave normalmente basta con rebatirle 3 o 4 veces para que termine admitiendo: “Tienes toda la razón”. Con el caso de Teresa T pasó igual
En la segunda pregunta, cuando le pedí el número de fuentes del nombre, siguió insistiendo en que “ABC7 News” y “NBC Bay Area” habían “retomado” ese nombre. Cuando en la tercera le pedí enlaces concretos, admitió que el nombre se había usado en un “contexto mediático informal”, y en la cuarta, cuando le dije que S.W. había hecho un experimento, encontró tu comentario de hace 21 días
El futuro será de la clase élite que pueda educar a sus hijos con tutores reales. Para el proletariado será un regreso al pasado
Hace apenas unos años Google era la empresa que respondía con total seguridad que 1963 fue “el año en que Marilyn Monroe le disparó a JFK”. Considerando que ella murió en 1962, es impresionante
Así que esto no es nuevo, y la “contraofensiva silenciosa” de Google será una respuesta ineficaz a medias. Aun así, probablemente a la mayoría de la gente no le importe
Al final, lo que esto significa es que Google va a intentar hacer un poco de control de calidad sobre los resultados de búsqueda web, algo que debió seguir haciendo desde el principio
Da risa que solo se estén esforzando ahora que la reputación del modelo ya salió golpeada