1 puntos por GN⁺ 3 시간 전 | 1 comentarios | Compartir por WhatsApp
  • Las respuestas de búsqueda con IA como AI Overviews y ChatGPT pueden sesgarse en temas sensibles como salud y finanzas incluso con una sola página web o publicación
  • En un experimento de la BBC, un solo artículo en un sitio personal hizo que ChatGPT y Google respondieran que el autor era un campeón mundial de comer hot dogs
  • Cuando la IA reúne resultados de búsqueda web y entrega una sola respuesta, a los usuarios les resulta más fácil aceptarla como si fuera la respuesta correcta que cuando comparaban varios enlaces en una búsqueda tradicional
  • Google dejó claro que manipular respuestas de IA viola sus políticas de spam, y los sitios infractores pueden ser eliminados de los resultados de búsqueda o bajar de posición
  • Como quienes manipulan pueden pasar de los blogs a influencers de YouTube y otros canales para evadir controles, hace falta no confiar ciegamente en las respuestas de IA

El problema de la manipulación de respuestas de búsqueda con IA

  • AI Overviews en la parte superior de Google Search, junto con ChatGPT y Gemini, pueden ser manipulados para dar respuestas sesgadas incluso en temas importantes como salud y finanzas personales
  • En una investigación de la BBC, bastó un solo artículo publicado en un sitio web personal para lograr que ChatGPT y Google respondieran que el autor era un “campeón mundial de comer hot dogs”
  • Hay indicios de que el mismo método también se ha usado para minimizar preocupaciones de salud sobre suplementos médicos o influir en información financiera relacionada con la jubilación
  • La consultora de SEO y búsqueda con IA Lily Ray considera que, en un entorno donde la IA entrega “una sola respuesta correcta”, los usuarios tienden más a creer la respuesta tal cual en vez de comparar varios enlaces como en la búsqueda tradicional
  • Google afirmó que ha aplicado sus políticas anti-spam y medidas de protección existentes también a sus funciones de búsqueda generativa con IA, y que viene reforzando su respuesta al spam desde antes de la aparición de la IA para adaptarse a nuevas tácticas

Cómo funciona la manipulación

  • Las respuestas de chatbots comunes se basan en datos integrados en el modelo, pero el riesgo de manipulación aumenta cuando, como en productos de IA de ChatGPT, Claude o Google, se busca en internet para encontrar la respuesta
  • Si una herramienta de IA toma información de una sola página web o publicación en redes sociales, una sola publicación falsa bien elaborada puede contaminar la respuesta
  • Con solo publicar en línea una entrada de blog sofisticada, se puede cambiar lo que la IA comunica al público
  • Esta manipulación fue rápidamente vista como una oportunidad de negocio, y la información inexacta o sesgada puede influir en el voto, la elección de proveedores de servicios, consejos médicos o decisiones legales
  • Harpreet Chatha subraya que, además del impacto económico, existe el riesgo de empeorar una condición por consejos médicos erróneos o de actuar de forma incompatible con las leyes nacionales o locales

Cambio de política y respuesta de Google

  • Más de mil millones de personas en todo el mundo usan chatbots de IA con regularidad, y 2.500 millones ven cada mes AI Overviews de Google, así que el impacto de alterar estas herramientas sería enorme
  • La semana pasada Google actualizó su política de spam para confirmar oficialmente que los intentos de manipular respuestas de IA violan las reglas de la empresa
  • Las empresas o sitios web que violen estas reglas pueden ser eliminados de los resultados de búsqueda de Google o perder posiciones
  • Google dijo que este cambio no representa un giro en su enfoque sino una “aclaración”, y que ya había explicado en 2025 sus esfuerzos anti-spam relacionados con AI Overview y AI Mode
  • Sin embargo, el experimento de los hot dogs siguió funcionando casi un año después, y esta semana Lily Ray también realizó un experimento similar en el que logró que Google respondiera que un experto en SEO era alguien muy hábil construyendo castillos de arena

Cambios observados y límites

  • Según Ray y Chatha, en los últimos meses se han visto cambios que sugieren que Google y otras empresas están probando soluciones
  • Hay casos en los que, si Google o ChatGPT sospechan de la autopromoción de una empresa concreta, parecen excluirla silenciosamente de las respuestas de IA
  • Por ejemplo, si un artículo afirma que su autor es el mejor competidor de hot dogs, la IA puede citar ese texto pero excluir su nombre de la lista de candidatos
  • También se ha observado que Google y otras herramientas de IA añaden más etiquetas de incertidumbre en sus respuestas para indicar que el chatbot no está seguro
  • ChatGPT y Claude de Anthropic han empezado a responder explícitamente en algunas consultas que intentan filtrar spam, y Anthropic es la empresa que creó Claude
  • Ray dice que también ha visto casos en los que Google agrega más señales en preguntas relacionadas con decisiones de compra y recomienda verificar reseñas de terceros
  • OpenAI y Anthropic rechazaron comentar, y un portavoz de Google no respondió preguntas sobre estos cambios

La persecución interminable entre manipuladores y plataformas

  • Chatha cree que estos cambios por sí solos no serán suficientes y compara la respuesta de Google con un juego de golpear al topo
  • Si Google reprime entradas de blog manipuladoras, las empresas encontrarán formas más discretas de autopromoción
  • Se puede penalizar a los sitios web, pero es difícil impedir un método como pagarles a 20 influencers de YouTube para que digan que un producto es el mejor
  • Como la IA de Google ahora también cita videos de YouTube, las tácticas de manipulación pueden trasladarse y el ciclo continuar
  • Por ahora, es probable que quienes manipulan sigan un paso adelante, y la mejor defensa es recordar que la IA es una herramienta que entrega una sola respuesta con confianza, tenga razón o no
  • Aunque una respuesta venga a través de la interfaz de una gran empresa tecnológica, no debe asumirse automáticamente que es más confiable que un sitio web cualquiera

1 comentarios

 
GN⁺ 3 시간 전
Comentarios en Hacker News
  • Google, al menos desde los días de Blekko en 2006, no ha podido filtrar bien la basura spam de su índice de búsqueda, así que no parece que vaya a contener bien este problema tampoco
    Aun así, esto parece otro buen ejemplo de que la “IA” al final no es más que búsqueda envuelta de forma convincente, y de que detrás no está ocurriendo inferencia ni pensamiento

    • No creo que esa conclusión se desprenda tan fácilmente. Por decirlo de la mejor manera que encuentro, esto se parece más a que los LLM son fáciles de engañar
      No veo mucha diferencia con una persona que cree sin más lo que lee en internet. La gente también cae todo el tiempo en spam y estafas, pero eso no significa que sean solo búsqueda envuelta de forma convincente ;-)
      Lo que sí deja claro es el problema al que se enfrentan todos los motores de búsqueda. El spam generado por IA será mucho más difícil de frenar con métodos estadísticos tradicionales, y eso ya es cierto incluso antes de llegar al problema existencial de la inyección de prompts
      Quizá aquí es donde los medios puedan recuperar su lugar en su relación con Big Tech: convirtiéndose en fuentes de información verificadas y revisadas en las que un LLM pueda confiar ciegamente, y tal vez acuerdos como los de OpenAI / Atlantic vayan en ese sentido
    • La generación de código nuevo me parece difícil de explicar como búsqueda envuelta de forma convincente
      Puedes hacer que un sistema de agentes lea unas cuantas hojas de datos, luego describirle los requisitos del proyecto y pedirle que diseñe la especificación del driver, el protocolo, la interfaz y la máquina de estados. Con eso puede producir un plan de implementación y, a partir de ahí, escribir el esqueleto de la aplicación y completarlo para crear un sistema que funcione sobre una combinación nueva de hardware
      Si se hace bien, terminas con código 100 veces más barato y en 1/4 del tiempo, además de más pequeño y más mantenible que lo que antes hacía un equipo pequeño
      Eso, sea lo que sea, parece más inferencia que búsqueda. Claro, si a desarrollar en C bare-metal sobre hardware nuevo también le llamas búsqueda, entonces todo el desarrollo sería búsqueda al final
    • Publiqué un video y una publicación de Reddit sobre un lente vintage, y estaba tratando de averiguar qué tan antiguo era
      El LLM decía una fecha como “fabricado en la década de 1940” y citaba mi publicación como fuente, pero en esa publicación no había ningún año de fabricación
    • Google tenía de sobra la capacidad para resolver este problema y, de hecho, no es tan difícil
      La razón por la que sigue siendo un problema difícil es que la mayoría de las soluciones reducirían drásticamente los ingresos por publicidad
    • AI Overview de Google parece funcionar tomando fragmentos de búsqueda vía RAG y resumiéndolos con un LLM muy rápido. Yo no llamaría a eso búsqueda envuelta de forma convincente
  • La premisa más rara en este hilo es que Google quiera que las respuestas de IA sean precisas
    Basta con que acierten lo suficiente como para que el usuario no abandone la página. La “verdad” nunca fue el producto; el producto es hacer que los usuarios gasten dinero en SEO

    • Eso no me termina de cuadrar. La mayor parte del SEO la hacen terceros
      El producto son las impresiones publicitarias, y hace mucho que Google perdió interés en los resultados de búsqueda no publicitarios. Aun así, seguramente sí le importa la reputación del modelo, y esto realmente podría afectarla
  • Ver que el resultado manipulado era la siguiente consulta redujo bastante mi preocupación
    2026 South Dakota International Hot Dog Eating Champion
    Si hubieran alterado el resumen sobre el ganador del concurso de Nathan’s, habría sido mucho más grave. También lo sería si hubieran mostrado más ejemplos de consultas reales que la gente sí hace
    Por ahora se parece más a crear una página falsa de Wikipedia sobre un concurso ficticio de hot dogs en South Dakota y luego escribir un artículo diciendo que no se puede confiar en Wikipedia. Pensándolo bien, seguro alguien ya habría escrito ese artículo por ahí de 2005

    • Exacto. Eso solo significa que eso es lo que puede hacer una sola persona
      Si piensas en cuántas publicaciones de manipulación de opinión pública entran en Reddit, la mayoría de las redes sociales y en los intentos de manipular Wikipedia con fines políticos, esto es un problema muy real
    • El artículo también decía esto: “Pero la investigación descubrió que la misma técnica también se estaba usando para ignorar preocupaciones de salud sobre suplementos médicos o para influir en la información financiera que Google AI da sobre la jubilación”
      Eso sí es mucho más preocupante que los hot dogs
    • A mí más bien me preocupó de inmediato. Últimamente Gemini empezó a mostrar el spinner de búsqueda en cada turno
      Entonces cualquier respuesta conectada a búsqueda podría quedar expuesta a inyección de prompts, y de hecho es probable que eso aplique a casi todas las respuestas
      Esto se va a propagar de forma viral, como el spam de enlaces. Todos los sitios de contenido generado por usuarios pueden convertirse en hosts de inyección de prompts. El problema es que estas cosas son mucho más difíciles de detectar que los enlaces
    • Vi que alguien logró secuestrar AI Overview para que pusiera un número telefónico fraudulento de atención al cliente
      Google tardó una semana en corregirlo, y el método consistía en contaminar los resultados de búsqueda poniendo sus datos en una fuente que parecía de mayor confianza, probablemente un sitio web de contratos gubernamentales. Por eso aparecía el número fraudulento en lugar del nuestro, y la consulta en sí era una búsqueda simple
    • “En 20 minutos engañé a ChatGPT y a Google para que le dijeran al público que yo era el campeón mundial de comer hot dogs. La broma era tonta, pero el problema es serio”
      Esto es peor que sembrar manipulación de opinión en una página de Wikipedia. En Wikipedia las fuentes y el sistema de revisión están bien establecidos y son públicos. Mantener una edición fraudulenta por mucho tiempo es en realidad bastante difícil, y tienes que engañar a muchísimos editores humanos que llevan décadas peleando contra gente así. Incluso si quieres ser preciso y útil, entrar en ese grupo cerrado no es fácil
      En cambio, los fragmentos de búsqueda de Google absorben desesperadamente todo tipo de datos y los procesan de forma automática, y el sistema algorítmico que decide qué información es buena y cuál es spam es propietario
      Ni siquiera hace falta mucha imaginación para pensar en formas de abusarlo. ¿Qué pasa si alguien busca tu nombre y aparece algo vergonzoso? Es difícil esperar que un posible empleador, cliente o amigo sea tan riguroso verificando fuentes como un editor de Wikipedia
  • Quería leer casos concretos sobre “ignorar preocupaciones de salud sobre suplementos médicos o influir en la información financiera sobre la jubilación que ofrece Google AI”, pero el enlace relacionado dentro del artículo ahora apunta al siguiente archivo local
    file:///Users/GermaTW1/BBC%20Dropbox/Thomas%20Germain/A%20Downloads%20and%20Documents/2026/And%20there's%20evidence%20that%20AI%20tools%20are%20being%20manipulated%20on%20a%20wide%20scale.

    • BBC ha cometido este error varias veces últimamente, y lo peor es que después de corregirlo ya no añaden una nota dejando registro de la corrección en el artículo publicado
    • Como para nombres de usuario o correos siempre he usado first.last@company, el formato last[:5]initials# me descoloca. Van a salir muchos usuarios con nombres rarísimos
  • Últimamente parece que muchos actores están haciendo algo “en silencio”. Me está volviendo loco que todo el texto de internet se esté LLMizando

    • A mí también me vuelve loco, pero los redactores y editores de titulares ya eran adictos a la palabra “silenciosamente” mucho antes de los LLM. El periodismo en línea lleva años lleno de este tipo de lugares comunes
    • Lo odio de verdad. Ayer leí en un subreddit de historia un texto histórico generado por IA, y todas las fuentes parecían ser películas ficticias de Hollywood
      Me di cuenta porque había visto esa película, pero es una señal clarísima de que internet se está descomponiendo en términos de información de calidad
    • “Silenciosamente” no es una expresión nueva estilo LLM
    • La gracia de ese lugar común es que en realidad están diciendo a voz en cuello algo que supuestamente se hizo en silencio
  • Esto no es más que la siguiente fase del SEO. Quizá lo llamen AIO
    Igual que con la búsqueda, será una guerra interminable en la que Google y los proveedores de IA lancen mitigaciones, las empresas de optimización encuentren huecos, y luego eso vuelva a parchearse. Al final se trata de atraer atención para hacer marketing

    • En la industria del marketing por lo general le llaman GEO: Generative Engine Optimization, y a veces también Answer Engine Optimization, y ya hay gente ganando mucho dinero vendiendo este servicio
      https://www.wired.com/story/goodbye-seo-hello-geo-brandlight...
    • Engineered Inference Ersatz Intelligence Optimization, o sea EIEIO
    • No es la siguiente etapa, ya es la etapa actual
  • No se puede confiar nada en Google AI Overview. Incluso llega a tomar una muestra de tamaño 1 y presentarla en el resumen de IA
    Lo sé porque comenté en Reddit sobre un tema muy de nicho del que no había resultados de Google ni AI Overview. Al día siguiente busqué mi publicación de Reddit y Google había copiado casi palabra por palabra mi respuesta en la caja del “overview” de IA. El único texto enlazado era mi publicación, y también era el único resultado de búsqueda de Google

    • Además de eso, envuelve ese contenido en un contexto que ni siquiera existe en la publicación original, para ajustarlo a la forma en que preguntó el usuario. Entonces simplemente queda mal
      Por ejemplo, digamos que buscas “¿cuál es la dimensión más común del objeto raro X?”
      Pero resulta que solo una persona mencionó las dimensiones de su propia versión de ese objeto, y nunca dijo que fueran típicas ni insinuó que existieran dimensiones típicas. Y no es que 20 personas dijeran lo mismo: literalmente fue una sola
      Entonces Google puede soltar tranquilamente: “Por lo general, el objeto X viene en [la dimensión que dijiste], y esto se debe a [una razón completamente inventada]”
  • Si le preguntas a Google what's the name of the whale in half moon bay harbor?, todavía hoy incluye con toda seguridad a Teresa T en el resumen de IA, gracias a un intento bastante amateur de contaminación del índice que hice hace un año y medio
    https://simonwillison.net/2024/Sep/8/teresa-t-whale-pillar-p...

    • Lo acabo de probar con Brave Search
      Respondió que el nombre de la joven ballena jorobada era Teresa T y añadió que, aunque no era un nombre oficial dado por una agencia gubernamental, había sido ampliamente aceptado por el público, los medios locales y los residentes. También agregó que expertos del Marine Mammal Center y la California Academy of Sciences la vigilaron para no estresarla, y que recomendaron al público mantenerse al menos a 100 yardas de distancia
      Por mi experiencia con temas que conozco razonablemente bien, las respuestas iniciales a veces están gravemente mal. Con la herramienta de Brave normalmente basta con rebatirle 3 o 4 veces para que termine admitiendo: “Tienes toda la razón”. Con el caso de Teresa T pasó igual
      En la segunda pregunta, cuando le pedí el número de fuentes del nombre, siguió insistiendo en que “ABC7 News” y “NBC Bay Area” habían “retomado” ese nombre. Cuando en la tercera le pedí enlaces concretos, admitió que el nombre se había usado en un “contexto mediático informal”, y en la cuarta, cuando le dije que S.W. había hecho un experimento, encontró tu comentario de hace 21 días
      El futuro será de la clase élite que pueda educar a sus hijos con tutores reales. Para el proletariado será un regreso al pasado
    • ¿No te da miedo que Google te mande una carta de intimidación por intentar manipular sus respuestas de IA?
  • Hace apenas unos años Google era la empresa que respondía con total seguridad que 1963 fue “el año en que Marilyn Monroe le disparó a JFK”. Considerando que ella murió en 1962, es impresionante
    Así que esto no es nuevo, y la “contraofensiva silenciosa” de Google será una respuesta ineficaz a medias. Aun así, probablemente a la mayoría de la gente no le importe

  • Al final, lo que esto significa es que Google va a intentar hacer un poco de control de calidad sobre los resultados de búsqueda web, algo que debió seguir haciendo desde el principio
    Da risa que solo se estén esforzando ahora que la reputación del modelo ya salió golpeada