Ya no se puede confiar en internet

(nicole.express)

1 puntos por GN⁺ 2026-02-16 | 1 comentarios | Compartir por WhatsApp

Un texto sobre el colapso de la confianza en internet, centrado en el caso de haber encontrado un artículo falso generado por IA sobre el relanzamiento para Sega Genesis en Japón de ‘Phantasy Star Fukkokuban’, un juego que en realidad sí existe
Un sitio que aparecía entre los primeros resultados de búsqueda publicó un texto con contenidos completamente falsos, como mejoras gráficas y efectos climáticos, y luego se reveló que era una ficción creada por un modelo de lenguaje grande (LLM)
El autor también comprobó directamente el fenómeno de alucinación (hallucination) por falta de datos de entrenamiento al pedirle a ChatGPT que describiera el mismo juego, obteniendo información sobre plataforma y contenido incorrectos
Este tipo de contenido generado automáticamente llega en masa a sitios publicitarios con fines de SEO, reforzando una estructura que difunde información falsa pero verosímil sin verificación
Como resultado, la base de conocimiento compartida de internet se está deteriorando, y se concluye que la información confiable solo puede depender de sitios con reputación previa a la era de los LLM

Caso de Phantasy Star Fukkokuban

‘Phantasy Star Fukkokuban’ para Sega Genesis, lanzado en Japón en 1994, es una reedición que incluye tal cual el juego original de Master System
- En algunas consolas Genesis no se pueden ejecutar juegos de Master System, por lo que ese cartucho tampoco funciona
- El autor intentó confirmar la fecha de lanzamiento de este juego y encontró entre los primeros resultados de búsqueda un sitio con información falsa
El sitio problemático, ‘Press Start Gaming’, mencionaba mejoras gráficas, efectos climáticos y ciclos de día y noche, pero nada de eso existe en el juego real
- Aunque la primera frase del artículo era “Game data not found”, después seguía una descripción verosímil generada por IA

El problema de las alucinaciones en los modelos de lenguaje grandes

Los LLM funcionan con base en la predicción del siguiente token, y sobre temas raros que no están en los datos de entrenamiento producen ficciones plausibles
- Al combinar la serie ‘Phantasy Star’ con el significado de la palabra ‘Fukkokuban’ (edición reeditada), el modelo imaginó una versión remake que no existe
Cuando el autor le pidió a ChatGPT que describiera el mismo juego, recibió una respuesta que lo confundía con una compilación para Sega Saturn
- Al parecer, en realidad se mezcló con otro juego llamado ‘Phantasy Star Collection’
De forma similar, también existe en la web japonesa una descripción ficticia generada por IA sobre otro juego raro tratado por el autor, ‘Mahjong Daireikai’

El derrumbe de la confianza en internet

Se presume que el sitio ‘Press Start Gaming’ es una plataforma de contenido automatizado orientada a ingresos publicitarios
- En la parte inferior del sitio aparece la leyenda “©2025 Cloud Gears Media”, pero no está clara su relación con una empresa real
- Este tipo de sitios prioriza la visibilidad en búsquedas (SEO) por encima de la transmisión de hechos
Con la introducción de los LLM, el costo de producir información falsa cayó drásticamente, y el contenido sin verificación se está difundiendo a gran escala
- Antes, incluso los redactores mal pagados hacían al menos una verificación mínima; ahora la IA genera ficción completa
El autor señala que “ahora es difícil confiar en sitios nuevos” y que ha terminado dependiendo solo de medios que construyeron su reputación antes de la IA

Daño al ecosistema informativo en la era de la IA

El autor evalúa que el “conocimiento compartido (common)” de internet ya está dañado hasta un punto difícil de revertir
- Incluso las fuentes confiables corren el riesgo de contaminarse con contenido de IA
- Como ejemplo, menciona el caso de Ars Technica, que publicó un artículo con una cita generada por IA y luego tuvo que corregirlo y retirarlo
Si los LLM llegan a integrar más datos, quizá algún día su precisión mejore, pero el daño actual ya está en marcha
El autor dice que “este texto es solo un rant”, pero subraya la sensación real y concreta de pérdida de confianza en internet

Conclusión

El ecosistema de contenido centrado en IA y SEO prioriza la eficiencia de producción por encima de la veracidad de la información
Como resultado, los textos generados automáticamente sin verificación de hechos aparecen en los primeros resultados de búsqueda y dañan la base del aprendizaje y la exploración de los usuarios
El autor cierra el texto con la declaración “ya no se puede confiar en internet”, sugiriendo la urgencia de recuperar la confianza en el conocimiento digital

1 comentarios

GN⁺ 2026-02-16

Comentarios en Hacker News

Estoy construyendo una red mesh en mi pueblo junto con amigos
El internet abierto ya venía en declive desde hace mucho, pero los LLM están acelerando su final
Ya acepté que el internet de los 90 y principios de los 2000 está muerto
Creo que la alternativa en adelante son las redes locales confiables
Da tristeza tener que replegarse a espacios exclusivos por culpa de gente obsesionada solo con ganar dinero
- Creo que estás intentando resolver el problema en la capa equivocada
  La clave no es la red, sino la calidad del contenido
  Basta con crear un foro donde solo invites a personas de confianza
- Me conecté por primera vez en 1985, y nunca sentí que un internet basado en lo local fuera útil
- Estoy investigando para montar un servicio mesh de Wireguard con amigos repartidos por todo el mundo
  Suerte con el intento
- Yo también he estado trabajando en un proyecto parecido desde hace unos meses por la misma razón
  Ahora mismo estoy puliendo un reproductor MP3 basado en red; todavía está en una etapa temprana, pero soy optimista
  Enlace del proyecto
- Sería mucho más simple crear un sitio solo por invitación dentro de la web actual
Creo que una razón por la que hoy hay mucha más desinformación en línea que antes podrían ser los mercados de predicción (prediction markets)
Es una estructura que distorsiona la percepción de la gente para poder apostar dinero
Desde el caso del superconductor LK99 en 2023, este fenómeno ha aumentado de forma drástica
- La mayoría de los casos son demasiado pequeños para tener impacto, así que apostar mal incluso podría salir al revés
- En la práctica, el tamaño del mercado es pequeño
- Es una hipótesis interesante, pero no estoy de acuerdo
  Los mercados de predicción permiten comerciar información por dinero, pero no son lo bastante grandes como para impulsar desinformación deliberada
  Más bien creo que la causa principal son los políticos, influencers y la desinformación participativa motivada por ingresos publicitarios
- LK99 no era un semiconductor, sino un superconductor
- Si no cuentas ya con fuentes confiables, es cuestión de tiempo antes de que empieces a entender mal el mundo por culpa de artículos web
El problema es el colapso de la confianza en internet
Antes era cosa de caer ocasionalmente en información errónea, pero ahora está lleno de contenido reproducido por bots
La proporción entre personas y bots está casi en cero
Al final, terminamos incendiando la web
- Yo también me deprimí después de llegar a la misma conclusión
  A estas alturas, da la impresión de que ni siquiera quienes movían los hilos saben ya qué está pasando
- Por eso la teoría del internet muerto ya se volvió realidad
- Estos datos contaminados terminarán arruinando también a los modelos de IA del futuro
  Por eso los modelos actuales podrían acabar siendo la versión menos sesgada de todas
Pensé mucho en cómo proteger HN, pero al final parece que no hay otra salida más que un sistema basado en invitaciones
Últimamente agota emocionalmente porque ya ni siquiera sabes si los comentarios los escribió una persona
- Si hablamos de invitaciones, lobste.rs ya es un ejemplo de eso
- Pero HN ya está lleno de gente de la industria de la IA
  El ambiente es de fe casi religiosa en la IA, así que se mezclan cuentas bot y comentarios filtrados por IA
  El Fediverse, como Mastodon, todavía se mantiene sano, pero algún día también se contaminará
La relación señal/ruido (SNR) de internet está en su punto más bajo de la historia
Creo que la única solución son las firmas digitales verificadas como humanas
Deberíamos poder demostrar que somos humanos mediante sistemas como eIDAS sin perder el anonimato
- La “tragedia de los comunes” es un concepto ficticio que no explica la historia real
  Enlace a la discusión relacionada
- Sería interesante un motor de búsqueda que solo mostrara publicaciones verificadas como humanas
  Habría que mantener el anonimato, pero con una estructura que impida los ataques Sybil
- Al final los humanos volverían a usar IA igual, así que no sería una solución de fondo
- Sí, la SNR está bajando
- Con una estructura de árbol de confianza (tree of trust), sería posible aumentar la confianza cuanto más cerca esté un nodo
Me impacté al buscar videos sobre el Intel i7-4790T
La mayoría de los videos recientes eran puro contenido basura, con gente leyendo guiones generados por LLM
El producto ni siquiera se vendió al por menor, pero canales de YouTube suben decenas al día para monetizar con enlaces de afiliado de Amazon
Video de ejemplo 1 / Video de ejemplo 2
Ahora que el costo de producir contenido falso es casi cero, necesitamos mecanismos de confianza escalables
Personalmente, la estructura de Web of Trust me parece atractiva
Algunas personas quedarán excluidas, pero no hay mucho que hacer al respecto
Estoy construyendo un archivador auxiliar basado en el protocolo Gemini
Solo planeo registrar sitios web permitidos por robots.txt
- Si Web of Trust se vuelve algo generalizado, será posible delegar y revocar confianza, así que la exclusión disminuirá
  Se podrían formar redes de confianza no solo entre personas, sino también entre sitios
  Podría empezar a nivel de comunidades locales o grupos de hobby, y luego expandirse poco a poco
Hace poco estuve buscando información sobre el nuevo Hollow Knight, y me encontré con varios sitios falsos de guías hechos con LLM
Como solo lleva seis meses desde su lanzamiento, todavía no hay mucha información real, así que parece hecho para ganar dinero con anuncios
Me pregunto si de verdad sale rentable fabricar contenido falso incluso sobre temas de nicho como este
- Como el costo de producción es casi nulo, puede que se comporten como una forma de exploración mediante contaminación
  Es como ver la “teoría de la asimetría de las tonterías” funcionando en la práctica
- Si vives en un país VLCOL (de costo de vida muy bajo) y usas herramientas gratuitas, incluso una ganancia mínima puede valer la pena
Mientras peor sea el SEO de un sitio web, más confiable parece
Creo que el futuro de internet irá hacia las comunidades por invitación
Me pregunto si aparecerá la próxima generación de foros o si volveremos a la era de phpBB
- Pero esos espacios también pronto se contaminarán por la infiltración de bots y el sesgo político
  Solo podrá sobrevivir el contenido que no se convierta en objetivo de juegos o spam
- lobste.rs ya se parece bastante a eso
  Tiene un ambiente similar al de HN, pero funciona con una estructura solo por invitación

Ya no se puede confiar en internet

Caso de Phantasy Star Fukkokuban

El problema de las alucinaciones en los modelos de lenguaje grandes

El derrumbe de la confianza en internet

Daño al ecosistema informativo en la era de la IA

Conclusión

Lecturas relacionadas

1 comentarios

Comentarios en Hacker News