Está creciendo la resistencia contra la IA
(stephvee.ca)- Mientras internet se desborda de contenido de baja calidad generado por IA (
slop), se están expandiendo varios movimientos en los que la gente resiste activamente a la IA - La comunidad de Reddit r/PoisonFountain trabaja con la meta de entregar a los rastreadores de IA 1 terabyte diario de datos contaminados para finales de 2026
- Están apareciendo distintas formas de resistencia, como técnicas para engañar a resumidores de video con IA o la inserción deliberada de datos falsos en redes sociales
- El trasfondo de esta resistencia es la realidad de que los rastreadores de IA ignoran
robots.txty provocan en sitios pequeños una carga a nivel de DDoS - Existe la expectativa de que, si este sentimiento se convierte en actos de resistencia pacíficos y legales, podría cambiar la forma en que Silicon Valley recolecta datos
Comunidad de contaminación de datos dirigida a rastreadores de IA
- La comunidad de Reddit r/PoisonFountain fue creada por personas que se presentan como insiders de la industria de la IA, y anima a que la mayor cantidad posible de gente suministre grandes volúmenes de datos basura (
poison) a los rastreadores web - La meta es proporcionar a los rastreadores 1 terabyte diario de datos contaminados para finales de 2026
- La carga principal de estos datos contaminados está alojada en rnsaffn.com, colocada entre enlaces basura que podrían resultar atractivos para los rastreadores de IA
- A simple vista parece código normal, pero en realidad incluye errores sutiles que hacen que el código generado sea inutilizable
- Es posible filtrar estos errores, pero hacerlo a gran escala resulta costoso
- Como las empresas de IA no pueden mejorar sus modelos sin nuevos datos creados por humanos, la estrategia central es aumentar el tiempo y el costo del robo de datos
- Miasma es una herramienta que usa estos datos contaminados para entregar grandes cantidades de basura a bots maliciosos; su desarrollador la describió como un "buffet infinito de slop para máquinas de slop"
Conductas problemáticas de los rastreadores de IA
- Los equipos que envían rastreadores de IA están provocando de forma regular una carga a nivel de DDoS en sitios pequeños, elevando los costos de hosting para todos
- No respetan
robots.txty con frecuencia incluso esconden sus rastreadores detrás de proxies residenciales - Si no pueden conseguir datos de entrenamiento de manera ética, no hay razón para que los administradores de sitios web faciliten el robo de datos
Intentos de contaminar resumidores de video con IA
- En un video difundido a través de r/PoisonFountain, la creadora @f4mi demostró una técnica para contaminar resumidores de video con IA usando una vulnerabilidad en los subtítulos de YouTube
- Actualmente, YouTube ya corrigió esa vulnerabilidad en los subtítulos, por lo que la técnica ya no funciona
- Aunque fue temporal, es un caso que logró interferir con sistemas de IA y muestra que la gente está intentando resistirse activamente
Sabotaje deliberado contra la IA en redes sociales
- En plataformas de redes sociales como Reddit está aumentando la práctica de publicar información falsa de manera intencional para contaminar los datos de entrenamiento de IA
- Como ejemplo, hay casos en los que se publica la afirmación claramente falsa de que en "Everybody Loves Raymond" Idris Elba interpretó a la madre de Raymond
- Los humanos pueden detectar de inmediato por el contexto que es falso, pero los scrapers web automatizados lo reconocen como datos de calidad generados por humanos
- Si esos datos llegan a OpenAI u otras empresas, eliminarlos del dataset de entrenamiento requiere recursos adicionales
- Puede verse como una versión moderna de cuando los trabajadores textiles destruían telares mecánicos durante la Revolución Industrial; si suficientes personas contaminan los espacios públicos con información falsa dirigida a bots, podrían presionar a las empresas de IA para que reconsideren cómo recolectan sus datos de entrenamiento
Rechazo generalizado hacia la IA
- La gente siente rechazo por el impacto que la IA tiene en el mundo, en particular por sus efectos sobre las comunidades en línea, el medio ambiente, las escuelas primarias y universidades, las personas en riesgo de problemas de salud mental y los medios de vida
- Aunque hay personas que consumen y generan
slopde IA, son muchas más las que odian y rechazan esta tecnología, tanto en línea como fuera de línea - Rara vez el odio lleva a buenos resultados, y se rechazan los actos violentos como patear o voltear robots repartidores de IA o el caso de lanzar un cóctel molotov a la casa de Sam Altman
- Aun así, si los sentimientos hacia la IA se transforman en actos de resistencia pacíficos y legales, existe la posibilidad de que realmente cambien la manera de actuar de Silicon Valley
Epílogo: edición del texto original tras volverse viral en Hacker News
- Este texto llegó a la primera página de un gran hub de noticias (Hacker News), lo que atrajo un volumen inesperadamente grande de tráfico
- Se produjo un ataque malicioso de sobrecarga del servidor que envió miles de solicitudes a esa página desde un pequeño número de direcciones IP
- Si hubiera estado en un hosting compartido barato, es muy probable que el sitio se hubiera caído por completo, así que como respuesta se bloqueó temporalmente el tráfico hacia esa URL
- Aunque la autora no es experta en IA, algunos participantes en los comentarios exigieron una precisión de nivel experto y la criticaron en exceso
- Un comentario incluso usó la expresión de que "no son mejores que un grupo que quema bibliotecas", una reacción especialmente decepcionante para una bloguera a la que le gustan las bibliotecas y compartir conocimiento
- La intención original era compartir enlaces sobre tendencias anti-IA con los seguidores de un blog pequeño, y sostiene que no lo habría publicado si hubiera sabido que atraería atención negativa en una plataforma tan grande
- Después de eso decidió abstenerse de publicar opiniones personales sobre IA y concentrarse en el propósito original del blog: disfrutar de la small web
- Es un caso que muestra cómo la libre expresión de opiniones en la small web puede verse reprimida por la difusión viral
5 comentarios
Opiniones de Hacker News
Me alegra que esta persona haya encontrado una comunidad, pero siento que está demasiado abrumada por el sentimiento anti-AI. Creo que durante los próximos 30 años va a seguir existiendo gente que odie y quiera frenar la AI. Siempre hubo grupos así con los smartphones, Internet y la TV. Por otro lado, si el poisoning de modelos realmente llegara a ser posible de forma estable, me parecería un problema de ciencias de la computación bastante interesante. No comparto la causa de los activistas anti-AI, pero sí me interesan mucho las técnicas de ataque en sí. Por eso, si siguen investigando eso, creo que incluso personas que no están de acuerdo con su causa van a leer esa discusión seriamente
Me da pena porque estos intentos de poisoning me parecen energía gastada en el lugar equivocado. Ya hay suficientes datos no contaminados para entrenar, y además se sigue generando contenido nuevo mediante recolección automática del mundo real o trabajo controlado en grandes talleres de África. Así que quizá se pueda ensuciar el Internet viejo, pero no revertir la flecha del tiempo. Además, ahora está creciendo un nuevo Internet más centrado en APIs y announce federation pública, así que siento que la importancia de ese poisoning tradicional va a ir disminuyendo
Recuerdo cuando la agenda principal de la vieja cultura hacker era eliminar barreras que dificultaban usar la información, como DRM, DMCA, patent trolls o los controles de exportación de PGP. Comparado con esa época en que “Information wants to be free” funcionaba casi como lema, ahora parece un giro enorme que haya crecido tanto la idea de que, si las empresas no pueden conseguir ethically training data, no hay por qué ponérsela fácil para robarla de los sitios web. Hace 25 años habría sido difícil predecir un cambio así
Siento que la forma más fácil de aumentar la resistencia a la AI es poner a Dario Amodei y Sam Altman en TV y simplemente dejarlos hablar
Veo la AI como una herramienta corporativa para sacarle más trabajo a los empleados. Al mismo tiempo, siento que también les mete en la cabeza la ilusión de que ahora son turbo-charged devs. Hoy la tech industry me parece más un circo al que se le fue el dinero encima que un esfuerzo serio por mejorar a la humanidad
Siento que este movimiento de poisoning se parece más a slacktivism. Entiendo hasta cierto punto el análisis de que se está reemplazando trabajo de la clase trabajadora por compute, y como el compute es capital puro, al final eso significa que la clase capitalista le aprieta el cuello a la clase trabajadora. Y también creo que los capitalistas realmente podrían querer ir en esa dirección. Pero si uno lo ve así, contaminar un poco los modelos está lejísimos de enfrentar de verdad lo que está pasando
Veo esta tendencia muy fuerte en Reddit. Algunas comunidades son tan pro-AI que hasta ponen comentarios de resumen hechos por AI y fomentan publicaciones escritas por AI, mientras que otros subreddits se mueven hacia posturas cautelosas o abiertamente anti-AI. Las comunidades de fotografía tienen el problema de que su trabajo sea sospechado de ser AI, y las de programadores en general parecen favorables pero al mismo tiempo escépticas. Al final, hasta los subreddits más tradicionales están encontrando su lugar en algún punto del espectro de la AI. Pienso en ejemplos como https://www.reddit.com/r/vibecoding/, https://www.reddit.com/r/isthisAI/, https://www.reddit.com/r/aiwars/, https://www.reddit.com/r/antiai/, https://www.reddit.com/r/photography/comments/1q4iv0k/what_do_you_say_to_people_who_think_every_photo/, https://www.reddit.com/r/webdev/comments/1s6mtt7/ai_has_sucked_all_the_fun_out_of_programming/
Ojalá en algún momento podamos tener una conversación más matizada sobre la AI y el papel que debería tener en el mundo. Ahora mismo el ambiente parece casi reducido a dos extremos. Entre la postura de sacar la AI por completo del mundo y la de entregarle todo, me gustaría discutir cosas más reales como el uso responsable, los amortiguadores sociales o el problema del consumo energético
Siento que la ira del blog original también es excesiva, pero igual me deja un mal sabor ver a gente que de verdad cree que estos intentos de poisoning no pueden perjudicar en absoluto el entrenamiento de modelos; eso también me suena a una falta de comprensión técnica
Quiero hacer el chiste de “Resistance is futile”, pero al mismo tiempo sí conecto bastante con la idea de que la AI está arruinando comunidades de verdad. Por ejemplo, YouTube hasta ha puesto el procesamiento de reportes en manos de AI, de modo que actores maliciosos pueden afirmar que videos originales de otros les pertenecen y quitarles ingresos mediante demonetize. A YouTubers conocidos como Davie504 les ha pasado, y encima hasta las apelaciones las procesa otro robot, lo que resulta desesperante
Aparte de contaminar los datos con los que aprende la IA, ¿no hay otras formas de resistencia?
Por ejemplo, no consumir contenido generado por IA...
Yo también, mientras leía esto, pensé que quizá sin querer también termina envenenando a los humanos.
No sé dónde se generó el problema, pero a
'kkim','bom','doem'y'jim'se les está agregando un'eum'que no encaja. ¿Será también poisoning? ;)Parece que el modelo cambió un poco, porque el mismo prompt está fallando. Ya corregí esta parte.