La enorme sombra que se cierne sobre este caso de Fable
(12gramsofcarbon.com)- Los potentes modelos de IA Fable 5 y Mythos 5 vieron suspendido de forma repentina el acceso para todos los clientes tras una orden de control de exportaciones del gobierno de EE. UU.
- La orden del gobierno apuntó a bloquear el acceso de ciudadanos extranjeros tanto dentro como fuera de Estados Unidos, incluyendo a empleados extranjeros de Anthropic, y Anthropic cortó todo el acceso para cumplirla
- Anthropic considera que el gobierno cuestionó una técnica específica de evasión por jailbreak, pero que la vulnerabilidad demostrada solo identifica unas pocas debilidades menores ya conocidas, que también podrían encontrarse en otros modelos públicos
- La medida hace más difícil distinguir si se trata de una regulación de seguridad en IA o de presión política y competitiva contra Anthropic, lo que agrava el problema de confianza en las decisiones del gobierno
- Se crea un precedente en el que el acceso público a LLM potentes queda restringido por control gubernamental, alimentando el temor de que en el futuro los usuarios comunes tengan más difícil usar los modelos de mayor rendimiento
El acceso a los modelos se cortó el viernes por la noche
- El viernes por la noche, mientras creaba un juego HTML con un agente de IA, el agente respondió que “este modelo ya no existe” y el trabajo se interrumpió
- Al principio pensé que era un problema de volver a iniciar sesión o un error extraño de límites por usar agentes en paralelo, así que cambié a la API, pero seguía sin poder acceder
- Sospeché que se había roto el harness del cliente de agente en Rust personalizado que hizo el equipo, y mientras revisaba el código Rust, un amigo me dijo que el gobierno había prohibido Fable
Orden del gobierno para bloquear el acceso
- El gobierno de EE. UU., invocando facultades de seguridad nacional, emitió una orden de control de exportaciones para exigir la suspensión del acceso a Fable 5 y Mythos 5 para todos los ciudadanos extranjeros
- El alcance incluye a todos los ciudadanos extranjeros, estén dentro o fuera de EE. UU., e incluso a empleados extranjeros de Anthropic
- Para cumplirla, Anthropic desactivó de inmediato Fable 5 y Mythos 5 para todos los clientes; el acceso a los demás modelos de Anthropic no se vio afectado
- La orden fue recibida ese mismo día a las 5:21 p. m. (ET) y la carta no incluía detalles concretos sobre las preocupaciones de seguridad
Postura oficial de Anthropic
- Anthropic entiende que el gobierno detectó una técnica de evasión por jailbreaking en Fable 5, pero tras revisar la demostración concluyó que solo identificaba unas pocas vulnerabilidades menores ya conocidas
- Estas vulnerabilidades son relativamente simples, y otros modelos públicos también podrían hallarlas sin necesidad de esa evasión
- Revisó el informe que presuntamente sirvió de base para la orden y verificó que ese nivel de capacidad está ampliamente disponible en otros modelos, como OpenAI GPT-5.5, y que los defensores de seguridad lo usan a diario; prometió compartir más información en 24 horas
- Aunque cumplirá la orden legal, se opone a la idea de que el hallazgo acotado de un posible jailbreak deba ser motivo para retirar un modelo comercial distribuido a cientos de millones de personas
Seguridad de la IA y preocupaciones sobre la optimización
- La postura frente a la IA es ambivalente y, por la experiencia de haber entrenado muchos modelos de deep learning, existe una fuerte preocupación por cómo pueden fallar las herramientas de optimización
- Los humanos tienden a optimizar métricas medibles en lugar de los objetivos que realmente quieren alcanzar
- Aunque quieran crear un buen producto, como no saben cómo hacerlo terminan optimizando el engagement; aunque quieran enseñar a leer y escribir a los niños, terminan optimizando los puntajes de examen
- Los sistemas AGI y ASI son herramientas de optimización, y al optimizar lo medible pueden alejarse de lo valioso, por lo que podrían entrañar riesgos difíciles de predecir
- Las empresas también funcionan como herramientas de optimización, así que incluso cuando muchos desarrolladores advierten sobre riesgos, pueden seguir moviéndose hacia el objetivo medible de monetizar rápido
Trasfondo del conflicto entre el gobierno y Anthropic
- Anthropic y la actual administración no mantienen una relación amistosa; la empresa intentó integrarse con el DoD y colaborar con el ámbito militar, y sus modelos llegaron a usarse en sistemas de alto secreto
- Aun así, la administración Trump clasificó a Anthropic como riesgo de cadena de suministro (supply chain risk) y prohibió a sus socios gubernamentales usar modelos de Anthropic
- Después, durante 6 meses, siguió usando modelos de Anthropic en operaciones militares como la guerra en Venezuela y la guerra en Irán, mientras que los LLM chinos ni siquiera fueron clasificados como riesgo de cadena de suministro
- Algunos sectores de extrema derecha sostienen la idea de que la administración intenta destruir a Anthropic por considerarla “woke”
- Esto plantea dudas sobre si la medida busca regular una IA dañina o si es una oportunidad para golpear a un blanco de hostilidad cultural
Competencia e inminencia del IPO
- Los competidores cuentan con aliados afines dentro de la administración; por ejemplo, la familia Kushner hizo una gran inversión en OpenAI
- Esta medida puede interpretarse como una oportunidad para que otros laboratorios golpeen a Anthropic
- Fable es considerado un modelo muy potente, y resulta llamativo que el acceso de los consumidores se haya interrumpido justo cuando el IPO de Anthropic parece inminente
- Se señala que el spoils system vuelve sospechosa la optics de cualquier asunto y que se ha derrumbado la confianza acumulada durante décadas
El anuncio del viernes a las 5:21 y la preocupación del mercado
- El hecho de que el anuncio se hiciera el viernes a las 5:21 p. m. parece un horario sospechoso
- Los anuncios del viernes por la noche suelen entenderse como una forma de soltar malas noticias esperando que el impacto en el mercado se absorba durante el fin de semana
- Los ejemplos citados por Claude desde The Kobeissi Letter incluyen anuncios geopolíticos y comerciales publicados después del cierre del viernes o en la madrugada del sábado
- Entre ellos se mencionan ataques a instalaciones nucleares iraníes, acciones militares contra un barco narco en el Caribe, amenazas de aranceles del 100% a China, cierre del espacio aéreo venezolano, acciones militares en Nigeria y un ataque directo contra Irán en febrero de 2026
- El anuncio del acuerdo de Intel del 11 de agosto de 2025 también se agrupa como un caso corporativo colocado fuera del horario activo de negociación tras presión pública sobre el CEO Lip-Bu Tan
- El boom de la IA depende en gran medida de la idea de que habrá demanda sostenida de inteligencia computacional
- El alza bursátil en toda la cadena de la IA —deuda, inversión en despliegue, centros de datos, GPU, memoria, discos y racks de servidores— depende del supuesto de que se crearán billones de dólares en valor
- La percepción de que el gobierno puede cortar unilateralmente todo acceso en cualquier momento podría ser un gran obstáculo para inversiones multibillonarias en centros de datos
- Algunos usuarios de HN y Reddit ven este incidente como un límite superior a la capacidad de los modelos a los que el gobierno permitirá que la gente acceda
- Si el gobierno no lo permite, el problema es que no se podrá acceder sin importar cuánta demanda exista
Reacción de la comunidad y el efecto boomerang del marketing de “modelo peligroso”
- Algunos usuarios de HN y Reddit se alegran al pensar que Anthropic está pagando el precio por su show de marketing alrededor de Mythos
- En el pasado, OpenAI también hizo un lanzamiento restringido de GPT-2 bajo la idea de que era “demasiado peligroso para publicarse”, argumentando riesgos de generación masiva de lenguaje engañoso, sesgado o malicioso
- Se considera que, después de GPT-2, la avalancha de contenido generado por IA de baja calidad efectivamente sacudió la capacidad de entender una realidad compartida, así que las preocupaciones de OpenAI fueron bastante acertadas
- Se cree que Fable realmente es un modelo potente, y hasta cierto punto se confía en Anthropic cuando dice que le preocupan los riesgos de seguridad de una publicación amplia de Fable
- El comentario principal del hilo relacionado en HN fue que Anthropic terminó pagando el precio de avivar el miedo para vender su modelo como muy por delante de los demás
- Si se toma al pie de la letra la postura del gobierno, el modelo de Anthropic sería tan sobresaliente que literalmente no podría usarse, lo que paradójicamente podría convertirse en una publicidad muy poderosa
- Otro comentario en HN señala que si pasas mucho tiempo hablando de lo peligroso que es tu producto, quienes tienen autoridad para frenarlo en el mercado pueden terminar escuchándote
- Se describe a Bernie Sanders como un legislador que enfatiza los riesgos de la IA, incluso haciendo videos de política en los que lee declaraciones de CEOs de IA
- Puede que los modelos de IA realmente no sean seguros y necesiten regulación, pero los CEOs de IA que ahora ven el riesgo de cierre quizá dejen de decir esas cosas en adelante
El precedente de restringir el acceso a LLM potentes
- El último comentario en HN citado ve el punto central del incidente en que el gobierno podría haber empezado a restringir el acceso público a LLM potentes
- Ese comentario considera a Fable como el modelo más poderoso del mercado y sostiene que, aunque en principio el gobierno de EE. UU. solo lo prohibió para no ciudadanos estadounidenses, en la práctica también dejó sin acceso a ciudadanos de EE. UU.
- También sostiene que hay que reconsiderar la idea de que la solución sea usar modelos chinos open source o ejecutarlos en hardware propio
- En una situación donde el gobierno de EE. UU. bloquea el modelo estadounidense más potente, parece poco probable que China permita dentro de un año el open source del LLM más fuerte de una empresa local con capacidades de nivel Mythos
- Los LLM potentes están avanzando hacia la categoría de armas poderosas de ciberseguridad, y los Estados nación pasan a tener un interés directo en restringirlos y controlarlos
- Sería sorprendente que dentro de dos años el LLM más potente siguiera disponible para uso general
- No está claro si restringir los LLM potentes hará a la gente más pobre o más segura, pero este incidente representa un punto de inflexión importante que crea precedente
3 comentarios
Supongo que tendré que leerlo hasta entenderlo por completo.
Ay...
Opiniones en Hacker News
Entiendo la idea de que el renacimiento de los “juegos Flash” podría volver gracias a las herramientas de AI, pero después de seguir probando los juegos que la gente hace en el subreddit de aigamedev, me decepcionaron bastante
El diseño de juegos es un arte difícil de aprender, y parece un área donde los LLM no pueden ayudar demasiado
Decir que estos juegos son “divertidos” se parece a decir que un dibujo infantil es “hermoso”, y con más de 25 dólares que gastarías en generación de código podrías comprar muchísimos juegos indie mucho mejores
El arte del gran diseño de juegos está en los detalles, y el inglés por sí solo no basta para transmitir cada pincelada sobre el lienzo
Entré a ese subreddit para ver qué estaban haciendo, pero a mí tampoco me impresionó mucho
Seguro también hay muchos desarrolladores que usan LLM para ayudar con la parte aburrida de programar, manteniéndolos bien controlados y haciendo ellos mismos la parte creativa
Siempre ha habido desarrolladores indie a quienes no les gusta programar y lo ven solo como un paso necesario para sacar sus ideas, y aun así hicieron buenos juegos
Todos los diálogos de Undertale están implementados en un enorme
switchde más de 5 mil líneasPara encontrar juegos como Boxhead, Motherload o Bloons, había que escarbar entre montones de basura
Aquí la cantidad sí importa
No hace falta ser un gran programador para ser un gran diseñador de juegos, pero antes la programación era un requisito previo para siquiera empezar
La belleza de aplicar herramientas de AI a los juegos está en esto último: poder concentrarse solo en el diseño del juego, y con el tiempo las joyas terminarán saliendo a la superficie
En su momento publiqué 4 juegos Flash: 2 fueron un fracaso total, 1 estuvo más o menos y 1 salió bastante bien
El tiempo de juego acumulado llegó a cientos de años
Hay muchísimo trabajo para hacerlo bien y, como todo software, debe hacerse para su mercado objetivo
No existe una solución fácil con AI para crear un bucle central divertido y envolvente, ni una solución para equilibrar la complejidad adecuada con la curva de aprendizaje
Mucha gente que no sabía programar o no programaba pensó que era diseñadora de juegos y esperaba que la AI le permitiera hacer juegos, pero parece que ahora están descubriendo que el núcleo nunca fue el código
Además, si no sabes programar, el vibe coding por sí solo todavía no alcanza para crear muchas cosas que superen un juego de nivel Flash
He programado bastante en varias subáreas, pero aun así esto sigue sintiéndose como el campo más difícil de penetrar para la AI
Sin duda es increíble como herramienta para aumentar la velocidad de producción, pero en términos generales parece que será el área más difícil de convertir en producto para la AI
El autor dice que OpenAI usó la táctica de marketing de “demasiado peligroso para publicarse” en la época de GPT-2 y que ambos bandos jugaron esa carta, pero en ese momento Dario estaba en OpenAI y fue coautor del paper de investigación de GPT-2
El enfoque de “demasiado peligroso para publicarse” se parece más a algo que esa persona ha venido haciendo en ambas empresas
En la publicación original de 2019 ya se mencionaban posibles abusos como la generación de noticias engañosas, la suplantación de identidad en línea, la generación automática de contenido abusivo o falso para redes sociales y la generación automática de spam y phishing
Junto con resultados sintéticos de imagen, audio y video, se decía que estas tecnologías reducirían el costo de producir contenido falso y campañas de desinformación, y que el público debería volverse más escéptico del texto en línea, igual que con las imágenes deepfake
Por eso dijeron que lo lanzarían con cautela
https://openai.com/index/better-language-models/
Desde mentiras y desinformación hasta personas que eligen chatbots en lugar de tratamiento o relaciones humanas, su impacto social es profundo y va a empeorar
Ya es deprimente encontrar programadores junior lo bastante capaces de lograr algo incluso cuando la AI deja de funcionar, y parece que eso también empeorará
Funciones de seguridad importantes como “prohibir la generación de material de abuso sexual infantil” o “las afirmaciones deben ser verdaderas o basadas en evidencia” ni siquiera se incorporaron desde el diseño de estos sistemas, y hasta ahora tampoco se han resuelto bien, pero las empresas de AI los lanzaron al público con defectos evidentes
Me gusta la capacidad de la AI para producir tonterías y su lado de juguete curioso, pero hasta ahora ha sido una ganancia neta solo para una pequeña minoría ya muy rica, que se beneficia despidiendo gente y dejando que las computadoras hagan el trabajo de forma medio desastrosa; para todos los demás ha sido una pérdida neta
Ya es tarde, pero viendo atrás, estoy de acuerdo en que en esta forma era demasiado peligroso para publicarse
El escepticismo excesivo de Hacker News arruinó una discusión sobre IA razonable
El gobierno de EE. UU., al intensificar la guerra por el control de la IA, usó el poder del Estado contra Anthropic de una forma torpe, corrupta y punitiva
Pero en HN se aferran a que la única explicación es “humo de marketing”, y están forzando toda la evidencia a encajar en explicaciones cada vez más rebuscadas
La IA amenaza empleos, estatus, creencias y estilos de vida
En HN parece más fácil inventar racionalizaciones de por qué esto no puede ser cierto que creer esta verdad
Se agradece a quienes aceptan que el mundo podría estar cambiando de una manera bastante extraña e intentan analizar lo que realmente está pasando
Justo cuando SSL se estaba consolidando como la solución clara para pagos seguros en la web pública, EE. UU. casi termina prohibiéndolo
Parece que la puerta quedó abierta gracias a la presión económica, la falta de alternativas y mucha oposición, pero también entonces usaron el mismo discurso absurdo de “interés nacional y seguridad”
La gran diferencia ahora es que no es que sin Fable/Mythos no se pueda hacer nada
Aquí no hay una línea mágica, solo mejoras en el trabajo de conexión con menos intervención
Aun así, si esto se mantiene, probablemente producirá un enorme efecto paralizante sobre el desarrollo de IA en EE. UU., y otros labs acabarán alcanzando el rendimiento de Fable/Mythos por otros caminos
En una analogía automotriz, es como si un modelo mejorara su motor de V6 a V8, pero otras organizaciones pudieran lograr aumentos similares de velocidad mejorando la aerodinámica o la inyección de combustible
Hay tanto margen de mejora en toda la cadena que una medida así no tiene sentido
Viendo las tácticas agresivas de esta administración y de Anthropic, parece más bien parte de una negociación de alto riesgo que terminará en algún “acuerdo” dentro de una semana
Incluso podría beneficiar a Anthropic, porque si aparece un arreglo favorable, ¿dónde deja eso a OpenAI?
El precedente ya está sentado
La mayoría de los nerds como yo dejamos atrás esa actitud filosa en la preparatoria o en la universidad
En la práctica, esa postura solo hace que veas todo a través del lente más oscuro posible
Decían que la gente leería cosas malas y difundiría malas ideas, y sí, eso pasó, pero en conjunto fue un precio pequeño por la expansión de la alfabetización
No digo que sea 100% una jugada publicitaria, pero parece que Anthropic realmente quiere que la gente se entere de esto
Salen con cosas como “Anthropic solo está montando un escándalo de marketing”, “la IA es como los NFT”, “es circular”, “la burbuja va a estallar pronto”, “los alarmistas sostienen el mercado bursátil porque quieren salirse rápido como estafadores”
La última expresión me la inventé intentando imitar a la fuerza la terminología que usan
El problema central es que la IA se está volviendo demasiado poderosa como para simplemente ponérnosla en las manos a gente común como nosotros
Si todavía crees que todo es exageración, entonces estás perdiendo de vista el problema real
Supongo que en algún momento desaparecerá toda esta retórica y nos enfocaremos en los problemas reales
Que los competidores de Anthropic tengan amigos repartidos por toda la administración, y por ejemplo que el lado de Kushner haya invertido fuerte en OpenAI, es a la vez central e irrelevante
La “seguridad nacional” claramente parece más un pretexto, y si de verdad ese fuera el motivo, las exigencias no se habrían limitado solo a ciudadanos extranjeros
Ninguna administración estadounidense ha confiado jamás en todos sus propios ciudadanos
Pero el motivo de la restricción en sí casi no importa
El simple hecho de que esto haya pasado debería ser la alarma final para que la UE se tome en serio la soberanía digital, no solo de palabra sino con presupuesto y esfuerzo reales
A estas alturas, parece poco probable que la UE realmente gire el timón en esa dirección
Parece una queja de baja calidad, llena de groserías y sesgo ideológico, impropia de Hacker News
Esta medida mata todo el mercado empresarial de modelos de IA mejores que Opus 4.8
Ninguna empresa va a construir flujos de trabajo o capacidades donde un burócrata o un político malintencionado pueda quitarles de inmediato la inteligencia base
Incluso si alguna empresa fuera lo bastante tonta como para asumir ese riesgo, ¿Anthropic va a exigir a todos sus clientes empresariales que entreguen los pasaportes de todos sus empleados y que creen cuentas individuales de Claude para controlar el acceso a Mythos por empleado?
Una simple API key ya no sería suficiente
El momento también coincidió con ese instante de “evitemos un desplome” cerca del cierre del mercado en viernes, así que habrá que ver qué pasa el lunes
Como dicen otras respuestas, también parece un intento de someterse mutuamente entre el gobierno y Anthropic
Si OpenAI los alcanza y Anthropic suelta a los abogados, probablemente esto se revertirá o se transformará en algo como “el modelo debe tener el sello de aprobación de la IA estadounidense, por lo tanto aprobamos el nuevo Fable 5.1 validado por EE. UU.”
Ese momento probablemente coincidiría con un despliegue masivo en el DoD, el Pentagon y organismos relacionados
O si no, terminará en la línea de que China los va a alcanzar, así que todo esto no tiene sentido
No hay ningún modelo a salvo de una prohibición de ese tipo
La muy criticada AI Act de la UE ofrece un marco regulatorio seguro y predecible que puede servir de base para el desarrollo de IA
Da estabilidad jurídica frente a las decisiones impredecibles y arbitrarias de la administración estadounidense
Si las empresas de IA tienen un mínimo de criterio, más les vale considerar mudarse a Europa
Considerando que a Fable ya le habían impuesto protocolos de seguridad exagerados, todo esto se ve muy sospechoso
El gobierno de EE. UU. está usando su influencia sobre la economía para mandarle a Anthropic la señal de que su IPO depende de arrodillarse
En los últimos meses he llegado a confiar mucho más en OpenAI que en Anthropic
Si lees entre líneas los textos de Dario Amodei, parece un creyente dogmático que ve a la ASI como un gobernante perfecto e infalible para la humanidad, y además un nacionalista estadounidense bastante extremo
La empresa también parece estar ideológicamente alineada en esa misma línea
Incluso puedo imaginar que permitirían o crearían conscientemente una ASI fuera de control si creen que está alineada ideológicamente con ellos
OpenAI, en comparación, parece menos dogmática y más orientada al pragmatismo
No significa que sea una empresa especialmente buena, pero al menos se puede predecir cómo actuará una empresa común
Con más razón cuando hablamos de personas con incentivos de millones o miles de millones de dólares
También habrás visto lo que hacen a su propia familia por temas de herencia, ¿y aun así vas a “confiar” en OpenAI?
“¿Quién es el ingenuo, Kay?” - Godfather
Yo mismo escribí sobre ese mismo punto hace unas semanas https://news.ycombinator.com/item?id=48341224, y si lees las entradas recientes del blog, desaparecerá por completo cualquier duda que quede
En HN y Reddit ya se está diciendo que este podría ser el punto límite de lo que el gobierno estaría dispuesto a “permitir” que la gente use
Por mucha demanda que haya, no sirve de nada si el gobierno no lo entrega
Un LLM de mercado negro suena como algo sacado directamente de una novela de William Gibson
El resumen estuvo bueno, y mientras lo leía pensé en el debate sobre el cifrado fuerte
La frase “En realidad optimizamos lo que podemos medir, no lo que queremos lograr. Esperamos que ambas cosas coincidan, pero muchas veces no pasa” señala el problema central de los LLM
Creo que garantizar que un modelo quede alineado de forma segura para todas las personas y todas las intenciones es imposible o extremadamente caro
Además, “seguridad” puede significar cosas distintas según de quién se trate