1 puntos por GN⁺ 5 시간 전 | 6 comentarios | Compartir por WhatsApp
  • A raíz de una orden de control de exportaciones emitida por el gobierno de EE. UU. con base en facultades de seguridad nacional, se bloquea el acceso a Fable 5 y Mythos 5 para todos los ciudadanos extranjeros, dentro y fuera de Estados Unidos, y el servicio para todos los clientes se suspende de inmediato para cumplir con la normativa
  • La orden se recibió a las 5:21 p. m. ET y no especifica el contenido concreto de las preocupaciones de seguridad nacional
  • Se entiende que la base de la preocupación del gobierno es el conocimiento de una técnica de jailbreaking de Fable 5, pero la vulnerabilidad identificada por esa técnica ya era conocida y de nivel menor, y también puede encontrarse en otros modelos públicos sin necesidad de evasión
  • Anthropic afirma que, antes del lanzamiento, realizó miles de horas de pruebas de red teaming con el gobierno de EE. UU., UK AISI y entidades externas, y que ningún evaluador encontró un jailbreak universal
  • La empresa no está de acuerdo con que la posibilidad de un jailbreak de alcance limitado sea motivo para retirar un modelo comercial usado por cientos de millones de personas, y considera que si se aplicara el mismo criterio a otros proveedores de modelos, el despliegue de nuevos modelos quedaría prácticamente detenido

Contenido de la orden e impacto inmediato

  • El gobierno de EE. UU. emitió una orden de control de exportaciones invocando facultades de seguridad nacional, con lo que suspende el acceso a Fable 5 y Mythos 5 para todos los ciudadanos extranjeros (incluidos empleados de Anthropic con nacionalidad extranjera), tanto dentro como fuera de Estados Unidos
  • Como resultado de la orden, Anthropic desactivó repentinamente Fable 5 y Mythos 5 para todos los clientes a fin de cumplir con la normativa
    • El acceso a todos los demás modelos de Anthropic no se ve afectado
  • La orden se recibió ese mismo día a las 5:21 p. m. ET, y la carta no incluía detalles concretos sobre las preocupaciones de seguridad nacional

Base estimada de la preocupación del gobierno

  • Se entiende que el gobierno tuvo conocimiento de una técnica de evasión o jailbreaking de Fable 5
  • Tras revisar la demostración de esa técnica, Anthropic concluye que se utilizó para identificar un pequeño número de vulnerabilidades menores ya conocidas
    • Estas vulnerabilidades son relativamente simples, y también pueden encontrarse de la misma forma en otros modelos públicos sin necesidad de evasión

Postura de Anthropic sobre las protecciones de Fable

  • La empresa señala que implementó fuertes protecciones para reducir de manera importante el posible uso indebido en tareas como ciberseguridad, al punto de que muchos usuarios se han quejado de que son demasiado amplias
  • Durante varias semanas antes del lanzamiento, llevó a cabo un total de miles de horas de validación de red teaming junto con el gobierno de EE. UU., UK AISI, múltiples terceros privados y equipos internos
  • En esas pruebas, según Anthropic, se confirmó que las protecciones de Fable son materialmente más efectivas que las de cualquier otro modelo ya desplegado
  • Ningún evaluador encontró un jailbreak universal (una forma de eludir ampliamente las protecciones del modelo y habilitar diversas capacidades cibernéticas)

Límites de una defensa total contra jailbreaks

  • Actualmente, Anthropic considera que ningún proveedor puede lograr una resistencia completa a los jailbreaks, y que todas las protecciones de seguridad de la industria son vulnerables a jailbreaks no universales (inducción de cierta información cibernética en situaciones específicas)
    • También es posible que eventualmente se descubra un jailbreak universal, algo que la empresa indicó claramente al lanzar Fable 5

Estrategia de Defense in Depth

  • Ante la imposibilidad de una defensa total, Anthropic adopta una estrategia de defense in depth para limitar los jailbreaks a un alcance estrecho (no universal) o hacerlos muy costosos (universal), y detectar y bloquear rápidamente los ataques mediante monitoreo exhaustivo
    • Para ello, exigió a Fable una retención de datos de clientes por 30 días, lo que implica un costo real para los clientes, pero permite investigar y mitigar jailbreaks
  • La empresa mantiene esta estrategia de defensa en profundidad y sostiene que ya reduce el riesgo a un nivel comparable al de modelos existentes desplegados en toda la industria
  • No ha recibido divulgaciones de jailbreaks no universales preocupantes que hayan derivado en resultados dañinos, y los posibles jailbreaks revelados hasta ahora solo produjeron respuestas inofensivas o hallazgos menores sin ventajas específicas de Mythos

Verificación de la evidencia presentada por el gobierno

  • Hasta ahora, el gobierno solo ha presentado evidencia verbal, y esta se refiere a un jailbreak no universal de alcance limitado en el que se pide al modelo leer una base de código específica y corregir defectos de software
  • Anthropic entiende que solo se compartió con el gobierno un posible jailbreak, y al revisar el informe que se presume sirvió de base para la orden, concluyó que el nivel de capacidad mostrado también está ampliamente disponible en otros modelos, como GPT-5.5 de OpenAI
    • Se trata de capacidades que los defensores usan todos los días para proteger sistemas
  • La empresa dice que compartirá más detalles dentro de las próximas 24 horas

Respuesta y postura de Anthropic

  • Anthropic cumplió la orden legal del gobierno y eliminó el acceso a Fable 5 y Mythos 5 para todos los usuarios
  • Sin embargo, no está de acuerdo con que el descubrimiento de un posible jailbreak de alcance limitado sea motivo suficiente para retirar un modelo comercial desplegado para cientos de millones de personas
    • Considera que, si se aplicara el mismo criterio a toda la industria, el despliegue de nuevos modelos de todos los proveedores frontier quedaría prácticamente paralizado
  • La empresa sostiene que el gobierno debe tener autoridad para bloquear despliegues inseguros, pero que eso debe formar parte de un proceso legal transparente, justo, claro y basado en hechos técnicos, y que esta medida no cumple con esos principios
  • Pide disculpas por la confusión causada a los clientes, considera que se trata de un malentendido y está trabajando para restaurar el acceso lo antes posible

6 comentarios

 
clumsily 3 시간 전

Por más que lo vea, parece que después de armar tanto alboroto diciendo una y otra vez que su modelo era peligroso, al final se terminaron disparando al pie.
No sé si esto será un éxito o un fracaso de marketing en el futuro, pero por ahora se ve como un fracaso.

 
unsure4000 3 시간 전

Considerando la afluencia de usuarios a Anthropic después del incidente del Pentágono, creo que en este momento, con la IPO cerca, no hay forma de que Anthropic salga perdiendo.
Además, también les vendría perfecto para tapar temas como los guardrails, porque si de entrada simplemente dejan de ofrecer el modelo como servicio, ya no se podrá seguir verificando.

 
kirinonakar 4 시간 전

Parece que las empresas de IA ya no tienen motivos para desarrollar modelos con mejor rendimiento. Da la impresión de que el avance de la IA llega hasta aquí.

 
lsdcnu 2 시간 전

¿Qué es esto? jaja

 
unsure4000 5 시간 전

Incluidos los empleados de Anthropic con nacionalidad extranjera

Jajajajajajajajajajajajajajaja

 
GN⁺ 5 시간 전
Comentarios en Hacker News
  • Han estado haciendo marketing del miedo para vender el modelo como si estuviera muchísimo más adelantado que los demás, así que ahora les tocó pagar el precio
    Parece que por fin encontraron al público adecuado de tontos que se lo creyera

    • De cara al IPO, para Anthropic esto es buena publicidad, porque pueden tuitear sobre lo aterrador y poderoso que es su modelo
    • No es un problema exclusivo de Anthropic. Es una lucha de poder, y todos los que usan esta tecnología salen perdiendo. No es algo para celebrar
    • ¿Pagar el precio? Esto es el mejor marketing que podían haber esperado
    • Viendo esto, parece muy probable que el gobierno de Trump hubiera apuntado contra Anthropic incluso sin ese “marketing del miedo”

      Hasta ahora, lo que el gobierno nos ha presentado es únicamente evidencia verbal de un jailbreak potencialmente limitado y no generalizable, que esencialmente consiste en pedirle al modelo que lea una base de código específica y corrija fallas de software. Según entendemos, se compartió con el gobierno un posible jailbreak. Revisamos ese informe y confirmamos que el nivel de capacidad que muestra está ampliamente disponible en otros modelos, incluido GPT-5.5 de OpenAI, y es algo que los defensores que mantienen seguros los sistemas usan todos los días

    • Esto era el tipo de medida que Anthropic quería, y querían que se aplicara a todos los demás proveedores de modelos frontier que lanzan modelos potentes, incluyéndolos a ellos mismos

      Como hemos dicho públicamente, creemos que el gobierno debe poder bloquear despliegues inseguros como parte de un proceso legal transparente, justo, claro y basado en hechos técnicos. Esta medida no sigue esos principios
      Al final consiguieron lo que querían

  • Casi se puede oír a muchísimas empresas y usuarios apostando con más fuerza por los modelos chinos
    Que otros países tengan acceso a estos modelos puede ser un tema de seguridad nacional para EE. UU. Pero ahora depender de estos modelos, y más ampliamente de la tecnología estadounidense en general, también se vuelve un tema de seguridad nacional para otros países

    • Me pregunto de qué modelos estamos hablando. Quisiera saber qué hipótesis más concreta se puede plantear. ¿Que entre 20% y 50% de los usuarios de Anthropic se pasarán a DeepSeek?
    • ¿No es Qwen 3.7 el modelo más grande y además cerrado? Tampoco parece razonable asumir que la política china aquí vaya a ser menos despiadada
    • Esperen el día en que descargar o usar modelos chinos también se vuelva ilegal, medio en broma
  • Viéndolo lógicamente, ¿no queda más que concluir que EE. UU. llegó al límite superior de capacidad de modelos que está dispuesto a permitir al público? Con un precedente así, ¿quién va a invertir en modelos aún más inteligentes?
    Y quizá más importante: si un modelo como Mythos, que como mucho es una mejora incremental frente a Opus, recibe este trato, ¿cómo se recupera cualquier inversión en IA basada en la premisa de ASI/AGI/modelos mucho mejores?

    • La conclusión más plausible parece ser que la administración está enojada con Anthropic y está respondiendo de forma retaliatoria con la herramienta que tiene a mano
      Si OpenAI o Grok estuvieran operando al mismo nivel, da la impresión de que no habrían recibido el garrote del gobierno
    • No lo veo así. Hubo una época en que también se consideraba que la PlayStation 2 era demasiado poderosa para exportarse: https://www.pcmag.com/news/20-years-later-how-concerns-about...
      ChatGPT 2 también fue considerado en su momento demasiado poderoso para hacerse público
      La IA ha avanzado más rápido que la cultura y la forma de pensar. Una vez que nos adaptemos a lo que estos modelos pueden hacer, se aflojará un poco la situación, y luego la siguiente mejora escalonada hará que todo se repita otra vez. Siempre pasa así
    • Creo que en adelante los mejores modelos frontier solo se ofrecerán de forma controlada a la gente rica
    • Esta “tecnología” está al alcance de cualquiera que tenga suficiente dinero para entrenar nuevos modelos. Así que, aparte de que esta burbuja reviente pronto, en unos meses aparecerá otra persona con un modelo parecido
      Esto es resultado del espectáculo estilo estadounidense alrededor de los modelos de lenguaje a gran escala. Esta vez simplemente les salió al revés
    • Hay un 95% de probabilidad de que esta medida se revierta para el lunes por la mañana, así que esa es la respuesta
  • De ahora en adelante, sean realmente peligrosos o no los modelos, las afirmaciones de riesgo sobre modelos futuros probablemente desaparecerán
    Si el gobierno puede ordenar arbitrariamente suspender el uso de un modelo a todos los extranjeros, dentro y fuera de EE. UU., nadie querrá asumir el riesgo de construir algo importante sobre estos modelos. Al final, será cuestión de tiempo para que empresas extranjeras alcancen ese nivel y se queden con el mercado comercial de estos modelos. Solo que EE. UU., como suele hacer, probablemente prohibirá a los competidores, así que en la práctica podría terminar habiendo un backend distinto solo dentro de EE. UU.

    • Esto se parece más al fin del boom de los semiconductores basado en la premisa de “monetizar modelos cada vez más grandes”. Si el gobierno de EE. UU. puede impedir la monetización con órdenes caprichosas porque cierto modelo “se volvió demasiado bueno”, se cae todo el teatro
      Con escasez mundial de petróleo, escasez de fertilizantes e intervenciones torpes para inflar la burbuja, casi habría que dar gracias de que al volante esté un stable genius octogenario senil que desprecia el Estado de derecho y tiene veintidós especialistas
    • Al leer el texto, parece mucho más probable que la prevención de jailbreaks se vuelva muchísimo más estricta y también aumenten los falsos positivos

      Hoy a las 5:21 p. m. (hora del Este) recibimos instrucciones del gobierno. La carta no incluía detalles concretos sobre las preocupaciones de seguridad nacional. Según entendemos, el gobierno cree haber encontrado una forma de eludir o “jailbreakear” Fable 5. Revisamos la demostración usada con esta técnica específica para identificar un pequeño número de vulnerabilidades previamente conocidas. Todas estas vulnerabilidades parecen relativamente simples, y confirmamos que otros modelos públicos también pueden encontrarlas sin necesidad de evasión

    • Si ese fuera el caso, me parece que muchos estadounidenses sí asumirían el riesgo de construir algo importante sobre eso
  • Desde la perspectiva de las grandes empresas o de organizaciones con cierto tamaño, es difícil asumir la amenaza de que algo así pueda desactivar de repente una pieza central de la infraestructura. La presión por el acceso on-premises y offline va a crecer de forma abrumadora, y ya sea con licencias de pesos o con entornos restringidos como TEE/CC, alguien va a cubrir esa demanda

    • Es muy probable que aparezcan varios puntos sobre el frente de Pareto
      Algunos asumirán más riesgo y ganarán o perderán, mientras que otros se moverán con más seguridad y acumularán resultados lentamente o quedarán atrás
      Ni hablar de la amenaza de poner a estos modelos a escribir el código que opera el trabajo de una empresa o a actuar como agentes. Incluso podría tratarse de un modelo entrenado por actores cuyos intereses son exactamente opuestos a los tuyos, ya sean empresas o Estados
      Ahora hay muchas más cosas que considerar, y es una época interesante para hacer negocios
    • Estoy de acuerdo en que la demanda de acceso on-premises y offline será abrumadora, pero el problema es que Big AI ha hecho que la mayoría no pueda costear el hardware necesario para correr eso. Cosas como RAM y NVMe
    • Justamente por esto creo que, a largo plazo, van a ganar los modelos abiertos chinos. En el panorama general, la diferencia de capacidades no es dramática, pero el hecho de poder ejecutarlos uno mismo es un argumento de venta enorme
      Incluso si alquilas un modelo abierto de una empresa china, si te cortan el acceso o cambian los términos de una forma que no te gusta, puedes pasar a on-premises. Puede ser molesto, pero no amenaza tu supervivencia. En cambio, si dependes de un modelo cerrado y te lo cortan, el dolor puede ser enorme
      La gran cuestión aquí es el dominio de la infraestructura. Los modelos chinos se convertirán en los modelos que la gente realmente usa y, al hacerlo, van a definir los estándares. Entonces se formarán más investigación, más herramientas y todo el ecosistema a su alrededor
      Incluso antes de este alboroto, esa tendencia ya había empezado, con modelos chinos convirtiéndose en los más usados del mundo. https://www.indiatoday.in/amp/technology/features/story/clau...
  • El amanecer de esta era se ve en todas partes, desde Irán hasta los sistemas de verificación de edad en línea, y esto es solo el principio. El mundo que viene será técnicamente ultramoderno e incluso futurista, pero estructuralmente se sentirá medieval. Es el mundo de Frank Herbert. No estará organizado como una inclusión universal de todos dentro de un único espacio normativo, sino como capas superpuestas de zonas de protección, extracción y acceso controlado
    https://turbulence.substack.com/p/the-gated-age

  • Si te pasas mucho tiempo hablando de lo peligroso que es tu producto, puede que quienes tienen autoridad para sacar del mercado productos peligrosos te escuchen
    Más aún si esas personas no son especialmente brillantes en este momento y además ya están molestas con Anthropic porque no les está ayudando a cumplir objetivos autoritarios aparte
    No creo que esto sea ajedrez 3D de Anthropic. No son los genios estrategas entre bambalinas que les gustaría ser. Quienes realmente han usado el producto saben que Fable y Mythos no son dispositivos del fin del mundo, sino mejoras graduales. Esto me parece una medida punitiva de una administración aficionada al castigo, y Anthropic reforzó sin querer la justificación con su retórica absurda

  • Dice que esto ocurrió hoy a las 5:21 p. m. hora del Este
    La página mostraba 11 de junio de 2026, y en los últimos 10 minutos se actualizó a 12 de junio de 2026
    https://imgur.com/a/lx7HCW9
    Google muestra que esta página fue rastreada hace varios días
    Solo busca “the us government directive to suspend access to fable”

    3 days ago — The US government has issued an export control directive to suspend all access to Fable 5 and Mythos 5.
    https://imgur.com/a/KQrYPMh

    • Ese es el post del blog de lanzamiento. Google probablemente tomó el snippet de la sección Related Content al final, donde está incluido un artículo sobre la directiva del gobierno de EE. UU.
    • Este hilo también aparece igual
      https://imgur.com/a/EOWWUbD
    • ¿De dónde salió la información de que Google lo rastreó hace varios días? La captura de imgur es de las pruebas más débiles. Como mínimo habría que usar archive.today o capturar la prueba misma de que Google lo rastreó
  • Revisamos ese informe y confirmamos que el nivel de capacidad revelado allí está ampliamente disponible en otros modelos, incluido GPT-5.5 de OpenAI, y es algo que los defensores que mantienen seguros los sistemas usan todos los días. Compartiremos más detalles en las próximas 24 horas
    Toda la retórica sobre que Mythos superaba ampliamente a GPT 5.5, especialmente en ciberseguridad, pierde fuerza con esto. Claro, el benchmark de AISI ya sugería eso, pero ahora es interesante ver a Anthropic decirlo cuando le conviene

    • No están diciendo que otros modelos tengan el mismo nivel de capacidad en términos generales. Están diciendo que la capacidad específica que probó el gobierno también existe en otros modelos
    • Esto se refiere a la capacidad específica que el gobierno objetó, no a las capacidades generales de Fable. Por experiencia personal usando Fable esta semana en tareas muy complejas, al menos en ingeniería de software era muchísimo más potente que cualquier otro modelo
    • De verdad me voy a enojar si por esto terminan prohibiendo 5.5
    • La comparación con otros modelos está limitada a los problemas que, en el caso del gobierno, se lograron completar con jailbreak, no a todas las vulnerabilidades que pueden explotarse sin evasiones
  • Incluso si están en EE. UU. o son empleados de Anthropic, impedir que los ciudadanos extranjeros lo usen, sin importar de qué país sean, parece excesivamente amplio y severo. Y que sea, aparentemente, por una sola vulnerabilidad potencial de jailbreak bastante menor sugiere que hay algo más de lo que se ve

    • Suena a que el alcance de quién puede seguir usándolo está alineado con otros controles de exportación de EE. UU., como ITAR o EAR
    • Sí. Este gobierno no es precisamente famoso por su sutileza...
    • Es lamentable, pero así es como suelen funcionar los controles de exportación. Incluso si trabajas en un laboratorio nacional, no permitir que investigadores extranjeros entren en áreas relacionadas con la seguridad nacional es la medida de seguridad más fácil de tomar
      No significa que sea un buen resultado para los investigadores ni para la investigación en sí. Es más bien una especie de seguro sobre el uso de fondos ordenado por EE. UU.
    • También queda cierto resentimiento entre el DoD y Anthropic. Viendo el nivel general de madurez en las más altas esferas del gobierno de EE. UU., apostaría bastante a que Mythos se convirtió en una buena excusa para que el grupo de Hegseth se vengara