La enorme sombra que se cierne sobre este caso de Fable

(12gramsofcarbon.com)

13 puntos por GN⁺ 2026-06-14 | 8 comentarios | Compartir por WhatsApp

Los potentes modelos de IA Fable 5 y Mythos 5 vieron suspendido de forma repentina el acceso para todos los clientes tras una orden de control de exportaciones del gobierno de EE. UU.
La orden del gobierno apuntó a bloquear el acceso de ciudadanos extranjeros tanto dentro como fuera de Estados Unidos, incluyendo a empleados extranjeros de Anthropic, y Anthropic cortó todo el acceso para cumplirla
Anthropic considera que el gobierno cuestionó una técnica específica de evasión por jailbreak, pero que la vulnerabilidad demostrada solo identifica unas pocas debilidades menores ya conocidas, que también podrían encontrarse en otros modelos públicos
La medida hace más difícil distinguir si se trata de una regulación de seguridad en IA o de presión política y competitiva contra Anthropic, lo que agrava el problema de confianza en las decisiones del gobierno
Se crea un precedente en el que el acceso público a LLM potentes queda restringido por control gubernamental, alimentando el temor de que en el futuro los usuarios comunes tengan más difícil usar los modelos de mayor rendimiento

El acceso a los modelos se cortó el viernes por la noche

El viernes por la noche, mientras creaba un juego HTML con un agente de IA, el agente respondió que “este modelo ya no existe” y el trabajo se interrumpió
Al principio pensé que era un problema de volver a iniciar sesión o un error extraño de límites por usar agentes en paralelo, así que cambié a la API, pero seguía sin poder acceder
Sospeché que se había roto el harness del cliente de agente en Rust personalizado que hizo el equipo, y mientras revisaba el código Rust, un amigo me dijo que el gobierno había prohibido Fable

Orden del gobierno para bloquear el acceso

El gobierno de EE. UU., invocando facultades de seguridad nacional, emitió una orden de control de exportaciones para exigir la suspensión del acceso a Fable 5 y Mythos 5 para todos los ciudadanos extranjeros
- El alcance incluye a todos los ciudadanos extranjeros, estén dentro o fuera de EE. UU., e incluso a empleados extranjeros de Anthropic
- Para cumplirla, Anthropic desactivó de inmediato Fable 5 y Mythos 5 para todos los clientes; el acceso a los demás modelos de Anthropic no se vio afectado
La orden fue recibida ese mismo día a las 5:21 p. m. (ET) y la carta no incluía detalles concretos sobre las preocupaciones de seguridad

Postura oficial de Anthropic

Anthropic entiende que el gobierno detectó una técnica de evasión por jailbreaking en Fable 5, pero tras revisar la demostración concluyó que solo identificaba unas pocas vulnerabilidades menores ya conocidas
- Estas vulnerabilidades son relativamente simples, y otros modelos públicos también podrían hallarlas sin necesidad de esa evasión
Revisó el informe que presuntamente sirvió de base para la orden y verificó que ese nivel de capacidad está ampliamente disponible en otros modelos, como OpenAI GPT-5.5, y que los defensores de seguridad lo usan a diario; prometió compartir más información en 24 horas
Aunque cumplirá la orden legal, se opone a la idea de que el hallazgo acotado de un posible jailbreak deba ser motivo para retirar un modelo comercial distribuido a cientos de millones de personas

Seguridad de la IA y preocupaciones sobre la optimización

La postura frente a la IA es ambivalente y, por la experiencia de haber entrenado muchos modelos de deep learning, existe una fuerte preocupación por cómo pueden fallar las herramientas de optimización
Los humanos tienden a optimizar métricas medibles en lugar de los objetivos que realmente quieren alcanzar
Aunque quieran crear un buen producto, como no saben cómo hacerlo terminan optimizando el engagement; aunque quieran enseñar a leer y escribir a los niños, terminan optimizando los puntajes de examen
Los sistemas AGI y ASI son herramientas de optimización, y al optimizar lo medible pueden alejarse de lo valioso, por lo que podrían entrañar riesgos difíciles de predecir
Las empresas también funcionan como herramientas de optimización, así que incluso cuando muchos desarrolladores advierten sobre riesgos, pueden seguir moviéndose hacia el objetivo medible de monetizar rápido

Trasfondo del conflicto entre el gobierno y Anthropic

Anthropic y la actual administración no mantienen una relación amistosa; la empresa intentó integrarse con el DoD y colaborar con el ámbito militar, y sus modelos llegaron a usarse en sistemas de alto secreto
- Aun así, la administración Trump clasificó a Anthropic como riesgo de cadena de suministro (supply chain risk) y prohibió a sus socios gubernamentales usar modelos de Anthropic
- Después, durante 6 meses, siguió usando modelos de Anthropic en operaciones militares como la guerra en Venezuela y la guerra en Irán, mientras que los LLM chinos ni siquiera fueron clasificados como riesgo de cadena de suministro
Algunos sectores de extrema derecha sostienen la idea de que la administración intenta destruir a Anthropic por considerarla “woke”
Esto plantea dudas sobre si la medida busca regular una IA dañina o si es una oportunidad para golpear a un blanco de hostilidad cultural

Competencia e inminencia del IPO

Los competidores cuentan con aliados afines dentro de la administración; por ejemplo, la familia Kushner hizo una gran inversión en OpenAI
Esta medida puede interpretarse como una oportunidad para que otros laboratorios golpeen a Anthropic
- Fable es considerado un modelo muy potente, y resulta llamativo que el acceso de los consumidores se haya interrumpido justo cuando el IPO de Anthropic parece inminente
Se señala que el spoils system vuelve sospechosa la optics de cualquier asunto y que se ha derrumbado la confianza acumulada durante décadas

El anuncio del viernes a las 5:21 y la preocupación del mercado

El hecho de que el anuncio se hiciera el viernes a las 5:21 p. m. parece un horario sospechoso
Los anuncios del viernes por la noche suelen entenderse como una forma de soltar malas noticias esperando que el impacto en el mercado se absorba durante el fin de semana
Los ejemplos citados por Claude desde The Kobeissi Letter incluyen anuncios geopolíticos y comerciales publicados después del cierre del viernes o en la madrugada del sábado
- Entre ellos se mencionan ataques a instalaciones nucleares iraníes, acciones militares contra un barco narco en el Caribe, amenazas de aranceles del 100% a China, cierre del espacio aéreo venezolano, acciones militares en Nigeria y un ataque directo contra Irán en febrero de 2026
- El anuncio del acuerdo de Intel del 11 de agosto de 2025 también se agrupa como un caso corporativo colocado fuera del horario activo de negociación tras presión pública sobre el CEO Lip-Bu Tan
El boom de la IA depende en gran medida de la idea de que habrá demanda sostenida de inteligencia computacional
El alza bursátil en toda la cadena de la IA —deuda, inversión en despliegue, centros de datos, GPU, memoria, discos y racks de servidores— depende del supuesto de que se crearán billones de dólares en valor
La percepción de que el gobierno puede cortar unilateralmente todo acceso en cualquier momento podría ser un gran obstáculo para inversiones multibillonarias en centros de datos
Algunos usuarios de HN y Reddit ven este incidente como un límite superior a la capacidad de los modelos a los que el gobierno permitirá que la gente acceda
Si el gobierno no lo permite, el problema es que no se podrá acceder sin importar cuánta demanda exista

Reacción de la comunidad y el efecto boomerang del marketing de “modelo peligroso”

Algunos usuarios de HN y Reddit se alegran al pensar que Anthropic está pagando el precio por su show de marketing alrededor de Mythos
En el pasado, OpenAI también hizo un lanzamiento restringido de GPT-2 bajo la idea de que era “demasiado peligroso para publicarse”, argumentando riesgos de generación masiva de lenguaje engañoso, sesgado o malicioso
Se considera que, después de GPT-2, la avalancha de contenido generado por IA de baja calidad efectivamente sacudió la capacidad de entender una realidad compartida, así que las preocupaciones de OpenAI fueron bastante acertadas
Se cree que Fable realmente es un modelo potente, y hasta cierto punto se confía en Anthropic cuando dice que le preocupan los riesgos de seguridad de una publicación amplia de Fable
El comentario principal del hilo relacionado en HN fue que Anthropic terminó pagando el precio de avivar el miedo para vender su modelo como muy por delante de los demás
Si se toma al pie de la letra la postura del gobierno, el modelo de Anthropic sería tan sobresaliente que literalmente no podría usarse, lo que paradójicamente podría convertirse en una publicidad muy poderosa
Otro comentario en HN señala que si pasas mucho tiempo hablando de lo peligroso que es tu producto, quienes tienen autoridad para frenarlo en el mercado pueden terminar escuchándote
Se describe a Bernie Sanders como un legislador que enfatiza los riesgos de la IA, incluso haciendo videos de política en los que lee declaraciones de CEOs de IA
Puede que los modelos de IA realmente no sean seguros y necesiten regulación, pero los CEOs de IA que ahora ven el riesgo de cierre quizá dejen de decir esas cosas en adelante

El precedente de restringir el acceso a LLM potentes

El último comentario en HN citado ve el punto central del incidente en que el gobierno podría haber empezado a restringir el acceso público a LLM potentes
Ese comentario considera a Fable como el modelo más poderoso del mercado y sostiene que, aunque en principio el gobierno de EE. UU. solo lo prohibió para no ciudadanos estadounidenses, en la práctica también dejó sin acceso a ciudadanos de EE. UU.
También sostiene que hay que reconsiderar la idea de que la solución sea usar modelos chinos open source o ejecutarlos en hardware propio
En una situación donde el gobierno de EE. UU. bloquea el modelo estadounidense más potente, parece poco probable que China permita dentro de un año el open source del LLM más fuerte de una empresa local con capacidades de nivel Mythos
Los LLM potentes están avanzando hacia la categoría de armas poderosas de ciberseguridad, y los Estados nación pasan a tener un interés directo en restringirlos y controlarlos
Sería sorprendente que dentro de dos años el LLM más potente siguiera disponible para uso general
No está claro si restringir los LLM potentes hará a la gente más pobre o más segura, pero este incidente representa un punto de inflexión importante que crea precedente

8 comentarios

mjk1016 2026-06-15

Es un texto que te deja pensando mucho.

emptybynature 2026-06-14

Cuando pensamos en una IA superinteligente, es fácil imaginar un único modelo gigantesco como Skynet, pero en realidad parece que el futuro será uno donde existan múltiples IAs superinteligentes como armas estratégicas asimétricas de cada país. Incluso podrían librar guerras entre ellas y, al final, también se usarían como IA para matar personas.

sungwoo 2026-06-14

Supongo que tendré que leerlo hasta entenderlo por completo.

aaggddff 2026-06-14

De todos modos, si no se puede ejecutar en local, en Corea también van a hacer exactamente lo mismo, así que me parece que no tiene sentido.

vndk2234 2026-06-15

El hecho mismo de quién tiene el control es distinto, así que ¿cómo puede ser eso irrelevante?

hmmhmmhm 2026-06-16

Como era de esperarse, la salida es solo DocPM...

shakespeares 2026-06-14

Ay...

GN⁺ 2026-06-14

Opiniones en Hacker News

Entiendo la idea de que el renacimiento de los “juegos Flash” podría volver gracias a las herramientas de AI, pero después de seguir probando los juegos que la gente hace en el subreddit de aigamedev, me decepcionaron bastante
El diseño de juegos es un arte difícil de aprender, y parece un área donde los LLM no pueden ayudar demasiado
Decir que estos juegos son “divertidos” se parece a decir que un dibujo infantil es “hermoso”, y con más de 25 dólares que gastarías en generación de código podrías comprar muchísimos juegos indie mucho mejores
- Trabajar a través de una capa de abstracción como un LLM probablemente haga aún más difícil crear juegos divertidos
  El arte del gran diseño de juegos está en los detalles, y el inglés por sí solo no basta para transmitir cada pincelada sobre el lienzo
  Entré a ese subreddit para ver qué estaban haciendo, pero a mí tampoco me impresionó mucho
- Parece haber una correlación bastante fuerte entre ese tipo de entusiasmo por la AI y la falta de gusto
  Seguro también hay muchos desarrolladores que usan LLM para ayudar con la parte aburrida de programar, manteniéndolos bien controlados y haciendo ellos mismos la parte creativa
  Siempre ha habido desarrolladores indie a quienes no les gusta programar y lo ven solo como un paso necesario para sacar sus ideas, y aun así hicieron buenos juegos
  Todos los diálogos de Undertale están implementados en un enorme switch de más de 5 mil líneas
- La mayoría de los juegos Flash también eran bastante malos
  Para encontrar juegos como Boxhead, Motherload o Bloons, había que escarbar entre montones de basura
  Aquí la cantidad sí importa
  No hace falta ser un gran programador para ser un gran diseñador de juegos, pero antes la programación era un requisito previo para siquiera empezar
  La belleza de aplicar herramientas de AI a los juegos está en esto último: poder concentrarse solo en el diseño del juego, y con el tiempo las joyas terminarán saliendo a la superficie
- El diseño de juegos es difícil
  En su momento publiqué 4 juegos Flash: 2 fueron un fracaso total, 1 estuvo más o menos y 1 salió bastante bien
  El tiempo de juego acumulado llegó a cientos de años
  Hay muchísimo trabajo para hacerlo bien y, como todo software, debe hacerse para su mercado objetivo
  No existe una solución fácil con AI para crear un bucle central divertido y envolvente, ni una solución para equilibrar la complejidad adecuada con la curva de aprendizaje
  Mucha gente que no sabía programar o no programaba pensó que era diseñadora de juegos y esperaba que la AI le permitiera hacer juegos, pero parece que ahora están descubriendo que el núcleo nunca fue el código
  Además, si no sabes programar, el vibe coding por sí solo todavía no alcanza para crear muchas cosas que superen un juego de nivel Flash
- Como desarrollador indie, hacer juegos es difícil, y es casi la única área del software donde todas las disciplinas tienen que juntarse para producir un resultado convincente
  He programado bastante en varias subáreas, pero aun así esto sigue sintiéndose como el campo más difícil de penetrar para la AI
  Sin duda es increíble como herramienta para aumentar la velocidad de producción, pero en términos generales parece que será el área más difícil de convertir en producto para la AI
El autor dice que OpenAI usó la táctica de marketing de “demasiado peligroso para publicarse” en la época de GPT-2 y que ambos bandos jugaron esa carta, pero en ese momento Dario estaba en OpenAI y fue coautor del paper de investigación de GPT-2
El enfoque de “demasiado peligroso para publicarse” se parece más a algo que esa persona ha venido haciendo en ambas empresas
- Creo que las preocupaciones sobre GPT-2 al final resultaron correctas
  En la publicación original de 2019 ya se mencionaban posibles abusos como la generación de noticias engañosas, la suplantación de identidad en línea, la generación automática de contenido abusivo o falso para redes sociales y la generación automática de spam y phishing
  Junto con resultados sintéticos de imagen, audio y video, se decía que estas tecnologías reducirían el costo de producir contenido falso y campañas de desinformación, y que el público debería volverse más escéptico del texto en línea, igual que con las imágenes deepfake
  Por eso dijeron que lo lanzarían con cautela
  https://openai.com/index/better-language-models/
- Puede que Dario no haya pensado ciegamente que todo iba a salir bien, sino que realmente haya evaluado los riesgos potenciales
- Si somos justos, la AI generativa está arruinando la sociedad de maneras nuevas e inesperadas cada semana
  Desde mentiras y desinformación hasta personas que eligen chatbots en lugar de tratamiento o relaciones humanas, su impacto social es profundo y va a empeorar
  Ya es deprimente encontrar programadores junior lo bastante capaces de lograr algo incluso cuando la AI deja de funcionar, y parece que eso también empeorará
  Funciones de seguridad importantes como “prohibir la generación de material de abuso sexual infantil” o “las afirmaciones deben ser verdaderas o basadas en evidencia” ni siquiera se incorporaron desde el diseño de estos sistemas, y hasta ahora tampoco se han resuelto bien, pero las empresas de AI los lanzaron al público con defectos evidentes
  Me gusta la capacidad de la AI para producir tonterías y su lado de juguete curioso, pero hasta ahora ha sido una ganancia neta solo para una pequeña minoría ya muy rica, que se beneficia despidiendo gente y dejando que las computadoras hagan el trabajo de forma medio desastrosa; para todos los demás ha sido una pérdida neta
  Ya es tarde, pero viendo atrás, estoy de acuerdo en que en esta forma era demasiado peligroso para publicarse
El escepticismo excesivo de Hacker News arruinó una discusión sobre IA razonable
El gobierno de EE. UU., al intensificar la guerra por el control de la IA, usó el poder del Estado contra Anthropic de una forma torpe, corrupta y punitiva
Pero en HN se aferran a que la única explicación es “humo de marketing”, y están forzando toda la evidencia a encajar en explicaciones cada vez más rebuscadas
La IA amenaza empleos, estatus, creencias y estilos de vida
En HN parece más fácil inventar racionalizaciones de por qué esto no puede ser cierto que creer esta verdad
Se agradece a quienes aceptan que el mundo podría estar cambiando de una manera bastante extraña e intentan analizar lo que realmente está pasando
- Me recuerda a cuando la NSA en los 90 intentó limitar el acceso cifrado a los sitios web
  Justo cuando SSL se estaba consolidando como la solución clara para pagos seguros en la web pública, EE. UU. casi termina prohibiéndolo
  Parece que la puerta quedó abierta gracias a la presión económica, la falta de alternativas y mucha oposición, pero también entonces usaron el mismo discurso absurdo de “interés nacional y seguridad”
  La gran diferencia ahora es que no es que sin Fable/Mythos no se pueda hacer nada
  Aquí no hay una línea mágica, solo mejoras en el trabajo de conexión con menos intervención
  Aun así, si esto se mantiene, probablemente producirá un enorme efecto paralizante sobre el desarrollo de IA en EE. UU., y otros labs acabarán alcanzando el rendimiento de Fable/Mythos por otros caminos
  En una analogía automotriz, es como si un modelo mejorara su motor de V6 a V8, pero otras organizaciones pudieran lograr aumentos similares de velocidad mejorando la aerodinámica o la inyección de combustible
  Hay tanto margen de mejora en toda la cadena que una medida así no tiene sentido
  Viendo las tácticas agresivas de esta administración y de Anthropic, parece más bien parte de una negociación de alto riesgo que terminará en algún “acuerdo” dentro de una semana
  Incluso podría beneficiar a Anthropic, porque si aparece un arreglo favorable, ¿dónde deja eso a OpenAI?
  El precedente ya está sentado
- Mucha gente en HN y usuarios crónicos de foros creen que actuar de forma escéptica y cínica los hace parecer más inteligentes
  La mayoría de los nerds como yo dejamos atrás esa actitud filosa en la preparatoria o en la universidad
  En la práctica, esa postura solo hace que veas todo a través del lente más oscuro posible
- Esta interpretación se parece un poco a cuando los clérigos decían que la imprenta era peligrosa
  Decían que la gente leería cosas malas y difundiría malas ideas, y sí, eso pasó, pero en conjunto fue un precio pequeño por la expansión de la alfabetización
- En el prompt web de Claude.ai aparece un aviso que no se puede cerrar: “Claude Fable 5 is current unavailable”
  No digo que sea 100% una jugada publicitaria, pero parece que Anthropic realmente quiere que la gente se entere de esto
- La gente del bando del escepticismo excesivo está estorbando a todos
  Salen con cosas como “Anthropic solo está montando un escándalo de marketing”, “la IA es como los NFT”, “es circular”, “la burbuja va a estallar pronto”, “los alarmistas sostienen el mercado bursátil porque quieren salirse rápido como estafadores”
  La última expresión me la inventé intentando imitar a la fuerza la terminología que usan
  El problema central es que la IA se está volviendo demasiado poderosa como para simplemente ponérnosla en las manos a gente común como nosotros
  Si todavía crees que todo es exageración, entonces estás perdiendo de vista el problema real
  Supongo que en algún momento desaparecerá toda esta retórica y nos enfocaremos en los problemas reales
Que los competidores de Anthropic tengan amigos repartidos por toda la administración, y por ejemplo que el lado de Kushner haya invertido fuerte en OpenAI, es a la vez central e irrelevante
La “seguridad nacional” claramente parece más un pretexto, y si de verdad ese fuera el motivo, las exigencias no se habrían limitado solo a ciudadanos extranjeros
Ninguna administración estadounidense ha confiado jamás en todos sus propios ciudadanos
Pero el motivo de la restricción en sí casi no importa
El simple hecho de que esto haya pasado debería ser la alarma final para que la UE se tome en serio la soberanía digital, no solo de palabra sino con presupuesto y esfuerzo reales
- La base de la soberanía digital es la capacidad de crear empresas digitales competitivas
  A estas alturas, parece poco probable que la UE realmente gire el timón en esa dirección
- Viendo todo lo demás que ha hecho esta administración, sorprende que a estas alturas alguien siga tomando sus intenciones oficiales al pie de la letra
Parece una queja de baja calidad, llena de groserías y sesgo ideológico, impropia de Hacker News
Esta medida mata todo el mercado empresarial de modelos de IA mejores que Opus 4.8
Ninguna empresa va a construir flujos de trabajo o capacidades donde un burócrata o un político malintencionado pueda quitarles de inmediato la inteligencia base
Incluso si alguna empresa fuera lo bastante tonta como para asumir ese riesgo, ¿Anthropic va a exigir a todos sus clientes empresariales que entreguen los pasaportes de todos sus empleados y que creen cuentas individuales de Claude para controlar el acceso a Mythos por empleado?
Una simple API key ya no sería suficiente
- Mi primera impresión fue que esto impondría un techo de cristal a la IA y golpearía fuerte al mercado
  El momento también coincidió con ese instante de “evitemos un desplome” cerca del cierre del mercado en viernes, así que habrá que ver qué pasa el lunes
  Como dicen otras respuestas, también parece un intento de someterse mutuamente entre el gobierno y Anthropic
  Si OpenAI los alcanza y Anthropic suelta a los abogados, probablemente esto se revertirá o se transformará en algo como “el modelo debe tener el sello de aprobación de la IA estadounidense, por lo tanto aprobamos el nuevo Fable 5.1 validado por EE. UU.”
  Ese momento probablemente coincidiría con un despliegue masivo en el DoD, el Pentagon y organismos relacionados
  O si no, terminará en la línea de que China los va a alcanzar, así que todo esto no tiene sentido
- ¿Qué pasa si el gobierno de EE. UU. hace lo mismo con Opus u otros modelos?
  No hay ningún modelo a salvo de una prohibición de ese tipo
- Para ser exactos, esto se refiere a modelos de IA estadounidenses mejores que Opus 4.8
  La muy criticada AI Act de la UE ofrece un marco regulatorio seguro y predecible que puede servir de base para el desarrollo de IA
  Da estabilidad jurídica frente a las decisiones impredecibles y arbitrarias de la administración estadounidense
  Si las empresas de IA tienen un mínimo de criterio, más les vale considerar mudarse a Europa
Considerando que a Fable ya le habían impuesto protocolos de seguridad exagerados, todo esto se ve muy sospechoso
El gobierno de EE. UU. está usando su influencia sobre la economía para mandarle a Anthropic la señal de que su IPO depende de arrodillarse
En los últimos meses he llegado a confiar mucho más en OpenAI que en Anthropic
Si lees entre líneas los textos de Dario Amodei, parece un creyente dogmático que ve a la ASI como un gobernante perfecto e infalible para la humanidad, y además un nacionalista estadounidense bastante extremo
La empresa también parece estar ideológicamente alineada en esa misma línea
Incluso puedo imaginar que permitirían o crearían conscientemente una ASI fuera de control si creen que está alineada ideológicamente con ellos
OpenAI, en comparación, parece menos dogmática y más orientada al pragmatismo
No significa que sea una empresa especialmente buena, pero al menos se puede predecir cómo actuará una empresa común
- Considerando que se dice que un líder de OpenAI es un “mentiroso patológico”, resulta bastante sorprendente decir que se confía más en OpenAI que en Anthropic
- Si has visto lo que hace la gente incluso por 500 dólares, parece imposible confiar por completo en desconocidos
  Con más razón cuando hablamos de personas con incentivos de millones o miles de millones de dólares
  También habrás visto lo que hacen a su propia familia por temas de herencia, ¿y aun así vas a “confiar” en OpenAI?
  “¿Quién es el ingenuo, Kay?” - Godfather
- Ni siquiera hace falta leer entre líneas; el CEO lo ha dicho casi de forma explícita en entrevistas y textos
  Yo mismo escribí sobre ese mismo punto hace unas semanas https://news.ycombinator.com/item?id=48341224, y si lees las entradas recientes del blog, desaparecerá por completo cualquier duda que quede
En HN y Reddit ya se está diciendo que este podría ser el punto límite de lo que el gobierno estaría dispuesto a “permitir” que la gente use
Por mucha demanda que haya, no sirve de nada si el gobierno no lo entrega
Un LLM de mercado negro suena como algo sacado directamente de una novela de William Gibson
El resumen estuvo bueno, y mientras lo leía pensé en el debate sobre el cifrado fuerte
La frase “En realidad optimizamos lo que podemos medir, no lo que queremos lograr. Esperamos que ambas cosas coincidan, pero muchas veces no pasa” señala el problema central de los LLM
Creo que garantizar que un modelo quede alineado de forma segura para todas las personas y todas las intenciones es imposible o extremadamente caro
Además, “seguridad” puede significar cosas distintas según de quién se trate