Presentan Claude Fable 5/Mythos 5, los modelos frontier de quinta generación de Anthropic
(anthropic.com)- Anthropic lanzó sus modelos de quinta generación para trabajo asíncrono y de larga duración, de varios días. Fable 5 es una versión del modelo de nivel Mythos adaptada para usuarios generales con mayor seguridad, y Mythos 5 es una versión del mismo modelo con algunas protecciones de seguridad relajadas
- El nivel Mythos es una nueva categoría de modelos por encima del nivel Opus. El primer modelo, Mythos Preview, se presentó en abril como Project Glasswing, y hoy lo siguen Fable 5 y Mythos 5
- Origen del nombre: Fable viene del latín fabula ("lo que se cuenta") y es cognado del griego mythos. Lo que distingue a ambos modelos son precisamente las protecciones de seguridad, por eso tienen nombres distintos
- El precio es de 10 dólares por cada millón de tokens de entrada y 50 dólares por salida, menos de la mitad que Mythos Preview. El nombre del modelo en la API es
claude-fable-5
Rendimiento
- El mensaje clave es que mientras más larga y compleja sea la tarea, mayor es su ventaja
- Programación: en pruebas previas de Stripe realizó en un día la migración completa de una base de código Ruby de 50 millones de líneas (al equipo le tomaría más de dos meses hacerlo manualmente). Escribió pruebas por sí mismo y verificó los resultados comparándolos con el diseño original mediante visión. En la evaluación FrontierCode de Cognition obtuvo la puntuación más alta entre los modelos frontier incluso en
medium effort - Agentes: puede operar de forma autónoma durante varios días en entornos como Claude Code, realizando planificación, delegación a subagentes y autoverificación
- Visión: reconstruyó el código fuente de una web app solo a partir de capturas de pantalla y completó Pokémon FireRed con un arnés mínimo dedicado a visión (los modelos anteriores necesitaban un arnés auxiliar más complejo)
- Memoria: en Slay the Spire, al contar con memoria persistente basada en archivos, mejoró 3 veces frente a Opus 4.8, y también triplicó la frecuencia con la que llega al acto final
- Trabajo de conocimiento: obtuvo la puntuación más alta entre todos los modelos en el benchmark financiero de Hebbia, y aprobó la evaluación de análisis de trading de IMC en casi todas las áreas
Benchmarks
- Afirma ventaja general en programación, trabajo de conocimiento, visión y uso de computadora con métricas como SWE-Bench Pro 80.3% (Opus 4.8: 69.2%, GPT 5.5: 58.6%), GDPval-AA 1932 y OSWorld 85.0%
- Atención: algunas cifras de la tabla corresponden al valor más alto entre Mythos 5 y Fable 5, y los elementos con asterisco (biología, ciberseguridad, etc.) llevan una nota indicando que, por el fallback de seguridad, el rendimiento se acerca al de Opus 4.8
Logros científicos de Mythos 5
- Aceleró aproximadamente 10 veces el proceso de diseño de proteínas y consiguió candidatos prometedores en 9 de 14 objetivos. Realizó sin ayuda humana la selección del sitio de unión, la ejecución de herramientas y la recuperación ante fallos
- En comparaciones a ciegas, los científicos prefirieron cerca del 80% de las hipótesis de biología molecular. Una de ellas (un nuevo mecanismo en una proteína de E. coli) fue confirmada de forma independiente por un laboratorio que estudiaba el mismo problema
- En más de una semana de trabajo autónomo, reunió datos de millones de células de 138 especies animales, diseñó y entrenó un modelo de ML personalizado, y superó con un tamaño 100 veces menor a un modelo reciente publicado en Science
- Evaluación de alineación: reportan que el nivel de comportamiento desalineado de Mythos 5 es bajo y similar al de Opus 4.8
Protecciones de seguridad
- Hay tres áreas que bloquea el clasificador: ciberseguridad, biología y química, y destilación (intentos de extraer capacidades para entrenar modelos competidores de estados autoritarios). Esas solicitudes se redirigen automáticamente a Opus 4.8 y se notifica al usuario (si hay redirección, no se cobra la tarifa de Fable)
- Más del 95% de las sesiones no tienen fallback y las protecciones actúan en menos del 5% de las sesiones en promedio. Aun así, reconocen que las han ajustado de forma conservadora y que a veces también bloquean solicitudes inofensivas, y planean reducir los falsos positivos
- En más de 1,000 horas de bug bounty externo no se encontró un jailbreak universal. Aun así, el UK AISI logró avances cercanos en pruebas iniciales breves. En una prueba de un socio externo, no respondió a ninguna de 30 solicitudes dañinas de un solo turno relacionadas con ciberataques, incluso usando técnicas públicas de jailbreak
- En la evaluación de diseño de AAV (vectores de entrega para terapia génica), el nivel Mythos superó a un modelo de lenguaje de proteínas especializado usando solo razonamiento biológico. Lo presentan como evidencia del riesgo de doble uso
- Su uso requiere retención obligatoria de datos por 30 días con fines de monitoreo de seguridad. Aplica a todo el tráfico de 1st party y 3rd party, no se usa para entrenamiento del modelo ni para fines no relacionados con seguridad, se registra el acceso humano y los datos se eliminan después de 30 días
Precio y lanzamiento
- Está disponible en planes Enterprise (basados en consumo), Claude Platform, AWS, GCP y Microsoft Foundry
- Los planes de suscripción tendrán despliegue gradual: del 9 al 22 de junio estará incluido sin costo en Pro, Max, Team y Enterprise por asiento. A partir del 23 de junio se retirará y será necesario usar créditos de consumo. Planean restaurarlo como configuración base cuando haya más capacidad disponible. La API y Enterprise basado en consumo están totalmente disponibles desde hoy
- Mythos 5 puede ser actualizado desde hoy por los usuarios actuales de Mythos Preview (como los socios de Glasswing). En la mayoría de los casos es similar o ligeramente más potente que Preview, con un costo mucho menor. Afirman que tiene la capacidad de ciberseguridad más fuerte del mundo
- También abrirán por separado un programa de acceso confiable para biología (en Fable 5 solo se desactivan las protecciones de biología y química, mientras se mantienen las de ciberseguridad)
Aún no hay comentarios.