Anthropic lanza Claude Opus 4.8
(anthropic.com)Anthropic lanzó Claude Opus 4.8, una versión mejorada de su modelo insignia Claude Opus. Basado en la versión anterior 4.7, mejora el rendimiento en benchmarks y refuerza las capacidades de colaboración, mientras mantiene el mismo precio.
Principales mejoras y características
- Mejor rendimiento: muestra un desempeño superior al del modelo anterior y al de modelos competidores como GPT-5.5 en tareas de programación, habilidades de agentes, razonamiento y conocimiento práctico.
- Mayor honestidad (Honesty): se mejoró el problema de que la IA haga afirmaciones sin fundamento o llegue a conclusiones precipitadas. Opus 4.8 señala por sí mismo las partes inciertas, y la probabilidad de pasar por alto defectos en el código se redujo aproximadamente 4 veces frente al modelo anterior.
- Capacidades de agente confiables: según pruebas iniciales, su criterio se volvió más fino al realizar tareas complejas de múltiples pasos, y muestra mejores capacidades de colaboración al detectar sus propios errores y cuestionar planes cuando no son válidos.
- Eficiencia de costos: la velocidad de 'Fast Mode' aumentó 2.5 veces, y el costo se redujo a una tercera parte frente al modelo anterior.
Nuevas funciones lanzadas junto con el modelo
- Dynamic Workflows: función en research preview de Claude Code que permite ejecutar cientos de subagentes en paralelo para realizar tareas complejas, como migraciones de grandes bases de código.
- Effort Control: permite al usuario elegir el nivel de esfuerzo que Claude dedicará a una tarea. Con una configuración alta, piensa más a fondo para ofrecer respuestas de mayor calidad; con una baja, responde más rápido.
- Actualización de la Messages API: ahora se pueden incluir entradas del sistema dentro del arreglo de mensajes, lo que permite actualizar instrucciones a mitad de una tarea sin romper la caché de prompts.
Planes a futuro
Anthropic está desarrollando un modelo que ofrecerá rendimiento de nivel Opus a menor costo y, a través de Project Glasswing, prepara una nueva clase de modelos con mayor inteligencia que Opus (Claude Mythos). Actualmente está en pruebas de seguridad con algunas organizaciones y se espera que esté disponible para todos los clientes en unas semanas.
Precios y disponibilidad
- Modo general: entrada $5 / 1M tokens, salida $25 / 1M tokens (igual que Opus 4.7)
- Fast Mode: entrada $10 / 1M tokens, salida $50 / 1M tokens
- Nombre del modelo:
claude-opus-4-8
Aún no hay comentarios.