1 puntos por flyingsquirrel 4 시간 전 | Aún no hay comentarios. | Compartir por WhatsApp

Anthropic lanzó Claude Opus 4.8, una versión mejorada de su modelo insignia Claude Opus. Basado en la versión anterior 4.7, mejora el rendimiento en benchmarks y refuerza las capacidades de colaboración, mientras mantiene el mismo precio.

Principales mejoras y características

  • Mejor rendimiento: muestra un desempeño superior al del modelo anterior y al de modelos competidores como GPT-5.5 en tareas de programación, habilidades de agentes, razonamiento y conocimiento práctico.
  • Mayor honestidad (Honesty): se mejoró el problema de que la IA haga afirmaciones sin fundamento o llegue a conclusiones precipitadas. Opus 4.8 señala por sí mismo las partes inciertas, y la probabilidad de pasar por alto defectos en el código se redujo aproximadamente 4 veces frente al modelo anterior.
  • Capacidades de agente confiables: según pruebas iniciales, su criterio se volvió más fino al realizar tareas complejas de múltiples pasos, y muestra mejores capacidades de colaboración al detectar sus propios errores y cuestionar planes cuando no son válidos.
  • Eficiencia de costos: la velocidad de 'Fast Mode' aumentó 2.5 veces, y el costo se redujo a una tercera parte frente al modelo anterior.

Nuevas funciones lanzadas junto con el modelo

  • Dynamic Workflows: función en research preview de Claude Code que permite ejecutar cientos de subagentes en paralelo para realizar tareas complejas, como migraciones de grandes bases de código.
  • Effort Control: permite al usuario elegir el nivel de esfuerzo que Claude dedicará a una tarea. Con una configuración alta, piensa más a fondo para ofrecer respuestas de mayor calidad; con una baja, responde más rápido.
  • Actualización de la Messages API: ahora se pueden incluir entradas del sistema dentro del arreglo de mensajes, lo que permite actualizar instrucciones a mitad de una tarea sin romper la caché de prompts.

Planes a futuro

Anthropic está desarrollando un modelo que ofrecerá rendimiento de nivel Opus a menor costo y, a través de Project Glasswing, prepara una nueva clase de modelos con mayor inteligencia que Opus (Claude Mythos). Actualmente está en pruebas de seguridad con algunas organizaciones y se espera que esté disponible para todos los clientes en unas semanas.

Precios y disponibilidad

  • Modo general: entrada $5 / 1M tokens, salida $25 / 1M tokens (igual que Opus 4.7)
  • Fast Mode: entrada $10 / 1M tokens, salida $50 / 1M tokens
  • Nombre del modelo: claude-opus-4-8

Aún no hay comentarios.

Aún no hay comentarios.