Anthropic lanza Claude Opus 4.7: autoverificación, visión de alta resolución 3.3x y mejora del 13% e

Anthropic lanzó su modelo insignia Claude Opus 4.7.

Con 87.6% en SWE-bench Verified (+6.8 pp) y 64.3% en SWE-bench Pro, supera a GPT-5.4 (57.7%) y ocupa el primer lugar
Logró 94.2% en GPQA Diamond, 69.4% en Terminal-Bench 2.0 y 64.4% en Finance Agent
Mejora del 13% en benchmarks de codificación frente a Opus 4.6 y triplica la tasa de resolución de tareas de producción
Nueva función de autoverificación (Self-Verification): diseña y ejecuta por sí mismo pasos de verificación antes de completar una tarea
Visión de alta resolución 3.3x (hasta 2,576 px) y nuevo tokenizador
Se añade el nivel de esfuerzo xhigh, con una mejora del 14% en razonamiento agéntico y una reducción a un tercio de los errores de herramientas
El precio es el mismo que el de Opus 4.6 ($5/$25 por MTok)
Anthropic reconoce directamente que su rendimiento es inferior al del modelo privado Mythos

También está disponible en Amazon Bedrock, Google Cloud Vertex AI y Microsoft Foundry.

Anthropic lanza Claude Opus 4.7: autoverificación, visión de alta resolución 3.3x y mejora del 13% en codificación