Anthropic lanza Claude Opus 4.7: autoverificación, visión de alta resolución 3.3x y mejora del 13% en codificación
(anthropic.com)Anthropic lanzó su modelo insignia Claude Opus 4.7.
- Con 87.6% en SWE-bench Verified (+6.8 pp) y 64.3% en SWE-bench Pro, supera a GPT-5.4 (57.7%) y ocupa el primer lugar
- Logró 94.2% en GPQA Diamond, 69.4% en Terminal-Bench 2.0 y 64.4% en Finance Agent
- Mejora del 13% en benchmarks de codificación frente a Opus 4.6 y triplica la tasa de resolución de tareas de producción
- Nueva función de autoverificación (Self-Verification): diseña y ejecuta por sí mismo pasos de verificación antes de completar una tarea
- Visión de alta resolución 3.3x (hasta 2,576 px) y nuevo tokenizador
- Se añade el nivel de esfuerzo
xhigh, con una mejora del 14% en razonamiento agéntico y una reducción a un tercio de los errores de herramientas - El precio es el mismo que el de Opus 4.6 ($5/$25 por MTok)
- Anthropic reconoce directamente que su rendimiento es inferior al del modelo privado Mythos
También está disponible en Amazon Bedrock, Google Cloud Vertex AI y Microsoft Foundry.
1 comentarios
OPUS 4.7 > GPT 5.4 > OPUS 4.6