2 puntos por minodevs 13 일 전 | 1 comentarios | Compartir por WhatsApp

Anthropic lanzó su modelo insignia Claude Opus 4.7.

  • Con 87.6% en SWE-bench Verified (+6.8 pp) y 64.3% en SWE-bench Pro, supera a GPT-5.4 (57.7%) y ocupa el primer lugar
  • Logró 94.2% en GPQA Diamond, 69.4% en Terminal-Bench 2.0 y 64.4% en Finance Agent
  • Mejora del 13% en benchmarks de codificación frente a Opus 4.6 y triplica la tasa de resolución de tareas de producción
  • Nueva función de autoverificación (Self-Verification): diseña y ejecuta por sí mismo pasos de verificación antes de completar una tarea
  • Visión de alta resolución 3.3x (hasta 2,576 px) y nuevo tokenizador
  • Se añade el nivel de esfuerzo xhigh, con una mejora del 14% en razonamiento agéntico y una reducción a un tercio de los errores de herramientas
  • El precio es el mismo que el de Opus 4.6 ($5/$25 por MTok)
  • Anthropic reconoce directamente que su rendimiento es inferior al del modelo privado Mythos

También está disponible en Amazon Bedrock, Google Cloud Vertex AI y Microsoft Foundry.

1 comentarios

 
runai 12 일 전

OPUS 4.7 > GPT 5.4 > OPUS 4.6