Anthropic lanza Claude 4
(anthropic.com)Anthropic lanzó la serie Claude 4 el 23 de mayo de 2025. Los modelos anunciados en esta ocasión, Claude Opus 4 y Claude Sonnet 4, mejoran las capacidades de programación y de ejecución de tareas de larga duración frente a las versiones anteriores, mientras que el precio se mantiene igual.
-
Capacidad de trabajo sostenido
- 7 horas de trabajo continuo: en una refactorización open source verificada por Rakuten, trabajó de forma independiente durante 7 horas
- Puede procesar sin interrupciones tareas complejas que requieren miles de pasos
- Una persistencia en el trabajo que supera ampliamente las limitaciones de los agentes de IA existentes
-
Sistema de memoria mejorado
- Genera automáticamente archivos de memoria como 'Navigation Guide' para mejorar la conciencia del contexto en tareas de largo plazo
- Uso práctico de la memoria, como escribir por sí mismo una guía de navegación mientras juega Pokémon
- Reducción del 65% en el uso de atajos o exploits frente al modelo anterior
-
Modelo de razonamiento híbrido
- Modo de respuesta inmediata: para casos en los que se necesita una respuesta rápida
- Modo de pensamiento extendido: permite razonamiento profundo de hasta 64K tokens
- Cambia automáticamente entre ambos modos según la situación
-
Uso de herramientas
- Ejecución paralela de herramientas: usa varias herramientas al mismo tiempo para mejorar la eficiencia
- Uso de herramientas durante el razonamiento: aprovecha búsquedas web y otros recursos durante el proceso de razonamiento para generar respuestas más precisas
-
Mejora en la calidad del código
- Evaluación de Block: "el primer modelo que mejoró la calidad del código durante la edición y depuración"
- Informe de iGent: la tasa de errores al explorar codebases se redujo del 20% a casi 0%
- Sourcegraph: código de mayor elegancia y comprensión más profunda de los problemas
-
Integración práctica de Claude Code
- Integración directa con el IDE: los cambios en el código se muestran de inmediato en el editor
- Respuesta a PR de GitHub: procesa automáticamente el feedback de revisores de PR y corrige errores de CI
- Tareas en segundo plano: soporte de automatización mediante GitHub Actions
- SDK extensible: los desarrolladores pueden crear sus propios agentes
-
Nuevas funciones de la API
- Herramienta de ejecución de código
- Conector MCP
- Files API
- Caché de prompts de hasta 1 hora
-
Seguridad
- Implementación de medidas de protección ASL-3 (AI Safety Level 3)
- Capacidad más sofisticada para seguir instrucciones
- Comportamiento más responsable que reduce la posibilidad de uso indebido
2 comentarios
Dice que realizó refactorización sin interrupciones durante 7 horas; si la calidad es buena, incluso podríamos esperar un nivel de trabajo externo avanzado que un desarrollador deje encargado al salir del trabajo y revise al día siguiente 😂
Captaron esta parte, así que en sitios como Google están probando en beta, de forma tentativa, agentes de programación como Jules... Si le lanzas trabajo a la IA, en vez de hacerlo en local se pone a resolverlo sola en un entorno en la nube, y luego revisas el resultado y le dices que haga
commit, despliegue y demás.