19 puntos por humblebee 2025-05-23 | 2 comentarios | Compartir por WhatsApp

Anthropic lanzó la serie Claude 4 el 23 de mayo de 2025. Los modelos anunciados en esta ocasión, Claude Opus 4 y Claude Sonnet 4, mejoran las capacidades de programación y de ejecución de tareas de larga duración frente a las versiones anteriores, mientras que el precio se mantiene igual.

  1. Capacidad de trabajo sostenido

    • 7 horas de trabajo continuo: en una refactorización open source verificada por Rakuten, trabajó de forma independiente durante 7 horas
    • Puede procesar sin interrupciones tareas complejas que requieren miles de pasos
    • Una persistencia en el trabajo que supera ampliamente las limitaciones de los agentes de IA existentes
  2. Sistema de memoria mejorado

    • Genera automáticamente archivos de memoria como 'Navigation Guide' para mejorar la conciencia del contexto en tareas de largo plazo
    • Uso práctico de la memoria, como escribir por sí mismo una guía de navegación mientras juega Pokémon
    • Reducción del 65% en el uso de atajos o exploits frente al modelo anterior
  3. Modelo de razonamiento híbrido

    • Modo de respuesta inmediata: para casos en los que se necesita una respuesta rápida
    • Modo de pensamiento extendido: permite razonamiento profundo de hasta 64K tokens
    • Cambia automáticamente entre ambos modos según la situación
  4. Uso de herramientas

    • Ejecución paralela de herramientas: usa varias herramientas al mismo tiempo para mejorar la eficiencia
    • Uso de herramientas durante el razonamiento: aprovecha búsquedas web y otros recursos durante el proceso de razonamiento para generar respuestas más precisas
  5. Mejora en la calidad del código

    • Evaluación de Block: "el primer modelo que mejoró la calidad del código durante la edición y depuración"
    • Informe de iGent: la tasa de errores al explorar codebases se redujo del 20% a casi 0%
    • Sourcegraph: código de mayor elegancia y comprensión más profunda de los problemas
  6. Integración práctica de Claude Code

    • Integración directa con el IDE: los cambios en el código se muestran de inmediato en el editor
    • Respuesta a PR de GitHub: procesa automáticamente el feedback de revisores de PR y corrige errores de CI
    • Tareas en segundo plano: soporte de automatización mediante GitHub Actions
    • SDK extensible: los desarrolladores pueden crear sus propios agentes
  7. Nuevas funciones de la API

    • Herramienta de ejecución de código
    • Conector MCP
    • Files API
    • Caché de prompts de hasta 1 hora
  8. Seguridad

    • Implementación de medidas de protección ASL-3 (AI Safety Level 3)
    • Capacidad más sofisticada para seguir instrucciones
    • Comportamiento más responsable que reduce la posibilidad de uso indebido

2 comentarios

 
humblebee 2025-05-23

Dice que realizó refactorización sin interrupciones durante 7 horas; si la calidad es buena, incluso podríamos esperar un nivel de trabajo externo avanzado que un desarrollador deje encargado al salir del trabajo y revise al día siguiente 😂

 
sinbumu 2025-05-23

Captaron esta parte, así que en sitios como Google están probando en beta, de forma tentativa, agentes de programación como Jules... Si le lanzas trabajo a la IA, en vez de hacerlo en local se pone a resolverlo sola en un entorno en la nube, y luego revisas el resultado y le dices que haga commit, despliegue y demás.