Claude Managed Agents: 10 veces más velocidad en producción

(claude.com)

25 puntos por GN⁺ 21 일 전 | 1 comentarios | Compartir por WhatsApp

Una suite de APIs componibles para construir e implementar agentes a gran escala en la nube, que permite llevar prototipos a producción en cuestión de días
Maneja automáticamente infraestructura de nivel producción como sandboxing de seguridad, gestión de credenciales y control de permisos, para que el usuario pueda enfocarse solo en definir las tareas
Soporta sesiones de larga duración, colaboración multiagente y gobernanza basada en confianza, con integración estrecha con los modelos Claude para ofrecer iteración autónoma y mejor rendimiento
Empresas como Notion, Rakuten, Asana y Sentry ya lo usan para lograr implementaciones 10 veces más rápidas y flujos de trabajo automatizados
Se ofrece con cobro según uso y es una plataforma que mejora de raíz la eficiencia operativa y la productividad de desarrollo de las organizaciones

Resumen de Claude Managed Agents

Claude Managed Agents se ofrece en beta pública como una suite de APIs componibles para construir e implementar agentes a gran escala en la nube
Antes, desarrollar agentes tomaba meses por la infraestructura de seguridad, la gestión de estado, el control de permisos y la necesidad de adaptarse a actualizaciones del modelo, pero Managed Agents permite pasar del prototipo a producción en pocos días
Soporta desde ejecutores de tareas individuales hasta complejos pipelines multiagente, y permite a los usuarios centrarse en la experiencia de usuario sin sobrecarga operativa

Construcción e implementación de agentes 10 veces más rápida

Para implementar agentes de nivel producción se necesita ejecución de código en sandbox, checkpoints, gestión de credenciales, definición del alcance de permisos y trazabilidad end-to-end
Managed Agents se encarga de esa complejidad, y el usuario solo necesita definir tareas, herramientas y guardrails
Un arness de orquestación integrado automatiza el momento de las llamadas a herramientas, la gestión de contexto y la recuperación ante errores
Funciones principales:
- Agentes de nivel producción: manejo automático de sandboxing de seguridad, autenticación y ejecución de herramientas
- Sesiones de larga duración: funcionan de forma autónoma durante horas y conservan el progreso y la salida incluso si se corta la conexión
- Colaboración multiagente: crean y dirigen otros agentes para paralelizar tareas complejas (en etapa de research preview)
- Gobernanza basada en confianza: incluye alcance de permisos, gestión de identidad y trazabilidad de ejecución

Diseño integrado con los modelos Claude

Los modelos Claude están optimizados para tareas centradas en agentes, y Managed Agents fue diseñado para aprovecharlos al máximo
El usuario solo necesita definir resultados y criterios de éxito, y Claude realiza autoevaluación e iteraciones para alcanzar el objetivo (disponible en research preview)
También admite, cuando hace falta, flujos de trabajo tradicionales de prompt-respuesta
En pruebas internas, en tareas de generación estructurada de archivos mostró hasta 10 puntos más de rendimiento frente a un loop de prompts estándar
Seguimiento de sesiones, analítica integrada y guías de resolución de problemas están incorporados en Claude Console para revisar todas las llamadas a herramientas y el proceso de decisión

Casos de uso reales

Distintos equipos ya han logrado implementaciones en producción 10 veces más rápidas con Managed Agents
- Agentes de programación: análisis de codebases, planificación de cambios y generación de PR
- Agentes de productividad: participación en proyectos, ejecución de tareas y entrega de resultados
- Agentes financieros y legales: procesamiento de documentos y extracción de información clave
Casos de empresas destacadas:
- Notion
  - Opera una versión alfa de Custom Agents que permite delegar tareas directamente a Claude dentro del workspace
  - Los ingenieros pueden desplegar código y los trabajadores del conocimiento pueden crear sitios web y presentaciones, con decenas de tareas ejecutándose en paralelo
- Rakuten
  - Implementó un agente corporativo integrado con Slack y Teams en las áreas de producto, ventas, marketing, finanzas y RR. HH.
  - Desplegó cada agente especializado en menos de una semana
- Asana
  - Integró dentro de los proyectos agentes que colaboran con humanos a través de AI Teammates
  - Con Managed Agents implementó funciones avanzadas en pocas semanas
- Vibecode
  - Implementó con Managed Agents una infraestructura de apps nativas de IA que conecta desde el prompt hasta el despliegue de la app
  - La misma infraestructura puede construirse 10 veces más rápido
- Sentry
  - Combinó el agente de depuración Seer con un agente de creación de parches basado en Claude
  - Automatizó en un solo flujo desde la detección del bug hasta la creación del PR, completando en semanas una integración que antes tomaba meses

Citas de clientes

Ansh Nanda (cofundador): antes había que gestionar manualmente los LLM en un sandbox, pero ahora se puede construir infraestructura 10 veces más rápido con unas pocas líneas de código, y prevé un auge de apps nativas de IA
Indragie Karunaratne (director de ingeniería AI/ML en Sentry): Managed Agents ofrece un runtime seguro y completamente administrado, mejorando la experiencia del desarrollador y eliminando la carga operativa
Sanchan Saxena (responsable de producto en Atlassian): integró agentes en los flujos de trabajo de Jira, y la automatización de sandboxing, sesiones y gestión de permisos mejoró la eficiencia de ingeniería
Javed Qadrud-Din (CTO): Managed Agents crea al instante las herramientas necesarias para atender todas las consultas de los usuarios, reduciendo el tiempo de desarrollo 10 veces
John Han (cofundador): implementó un agente de preparación de reuniones a nivel producción en pocos días, con conexión automática a sistemas externos y búsqueda web
Eric Liu (PM de Notion): las sesiones de larga duración y la gestión de memoria permiten delegar tareas complejas y abiertas
Yusuke Kaji (responsable de IA en Rakuten): desplegó agentes especializados para cada área en menos de una semana, logrando escalado seguro y democratización de la innovación
Amritansh Raghav (CTO de Asana): aceleró de forma drástica la velocidad de desarrollo de AI Teammates y reforzó una experiencia de colaboración de nivel empresarial

Cómo empezar

Managed Agents se ofrece con cobro según uso, con un cargo adicional de $0.08 por hora de sesión sobre la tarifa estándar de tokens de Claude Platform
Los detalles de precios pueden consultarse en la documentación oficial
Puedes desplegar tu primer agente desde Claude Console o la CLI, con soporte de integración para Claude Code y claude-api Skill
El onboarding puede iniciarse con el comando “start onboarding for managed agents in Claude API”

Innovación en la operación de las organizaciones

Managed Agents es una herramienta que puede transformar de raíz la forma en que operan las organizaciones, ayudando a que desarrolladores y equipos se enfoquen en la productividad y la experiencia de usuario en lugar de la infraestructura
Se prevén actualizaciones continuas y expansión de la comunidad a través de Claude Platform

1 comentarios

GN⁺ 21 일 전

Opiniones en Hacker News

Sospecho que esto podría terminar llevando a la orquestación óptima
Puede que el open source no logre sacar una mejor alternativa a tiempo
Hasta ahora, el mejor desempeño ha salido al mezclar agentes de varias empresas
Más importante que el planner es el worker. Algunos agentes son mucho mejores para tareas específicas
Por ejemplo, Opus 4.6 no tiene comparación con GPT 5.4 xhigh en detección de bugs
Así como en el mundo real distintas formas de pensar aumentan la solidez de un equipo, mezclar agentes parece dar un efecto parecido
- Para que Anthropic haga la mejor versión, tendría que superar a todas las demás empresas de IA en cada subtarea de detalle (documentación técnica, diagramas, detección de bugs, etc.)
  Pero no parece probable que dejen llamar modelos externos como Codex dentro de su stack
- Lo que me preocupa es que esto pueda terminar convertido en el lenguaje de orquestación óptimo
  Por ejemplo, ¿qué pasa si Claude convierte toda la comunicación entre agentes al sumerio?
  Una sola empresa podría monopolizar esa especialización lingüística
- A mí también me funcionaba mejor mezclar modelos de varias empresas
  Escribir especificaciones con Opus → corregir con Gemini → feedback otra vez con Opus → yo reviso → build con Qwen3.5 → review con Opus
  Ese flujo era perfecto, pero Anthropic cambió su política y lo rompió
- En este momento las empresas de IA se parecen a cangrejos en una cubeta
  Cuando una saca un modelo cerrado, las otras lo analizan, lo mejoran y lo publican como open source
  Al final terminan frenándose entre sí, y más adelante hasta podrían volverse una especie de cártel
Se nota que Anthropic quiere atraer a los desarrolladores a su propia plataforma
Para salir a bolsa, no les basta con ser un proveedor de modelos: tienen que convertirse en una empresa de plataforma
Todos sus movimientos actuales apuntan en esa dirección
Uso Claude Code todos los días, pero hacer que los sistemas de los clientes dependan de Anthropic es riesgoso
La ingeniería de calidad no es precisamente su fuerte. Y si la disponibilidad apenas llega a un “single 9”, eso es problemático
Estamos en los primeros días de los frameworks de agentes, como la web antes de PHP
Cada semana salen nuevos patrones y modelos, y todos los frameworks se rehacen desde cero
LangChain quiere volverse algo como Next.js/Vercel, pero la mayoría recomienda construirlo uno mismo
Anthropic, como tiene modelos propios, conseguirá cierta demanda con una solución de baja fricción, pero el lock-in y la velocidad del cambio tecnológico siguen siendo problemas
- También estoy de acuerdo. Estamos en esa etapa en la que hay cientos de soluciones a medio terminar flotando por blogs o GitHub
  LangChain es lo más cercano, pero todavía se siente muy DIY
  Además, todo el mundo está mezclando distintos vector DB y modelos de reranking
Yo estaba construyendo algo parecido por mi cuenta, así que me sorprendió ver que el enfoque de Anthropic era una idea paralela
Hay que evitar a toda costa quedar atado a un solo proveedor de modelos
Puede servir para equipos pequeños, pero en sistemas complejos es un suicidio
Hay que comparar y combinar varios modelos y gestionarlos con tu propio estilo. Como en la cocina, según la situación necesitas elegir distintos sabores
- En realidad todos están construyendo algo parecido. No hay tantas direcciones posibles
- Me pregunto si la razón para evitar el lock-in es solo el rendimiento, o también si Anthropic podría usar los datos de telemetría para convertirse en competidor más adelante
- Yo pienso igual. Es bastante sencillo montar un sistema así sobre una plataforma agregadora como openrouter
La página hecha por esos agentes estaba tan mal que el texto de las reseñas se encimaba y no se podía leer
- Yo de plano solo veía una pantalla negra
Estoy corriendo un contenedor Docker para crear un sitio Jekyll con el Agentic SDK de Anthropic
Montar la infraestructura no fue difícil; lo realmente complicado fue hacer que el agente se comportara como yo quería
Algún día tal vez migre a otro proveedor o a una opción autohospedada, así que quiero conservar la libertad
Yo igual voy a seguir usando la combinación de pydantic ai con dbos/temporal/celery
No quiero quedar atado a un proveedor específico. Quiero poder usar cualquier LLM con libertad
Hay que seguir empujando el desarrollo de la orquestación open source
Se ve impresionante por fuera, pero también podría convertirse en una bomba de costos
Como en AWS, si no tienes cuidado podrías terminar con miles de agentes corriendo y una factura disparada
Para Anthropic parece un modelo de ingresos enorme
Esta dirección era un paso esperado
Es una forma fácil de aumentar ingresos y reforzar el lock-in de usuarios sin tener que hacer los modelos más inteligentes
El análisis relacionado está bien resumido en este artículo

Claude Managed Agents: 10 veces más velocidad en producción

Resumen de Claude Managed Agents

Construcción e implementación de agentes 10 veces más rápida

Diseño integrado con los modelos Claude

Casos de uso reales

Notion

Rakuten

Asana

Vibecode

Sentry

Citas de clientes

Cómo empezar

Innovación en la operación de las organizaciones

Lecturas relacionadas

1 comentarios

Opiniones en Hacker News