25 puntos por GN⁺ 21 일 전 | 1 comentarios | Compartir por WhatsApp
  • Una suite de APIs componibles para construir e implementar agentes a gran escala en la nube, que permite llevar prototipos a producción en cuestión de días
  • Maneja automáticamente infraestructura de nivel producción como sandboxing de seguridad, gestión de credenciales y control de permisos, para que el usuario pueda enfocarse solo en definir las tareas
  • Soporta sesiones de larga duración, colaboración multiagente y gobernanza basada en confianza, con integración estrecha con los modelos Claude para ofrecer iteración autónoma y mejor rendimiento
  • Empresas como Notion, Rakuten, Asana y Sentry ya lo usan para lograr implementaciones 10 veces más rápidas y flujos de trabajo automatizados
  • Se ofrece con cobro según uso y es una plataforma que mejora de raíz la eficiencia operativa y la productividad de desarrollo de las organizaciones

Resumen de Claude Managed Agents

  • Claude Managed Agents se ofrece en beta pública como una suite de APIs componibles para construir e implementar agentes a gran escala en la nube
  • Antes, desarrollar agentes tomaba meses por la infraestructura de seguridad, la gestión de estado, el control de permisos y la necesidad de adaptarse a actualizaciones del modelo, pero Managed Agents permite pasar del prototipo a producción en pocos días
  • Soporta desde ejecutores de tareas individuales hasta complejos pipelines multiagente, y permite a los usuarios centrarse en la experiencia de usuario sin sobrecarga operativa

Construcción e implementación de agentes 10 veces más rápida

  • Para implementar agentes de nivel producción se necesita ejecución de código en sandbox, checkpoints, gestión de credenciales, definición del alcance de permisos y trazabilidad end-to-end
  • Managed Agents se encarga de esa complejidad, y el usuario solo necesita definir tareas, herramientas y guardrails
  • Un arness de orquestación integrado automatiza el momento de las llamadas a herramientas, la gestión de contexto y la recuperación ante errores
  • Funciones principales:
    • Agentes de nivel producción: manejo automático de sandboxing de seguridad, autenticación y ejecución de herramientas
    • Sesiones de larga duración: funcionan de forma autónoma durante horas y conservan el progreso y la salida incluso si se corta la conexión
    • Colaboración multiagente: crean y dirigen otros agentes para paralelizar tareas complejas (en etapa de research preview)
    • Gobernanza basada en confianza: incluye alcance de permisos, gestión de identidad y trazabilidad de ejecución

Diseño integrado con los modelos Claude

  • Los modelos Claude están optimizados para tareas centradas en agentes, y Managed Agents fue diseñado para aprovecharlos al máximo
  • El usuario solo necesita definir resultados y criterios de éxito, y Claude realiza autoevaluación e iteraciones para alcanzar el objetivo (disponible en research preview)
  • También admite, cuando hace falta, flujos de trabajo tradicionales de prompt-respuesta
  • En pruebas internas, en tareas de generación estructurada de archivos mostró hasta 10 puntos más de rendimiento frente a un loop de prompts estándar
  • Seguimiento de sesiones, analítica integrada y guías de resolución de problemas están incorporados en Claude Console para revisar todas las llamadas a herramientas y el proceso de decisión

Casos de uso reales

  • Distintos equipos ya han logrado implementaciones en producción 10 veces más rápidas con Managed Agents
    • Agentes de programación: análisis de codebases, planificación de cambios y generación de PR
    • Agentes de productividad: participación en proyectos, ejecución de tareas y entrega de resultados
    • Agentes financieros y legales: procesamiento de documentos y extracción de información clave
  • Casos de empresas destacadas:
    • Notion

      • Opera una versión alfa de Custom Agents que permite delegar tareas directamente a Claude dentro del workspace
      • Los ingenieros pueden desplegar código y los trabajadores del conocimiento pueden crear sitios web y presentaciones, con decenas de tareas ejecutándose en paralelo
    • Rakuten

      • Implementó un agente corporativo integrado con Slack y Teams en las áreas de producto, ventas, marketing, finanzas y RR. HH.
      • Desplegó cada agente especializado en menos de una semana
    • Asana

      • Integró dentro de los proyectos agentes que colaboran con humanos a través de AI Teammates
      • Con Managed Agents implementó funciones avanzadas en pocas semanas
    • Vibecode

      • Implementó con Managed Agents una infraestructura de apps nativas de IA que conecta desde el prompt hasta el despliegue de la app
      • La misma infraestructura puede construirse 10 veces más rápido
    • Sentry

      • Combinó el agente de depuración Seer con un agente de creación de parches basado en Claude
      • Automatizó en un solo flujo desde la detección del bug hasta la creación del PR, completando en semanas una integración que antes tomaba meses

Citas de clientes

  • Ansh Nanda (cofundador): antes había que gestionar manualmente los LLM en un sandbox, pero ahora se puede construir infraestructura 10 veces más rápido con unas pocas líneas de código, y prevé un auge de apps nativas de IA
  • Indragie Karunaratne (director de ingeniería AI/ML en Sentry): Managed Agents ofrece un runtime seguro y completamente administrado, mejorando la experiencia del desarrollador y eliminando la carga operativa
  • Sanchan Saxena (responsable de producto en Atlassian): integró agentes en los flujos de trabajo de Jira, y la automatización de sandboxing, sesiones y gestión de permisos mejoró la eficiencia de ingeniería
  • Javed Qadrud-Din (CTO): Managed Agents crea al instante las herramientas necesarias para atender todas las consultas de los usuarios, reduciendo el tiempo de desarrollo 10 veces
  • John Han (cofundador): implementó un agente de preparación de reuniones a nivel producción en pocos días, con conexión automática a sistemas externos y búsqueda web
  • Eric Liu (PM de Notion): las sesiones de larga duración y la gestión de memoria permiten delegar tareas complejas y abiertas
  • Yusuke Kaji (responsable de IA en Rakuten): desplegó agentes especializados para cada área en menos de una semana, logrando escalado seguro y democratización de la innovación
  • Amritansh Raghav (CTO de Asana): aceleró de forma drástica la velocidad de desarrollo de AI Teammates y reforzó una experiencia de colaboración de nivel empresarial

Cómo empezar

  • Managed Agents se ofrece con cobro según uso, con un cargo adicional de $0.08 por hora de sesión sobre la tarifa estándar de tokens de Claude Platform
  • Los detalles de precios pueden consultarse en la documentación oficial
  • Puedes desplegar tu primer agente desde Claude Console o la CLI, con soporte de integración para Claude Code y claude-api Skill
  • El onboarding puede iniciarse con el comando “start onboarding for managed agents in Claude API”

Innovación en la operación de las organizaciones

  • Managed Agents es una herramienta que puede transformar de raíz la forma en que operan las organizaciones, ayudando a que desarrolladores y equipos se enfoquen en la productividad y la experiencia de usuario en lugar de la infraestructura
  • Se prevén actualizaciones continuas y expansión de la comunidad a través de Claude Platform

1 comentarios

 
GN⁺ 21 일 전
Opiniones en Hacker News
  • Sospecho que esto podría terminar llevando a la orquestación óptima
    Puede que el open source no logre sacar una mejor alternativa a tiempo
    Hasta ahora, el mejor desempeño ha salido al mezclar agentes de varias empresas
    Más importante que el planner es el worker. Algunos agentes son mucho mejores para tareas específicas
    Por ejemplo, Opus 4.6 no tiene comparación con GPT 5.4 xhigh en detección de bugs
    Así como en el mundo real distintas formas de pensar aumentan la solidez de un equipo, mezclar agentes parece dar un efecto parecido

    • Para que Anthropic haga la mejor versión, tendría que superar a todas las demás empresas de IA en cada subtarea de detalle (documentación técnica, diagramas, detección de bugs, etc.)
      Pero no parece probable que dejen llamar modelos externos como Codex dentro de su stack
    • Lo que me preocupa es que esto pueda terminar convertido en el lenguaje de orquestación óptimo
      Por ejemplo, ¿qué pasa si Claude convierte toda la comunicación entre agentes al sumerio?
      Una sola empresa podría monopolizar esa especialización lingüística
    • A mí también me funcionaba mejor mezclar modelos de varias empresas
      Escribir especificaciones con Opus → corregir con Gemini → feedback otra vez con Opus → yo reviso → build con Qwen3.5 → review con Opus
      Ese flujo era perfecto, pero Anthropic cambió su política y lo rompió
    • En este momento las empresas de IA se parecen a cangrejos en una cubeta
      Cuando una saca un modelo cerrado, las otras lo analizan, lo mejoran y lo publican como open source
      Al final terminan frenándose entre sí, y más adelante hasta podrían volverse una especie de cártel
  • Se nota que Anthropic quiere atraer a los desarrolladores a su propia plataforma
    Para salir a bolsa, no les basta con ser un proveedor de modelos: tienen que convertirse en una empresa de plataforma
    Todos sus movimientos actuales apuntan en esa dirección

  • Uso Claude Code todos los días, pero hacer que los sistemas de los clientes dependan de Anthropic es riesgoso
    La ingeniería de calidad no es precisamente su fuerte. Y si la disponibilidad apenas llega a un “single 9”, eso es problemático

  • Estamos en los primeros días de los frameworks de agentes, como la web antes de PHP
    Cada semana salen nuevos patrones y modelos, y todos los frameworks se rehacen desde cero
    LangChain quiere volverse algo como Next.js/Vercel, pero la mayoría recomienda construirlo uno mismo
    Anthropic, como tiene modelos propios, conseguirá cierta demanda con una solución de baja fricción, pero el lock-in y la velocidad del cambio tecnológico siguen siendo problemas

    • También estoy de acuerdo. Estamos en esa etapa en la que hay cientos de soluciones a medio terminar flotando por blogs o GitHub
      LangChain es lo más cercano, pero todavía se siente muy DIY
      Además, todo el mundo está mezclando distintos vector DB y modelos de reranking
  • Yo estaba construyendo algo parecido por mi cuenta, así que me sorprendió ver que el enfoque de Anthropic era una idea paralela
    Hay que evitar a toda costa quedar atado a un solo proveedor de modelos
    Puede servir para equipos pequeños, pero en sistemas complejos es un suicidio
    Hay que comparar y combinar varios modelos y gestionarlos con tu propio estilo. Como en la cocina, según la situación necesitas elegir distintos sabores

    • En realidad todos están construyendo algo parecido. No hay tantas direcciones posibles
    • Me pregunto si la razón para evitar el lock-in es solo el rendimiento, o también si Anthropic podría usar los datos de telemetría para convertirse en competidor más adelante
    • Yo pienso igual. Es bastante sencillo montar un sistema así sobre una plataforma agregadora como openrouter
  • La página hecha por esos agentes estaba tan mal que el texto de las reseñas se encimaba y no se podía leer

    • Yo de plano solo veía una pantalla negra
  • Estoy corriendo un contenedor Docker para crear un sitio Jekyll con el Agentic SDK de Anthropic
    Montar la infraestructura no fue difícil; lo realmente complicado fue hacer que el agente se comportara como yo quería
    Algún día tal vez migre a otro proveedor o a una opción autohospedada, así que quiero conservar la libertad

  • Yo igual voy a seguir usando la combinación de pydantic ai con dbos/temporal/celery
    No quiero quedar atado a un proveedor específico. Quiero poder usar cualquier LLM con libertad
    Hay que seguir empujando el desarrollo de la orquestación open source

  • Se ve impresionante por fuera, pero también podría convertirse en una bomba de costos
    Como en AWS, si no tienes cuidado podrías terminar con miles de agentes corriendo y una factura disparada
    Para Anthropic parece un modelo de ingresos enorme

  • Esta dirección era un paso esperado
    Es una forma fácil de aumentar ingresos y reforzar el lock-in de usuarios sin tener que hacer los modelos más inteligentes
    El análisis relacionado está bien resumido en este artículo