130 puntos por xguru 2026-03-29 | 7 comentarios | Compartir por WhatsApp
  • "Configúrame un Harness": con una sola frase, diseña un equipo de agentes especializados acorde al dominio y además genera automáticamente las habilidades que usarán los agentes; una meta-skill
  • Soporta 6 patrones de arquitectura e incluye orquestación entre agentes y protocolos de manejo de errores
  • Patrones de arquitectura
    • Pipeline: tareas secuenciales con dependencia
    • Fan-out/Fan-in: tareas paralelas e independientes
    • Pool de expertos: invocación selectiva según la situación
    • Generación-validación: generación seguida de control de calidad
    • Supervisor: un agente central distribuye dinámicamente
    • Delegación jerárquica: delegación recursiva de nivel superior → inferior
  • Flujo de trabajo de 6 pasos: análisis del dominio → diseño de la arquitectura del equipo (equipo de agentes vs subagentes) → generación de definiciones de agentes → generación de habilidades → integración y orquestación → validación y pruebas
  • Hay dos modos de ejecución:
    • Equipo de agentes (predeterminado): método TeamCreate + SendMessage + TaskCreate, recomendado cuando se necesitan 2 o más agentes y colaboración
    • Subagentes: invocación directa de la herramienta Agent, adecuado para tareas puntuales o cuando no se necesita comunicación
  • Al ejecutar Harness, se crean automáticamente archivos de definición de agentes en .claude/agents/ (por ejemplo, analyst.md, builder.md, qa.md) y archivos de habilidades en .claude/skills/
  • Ejemplos de equipos que se pueden generar
    • Investigación profundaConfigúrame un Harness de investigación. Necesito un equipo de agentes que pueda investigar cualquier tema desde múltiples ángulos — búsqueda web, material académico, reacción de la comunidad — y que redacte un informe integral tras validación cruzada.
    • Creación de sitios webConfigúrame un Harness de desarrollo web full stack. Un equipo que coordine en pipeline diseño, frontend (React/Next.js), backend (API) y pruebas de QA desde wireframes hasta despliegue.
    • Producción de webtoonConfigúrame un Harness de producción de episodios de webtoon. Necesito agentes para redacción de historia, prompts de diseño de personajes, planificación de layout de paneles y edición de diálogos, y que revisen mutuamente su trabajo desde la perspectiva de la consistencia de estilo.
    • Planificación de contenido para YouTubeConfigúrame un Harness de producción de contenido para YouTube. Un equipo en el que un agente supervisor coordine investigación de tendencias, redacción de guion, optimización SEO de títulos/etiquetas y planificación del concepto de miniatura.
    • Revisión de códigoConfigúrame un Harness integral de revisión de código. Un equipo donde agentes auditen en paralelo arquitectura, vulnerabilidades de seguridad, cuellos de botella de rendimiento y estilo de código, e integren los resultados en un solo informe.
    • Redacción de documentación técnicaConfigúrame un Harness que genere automáticamente documentación de API a partir de este codebase. Un equipo que procese en pipeline análisis de endpoints, redacción de explicaciones, generación de ejemplos de uso y revisión de completitud.
    • Diseño de pipeline de datosConfigúrame un Harness de diseño de pipeline de datos. Un equipo de agentes que delegue jerárquicamente diseño de esquema, lógica ETL, reglas de validación de datos y configuración de monitoreo.
    • Campaña de marketingConfigúrame un Harness de creación de campañas de marketing. Un equipo que avance con investigación del mercado objetivo, redacción de copy publicitario, diseño de concepto visual y planeación de pruebas A/B, junto con revisiones iterativas de calidad.
  • revfactory/harness-100 — publicación de 100 Harness de equipos de agentes listos para producción en 10 dominios (200 paquetes en coreano e inglés)
    • Cada Harness incluye 4-5 agentes especializados, habilidades de orquestador y habilidades especializadas por dominio
    • Compuesto por 1,808 archivos Markdown sobre creación de contenido, desarrollo de software, datos/IA, estrategia de negocio, educación, legal, salud, etc.
    • Todos fueron generados con el plugin Harness
  • Requiere activar la función de equipos de agentes de Claude Code: CLAUDE_CODE_EXPERIMENTAL_AGENT_TEAMS=1

7 comentarios

 
namojo 29 일 전

El resultado tras usarlo de verdad es impresionante. La estructura misma de Harness que creó Minho hace fan-in/out, genera múltiples agentes según el objetivo y alineados con las instrucciones, y el orquestador que los administra descompone cada etapa del trabajo en varias fases para ejecutarlas.

El nivel de los resultados llega a producir entregables de nivel semiprofesional; puede ser un informe o incluso una aplicación, y para eso funcionan muy bien distintos agentes con roles como programador, tester, revisor y analista.

Podrían pensar que, como con MCP u otras herramientas, por Harness el contexto se mantiene grande todo el tiempo y los tokens se consumen rápido, pero si abren el contexto pueden ver que se está usando con la máxima eficiencia. Eso sí, si queremos lograr la legibilidad o un resultado más pulido que tenemos en mente, habría que crear y conectar una Skill de generación de imágenes Nanobanana basada en la API de Gemini.

Incluso con Claude Max 200, probablemente el límite diario llegue en 1 o 2 horas, y usé Opus.

Este es el resultado de cuando le di un itinerario de viaje por Japón y le pedí que, como guía de viaje de Japón, me creara una página interactiva del itinerario. Este tipo de cosas no consume muchos tokens y se hace muy rápido.

http://namojo.github.io/tokyo-tour

 
tested 2026-03-30

¿Alguien que lo haya probado puede compartir su opinión?

 
xguru 2026-03-29

Lo hizo Minho Hwang, líder del equipo de estrategia AI Native de Kakao.
Había visto varios posts donde lo presentaba, así que estaba esperando a ver cuándo lo publicaban.
¡Voy a probarlo!

 
edunga1 23 일 전

Si ya usabas el equipo de agentes de Claude Code, no había nada especialmente novedoso.
Pero fue conveniente construir la infraestructura usando agentes o skills para poder continuar incluso en sesiones nuevas con información como la configuración del equipo.
Cuando armabas el equipo manualmente, se repetían cosas tipo boilerplate para el equipo.

Había un problema: como es un entorno que considera tanto subagentes como equipos de agentes, en el patrón Supervisor a menudo ocurre la situación extraña de que el supervisor delega trabajo a un subagente aunque el equipo ya esté creado.

 
neocode24 2026-03-31

Dice Max 100, pero apenas empecé ya llegué al límite de tokens :(

 
neocode24 29 일 전

Me tomé un tiempo para ordenar lo que apliqué. Lo probé en un monorepo real de VibeCoding.

Entre el Mode A (desarrollo), B (auditoría de código) y C (integración: A+B), lo ejecuté en Mode B sobre un proyecto que ya estaba en marcha.
Pude encontrar elementos que el análisis estático no detecta, como inconsistencias de tipos entre frontend y backend.
Organicé el proceso de implementación.

https://blog.neocode24.com/blog/claude-code-harness-real-world/

 
wang3281 2026-03-30

Como alguien que está creando Harness por su cuenta, me da curiosidad saber con qué pruebas se reflejan los resultados del efecto de aplicar proyectos de código abierto. Me pregunto si existe una herramienta de benchmark cuantificable y oficial... También me interesa saber cómo suelen hacer otros para validar la efectividad más allá de la sensación subjetiva.