- A partir de 2025, crear directamente un agente de programación es uno de los mejores proyectos que un desarrollador individual puede intentar
- Un agente funciona solo con 300 líneas de código y un bucle de tokens de LLM, y construirlo ofrece la oportunidad de pasar de consumidor a productor de IA
- Los componentes básicos son herramientas como lectura de archivos, listado de archivos, ejecución de Bash, edición de archivos y búsqueda de código, con las que se implementa automatización real
- En la elección del modelo, son adecuados los modelos agentic como Claude Sonnet y Kimi K2; si hace falta, se puede conectar un modelo oráculo como GPT como herramienta para realizar verificaciones de mayor nivel
- De hecho, productos comerciales como Amp, Cursor, Claude Code y GitHub Copilot también tienen una estructura similar
Resumen del taller
- Taller gratuito impartido por Geoffrey Huntley que guía, con enfoque práctico, sobre cómo crear un agente de programación y entender sus principios
- Compara la estructura y los principios de asistentes de IA comerciales existentes como Roo code, Cline, Amp, Cursor, Windsurf y OpenCode, y ofrece la oportunidad de implementarlo directamente
- A través de la experiencia de construcción, es posible dejar de ser un simple usuario de IA y crecer como desarrollador que crea herramientas de automatización usando IA
- La estructura central consiste en usar un bucle de tokens de LLM dentro de unas 300 líneas de código para crear funciones de agente
- Se agregan primitivas por herramienta (lectura, listado de archivos, ejecución, edición, búsqueda de código), y los ejemplos reales de funcionamiento y el código están publicados en el repositorio de GitHub
Qué es un agente
- Últimamente el término "agente" se usa de forma muy amplia, pero su significado real y su principio interno de funcionamiento no están claros
- A medida que baja la barrera de entrada para crear agentes, se vuelve posible pasar de consumidor de IA a productor capaz de liderar la automatización del trabajo
- En 2025, al igual que conceptos básicos de bases de datos como la Primary key, los principios para crear agentes se están convirtiendo en conocimiento esencial
- Empresas como Canva ya recomiendan usar IA en sus procesos de entrevista, y la capacidad de automatizar con IA se está volviendo un factor clave de contratación
- Ahora quedarse atrás no es por la IA, sino por no aprender nuevas herramientas mediante el desarrollo personal
Principios clave de un agente de programación
- Un agente de programación está compuesto solo por 300 líneas de código y un bucle de tokens de LLM, y ejecuta funciones mediante entradas repetidas de tokens
- El concepto de trabajo concurrente (concurrent work) es importante
- Ejemplo: incluso durante una reunión de Zoom, el agente puede avanzar en paralelo, mejorando mucho la eficiencia del trabajo
- No todos los LLM son agentic
- 'Alta seguridad' (ej.: Anthropic, OpenAI)
- 'Baja seguridad' (ej.: Grok)
- 'Oráculo' (ventajoso para resumir y razonamiento de alto nivel)
- 'Agentic' (sesgo a la acción, iteración rápida y llamadas a herramientas)
- Los desarrolladores deben entender las características de cada modelo y elegir el modelo según el objetivo
- Asignar contexto sin medida perjudica el rendimiento, y hay que tener presente que "cuanto menos se asigne, mejor será el resultado"
- Registrar demasiadas herramientas MCP también lleva a una caída de rendimiento
- Regla: “Less is more” → para lograr el mejor rendimiento, hay que colocar en el contexto solo las herramientas y los datos necesarios
Flujo del proceso de construcción de un agente de programación
-
1. Registro de herramientas y llamadas a funciones
- Por ejemplo, se registra en el LLM una herramienta para consultar el clima y se permite que el LLM responda en formato de llamada a función cuando corresponda
- MCP (Model Context Protocol) es similar a un "banner informativo sobre una función"; con solo registrar la descripción de la función, es posible invocarla automáticamente
-
2. Funciones clave por herramienta primitiva
- Lectura de archivos (ReadFile): al pasar una ruta, lee el contenido del archivo al contexto
- Listado de archivos (ListFiles): entrega la lista de archivos y carpetas dentro de un directorio
- Ejecución de comandos (Bash): el LLM ejecuta comandos del shell del sistema y devuelve el resultado
- Edición de archivos (Edit): automatiza la creación o modificación del archivo indicado
- Búsqueda de código (CodeSearch): busca rápidamente en toda la base de código según patrones, palabras clave o nombres de funciones (usando ripgrep)
-
3. Ejemplos y flujo de resultados
- Al integrar cada herramienta con el LLM, se automatizan tareas continuas usando solo prompts en lenguaje natural (por ejemplo, generar código de FizzBuzz → verificar la ejecución, explorar un directorio → analizar el contenido)
- Las funciones de herramienta se invocan secuencialmente según la entrada del usuario o el escenario, repitiendo dentro del bucle la devolución de resultados
- Secuencia principal de operación del agente: entrada del usuario → decisión sobre si llamar una herramienta → ejecución de la herramienta → asignación del resultado al contexto → repetición
Posibilidades de expansión y código abierto
- Actualmente, la mayoría de los agentes de programación funcionan sobre la base de herramientas open source existentes como ripgrep
- En GitHub existen proyectos de agentes simples pero potentes, implementados en apenas 100 líneas, como SST Open Code y mini-swe-agent, que sirven como referencia para rendimiento y estructura
- Se recomienda que los desarrolladores entiendan y aprovechen los principios construyéndolos directamente, en lugar de limitarse a comparar productos existentes
- Al aplicarlos a trabajo real y automatización, crear agentes propios y difundirlos dentro de la organización se convierte en una ventaja competitiva
Conclusión e implicaciones
- Los agentes de programación no son una tecnología compleja, sino una combinación de una estructura de bucle simple y herramientas
- La clave para crear agentes de programación es entender la estructura y ejecutar con rapidez, y la experiencia de construirlos directamente permite responder de forma activa a los cambios en la tecnología de IA
- Más importante que la IA en sí misma es la inversión personal, como el desarrollo constante y la capacidad de crear herramientas, que hoy es la estrategia de crecimiento individual más importante
- “La IA no te quitará el trabajo; la amenaza es que tu colega se equipe con agentes, automatice y trabaje más rápido”
Aún no hay comentarios.