62 puntos por GN⁺ 2025-08-25 | Aún no hay comentarios. | Compartir por WhatsApp
  • A partir de 2025, crear directamente un agente de programación es uno de los mejores proyectos que un desarrollador individual puede intentar
  • Un agente funciona solo con 300 líneas de código y un bucle de tokens de LLM, y construirlo ofrece la oportunidad de pasar de consumidor a productor de IA
  • Los componentes básicos son herramientas como lectura de archivos, listado de archivos, ejecución de Bash, edición de archivos y búsqueda de código, con las que se implementa automatización real
  • En la elección del modelo, son adecuados los modelos agentic como Claude Sonnet y Kimi K2; si hace falta, se puede conectar un modelo oráculo como GPT como herramienta para realizar verificaciones de mayor nivel
  • De hecho, productos comerciales como Amp, Cursor, Claude Code y GitHub Copilot también tienen una estructura similar

Resumen del taller

  • Taller gratuito impartido por Geoffrey Huntley que guía, con enfoque práctico, sobre cómo crear un agente de programación y entender sus principios
  • Compara la estructura y los principios de asistentes de IA comerciales existentes como Roo code, Cline, Amp, Cursor, Windsurf y OpenCode, y ofrece la oportunidad de implementarlo directamente
  • A través de la experiencia de construcción, es posible dejar de ser un simple usuario de IA y crecer como desarrollador que crea herramientas de automatización usando IA
  • La estructura central consiste en usar un bucle de tokens de LLM dentro de unas 300 líneas de código para crear funciones de agente
  • Se agregan primitivas por herramienta (lectura, listado de archivos, ejecución, edición, búsqueda de código), y los ejemplos reales de funcionamiento y el código están publicados en el repositorio de GitHub

Qué es un agente

  • Últimamente el término "agente" se usa de forma muy amplia, pero su significado real y su principio interno de funcionamiento no están claros
  • A medida que baja la barrera de entrada para crear agentes, se vuelve posible pasar de consumidor de IA a productor capaz de liderar la automatización del trabajo
  • En 2025, al igual que conceptos básicos de bases de datos como la Primary key, los principios para crear agentes se están convirtiendo en conocimiento esencial
  • Empresas como Canva ya recomiendan usar IA en sus procesos de entrevista, y la capacidad de automatizar con IA se está volviendo un factor clave de contratación
  • Ahora quedarse atrás no es por la IA, sino por no aprender nuevas herramientas mediante el desarrollo personal

Principios clave de un agente de programación

  • Un agente de programación está compuesto solo por 300 líneas de código y un bucle de tokens de LLM, y ejecuta funciones mediante entradas repetidas de tokens
  • El concepto de trabajo concurrente (concurrent work) es importante
    • Ejemplo: incluso durante una reunión de Zoom, el agente puede avanzar en paralelo, mejorando mucho la eficiencia del trabajo
  • No todos los LLM son agentic
    • 'Alta seguridad' (ej.: Anthropic, OpenAI)
    • 'Baja seguridad' (ej.: Grok)
    • 'Oráculo' (ventajoso para resumir y razonamiento de alto nivel)
    • 'Agentic' (sesgo a la acción, iteración rápida y llamadas a herramientas)
  • Los desarrolladores deben entender las características de cada modelo y elegir el modelo según el objetivo
  • Asignar contexto sin medida perjudica el rendimiento, y hay que tener presente que "cuanto menos se asigne, mejor será el resultado"
    • Registrar demasiadas herramientas MCP también lleva a una caída de rendimiento
  • Regla: “Less is more” → para lograr el mejor rendimiento, hay que colocar en el contexto solo las herramientas y los datos necesarios

Flujo del proceso de construcción de un agente de programación

  • 1. Registro de herramientas y llamadas a funciones

    • Por ejemplo, se registra en el LLM una herramienta para consultar el clima y se permite que el LLM responda en formato de llamada a función cuando corresponda
    • MCP (Model Context Protocol) es similar a un "banner informativo sobre una función"; con solo registrar la descripción de la función, es posible invocarla automáticamente
  • 2. Funciones clave por herramienta primitiva

    • Lectura de archivos (ReadFile): al pasar una ruta, lee el contenido del archivo al contexto
    • Listado de archivos (ListFiles): entrega la lista de archivos y carpetas dentro de un directorio
    • Ejecución de comandos (Bash): el LLM ejecuta comandos del shell del sistema y devuelve el resultado
    • Edición de archivos (Edit): automatiza la creación o modificación del archivo indicado
    • Búsqueda de código (CodeSearch): busca rápidamente en toda la base de código según patrones, palabras clave o nombres de funciones (usando ripgrep)
  • 3. Ejemplos y flujo de resultados

    • Al integrar cada herramienta con el LLM, se automatizan tareas continuas usando solo prompts en lenguaje natural (por ejemplo, generar código de FizzBuzz → verificar la ejecución, explorar un directorio → analizar el contenido)
    • Las funciones de herramienta se invocan secuencialmente según la entrada del usuario o el escenario, repitiendo dentro del bucle la devolución de resultados
    • Secuencia principal de operación del agente: entrada del usuario → decisión sobre si llamar una herramienta → ejecución de la herramienta → asignación del resultado al contexto → repetición

Posibilidades de expansión y código abierto

  • Actualmente, la mayoría de los agentes de programación funcionan sobre la base de herramientas open source existentes como ripgrep
  • En GitHub existen proyectos de agentes simples pero potentes, implementados en apenas 100 líneas, como SST Open Code y mini-swe-agent, que sirven como referencia para rendimiento y estructura
  • Se recomienda que los desarrolladores entiendan y aprovechen los principios construyéndolos directamente, en lugar de limitarse a comparar productos existentes
  • Al aplicarlos a trabajo real y automatización, crear agentes propios y difundirlos dentro de la organización se convierte en una ventaja competitiva

Conclusión e implicaciones

  • Los agentes de programación no son una tecnología compleja, sino una combinación de una estructura de bucle simple y herramientas
  • La clave para crear agentes de programación es entender la estructura y ejecutar con rapidez, y la experiencia de construirlos directamente permite responder de forma activa a los cambios en la tecnología de IA
  • Más importante que la IA en sí misma es la inversión personal, como el desarrollo constante y la capacidad de crear herramientas, que hoy es la estrategia de crecimiento individual más importante
  • “La IA no te quitará el trabajo; la amenaza es que tu colega se equipe con agentes, automatice y trabaje más rápido

Aún no hay comentarios.

Aún no hay comentarios.