16 puntos por GN⁺ 2025-12-22 | 1 comentarios | Compartir por WhatsApp
  • Agent Skills es una estructura de extensión que añade a Codex capacidades especializadas por tarea para ejecutar flujos de trabajo específicos de forma confiable
  • Cada skill está compuesta por un archivo SKILL.md y scripts, recursos y assets opcionales, por lo que se puede compartir entre equipos o comunidades
  • Codex ejecuta las skills mediante invocación explícita (comando /skills o entrada con $) e invocación implícita (uso automático cuando coincide con la descripción de la tarea)
  • Las skills se administran mediante varias ubicaciones de almacenamiento y un sistema de prioridades como REPO, USER, ADMIN y SYSTEM, y se pueden crear nuevas skills con $skill-creator
  • Esta función está disponible tanto en la CLI como en la extensión de IDE de Codex, y permite ampliar capacidades instalando skills desde GitHub y otros lugares

Resumen de Agent Skills

  • Agent Skills es una estructura que le da a Codex nuevas funciones y especialización
    • Las skills empaquetan instrucciones, recursos y scripts opcionales para realizar tareas específicas
    • Se pueden compartir entre equipos o comunidades y están basadas en el estándar abierto de Agent Skills
  • Se puede usar tanto en la CLI como en la extensión de IDE de Codex

Estructura de las skills y sus componentes

  • Cada skill se organiza alrededor de un archivo SKILL.md y tiene una estructura de carpetas como la siguiente
    • SKILL.md: obligatorio, incluye instrucciones y metadatos
    • scripts/: código ejecutable opcional
    • references/: documentación opcional
    • assets/: plantillas y recursos opcionales
  • Codex usa un enfoque de progressive disclosure para gestionar el contexto de forma eficiente
    • Al inicio solo carga el nombre y la descripción de la skill, y lee las instrucciones completas cuando hace falta

Formas de invocar skills

  • Invocación explícita (Explicit invocation)
    • La skill se especifica directamente con el comando /skills o mediante una entrada con $
    • La versión web y la versión de iOS de Codex todavía no admiten invocación explícita, pero las skills incluidas en el repositorio se pueden usar mediante prompts
  • Invocación implícita (Implicit invocation)
    • Cuando la tarea del usuario coincide con la descripción de una skill, Codex la usa automáticamente

Ubicaciones de almacenamiento y prioridad de las skills

  • Codex carga skills desde varias ubicaciones, y las skills de ubicaciones con mayor prioridad sobrescriben skills inferiores con el mismo nombre
  • Principales scopes y ubicaciones
    • REPO: $CWD/.codex/skills, $CWD/../.codex/skills, $REPO_ROOT/.codex/skills
    • USER: $CODEX_HOME/skills o ~/.codex/skills
    • ADMIN: /etc/codex/skills
    • SYSTEM: skills incluidas por defecto en Codex
  • Cada scope se usa según el objetivo de administración a nivel personal, de equipo o del sistema

Cómo crear skills

  • Se pueden generar nuevas skills automáticamente usando la skill integrada $skill-creator
    • Si se combina con la skill $plan, se puede preparar un plan antes de crear la skill
  • Si se crean manualmente, hay que hacer una carpeta en una ubicación válida y escribir el archivo SKILL.md
    • Campos obligatorios: name, description
    • Campo opcional: metadata.short-description
  • Las skills se basan en la especificación de Agent Skills

Instalación de skills y ejemplos

  • Es posible instalar skills desde el repositorio público de skills en GitHub usando la skill $skill-installer
    • Ejemplo: $skill-installer linear
    • También se pueden instalar skills desde otros repositorios
  • Ejemplos de skills integradas
    • $plan: planificación para desarrollar nuevas funciones o resolver problemas complejos
    • $skill-installer linear: acceso al contexto de Linear
    • $skill-installer notion-spec-to-implementation: acceso a datos de Notion

Lo que significa para los desarrolladores de Codex

  • Agent Skills es un componente clave para aumentar la extensibilidad y la colaboración de Codex
  • Los desarrolladores pueden definir sus propias skills para construir flujos de trabajo de desarrollo automatizados
  • La integración con CLI e IDE, la conexión con GitHub y la especificación estandarizada de skills refuerzan el potencial de expansión del ecosistema de Codex

1 comentarios

 
GN⁺ 2025-12-22
Comentarios en Hacker News
  • Da mucho gusto ver que Skills se esté consolidando como un estándar
    Se puede escribir como un simple archivo Markdown y, por defecto, es eficiente en contexto
    Se puede montar sobre herramientas existentes, así que incluso se podría crear un skill que explique cómo usar el CLI gh en lugar de GitHub MCP
    Se pueden combinar varios skills y también incluir scripts en Python o JS
    Gracias a eso, se logra un enfoque mucho más simple y flexible sin exponer un servidor MCP aparte

    • Además, el propio agente puede editar, mejorar y agregar skills
      Por ejemplo, se puede automatizar algo como “agrega como skill los puntos clave de esta sesión”
      No solo en buenas sesiones, también se pueden guardar como skill los aprendizajes de sesiones con mucha prueba y error
      Ofrece un flujo de expansión de capacidades mucho más rápido y accesible que MCP
    • Estoy pensando cómo se podría aprovechar un skill en una app web mediana de Django + PostgreSQL + Python
      Me pregunto si quizá sería más útil del lado de data science o DevOps que en algo centrado en CRUD
    • Al final, entiendo skill como una especie de caché de recetas de casos de uso / flujos de trabajo
  • La clave de Skills es que, según la especificación, no se aplica RAG al contenido principal del código o markdown del skill
    Es decir, solo el nombre y la descripción del front-matter se incluyen en el prompt y se usan para seleccionar el skill
    Por lo tanto, una lógica que no se mencione en la descripción podría no descubrirse nunca
    Además, la descripción del skill es una especie de prompt injection, así que también afecta el tono general y el costo en tokens
    Para un ejemplo relacionado, ver este enlace al código

    • Personalmente, siento que el índice de skills podría ser más una carga que una ayuda
      Como es importante mantener limpio el contexto, prefiero agregar directamente el archivo md solo cuando hace falta
      MCP es excesivamente complejo, e incluso skill se siente un poco sobreingenierizado
    • Algunos sistemas agentic sí aplican RAG a los skills
      Eso es más un problema de diseño del harness agentic que del LLM en sí
      Parece probable que en adelante el LLM y el harness estén más estrechamente integrados
    • MCP y las tools al final tienen el mismo problema
  • Yo ya venía usando un enfoque parecido desde hace tiempo
    Creaba una carpeta por funcionalidad, con README.md, scripts y GUIDE.md
    Cuando encontraba código reutilizable (por ejemplo, integración con clerk.dev), lo organizaba en una carpeta,
    y cuando hacía falta lo fusionaba con merge-to-md para usarlo
    Este enfoque funcionó perfectamente, así que me da gusto que ahora este tipo de función venga integrada por defecto en el agente

    • Gracias a esta explicación, el concepto de skill se entiende fácilmente
  • Parece que Skills, a largo plazo, podría evolucionar como una biblioteca open source
    Si se ofrecieran como skills soluciones estandarizadas para autenticación o multitenancy,
    la seguridad y la calidad del código mejorarían muchísimo

    • Más adelante, si el modelo pudiera buscar y descargar el skill necesario desde un índice global de skills
      y usarlo de inmediato, incluso podría convertirse en una alternativa al aprendizaje continuo
  • Skills, plugins, apps, connectors, MCPs, agents… sinceramente, es confuso

    • Esta confusión se debe a la inmadurez de la tecnología y a lo rápido que cambia
      Todavía no se ha definido el mejor enfoque y la terminología tampoco está asentada
      Incluso “Agent” significa cosas distintas según el grupo
    • En realidad, todo esto no es más que un mecanismo de conveniencia para cargar contexto
      Fuera de ejecutar herramientas, son distintas maneras de agregar contexto al prompt
    • Hay quien dice que todo esto es puro parche (bandaid)
    • Otros lo ven solo como un nombre de marketing para API y prompt
    • También se parece al fenómeno en que los LLM generan en masa ideas parecidas, pero ligeramente distintas
  • Hace poco, en este post,
    se explicaba una estructura donde el agent llama repetidamente al LLM e intercambia solicitudes de uso de herramientas en formato JSON,
    y me pregunto qué forma tendría un skill dentro de ese framework

    • Antes del primer loop, el harness le envía al LLM un bloque <Skills>
      Ejemplo: <Skill><Name>postgres</Name><Description>cómo consultar la BD pre-prod</Description><File>skills/postgres.md</File></Skill>
      Este aviso se vuelve a enviar periódicamente para que el LLM no “olvide” el skill
      Al final, solo se transmiten nombre + descripción + ruta del archivo, así que el costo en tokens es bajo
      Pero si el LLM fuera lo bastante inteligente, quizá podría funcionar bien incluso sin esta estructura
    • El agente carga selectivamente uno o más skills cuando los necesita
      Es una forma estandarizada de traer y usar juntos el prompt del skill y los scripts relacionados
  • Mucha gente está entendiendo mal Skills
    La clave no es el archivo .md, sino el empaquetado de código e instrucciones
    Skills asume un entorno de ejecución de código

    • Se puede dejar preaprobado código ejecutable y llamarlo desde el prompt cuando haga falta
      La indexación de metadatos y carga diferida para ahorrar contexto es una gran ventaja
    • Hay quien lo describe como el regreso de la programación literaria
  • Si existiera un marketplace de skills.md, quizá ayudaría a expandir la tecnología

    • Pero siendo realistas, creo que sería difícil operarlo por problemas de spam, seguridad y falta de rentabilidad
      Basta con ver los casos de spam relacionados con MCP
      Al final, probablemente solo podría mantenerse alrededor de empresas confiables o desarrolladores reconocidos
    • Ya existe el repositorio de skills de Anthropic
      No tiene calificaciones ni comentarios, pero se puede esperar cierto nivel de calidad
    • Este tipo de intentos aparecen seguido, pero como el costo de crear un skill personalizado es casi cero,
      hay poco incentivo para usar el prompt de otra persona
    • Yo también, tomando como referencia la documentación de Anthropic, hice un skill para escribir skills
      Al final, lo importante es optimizarlo para tu propio flujo de trabajo y codebase
  • Me pregunto si, usando el skill generado, el agente podría organizar la solución final obtenida tras varios intentos

    • Yo también hice un “meta skill” para que, al terminar la sesión, actualice por sí mismo las reglas
      Así voy creando un efecto flywheel
  • Hubo una broma diciendo que Anthropic parece el Chief Product Officer de OpenAI

    • Y luego siguió otra broma agregando que “sin compensación además”