- Agent Skills es una estructura de extensión que añade a Codex capacidades especializadas por tarea para ejecutar flujos de trabajo específicos de forma confiable
- Cada skill está compuesta por un archivo
SKILL.md y scripts, recursos y assets opcionales, por lo que se puede compartir entre equipos o comunidades
- Codex ejecuta las skills mediante invocación explícita (comando
/skills o entrada con $) e invocación implícita (uso automático cuando coincide con la descripción de la tarea)
- Las skills se administran mediante varias ubicaciones de almacenamiento y un sistema de prioridades como REPO, USER, ADMIN y SYSTEM, y se pueden crear nuevas skills con
$skill-creator
- Esta función está disponible tanto en la CLI como en la extensión de IDE de Codex, y permite ampliar capacidades instalando skills desde GitHub y otros lugares
Resumen de Agent Skills
- Agent Skills es una estructura que le da a Codex nuevas funciones y especialización
- Las skills empaquetan instrucciones, recursos y scripts opcionales para realizar tareas específicas
- Se pueden compartir entre equipos o comunidades y están basadas en el estándar abierto de Agent Skills
- Se puede usar tanto en la CLI como en la extensión de IDE de Codex
Estructura de las skills y sus componentes
- Cada skill se organiza alrededor de un archivo
SKILL.md y tiene una estructura de carpetas como la siguiente
SKILL.md: obligatorio, incluye instrucciones y metadatos
scripts/: código ejecutable opcional
references/: documentación opcional
assets/: plantillas y recursos opcionales
- Codex usa un enfoque de progressive disclosure para gestionar el contexto de forma eficiente
- Al inicio solo carga el nombre y la descripción de la skill, y lee las instrucciones completas cuando hace falta
Formas de invocar skills
- Invocación explícita (Explicit invocation)
- La skill se especifica directamente con el comando
/skills o mediante una entrada con $
- La versión web y la versión de iOS de Codex todavía no admiten invocación explícita, pero las skills incluidas en el repositorio se pueden usar mediante prompts
- Invocación implícita (Implicit invocation)
- Cuando la tarea del usuario coincide con la descripción de una skill, Codex la usa automáticamente
Ubicaciones de almacenamiento y prioridad de las skills
- Codex carga skills desde varias ubicaciones, y las skills de ubicaciones con mayor prioridad sobrescriben skills inferiores con el mismo nombre
- Principales scopes y ubicaciones
REPO: $CWD/.codex/skills, $CWD/../.codex/skills, $REPO_ROOT/.codex/skills
USER: $CODEX_HOME/skills o ~/.codex/skills
ADMIN: /etc/codex/skills
SYSTEM: skills incluidas por defecto en Codex
- Cada scope se usa según el objetivo de administración a nivel personal, de equipo o del sistema
Cómo crear skills
- Se pueden generar nuevas skills automáticamente usando la skill integrada
$skill-creator
- Si se combina con la skill
$plan, se puede preparar un plan antes de crear la skill
- Si se crean manualmente, hay que hacer una carpeta en una ubicación válida y escribir el archivo
SKILL.md
- Campos obligatorios:
name, description
- Campo opcional:
metadata.short-description
- Las skills se basan en la especificación de Agent Skills
Instalación de skills y ejemplos
- Es posible instalar skills desde el repositorio público de skills en GitHub usando la skill
$skill-installer
- Ejemplo:
$skill-installer linear
- También se pueden instalar skills desde otros repositorios
- Ejemplos de skills integradas
$plan: planificación para desarrollar nuevas funciones o resolver problemas complejos
$skill-installer linear: acceso al contexto de Linear
$skill-installer notion-spec-to-implementation: acceso a datos de Notion
Lo que significa para los desarrolladores de Codex
- Agent Skills es un componente clave para aumentar la extensibilidad y la colaboración de Codex
- Los desarrolladores pueden definir sus propias skills para construir flujos de trabajo de desarrollo automatizados
- La integración con CLI e IDE, la conexión con GitHub y la especificación estandarizada de skills refuerzan el potencial de expansión del ecosistema de Codex
1 comentarios
Comentarios en Hacker News
Da mucho gusto ver que Skills se esté consolidando como un estándar
Se puede escribir como un simple archivo Markdown y, por defecto, es eficiente en contexto
Se puede montar sobre herramientas existentes, así que incluso se podría crear un skill que explique cómo usar el CLI
ghen lugar de GitHub MCPSe pueden combinar varios skills y también incluir scripts en Python o JS
Gracias a eso, se logra un enfoque mucho más simple y flexible sin exponer un servidor MCP aparte
Por ejemplo, se puede automatizar algo como “agrega como skill los puntos clave de esta sesión”
No solo en buenas sesiones, también se pueden guardar como skill los aprendizajes de sesiones con mucha prueba y error
Ofrece un flujo de expansión de capacidades mucho más rápido y accesible que MCP
Me pregunto si quizá sería más útil del lado de data science o DevOps que en algo centrado en CRUD
La clave de Skills es que, según la especificación, no se aplica RAG al contenido principal del código o markdown del skill
Es decir, solo el nombre y la descripción del front-matter se incluyen en el prompt y se usan para seleccionar el skill
Por lo tanto, una lógica que no se mencione en la descripción podría no descubrirse nunca
Además, la descripción del skill es una especie de prompt injection, así que también afecta el tono general y el costo en tokens
Para un ejemplo relacionado, ver este enlace al código
Como es importante mantener limpio el contexto, prefiero agregar directamente el archivo md solo cuando hace falta
MCP es excesivamente complejo, e incluso skill se siente un poco sobreingenierizado
Eso es más un problema de diseño del harness agentic que del LLM en sí
Parece probable que en adelante el LLM y el harness estén más estrechamente integrados
Yo ya venía usando un enfoque parecido desde hace tiempo
Creaba una carpeta por funcionalidad, con
README.md,scriptsyGUIDE.mdCuando encontraba código reutilizable (por ejemplo, integración con clerk.dev), lo organizaba en una carpeta,
y cuando hacía falta lo fusionaba con merge-to-md para usarlo
Este enfoque funcionó perfectamente, así que me da gusto que ahora este tipo de función venga integrada por defecto en el agente
Parece que Skills, a largo plazo, podría evolucionar como una biblioteca open source
Si se ofrecieran como skills soluciones estandarizadas para autenticación o multitenancy,
la seguridad y la calidad del código mejorarían muchísimo
y usarlo de inmediato, incluso podría convertirse en una alternativa al aprendizaje continuo
Skills, plugins, apps, connectors, MCPs, agents… sinceramente, es confuso
Todavía no se ha definido el mejor enfoque y la terminología tampoco está asentada
Incluso “Agent” significa cosas distintas según el grupo
Fuera de ejecutar herramientas, son distintas maneras de agregar contexto al prompt
Hace poco, en este post,
se explicaba una estructura donde el agent llama repetidamente al LLM e intercambia solicitudes de uso de herramientas en formato JSON,
y me pregunto qué forma tendría un skill dentro de ese framework
<Skills>Ejemplo:
<Skill><Name>postgres</Name><Description>cómo consultar la BD pre-prod</Description><File>skills/postgres.md</File></Skill>Este aviso se vuelve a enviar periódicamente para que el LLM no “olvide” el skill
Al final, solo se transmiten nombre + descripción + ruta del archivo, así que el costo en tokens es bajo
Pero si el LLM fuera lo bastante inteligente, quizá podría funcionar bien incluso sin esta estructura
Es una forma estandarizada de traer y usar juntos el prompt del skill y los scripts relacionados
Mucha gente está entendiendo mal Skills
La clave no es el archivo
.md, sino el empaquetado de código e instruccionesSkills asume un entorno de ejecución de código
La indexación de metadatos y carga diferida para ahorrar contexto es una gran ventaja
Si existiera un marketplace de skills.md, quizá ayudaría a expandir la tecnología
Basta con ver los casos de spam relacionados con MCP
Al final, probablemente solo podría mantenerse alrededor de empresas confiables o desarrolladores reconocidos
No tiene calificaciones ni comentarios, pero se puede esperar cierto nivel de calidad
hay poco incentivo para usar el prompt de otra persona
Al final, lo importante es optimizarlo para tu propio flujo de trabajo y codebase
Me pregunto si, usando el skill generado, el agente podría organizar la solución final obtenida tras varios intentos
Así voy creando un efecto flywheel
Hubo una broma diciendo que Anthropic parece el Chief Product Officer de OpenAI