Skills incorporadas oficialmente en Codex

(developers.openai.com)

16 puntos por GN⁺ 2025-12-22 | 1 comentarios | Compartir por WhatsApp

Agent Skills es una estructura de extensión que añade a Codex capacidades especializadas por tarea para ejecutar flujos de trabajo específicos de forma confiable
Cada skill está compuesta por un archivo SKILL.md y scripts, recursos y assets opcionales, por lo que se puede compartir entre equipos o comunidades
Codex ejecuta las skills mediante invocación explícita (comando /skills o entrada con $) e invocación implícita (uso automático cuando coincide con la descripción de la tarea)
Las skills se administran mediante varias ubicaciones de almacenamiento y un sistema de prioridades como REPO, USER, ADMIN y SYSTEM, y se pueden crear nuevas skills con $skill-creator
Esta función está disponible tanto en la CLI como en la extensión de IDE de Codex, y permite ampliar capacidades instalando skills desde GitHub y otros lugares

Resumen de Agent Skills

Agent Skills es una estructura que le da a Codex nuevas funciones y especialización
- Las skills empaquetan instrucciones, recursos y scripts opcionales para realizar tareas específicas
- Se pueden compartir entre equipos o comunidades y están basadas en el estándar abierto de Agent Skills
Se puede usar tanto en la CLI como en la extensión de IDE de Codex

Estructura de las skills y sus componentes

Cada skill se organiza alrededor de un archivo SKILL.md y tiene una estructura de carpetas como la siguiente
- SKILL.md: obligatorio, incluye instrucciones y metadatos
- scripts/: código ejecutable opcional
- references/: documentación opcional
- assets/: plantillas y recursos opcionales
Codex usa un enfoque de progressive disclosure para gestionar el contexto de forma eficiente
- Al inicio solo carga el nombre y la descripción de la skill, y lee las instrucciones completas cuando hace falta

Formas de invocar skills

Invocación explícita (Explicit invocation)
- La skill se especifica directamente con el comando /skills o mediante una entrada con $
- La versión web y la versión de iOS de Codex todavía no admiten invocación explícita, pero las skills incluidas en el repositorio se pueden usar mediante prompts
Invocación implícita (Implicit invocation)
- Cuando la tarea del usuario coincide con la descripción de una skill, Codex la usa automáticamente

Ubicaciones de almacenamiento y prioridad de las skills

Codex carga skills desde varias ubicaciones, y las skills de ubicaciones con mayor prioridad sobrescriben skills inferiores con el mismo nombre
Principales scopes y ubicaciones
- REPO: $CWD/.codex/skills, $CWD/../.codex/skills, $REPO_ROOT/.codex/skills
- USER: $CODEX_HOME/skills o ~/.codex/skills
- ADMIN: /etc/codex/skills
- SYSTEM: skills incluidas por defecto en Codex
Cada scope se usa según el objetivo de administración a nivel personal, de equipo o del sistema

Cómo crear skills

Se pueden generar nuevas skills automáticamente usando la skill integrada $skill-creator
- Si se combina con la skill $plan, se puede preparar un plan antes de crear la skill
Si se crean manualmente, hay que hacer una carpeta en una ubicación válida y escribir el archivo SKILL.md
- Campos obligatorios: name, description
- Campo opcional: metadata.short-description
Las skills se basan en la especificación de Agent Skills

Instalación de skills y ejemplos

Es posible instalar skills desde el repositorio público de skills en GitHub usando la skill $skill-installer
- Ejemplo: $skill-installer linear
- También se pueden instalar skills desde otros repositorios
Ejemplos de skills integradas
- $plan: planificación para desarrollar nuevas funciones o resolver problemas complejos
- $skill-installer linear: acceso al contexto de Linear
- $skill-installer notion-spec-to-implementation: acceso a datos de Notion

Lo que significa para los desarrolladores de Codex

Agent Skills es un componente clave para aumentar la extensibilidad y la colaboración de Codex
Los desarrolladores pueden definir sus propias skills para construir flujos de trabajo de desarrollo automatizados
La integración con CLI e IDE, la conexión con GitHub y la especificación estandarizada de skills refuerzan el potencial de expansión del ecosistema de Codex

1 comentarios

GN⁺ 2025-12-22

Comentarios en Hacker News

Da mucho gusto ver que Skills se esté consolidando como un estándar
Se puede escribir como un simple archivo Markdown y, por defecto, es eficiente en contexto
Se puede montar sobre herramientas existentes, así que incluso se podría crear un skill que explique cómo usar el CLI gh en lugar de GitHub MCP
Se pueden combinar varios skills y también incluir scripts en Python o JS
Gracias a eso, se logra un enfoque mucho más simple y flexible sin exponer un servidor MCP aparte
- Además, el propio agente puede editar, mejorar y agregar skills
  Por ejemplo, se puede automatizar algo como “agrega como skill los puntos clave de esta sesión”
  No solo en buenas sesiones, también se pueden guardar como skill los aprendizajes de sesiones con mucha prueba y error
  Ofrece un flujo de expansión de capacidades mucho más rápido y accesible que MCP
- Estoy pensando cómo se podría aprovechar un skill en una app web mediana de Django + PostgreSQL + Python
  Me pregunto si quizá sería más útil del lado de data science o DevOps que en algo centrado en CRUD
- Al final, entiendo skill como una especie de caché de recetas de casos de uso / flujos de trabajo
La clave de Skills es que, según la especificación, no se aplica RAG al contenido principal del código o markdown del skill
Es decir, solo el nombre y la descripción del front-matter se incluyen en el prompt y se usan para seleccionar el skill
Por lo tanto, una lógica que no se mencione en la descripción podría no descubrirse nunca
Además, la descripción del skill es una especie de prompt injection, así que también afecta el tono general y el costo en tokens
Para un ejemplo relacionado, ver este enlace al código
- Personalmente, siento que el índice de skills podría ser más una carga que una ayuda
  Como es importante mantener limpio el contexto, prefiero agregar directamente el archivo md solo cuando hace falta
  MCP es excesivamente complejo, e incluso skill se siente un poco sobreingenierizado
- Algunos sistemas agentic sí aplican RAG a los skills
  Eso es más un problema de diseño del harness agentic que del LLM en sí
  Parece probable que en adelante el LLM y el harness estén más estrechamente integrados
- MCP y las tools al final tienen el mismo problema
Yo ya venía usando un enfoque parecido desde hace tiempo
Creaba una carpeta por funcionalidad, con README.md, scripts y GUIDE.md
Cuando encontraba código reutilizable (por ejemplo, integración con clerk.dev), lo organizaba en una carpeta,
y cuando hacía falta lo fusionaba con merge-to-md para usarlo
Este enfoque funcionó perfectamente, así que me da gusto que ahora este tipo de función venga integrada por defecto en el agente
- Gracias a esta explicación, el concepto de skill se entiende fácilmente
Parece que Skills, a largo plazo, podría evolucionar como una biblioteca open source
Si se ofrecieran como skills soluciones estandarizadas para autenticación o multitenancy,
la seguridad y la calidad del código mejorarían muchísimo
- Más adelante, si el modelo pudiera buscar y descargar el skill necesario desde un índice global de skills
  y usarlo de inmediato, incluso podría convertirse en una alternativa al aprendizaje continuo
Skills, plugins, apps, connectors, MCPs, agents… sinceramente, es confuso
- Esta confusión se debe a la inmadurez de la tecnología y a lo rápido que cambia
  Todavía no se ha definido el mejor enfoque y la terminología tampoco está asentada
  Incluso “Agent” significa cosas distintas según el grupo
- En realidad, todo esto no es más que un mecanismo de conveniencia para cargar contexto
  Fuera de ejecutar herramientas, son distintas maneras de agregar contexto al prompt
- Hay quien dice que todo esto es puro parche (bandaid)
- Otros lo ven solo como un nombre de marketing para API y prompt
- También se parece al fenómeno en que los LLM generan en masa ideas parecidas, pero ligeramente distintas
Hace poco, en este post,
se explicaba una estructura donde el agent llama repetidamente al LLM e intercambia solicitudes de uso de herramientas en formato JSON,
y me pregunto qué forma tendría un skill dentro de ese framework
- Antes del primer loop, el harness le envía al LLM un bloque <Skills>
  Ejemplo: <Skill><Name>postgres</Name><Description>cómo consultar la BD pre-prod</Description><File>skills/postgres.md</File></Skill>
  Este aviso se vuelve a enviar periódicamente para que el LLM no “olvide” el skill
  Al final, solo se transmiten nombre + descripción + ruta del archivo, así que el costo en tokens es bajo
  Pero si el LLM fuera lo bastante inteligente, quizá podría funcionar bien incluso sin esta estructura
- El agente carga selectivamente uno o más skills cuando los necesita
  Es una forma estandarizada de traer y usar juntos el prompt del skill y los scripts relacionados
Mucha gente está entendiendo mal Skills
La clave no es el archivo .md, sino el empaquetado de código e instrucciones
Skills asume un entorno de ejecución de código
- Se puede dejar preaprobado código ejecutable y llamarlo desde el prompt cuando haga falta
  La indexación de metadatos y carga diferida para ahorrar contexto es una gran ventaja
- Hay quien lo describe como el regreso de la programación literaria
Si existiera un marketplace de skills.md, quizá ayudaría a expandir la tecnología
- Pero siendo realistas, creo que sería difícil operarlo por problemas de spam, seguridad y falta de rentabilidad
  Basta con ver los casos de spam relacionados con MCP
  Al final, probablemente solo podría mantenerse alrededor de empresas confiables o desarrolladores reconocidos
- Ya existe el repositorio de skills de Anthropic
  No tiene calificaciones ni comentarios, pero se puede esperar cierto nivel de calidad
- Este tipo de intentos aparecen seguido, pero como el costo de crear un skill personalizado es casi cero,
  hay poco incentivo para usar el prompt de otra persona
- Yo también, tomando como referencia la documentación de Anthropic, hice un skill para escribir skills
  Al final, lo importante es optimizarlo para tu propio flujo de trabajo y codebase
Me pregunto si, usando el skill generado, el agente podría organizar la solución final obtenida tras varios intentos
- Yo también hice un “meta skill” para que, al terminar la sesión, actualice por sí mismo las reglas
  Así voy creando un efecto flywheel
Hubo una broma diciendo que Anthropic parece el Chief Product Officer de OpenAI
- Y luego siguió otra broma agregando que “sin compensación además”

Skills incorporadas oficialmente en Codex

Resumen de Agent Skills

Estructura de las skills y sus componentes

Formas de invocar skills

Ubicaciones de almacenamiento y prioridad de las skills

Cómo crear skills

Instalación de skills y ejemplos

Lo que significa para los desarrolladores de Codex

Lecturas relacionadas

1 comentarios

Comentarios en Hacker News