69 puntos por GN⁺ 2026-03-19 | 3 comentarios | Compartir por WhatsApp
  • Video del webinar de Codex para desarrolladores publicado directamente por OpenAI (58 minutos)
  • Codex es una plataforma de agentes de programación diseñada para ir más allá del autocompletado de código o la programación en pareja, y permitir que los ingenieros deleguen tareas de gran escala a agentes
  • Comparte el mismo backend en diversas interfaces como la app de Codex, la CLI y extensiones de IDE, y puede ejecutar múltiples tareas en paralelo al mismo tiempo
  • Cubre todo el ciclo de vida del desarrollo de software (SDLC), desde planificación (Plan), diseño (Design), construcción (Build), pruebas (Test), revisión (Review), documentación (Document) y hasta despliegue y mantenimiento (Deploy & Maintenance)
  • Mediante el archivo agents.md, se pueden configurar instrucciones de comportamiento del agente a nivel de repositorio, y con Skills y Automations se pueden empaquetar flujos de trabajo repetitivos para ejecutarlos automáticamente
  • Permite trabajo ininterrumpido durante 25 horas y mantener contexto durante largos periodos mediante compactación del lado del servidor (compaction) realizada 13 o 14 veces, con seguridad garantizada por un sandbox a nivel del sistema operativo

Evolución de la programación con IA: del autocompletado a la delegación en agentes

  • En los últimos años, la programación con IA ha evolucionado desde el autocompletado de código (mejora de alrededor del 10% en la velocidad de escritura) hasta la programación en pareja (planificación entre archivos, ejecución de pruebas, edición del repositorio)
  • Ambos enfoques se centraban en crear un “mejor colaborador”, pero Codex comenzó a desarrollarse hace un año con el objetivo de construir agentes a los que se les pudiera delegar trabajo
  • En diciembre de 2025, el modelo GT 5.2 Codex logró trabajo prolongado sin interrupciones y alta capacidad de control (steerability), resolviendo la barrera principal de la “verdadera delegación a agentes”
  • Después llegaron GT 5.3, más rápido y eficiente, y el más reciente GT 5.4, con mejoras continuas de rendimiento
  • El punto clave del avance es poder recorrer de forma estable grandes bases de código empresariales y mantener durante mucho tiempo la alineación con la intención del usuario

Interfaces disponibles para usar Codex

  • Codex permite usar un mismo agente en varias superficies, como la CLI, extensiones de IDE y la app de Codex, todas compartiendo el mismo backend
  • La app de Codex es la interfaz más visual para ejecutar trabajo en paralelo, optimizada para correr varios agentes al mismo tiempo y revisar sus resultados
  • Caso de Peter Steinberger (creador de OpenClaw): pasó de administrar más de 10 ventanas de CLI a usar la app de Codex, mejorando la eficiencia en la gestión de agentes en paralelo
  • Es compatible con macOS y Windows, se puede descargar en openai.com/codex, y en Windows también está disponible en Microsoft Store
  • En la CLI, la sesión se inicia primero con el comando codex login y luego con codex

UI y configuración de la app de Codex

  • Se puede elegir el modelo (como GPT 5.4) y ajustar el nivel de esfuerzo de razonamiento (reasoning effort): low, medium, high, extra high
    • medium es el valor predeterminado y ofrece el mejor equilibrio entre velocidad y profundidad de razonamiento
    • Para preguntas simples conviene low; para pensamiento profundo y prolongado, high o extra high
  • Se puede ajustar la velocidad de respuesta con el interruptor de modo Speed (fast/standard)
  • Además del trabajo local, ofrece modo Git worktree y opción para iniciar un contenedor remoto en la nube
  • Configuración de permisos: se puede elegir entre permisos básicos (leer/editar archivos dentro del proyecto, pedir aprobación para comandos peligrosos) o acceso total (todos los archivos del equipo, acceso a red, ejecución sin aprobación)
    • Para usuarios nuevos se recomiendan los permisos básicos
  • En la barra lateral izquierda se pueden agregar y cambiar proyectos (carpetas)

Uso de Codex en todas las etapas del SDLC

  • OpenAI publicó la guía “Building an AI Native Engineering Team”, que resume cómo los agentes de programación aceleran las 7 etapas del SDLC (planificación, diseño, construcción, pruebas, revisión, documentación, despliegue/mantenimiento)
  • En particular, las etapas de pruebas y revisión se vuelven todavía más importantes a medida que mejora la capacidad de generar código
  • Codex ha sido especialmente bien valorado por su razonamiento en bases de código complejas y por escribir código de nivel de producción

Etapa de planificación (Plan)

  • Al activar el modo Plan (/plan o Shift+Tab), Codex primero elabora un plan antes de implementar
  • En la demo, al pedir un plan para una app complementaria de iOS en SwiftUI, Codex exploró la base de código y luego presentó preguntas de seguimiento (método de autenticación, alcance del primer lanzamiento, etc.)
  • El agente se puede ajustar aceptando opciones sugeridas o escribiendo instrucciones directamente
  • Estructura sus planes explicitando supuestos (assumptions) para que el usuario pueda validarlos y corregirlos

Etapa de diseño (Design) — integración con MCP

  • Mediante MCP (Model Context Protocol), Codex puede conectar directamente contexto de herramientas externas como Figma y Linear
    • Compatible en todas las interfaces: CLI, extensión de IDE y app de Codex
  • Con la integración de Figma MCP, basta pegar un enlace de diseño para que Codex obtenga ese contexto y lo convierta en código
    • Si MCP no está configurado, Codex muestra automáticamente instrucciones de instalación
  • La integración con la app de ChatGPT también puede usarse directamente en Codex mediante conectores hechos por terceros
  • Con esto, los ingenieros pueden concentrarse en la lógica principal y los diseñadores dedicar más tiempo a explorar conceptos de diseño

Etapa de construcción (Build)

  • Es la etapa del SDLC donde el impacto de los agentes de programación es mayor
  • En la demo se ejecutaron en paralelo tareas como corregir ineficiencias de consultas N+1 y agregar pruebas de regresión, auditar rutas de API con autenticación faltante y la migración de NextAuth v4 a Auth.js v5
  • Resultado de generar código a partir de un diseño en Figma: cambios en 10 archivos y 320 líneas de código escritas, sin necesidad de trabajar CSS manualmente
  • La función Worktree crea automáticamente una copia del proyecto local para evitar conflictos entre trabajos paralelos, sin necesidad de duplicar el repositorio por separado
  • Codex ejecuta automáticamente los comandos de validación, build y lint definidos en agents.md, como npx tsc y npm test, para verificar el cumplimiento de las convenciones del equipo
  • La construcción en sí ya no es el cuello de botella; en entornos empresariales, lo clave es validar que el código cumpla las normas del equipo
  • El terminal puede abrirse y usarse directamente dentro de la app con Command+J
  • Incluso para apps de iOS, se puede ejecutar xcode build dentro de la app de Codex sin abrir Xcode directamente

Comandos con barra (Slash Commands)

  • La CLI, las extensiones de IDE y la app de Codex admiten comandos con barra para modo plan, menciones de archivos, ver estado de la sesión, cambiar permisos y más
  • El comando /experimental permite activar funciones experimentales
    • Incluye la creación de multiagentes (sub-agents)
    • La CLI incorpora funciones nuevas un poco antes que otras interfaces
  • La configuración activada en una interfaz se refleja en todas, ya que comparten el mismo backend

Etapa de revisión (Review)

  • Con el comando /review se puede ejecutar una revisión de código contra la rama base o sobre cambios locales sin commit
  • Los agentes de Codex están entrenados especialmente para identificar bugs de nivel P0/P1, por lo que ofrecen retroalimentación de alta señal y poco ruido
  • Esto permite detectar problemas localmente de forma temprana antes de que el PR llegue al pipeline de CI/CD
  • Integración nativa con GitHub Cloud: Codex puede hacer revisión de código automática sobre PRs de forma proactiva o reactiva
    • Se presentó un caso en el que detectó un problema P1 difícil de ver para una persona, como en la revisión de reglas con regex
  • Otros SCM como GitLab y Bitbucket también pueden integrarse directamente mediante el SDK de Codex
  • Si se agregan comentarios de revisión directamente en el panel de diff, esos comentarios se incorporan automáticamente al contexto de la siguiente conversación

Skills — empaquetado de flujos de trabajo reutilizables

  • Un Skill es un estándar abierto que empaqueta instrucciones reutilizables de flujo de trabajo para que Codex las ejecute
    • Estructuralmente es una carpeta, y el archivo obligatorio es skill.md (metadatos + instrucciones para el agente)
    • Opcionalmente puede incluir scripts de ejecución, documentación y plantillas
  • También se puede incrustar MCP dentro de un skill para integrar herramientas externas
  • Ejemplos de la demo: procesar comentarios de PR, corregir automáticamente fallas de compilación en BuildKite y detectar código muerto
  • Skill Creator (skill del sistema): si durante una conversación se pide algo como “create a skill to find dead code paths”, genera automáticamente el esqueleto de skill.md
  • Skill Installer (skill del sistema): instala de inmediato el skill generado en el directorio local de skills de Codex
  • Si un flujo de trabajo que se repite después de conversaciones largas se convierte en skill, la próxima vez se puede ejecutar todo el flujo con una sola invocación
  • Ejemplo del skill GitHub Issue Plan PR: con un solo prompt realiza triage de issues de GitHub, planificación, edición, documentación y hasta la creación de un PR en borrador, cubriendo de una vez todas las etapas del SDLC

Etapa de documentación (Documentation)

  • Es una de las áreas de uso más subestimadas de Codex
  • Puede generar diagramas del sistema y actualizar documentación automáticamente al implementar funcionalidades
  • Se mostró una demo integrada con Linear MCP para documentar automáticamente en el tablero de Linear los cambios de un ticket, resultados de pruebas de regresión y validaciones realizadas

Etapa de despliegue y mantenimiento (Deploy & Maintenance)

  • Desde la app de Codex se puede hacer Commit, Push y creación de PR directamente con clics (basado en Git)
  • Si se pega un stack trace, Codex razona sobre toda la base de código para identificar la causa del problema
  • Skill Triage Page: al ingresar un ID de incidente, reúne detalles, confirma el incidente, inspecciona métricas y logs, y lo lleva hasta el parche en una sola pasada
    • Esto cambia la respuesta a guardias/pagers del análisis manual de logs a la delegación en agentes
  • Skill PR Babysitter: monitorea continuamente el avance del pipeline de CI/CD de un PR y, si surge un problema, lo corrige automáticamente hasta completar el merge final
    • Ya se usa realmente en el entorno de monorepo a gran escala de OpenAI
    • Puede descargarse desde un repositorio abierto de skills

Automations — ejecución automática basada en horarios

  • Una vez que el equipo se familiariza con el uso de skills, la función Automations permite configurar la ejecución automática de tareas en horarios específicos
  • Automatización del skill de Sentry: cada jueves (o todos los días), busca issues en un repositorio específico y propone correcciones o las aplica automáticamente
  • Automatización de “What is everyone up to?”: todos los días a las 9 a. m. genera un resumen de la actividad del equipo en el repositorio
  • Así, aunque no se escriban prompts manualmente, Codex sigue trabajando en segundo plano

Cómo funcionan los agentes de Codex

  • Los agentes de Codex funcionan en bucle: el usuario da un objetivo claro y una dirección inicial → el agente repite razonamiento, llamadas a herramientas, lectura de archivos, búsqueda en el repositorio, escritura de código y ejecución de comandos
  • El resultado de cada herramienta se retroalimenta en la siguiente llamada al modelo, lo que permite construir comprensión y avanzar de forma gradual
  • El contexto es la variable clave que determina el rendimiento del agente: es importante orientar correctamente con la cantidad adecuada de información de entrada
  • Sandboxing a nivel del sistema operativo: no se basa en restricciones ligeras a nivel de harness, sino en control de acceso a red y archivos desde el sistema operativo
    • Está diseñado para anticipar la posibilidad de que modelos más avanzados eludan protecciones ligeras
    • Todos los sistemas (Mac, Windows) admiten sandbox; en Windows se implementa un sandbox nativo de Windows más seguro que WSL
  • En el archivo config TOML se pueden ajustar en detalle el approval mode (cuándo pedir aprobación) y el sandbox mode (alcance del acceso)
    • El valor predeterminado es “on request”: funciona normalmente y se pausa cuando necesita elevar permisos

Compactación (Compaction) — gestión de hilos de larga duración

  • Cuando la conversación se acerca al límite de contexto del modelo, Codex realiza una compactación que comprime la parte inicial
  • La compactación se procesa del lado del servidor con base en la cadena de pensamiento (chain of thought) sin procesar, por lo que preserva mejor el contenido real del trabajo que una compactación del lado del cliente
  • Caso real: durante 25 horas de trabajo ininterrumpido, logró mantener el contexto haciendo compactación 13 o 14 veces

Mejores prácticas de prompting para una delegación efectiva

  • Incluso con un prompt mínimo, conviene incluir un objetivo claro, restricciones y criterios de “terminado”
  • Incorporar condiciones de validación en el prompt: criterios de éxito y comandos de prueba/build que se deben ejecutar
  • Aprovechar prompts abiertos: pedirle a Codex ideas para mejorar rendimiento o detectar áreas con poca cobertura de pruebas para usarlo como socio de pensamiento

agents.md — archivo de instrucciones de comportamiento del agente

  • Es un formato abierto similar a Rules de Cursor o la configuración de Windsurf; no es exclusivo de OpenAI
  • Se carga automáticamente en todas las sesiones de Codex y ayuda a producir resultados consistentes
  • Sistema de prioridad en 3 niveles:
    • Global (~/.codex/agents.md): configuración personal predeterminada (independiente del equipo)
    • Raíz del repositorio (agents.md): convenciones de todo el repositorio
    • Subdirectorios (agents.md): instrucciones detalladas por microservicio o subcarpeta
    • Codex concatena los archivos agents.md siguiendo la ruta desde la raíz del proyecto hasta el directorio actual, dando prioridad a los archivos más específicos
  • Se recomienda incluir: visión general del repositorio, comandos a ejecutar, expectativas de pruebas, ubicación de módulos clave y lineamientos para commits/PRs
  • Con el comando /init (CLI) se puede generar automáticamente el primer agents.md, resolviendo el problema del arranque en frío
  • Se recomienda mantenerlo conciso, idealmente por debajo de 100 líneas (según el agents.md del monorepo interno de OpenAI)
  • Si el contenido crece demasiado, conviene separarlo en archivos Markdown por tarea (planning.md, code-review.md, architecture.md, etc.) y referenciarlos desde agents.md
  • Se mostró un patrón de automatización en el que Codex analiza los logs locales de sesión (con la ruta de almacenamiento provista) y propone automáticamente mejoras semanales para agents.md
  • También se puede pedir a Codex una retrospectiva de la conversación para reflejar automáticamente en agents.md una sección de gotchas o notas de referencia

Cierre — 3 acciones clave para adoptar Codex

  • Crear agents.md y configurar ajustes personalizados
  • Asignarle a Codex tareas reales de trabajo y conectarlo con las herramientas (MCP) que se usan a diario
  • Ejecutar Codex no solo en la etapa de build, sino en todo el ciclo de desarrollo, desde diseño hasta despliegue y mantenimiento

3 comentarios

 
xguru 2026-03-19

La academia de OpenAI ya lleva casi un año desde que abrió, así que se han acumulado bastantes cursos muy buenos.
(pero es una pena que solo tenga subtítulos automáticos en inglés)

 
mindok 2026-03-20

Ojalá hubiera subtítulos en español; qué lástima..

 
j2sus91 2026-03-19

¿Alguien ya escuchó esto?
¿Vale la pena invertirle una hora?

En esta era de la IA de darle clic y listo, el tiempo es valioso jaja