- Gestiona varios agentes de IA al mismo tiempo y ofrece trabajo en paralelo y colaboración de largo plazo en un entorno integrado de desarrollo con IA
- Cada agente se ejecuta en un hilo independiente, lo que permite multitarea por proyecto, revisión de código, comentarios sobre diffs y correcciones manuales
- Con la función Skills, se expande más allá de escribir código hacia tareas como recopilación de información, resolución de problemas, generación de imágenes, redacción de documentos y despliegue en la nube
- Con la función Automations, puede ejecutar automáticamente tareas repetitivas en segundo plano según una programación definida
- Aplica seguridad con sandbox de forma predeterminada, y los comandos que requieren privilegios elevados, como acceso a red, necesitan aprobación del usuario
- Codex también estará disponible temporalmente para usuarios de ChatGPT Free y Go, y los planes de pago tendrán un límite de uso 2 veces mayor
Resumen de la app de Codex: un centro de mando para agentes
- Desde el lanzamiento de Codex en abril de 2025, la forma en que los desarrolladores usan agentes ha cambiado de manera fundamental
- Los modelos ahora pueden encargarse de tareas complejas y de larga duración de principio a fin
- Los desarrolladores ahora coordinan varios agentes a lo largo de todo el proyecto, delegan trabajo y lo ejecutan en paralelo
- El reto principal pasó de “qué pueden hacer los agentes” a “cómo pueden las personas dirigir, supervisar y colaborar con agentes a gran escala”
- Los IDE existentes y las herramientas basadas en terminal no fueron diseñados para este modo de trabajo, por lo que se necesitaba una nueva herramienta
- La app de Codex para macOS permite gestionar varios agentes de IA al mismo tiempo y ejecutar tareas en paralelo
- Admite tareas de larga ejecución y, mediante colaboración entre agentes, gestiona todo el ciclo de diseño, desarrollo, despliegue y mantenimiento de software
Trabajo paralelo con múltiples agentes
- La app de Codex ofrece un espacio enfocado para hacer multitarea con agentes
- Los agentes se ejecutan en hilos separados configurados por proyecto, lo que permite cambiar entre tareas sin perder contexto
- Dentro del hilo, se pueden revisar los cambios del agente, comentar el diff o editar directamente desde el editor
- Incluye soporte nativo para worktrees, por lo que varios agentes pueden trabajar en el mismo repositorio sin conflictos
- Cada agente trabaja en una copia aislada del código, lo que permite explorar distintos caminos sin afectar el estado local de git
- Mientras el agente trabaja, se pueden hacer checkout de los cambios localmente o dejar que continúe sin modificar el estado local de git
- Importa automáticamente el historial de sesiones y la configuración desde Codex CLI y la extensión del IDE, permitiendo usarlo de inmediato en proyectos existentes
Skills: expansión más allá de la generación de código
- Codex está evolucionando de un agente que escribe código a un agente que usa código para realizar tareas en la computadora
- Con Skills, puede ampliarse más allá de generar código hacia tareas como recopilación y síntesis de información, resolución de problemas y redacción
- Agrupa instrucciones, recursos y scripts para que Codex pueda conectarse a herramientas y ejecutar flujos de trabajo
- Completa tareas de forma confiable según las preferencias del equipo
- La app de Codex incluye una interfaz dedicada para crear y gestionar Skills
- Se puede solicitar explícitamente el uso de ciertas Skills o configurarlas para que se usen automáticamente según la tarea
-
Ejemplo de uso de Skills: creación de un juego de carreras
- Se le pidió a Codex crear un juego de carreras con varios pilotos, 8 mapas e ítems utilizables con la barra espaciadora
- Usó una skill de generación de imágenes (basada en GPT Image) y una skill de desarrollo de juegos web
- Completó el juego trabajando de forma autónoma con más de 7 millones de tokens a partir de un único prompt inicial
- Actuó como diseñador, desarrollador de juegos y tester de QA, y verificó el resultado jugando realmente el juego
- Nombre del juego: Voxel Velocity, un kart racer 3D voxel hecho con Three.js
- Modo de carrera individual (siempre 3 vueltas, 1 humano vs 7 CPU, 8 pistas disponibles de inmediato)
- Modelo de conducción arcade, sistema de carga por drift, niveles de boost (Tier 1 0.7 s, Tier 2 1.1 s, Tier 3 1.5 s)
- 8 personajes, 8 ítems, presets de dificultad para CPU e implementación de splines para IA
-
Principales Skills disponibles
- Implement designs: toma contexto de diseño, assets y capturas desde Figma y los convierte en código de UI para producción con fidelidad visual 1:1
- Manage projects: clasificación de bugs, seguimiento de releases y gestión de carga de trabajo del equipo en Linear
- Deploy to the cloud: despliegue de apps web en los principales hosts cloud como Cloudflare, Netlify, Render y Vercel
- Generate images: generación y edición de imágenes para sitios web, mockups de UI, visuales de producto y assets de juegos con una skill basada en GPT Image
- Build with OpenAI APIs: al desarrollar con la API de OpenAI, consulta la documentación más reciente
- Create documents: lectura, creación y edición de archivos PDF, hojas de cálculo y docx (con soporte para formato y diseño profesional)
- Al crear una nueva skill en la app, se puede usar desde la app, el CLI o la extensión del IDE
- Las skills pueden agregarse al repositorio para compartirlas con todo el equipo
Automations: automatización de tareas repetitivas
- Con Automations, Codex puede ejecutar tareas automáticamente en segundo plano según una programación definida
- Se configura combinando instrucciones y skills opcionales
- Al completarse, el resultado se guarda en la cola de revisión para poder continuar después si hace falta
- Ejemplos de uso interno en OpenAI
- Clasificación diaria de issues
- Búsqueda y resumen de fallas en CI
- Generación de briefs diarios de release
- Verificación de bugs
Personality: personalización del estilo de trabajo
- Cada desarrollador tiene preferencias distintas sobre cómo trabajar con agentes
- Hay quienes prefieren un colaborador conciso y orientado a la ejecución
- Otros prefieren una interacción más conversacional y empática
- En Codex se pueden elegir dos personalidades: un estilo conciso y práctico vs. uno conversacional y empático
- Se adapta a la preferencia del usuario sin cambiar la funcionalidad
- Se configura con el comando /personality en la app, el CLI y la extensión del IDE
Seguridad: integrada por defecto y configurable
- La seguridad está integrada desde el diseño en toda la pila de agentes de Codex
- Igual que Codex CLI, usa sandboxing nativo a nivel sistema, de código abierto y configurable
- Configuración predeterminada
- Los agentes solo pueden editar archivos de la carpeta o rama en la que están trabajando y realizar búsquedas web en caché
- Cuando un comando requiere privilegios elevados, como acceso a red, solicita aprobación del usuario
- Se pueden configurar reglas para proyectos o equipos para permitir que ciertos comandos se ejecuten automáticamente con privilegios elevados
Disponibilidad y precios
- La app de Codex está disponible desde hoy en macOS
- Los suscriptores de ChatGPT Plus, Pro, Business, Enterprise y Edu pueden usar Codex en CLI, web, extensión del IDE y app iniciando sesión con ChatGPT
- El uso está incluido en la suscripción de ChatGPT, con opción de comprar créditos adicionales si hace falta
- Temporalmente, Codex también estará disponible para usuarios de ChatGPT Free y Go
- Durante este período, los usuarios actuales de Codex en todos los planes de pago tendrán un límite de uso 2 veces mayor
Próximos planes
- Desde el lanzamiento de GPT-5.2-Codex a mediados de diciembre de 2024, el uso total de Codex se duplicó
- En el último mes, más de 1 millón de desarrolladores usaron Codex
- Próximos planes
- Lanzamiento de una app para Windows
- Expansión de la frontera de capacidades del modelo
- Inferencia más rápida
- Mejoras dentro de la app
- Mejora continua de los flujos de trabajo multiagente con base en retroalimentación real
- Mejor manejo del trabajo en paralelo y mayor facilidad para conservar el contexto al cambiar entre agentes
- Expansión de Automations
- Se está construyendo soporte para triggers basados en la nube
- Codex podrá seguir ejecutándose en segundo plano aunque la computadora no esté encendida
La premisa central de Codex
- Se basa en la premisa simple de que todo puede controlarse con código
- Cuanto mejor sea la capacidad del agente para razonar sobre código y generarlo, más competente será en todo tipo de trabajo técnico y de conocimiento
- El reto clave actual: la brecha entre las capacidades de los modelos de frontera y lo fácil que resulta para las personas usarlos en la práctica
- Codex fue diseñado para cerrar esa brecha, permitiendo dirigir, supervisar y aplicar con facilidad toda la inteligencia del modelo a tareas reales
- Se enfocaron en crear el mejor agente de programación, que servirá como base para agentes potentes orientados a trabajo de conocimiento más amplio
9 comentarios
Yo también últimamente uso Codex como principal y está muy bueno. Ojalá salga pronto una versión para Windows.
Cuando lo inicias por primera vez, importa de una todos los proyectos en los que ya estabas trabajando con Codex y te los muestra en la izquierda organizados por proyecto/hilo, así que es ideal para poner varias tareas a correr al mismo tiempo.
¿Hay alguna razón por la que Codex sea el principal y no Claude Code?
Yo suelo dejarles trabajo armando documentos de planificación largos, y Codex me quedó mejor para ese tipo de uso.
Y además, claramente casi nunca me pega el rate limit, incluso cuando corro varios proyectos al mismo tiempo con una cuenta barata.
Oh, gracias por el comentario.
Además, el creador de OpenClaw también usa Codex
> MoltBot 제작자: “나는 읽지 않은 코드를 배포한다”
Parece que Codex tampoco tiene malas reseñas, pero viendo los comentarios en Hacker News, da la impresión de que quizá no sea así...
2222 por favor para Windows/Linux T_T
También quería probar Atlas, el navegador de ChatGPT, pero dijeron que Windows llegaría pronto y desde entonces no ha habido noticias por un buen rato
Lo probé hoy y está buenísimo, ¿no?
Parece que los forks de VSCode van a tener que prepararse para desaparecer.
Claro, también podría reducirse el empleo para los desarrolladores.
Parece que en Windows es difícil hacer algo porque no tiene tecnología de sandbox.
Que saquen WSL o Windows...
Opiniones en Hacker News
La mayoría apenas tienen una UI de chat simple, pero con Electron es difícil llamar directamente a APIs del SO (por ejemplo, Win32), así que no se puede lograr una integración profunda
Software complejo como Blender, Godot, Unity o UE5 corre de forma nativa, así que desespera que estas empresas solo pongan excusas
En Windows, Electron es el estándar de facto, y hasta Microsoft lo usa con frecuencia
macOS es mucho mejor, pero al final el equipo queda atrapado en Mac o elige Electron para tener algo multiplataforma
La UI de UE5 casi no se siente nativa, y tampoco diría que sea mejor que Electron
En Electron también se pueden hacer llamadas a APIs nativas
A la mayoría de los usuarios no les importa si una app es nativa o no, y para las empresas es una gran ventaja poder reutilizar desarrolladores web para desarrollo de apps de escritorio
Una TUI o GUI es una capa de abstracción innecesaria que dificulta la automatización
Lo importante es la invocación simple de comandos y el registro de logs. El [modo headless o los logs de sesión] van más en esa dirección
A la mayoría no le importa si una app está hecha con tecnologías web o no
Electron también facilita mucho el port a Linux. Si insistieran solo en nativo, eso no habría sido posible
No es perfecto, pero entrega resultados de nivel de un ingeniero intermedio de forma consistente
Eso sí, la app se queda congelada en “Loading projects…”
El enlace a la documentación también estaba roto, pero este enlace ya funciona
Como uso varios entornos VM con VS Code Remote, parece que tendré que ajustar un poco la configuración del offset de puertos
Codex suele quedarse atrapado en loops mientras resuelve problemas, y Claude suele cerrarlos bien
Ir alternando entre los dos modelos resulta bastante eficiente
Aun así, mejora constantemente, así que tengo expectativas
Cowork llama a Claude Code desde una VM, mientras que Codex ejecuta la CLI dentro de un sandbox del SO
El stack técnico incluye Electron 40, React 19, TypeScript, Node.js, SQLite, Vite y más
Para macOS usa Sparkle, Squirrel y Sentry
No sigue instrucciones, se detiene a mitad del proceso o lanza código sin sentido
Como no tiene datos recientes sobre Nuxt 4+, sigue produciendo errores
La función Undo tampoco funciona bien y no hay feedback
Claude Code resolvió la misma tarea de una sola vez, mientras que Codex tardó mucho y lo hizo fatal
Esto me recordó cuando usaba el viejo Nokia N800: había potencial, pero el nivel de terminación era tan bajo que me preocupa la dirección de OpenAI
Me pregunto si Anthropic también lanzará una app multiagente de Claude Code similar
Si hay contratos claros (como definiciones de API), es más eficiente trabajar en paralelo con sesiones independientes
Estuve a punto de construir algo parecido
El punto clave del paper de Recursive Language Models es gestionar requisitos, diseño y planificación como objetos inmutables, no como contexto
Yo manejo cada etapa (spec, analysis, plan, etc.) en archivos
.mdy lo opero con un proceso kanban con etapas de aprobaciónAsí funciona bien incluso sin UI, se mantiene la calidad del código y, a largo plazo, la velocidad de desarrollo aumenta 10 veces
Con
.claude/commandsy.claude/agentspuedes correr varias tareas al mismo tiempoCodex detecta bien cosas que Claude pasa por alto, y usar ambos modelos de forma complementaria mejora mucho la eficiencia
La ventaja de Codex es que es barato y tiene un uso casi ilimitado; Claude tiene mejor calidad
Construye el proceso a partir de
plan.mdy te deja agregar pasos o hooks de forma dinámicaEs cómodo poder controlar la automatización de flujos de trabajo desde documentación
Ya les pago a los tres modelos principales, así que no creo que este tipo de servicios dure mucho
Dicen que usaron 7 millones de tokens, así que sorprende que no detectaran un error de QA así
Este tipo de problemas sutiles es difícil de detectar con un test harness o un agente de QA
Aunque aumentaron los tokens, solo mejoró el acabado; el gameplay es el mismo. Me pregunto en qué se fueron esos tokens extra
Me pregunto si planean que la versión CLI también soporte las mismas funciones
Estaría bien tener una función de clúster administrado que opere solo dentro de la red interna
También sería ideal poder compartir el progreso del trabajo con el equipo
Si la herramienta ofreciera esto de forma nativa, sería mucho más cómodo
La calidad reciente de GPT-5.x también ha bajado, y en este anuncio decepciona que el lanzamiento haya sido solo para Mac
El artículo también tiene muchos errores tipográficos, y molesta que no hayan publicado los prompts reales usados
Aun así, si mejora, estaría dispuesto a volver a probarlo
Supongo que es porque ya estamos acostumbrados a la velocidad de Sonnet o Gemini 3.0 Flash
El ChatGPT de 20 dólares me resulta más eficiente que Claude de 200 dólares