OpenAI presenta la app de Codex para macOS

(openai.com)

12 puntos por GN⁺ 2026-02-03 | 9 comentarios | Compartir por WhatsApp

Gestiona varios agentes de IA al mismo tiempo y ofrece trabajo en paralelo y colaboración de largo plazo en un entorno integrado de desarrollo con IA
Cada agente se ejecuta en un hilo independiente, lo que permite multitarea por proyecto, revisión de código, comentarios sobre diffs y correcciones manuales
Con la función Skills, se expande más allá de escribir código hacia tareas como recopilación de información, resolución de problemas, generación de imágenes, redacción de documentos y despliegue en la nube
Con la función Automations, puede ejecutar automáticamente tareas repetitivas en segundo plano según una programación definida
Aplica seguridad con sandbox de forma predeterminada, y los comandos que requieren privilegios elevados, como acceso a red, necesitan aprobación del usuario
Codex también estará disponible temporalmente para usuarios de ChatGPT Free y Go, y los planes de pago tendrán un límite de uso 2 veces mayor

Resumen de la app de Codex: un centro de mando para agentes

Desde el lanzamiento de Codex en abril de 2025, la forma en que los desarrolladores usan agentes ha cambiado de manera fundamental
- Los modelos ahora pueden encargarse de tareas complejas y de larga duración de principio a fin
- Los desarrolladores ahora coordinan varios agentes a lo largo de todo el proyecto, delegan trabajo y lo ejecutan en paralelo
El reto principal pasó de “qué pueden hacer los agentes” a “cómo pueden las personas dirigir, supervisar y colaborar con agentes a gran escala”
Los IDE existentes y las herramientas basadas en terminal no fueron diseñados para este modo de trabajo, por lo que se necesitaba una nueva herramienta
La app de Codex para macOS permite gestionar varios agentes de IA al mismo tiempo y ejecutar tareas en paralelo
Admite tareas de larga ejecución y, mediante colaboración entre agentes, gestiona todo el ciclo de diseño, desarrollo, despliegue y mantenimiento de software

Trabajo paralelo con múltiples agentes

La app de Codex ofrece un espacio enfocado para hacer multitarea con agentes
- Los agentes se ejecutan en hilos separados configurados por proyecto, lo que permite cambiar entre tareas sin perder contexto
- Dentro del hilo, se pueden revisar los cambios del agente, comentar el diff o editar directamente desde el editor
Incluye soporte nativo para worktrees, por lo que varios agentes pueden trabajar en el mismo repositorio sin conflictos
- Cada agente trabaja en una copia aislada del código, lo que permite explorar distintos caminos sin afectar el estado local de git
- Mientras el agente trabaja, se pueden hacer checkout de los cambios localmente o dejar que continúe sin modificar el estado local de git
Importa automáticamente el historial de sesiones y la configuración desde Codex CLI y la extensión del IDE, permitiendo usarlo de inmediato en proyectos existentes

Skills: expansión más allá de la generación de código

Codex está evolucionando de un agente que escribe código a un agente que usa código para realizar tareas en la computadora
Con Skills, puede ampliarse más allá de generar código hacia tareas como recopilación y síntesis de información, resolución de problemas y redacción
- Agrupa instrucciones, recursos y scripts para que Codex pueda conectarse a herramientas y ejecutar flujos de trabajo
- Completa tareas de forma confiable según las preferencias del equipo
La app de Codex incluye una interfaz dedicada para crear y gestionar Skills
- Se puede solicitar explícitamente el uso de ciertas Skills o configurarlas para que se usen automáticamente según la tarea
Ejemplo de uso de Skills: creación de un juego de carreras
- Se le pidió a Codex crear un juego de carreras con varios pilotos, 8 mapas e ítems utilizables con la barra espaciadora
  - Usó una skill de generación de imágenes (basada en GPT Image) y una skill de desarrollo de juegos web
  - Completó el juego trabajando de forma autónoma con más de 7 millones de tokens a partir de un único prompt inicial
  - Actuó como diseñador, desarrollador de juegos y tester de QA, y verificó el resultado jugando realmente el juego
- Nombre del juego: Voxel Velocity, un kart racer 3D voxel hecho con Three.js
  - Modo de carrera individual (siempre 3 vueltas, 1 humano vs 7 CPU, 8 pistas disponibles de inmediato)
  - Modelo de conducción arcade, sistema de carga por drift, niveles de boost (Tier 1 0.7 s, Tier 2 1.1 s, Tier 3 1.5 s)
  - 8 personajes, 8 ítems, presets de dificultad para CPU e implementación de splines para IA
Principales Skills disponibles
- Implement designs: toma contexto de diseño, assets y capturas desde Figma y los convierte en código de UI para producción con fidelidad visual 1:1
- Manage projects: clasificación de bugs, seguimiento de releases y gestión de carga de trabajo del equipo en Linear
- Deploy to the cloud: despliegue de apps web en los principales hosts cloud como Cloudflare, Netlify, Render y Vercel
- Generate images: generación y edición de imágenes para sitios web, mockups de UI, visuales de producto y assets de juegos con una skill basada en GPT Image
- Build with OpenAI APIs: al desarrollar con la API de OpenAI, consulta la documentación más reciente
- Create documents: lectura, creación y edición de archivos PDF, hojas de cálculo y docx (con soporte para formato y diseño profesional)
- Al crear una nueva skill en la app, se puede usar desde la app, el CLI o la extensión del IDE
- Las skills pueden agregarse al repositorio para compartirlas con todo el equipo

Automations: automatización de tareas repetitivas

Con Automations, Codex puede ejecutar tareas automáticamente en segundo plano según una programación definida
- Se configura combinando instrucciones y skills opcionales
- Al completarse, el resultado se guarda en la cola de revisión para poder continuar después si hace falta
Ejemplos de uso interno en OpenAI
- Clasificación diaria de issues
- Búsqueda y resumen de fallas en CI
- Generación de briefs diarios de release
- Verificación de bugs

Personality: personalización del estilo de trabajo

Cada desarrollador tiene preferencias distintas sobre cómo trabajar con agentes
- Hay quienes prefieren un colaborador conciso y orientado a la ejecución
- Otros prefieren una interacción más conversacional y empática
En Codex se pueden elegir dos personalidades: un estilo conciso y práctico vs. uno conversacional y empático
- Se adapta a la preferencia del usuario sin cambiar la funcionalidad
- Se configura con el comando /personality en la app, el CLI y la extensión del IDE

Seguridad: integrada por defecto y configurable

La seguridad está integrada desde el diseño en toda la pila de agentes de Codex
Igual que Codex CLI, usa sandboxing nativo a nivel sistema, de código abierto y configurable
Configuración predeterminada
- Los agentes solo pueden editar archivos de la carpeta o rama en la que están trabajando y realizar búsquedas web en caché
- Cuando un comando requiere privilegios elevados, como acceso a red, solicita aprobación del usuario
Se pueden configurar reglas para proyectos o equipos para permitir que ciertos comandos se ejecuten automáticamente con privilegios elevados

Disponibilidad y precios

La app de Codex está disponible desde hoy en macOS
Los suscriptores de ChatGPT Plus, Pro, Business, Enterprise y Edu pueden usar Codex en CLI, web, extensión del IDE y app iniciando sesión con ChatGPT
El uso está incluido en la suscripción de ChatGPT, con opción de comprar créditos adicionales si hace falta
Temporalmente, Codex también estará disponible para usuarios de ChatGPT Free y Go
Durante este período, los usuarios actuales de Codex en todos los planes de pago tendrán un límite de uso 2 veces mayor

Próximos planes

Desde el lanzamiento de GPT-5.2-Codex a mediados de diciembre de 2024, el uso total de Codex se duplicó
En el último mes, más de 1 millón de desarrolladores usaron Codex
Próximos planes
- Lanzamiento de una app para Windows
- Expansión de la frontera de capacidades del modelo
- Inferencia más rápida
Mejoras dentro de la app
- Mejora continua de los flujos de trabajo multiagente con base en retroalimentación real
- Mejor manejo del trabajo en paralelo y mayor facilidad para conservar el contexto al cambiar entre agentes
Expansión de Automations
- Se está construyendo soporte para triggers basados en la nube
- Codex podrá seguir ejecutándose en segundo plano aunque la computadora no esté encendida

La premisa central de Codex

Se basa en la premisa simple de que todo puede controlarse con código
Cuanto mejor sea la capacidad del agente para razonar sobre código y generarlo, más competente será en todo tipo de trabajo técnico y de conocimiento
El reto clave actual: la brecha entre las capacidades de los modelos de frontera y lo fácil que resulta para las personas usarlos en la práctica
Codex fue diseñado para cerrar esa brecha, permitiendo dirigir, supervisar y aplicar con facilidad toda la inteligencia del modelo a tareas reales
Se enfocaron en crear el mejor agente de programación, que servirá como base para agentes potentes orientados a trabajo de conocimiento más amplio

9 comentarios

xguru 2026-02-03

Yo también últimamente uso Codex como principal y está muy bueno. Ojalá salga pronto una versión para Windows.

Cuando lo inicias por primera vez, importa de una todos los proyectos en los que ya estabas trabajando con Codex y te los muestra en la izquierda organizados por proyecto/hilo, así que es ideal para poner varias tareas a correr al mismo tiempo.

tested 2026-02-03

¿Hay alguna razón por la que Codex sea el principal y no Claude Code?

xguru 2026-02-03

Yo suelo dejarles trabajo armando documentos de planificación largos, y Codex me quedó mejor para ese tipo de uso.
Y además, claramente casi nunca me pega el rate limit, incluso cuando corro varios proyectos al mismo tiempo con una cuenta barata.

tested 2026-02-03

Oh, gracias por el comentario.

Además, el creador de OpenClaw también usa Codex
> MoltBot 제작자: “나는 읽지 않은 코드를 배포한다”

Parece que Codex tampoco tiene malas reseñas, pero viendo los comentarios en Hacker News, da la impresión de que quizá no sea así...

unknowncyder 2026-02-03

2222 por favor para Windows/Linux T_T
También quería probar Atlas, el navegador de ChatGPT, pero dijeron que Windows llegaría pronto y desde entonces no ha habido noticias por un buen rato

treestae 2026-02-03

Lo probé hoy y está buenísimo, ¿no?
Parece que los forks de VSCode van a tener que prepararse para desaparecer.
Claro, también podría reducirse el empleo para los desarrolladores.

m00nlygreat 2026-02-03

Parece que en Windows es difícil hacer algo porque no tiene tecnología de sandbox.

cshj55 2026-02-03

Que saquen WSL o Windows...

GN⁺ 2026-02-03

Opiniones en Hacker News

No entiendo por qué las empresas de IA con decenas de miles de millones de dólares todavía no pueden hacer apps nativas
La mayoría apenas tienen una UI de chat simple, pero con Electron es difícil llamar directamente a APIs del SO (por ejemplo, Win32), así que no se puede lograr una integración profunda
Software complejo como Blender, Godot, Unity o UE5 corre de forma nativa, así que desespera que estas empresas solo pongan excusas
- El entorno de desarrollo de escritorio es un desastre. Microsoft ha sacado demasiados frameworks a medias, así que nadie sabe qué usar
  En Windows, Electron es el estándar de facto, y hasta Microsoft lo usa con frecuencia
  macOS es mucho mejor, pero al final el equipo queda atrapado en Mac o elige Electron para tener algo multiplataforma
- Hoy en día mucha UI de videojuegos también está basada en HTML/JS
  La UI de UE5 casi no se siente nativa, y tampoco diría que sea mejor que Electron
  En Electron también se pueden hacer llamadas a APIs nativas
  A la mayoría de los usuarios no les importa si una app es nativa o no, y para las empresas es una gran ventaja poder reutilizar desarrolladores web para desarrollo de apps de escritorio
- Yo lo veo al revés. Si conviertes todo en una interfaz de texto, el modelo puede aprender las herramientas de forma natural
  Una TUI o GUI es una capa de abstracción innecesaria que dificulta la automatización
  Lo importante es la invocación simple de comandos y el registro de logs. El [modo headless o los logs de sesión] van más en esa dirección
- La realidad es que el resultado hecho con IA termina siendo una app de Electron con una sola caja de entrada
- No me queda claro qué funciones tan importantes podría ofrecer una app nativa
  A la mayoría no le importa si una app está hecha con tecnologías web o no
  Electron también facilita mucho el port a Linux. Si insistieran solo en nativo, eso no habría sido posible
He usado bastante Codex en los últimos dos meses y me pareció bastante impresionante
No es perfecto, pero entrega resultados de nivel de un ingeniero intermedio de forma consistente
Eso sí, la app se queda congelada en “Loading projects…”
El enlace a la documentación también estaba roto, pero este enlace ya funciona
Como uso varios entornos VM con VS Code Remote, parece que tendré que ajustar un poco la configuración del offset de puertos
- Uso ChatGPT ($20/mes) junto con Claude ($200/año), y con Codex todavía no me he topado con límites de uso
  Codex suele quedarse atrapado en loops mientras resuelve problemas, y Claude suele cerrarlos bien
  Ir alternando entre los dos modelos resulta bastante eficiente
- Recibí una respuesta agradeciendo que reportara el problema del enlace. También dijeron que están mejorando la velocidad de carga
- Codex es fuerte en backend o tareas lógicas, pero se equivoca seguido en trabajos simples de UI frontend
  Aun así, mejora constantemente, así que tengo expectativas
- Yo voy a seguir usando Cursor. OpenAI debería enfocarse más en corregir bugs de sus apps existentes que en sacar una nueva
Codex parece un competidor del estilo de Claude Cowork
Cowork llama a Claude Code desde una VM, mientras que Codex ejecuta la CLI dentro de un sandbox del SO
El stack técnico incluye Electron 40, React 19, TypeScript, Node.js, SQLite, Vite y más
Para macOS usa Sparkle, Squirrel y Sentry
- Por el nombre y su diseño centrado en diff/worktree, se nota que está muy orientado a desarrolladores
- Se siente como un stack de nivel bootcamp, y eso decepciona un poco
- Me pregunto si la integración con Sentry es nativa o a través de MCP
- Tener vista de git y terminal es una gran ventaja para quienes usan CLI. También tengo expectativas con la función de skills
Probé Codex y me frustró al punto de darme rabia de lo lento y tonto que se siente
No sigue instrucciones, se detiene a mitad del proceso o lanza código sin sentido
Como no tiene datos recientes sobre Nuxt 4+, sigue produciendo errores
La función Undo tampoco funciona bien y no hay feedback
Claude Code resolvió la misma tarea de una sola vez, mientras que Codex tardó mucho y lo hizo fatal
Esto me recordó cuando usaba el viejo Nokia N800: había potencial, pero el nivel de terminación era tan bajo que me preocupa la dirección de OpenAI
El Codex de OpenAI es básicamente una versión oficializada de productos como Emdash y Conductor
Me pregunto si Anthropic también lanzará una app multiagente de Claude Code similar
- Ya existe Claude Code Desktop
- Creo que el enfoque multiagente está sobrevalorado
  Si hay contratos claros (como definiciones de API), es más eficiente trabajar en paralelo con sesiones independientes
- Cuando usas Claude Code con GUI, me pregunto si usa todo el harness de Claude Code o solo el modelo
- Es la primera vez que escucho de Emdash, pero hay tantas herramientas de este tipo que es difícil promocionarlas y el mercado es ruidoso
  Estuve a punto de construir algo parecido
- La versión web de Claude Code ya está disponible como vista previa de investigación
La función de agentes no me interesa mucho
El punto clave del paper de Recursive Language Models es gestionar requisitos, diseño y planificación como objetos inmutables, no como contexto
Yo manejo cada etapa (spec, analysis, plan, etc.) en archivos .md y lo opero con un proceso kanban con etapas de aprobación
Así funciona bien incluso sin UI, se mantiene la calidad del código y, a largo plazo, la velocidad de desarrollo aumenta 10 veces
Parece que la función central de Codex es la ejecución paralela de agentes, pero yo ya llevo 9 meses usando Claude Code así
Con .claude/commands y .claude/agents puedes correr varias tareas al mismo tiempo
Codex detecta bien cosas que Claude pasa por alto, y usar ambos modelos de forma complementaria mejora mucho la eficiencia
La ventaja de Codex es que es barato y tiene un uso casi ilimitado; Claude tiene mejor calidad
Yo uso sobre todo Claude Code, pero el mejor orquestador que he probado fue Zenflow de Zencoder.ai
Construye el proceso a partir de plan.md y te deja agregar pasos o hooks de forma dinámica
Es cómodo poder controlar la automatización de flujos de trabajo desde documentación
- Pero cuando buscas, muchas veces termina siendo otra “app para vender paquetes de créditos de IA”
  Ya les pago a los tres modelos principales, así que no creo que este tipo de servicios dure mucho
- Ya existen más de 500 servicios de integración de IA
En la parte inferior del demo del juego “Voxel Velocity” aparece “Enter start”, pero en realidad Enter solo cambia la selección
Dicen que usaron 7 millones de tokens, así que sorprende que no detectaran un error de QA así
- El juego en sí es impresionante, pero en los detalles se nota falta de control de calidad
  Este tipo de problemas sutiles es difícil de detectar con un test harness o un agente de QA
- Entre las versiones de 60 mil, 800 mil y 7 millones de tokens casi no hay diferencias en la jugabilidad
  Aunque aumentaron los tokens, solo mejoró el acabado; el gameplay es el mismo. Me pregunto en qué se fueron esos tokens extra
Soy usuario de Linux, así que me decepciona que Codex sea solo para Mac
Me pregunto si planean que la versión CLI también soporte las mismas funciones
- Respondió directamente Romain de OpenAI. Como está basado en Electron, dijeron que el soporte para Windows y Linux también llegará pronto
- Por ahora, ni siquiera corre en Mac con chips Intel
- macOS es adecuado para experimentación. Como la configuración de hardware es uniforme, hay menos bugs de edge cases
Es una lástima que todo corra solo en local
Estaría bien tener una función de clúster administrado que opere solo dentro de la red interna
También sería ideal poder compartir el progreso del trabajo con el equipo
- Yo hago algo parecido con ssh y tmux
  Si la herramienta ofreciera esto de forma nativa, sería mucho más cómodo
OpenAI y Codex lideraron la innovación al principio, pero ahora Claude y Gemini van más adelante
La calidad reciente de GPT-5.x también ha bajado, y en este anuncio decepciona que el lanzamiento haya sido solo para Mac
El artículo también tiene muchos errores tipográficos, y molesta que no hayan publicado los prompts reales usados
Aun así, si mejora, estaría dispuesto a volver a probarlo
- Se notó mucho que la parte de generación de código en el video estaba editada a más de 5x de velocidad
  Supongo que es porque ya estamos acostumbrados a la velocidad de Sonnet o Gemini 3.0 Flash
- Yo más bien siento que Codex es más estable que Claude Code o Gemini para manejar tareas complejas
  El ChatGPT de 20 dólares me resulta más eficiente que Claude de 200 dólares
- OpenAI ya había hecho antes esta política de lanzar primero en macOS