12 puntos por GN⁺ 2026-02-03 | 9 comentarios | Compartir por WhatsApp
  • Gestiona varios agentes de IA al mismo tiempo y ofrece trabajo en paralelo y colaboración de largo plazo en un entorno integrado de desarrollo con IA
  • Cada agente se ejecuta en un hilo independiente, lo que permite multitarea por proyecto, revisión de código, comentarios sobre diffs y correcciones manuales
  • Con la función Skills, se expande más allá de escribir código hacia tareas como recopilación de información, resolución de problemas, generación de imágenes, redacción de documentos y despliegue en la nube
  • Con la función Automations, puede ejecutar automáticamente tareas repetitivas en segundo plano según una programación definida
  • Aplica seguridad con sandbox de forma predeterminada, y los comandos que requieren privilegios elevados, como acceso a red, necesitan aprobación del usuario
  • Codex también estará disponible temporalmente para usuarios de ChatGPT Free y Go, y los planes de pago tendrán un límite de uso 2 veces mayor

Resumen de la app de Codex: un centro de mando para agentes

  • Desde el lanzamiento de Codex en abril de 2025, la forma en que los desarrolladores usan agentes ha cambiado de manera fundamental
    • Los modelos ahora pueden encargarse de tareas complejas y de larga duración de principio a fin
    • Los desarrolladores ahora coordinan varios agentes a lo largo de todo el proyecto, delegan trabajo y lo ejecutan en paralelo
  • El reto principal pasó de “qué pueden hacer los agentes” a “cómo pueden las personas dirigir, supervisar y colaborar con agentes a gran escala”
  • Los IDE existentes y las herramientas basadas en terminal no fueron diseñados para este modo de trabajo, por lo que se necesitaba una nueva herramienta
  • La app de Codex para macOS permite gestionar varios agentes de IA al mismo tiempo y ejecutar tareas en paralelo
  • Admite tareas de larga ejecución y, mediante colaboración entre agentes, gestiona todo el ciclo de diseño, desarrollo, despliegue y mantenimiento de software

Trabajo paralelo con múltiples agentes

  • La app de Codex ofrece un espacio enfocado para hacer multitarea con agentes
    • Los agentes se ejecutan en hilos separados configurados por proyecto, lo que permite cambiar entre tareas sin perder contexto
    • Dentro del hilo, se pueden revisar los cambios del agente, comentar el diff o editar directamente desde el editor
  • Incluye soporte nativo para worktrees, por lo que varios agentes pueden trabajar en el mismo repositorio sin conflictos
    • Cada agente trabaja en una copia aislada del código, lo que permite explorar distintos caminos sin afectar el estado local de git
    • Mientras el agente trabaja, se pueden hacer checkout de los cambios localmente o dejar que continúe sin modificar el estado local de git
  • Importa automáticamente el historial de sesiones y la configuración desde Codex CLI y la extensión del IDE, permitiendo usarlo de inmediato en proyectos existentes

Skills: expansión más allá de la generación de código

  • Codex está evolucionando de un agente que escribe código a un agente que usa código para realizar tareas en la computadora
  • Con Skills, puede ampliarse más allá de generar código hacia tareas como recopilación y síntesis de información, resolución de problemas y redacción
    • Agrupa instrucciones, recursos y scripts para que Codex pueda conectarse a herramientas y ejecutar flujos de trabajo
    • Completa tareas de forma confiable según las preferencias del equipo
  • La app de Codex incluye una interfaz dedicada para crear y gestionar Skills
    • Se puede solicitar explícitamente el uso de ciertas Skills o configurarlas para que se usen automáticamente según la tarea
  • Ejemplo de uso de Skills: creación de un juego de carreras

    • Se le pidió a Codex crear un juego de carreras con varios pilotos, 8 mapas e ítems utilizables con la barra espaciadora
      • Usó una skill de generación de imágenes (basada en GPT Image) y una skill de desarrollo de juegos web
      • Completó el juego trabajando de forma autónoma con más de 7 millones de tokens a partir de un único prompt inicial
      • Actuó como diseñador, desarrollador de juegos y tester de QA, y verificó el resultado jugando realmente el juego
    • Nombre del juego: Voxel Velocity, un kart racer 3D voxel hecho con Three.js
      • Modo de carrera individual (siempre 3 vueltas, 1 humano vs 7 CPU, 8 pistas disponibles de inmediato)
      • Modelo de conducción arcade, sistema de carga por drift, niveles de boost (Tier 1 0.7 s, Tier 2 1.1 s, Tier 3 1.5 s)
      • 8 personajes, 8 ítems, presets de dificultad para CPU e implementación de splines para IA
  • Principales Skills disponibles

    • Implement designs: toma contexto de diseño, assets y capturas desde Figma y los convierte en código de UI para producción con fidelidad visual 1:1
    • Manage projects: clasificación de bugs, seguimiento de releases y gestión de carga de trabajo del equipo en Linear
    • Deploy to the cloud: despliegue de apps web en los principales hosts cloud como Cloudflare, Netlify, Render y Vercel
    • Generate images: generación y edición de imágenes para sitios web, mockups de UI, visuales de producto y assets de juegos con una skill basada en GPT Image
    • Build with OpenAI APIs: al desarrollar con la API de OpenAI, consulta la documentación más reciente
    • Create documents: lectura, creación y edición de archivos PDF, hojas de cálculo y docx (con soporte para formato y diseño profesional)
    • Al crear una nueva skill en la app, se puede usar desde la app, el CLI o la extensión del IDE
    • Las skills pueden agregarse al repositorio para compartirlas con todo el equipo

Automations: automatización de tareas repetitivas

  • Con Automations, Codex puede ejecutar tareas automáticamente en segundo plano según una programación definida
    • Se configura combinando instrucciones y skills opcionales
    • Al completarse, el resultado se guarda en la cola de revisión para poder continuar después si hace falta
  • Ejemplos de uso interno en OpenAI
    • Clasificación diaria de issues
    • Búsqueda y resumen de fallas en CI
    • Generación de briefs diarios de release
    • Verificación de bugs

Personality: personalización del estilo de trabajo

  • Cada desarrollador tiene preferencias distintas sobre cómo trabajar con agentes
    • Hay quienes prefieren un colaborador conciso y orientado a la ejecución
    • Otros prefieren una interacción más conversacional y empática
  • En Codex se pueden elegir dos personalidades: un estilo conciso y práctico vs. uno conversacional y empático
    • Se adapta a la preferencia del usuario sin cambiar la funcionalidad
    • Se configura con el comando /personality en la app, el CLI y la extensión del IDE

Seguridad: integrada por defecto y configurable

  • La seguridad está integrada desde el diseño en toda la pila de agentes de Codex
  • Igual que Codex CLI, usa sandboxing nativo a nivel sistema, de código abierto y configurable
  • Configuración predeterminada
    • Los agentes solo pueden editar archivos de la carpeta o rama en la que están trabajando y realizar búsquedas web en caché
    • Cuando un comando requiere privilegios elevados, como acceso a red, solicita aprobación del usuario
  • Se pueden configurar reglas para proyectos o equipos para permitir que ciertos comandos se ejecuten automáticamente con privilegios elevados

Disponibilidad y precios

  • La app de Codex está disponible desde hoy en macOS
  • Los suscriptores de ChatGPT Plus, Pro, Business, Enterprise y Edu pueden usar Codex en CLI, web, extensión del IDE y app iniciando sesión con ChatGPT
  • El uso está incluido en la suscripción de ChatGPT, con opción de comprar créditos adicionales si hace falta
  • Temporalmente, Codex también estará disponible para usuarios de ChatGPT Free y Go
  • Durante este período, los usuarios actuales de Codex en todos los planes de pago tendrán un límite de uso 2 veces mayor

Próximos planes

  • Desde el lanzamiento de GPT-5.2-Codex a mediados de diciembre de 2024, el uso total de Codex se duplicó
  • En el último mes, más de 1 millón de desarrolladores usaron Codex
  • Próximos planes
    • Lanzamiento de una app para Windows
    • Expansión de la frontera de capacidades del modelo
    • Inferencia más rápida
  • Mejoras dentro de la app
    • Mejora continua de los flujos de trabajo multiagente con base en retroalimentación real
    • Mejor manejo del trabajo en paralelo y mayor facilidad para conservar el contexto al cambiar entre agentes
  • Expansión de Automations
    • Se está construyendo soporte para triggers basados en la nube
    • Codex podrá seguir ejecutándose en segundo plano aunque la computadora no esté encendida

La premisa central de Codex

  • Se basa en la premisa simple de que todo puede controlarse con código
  • Cuanto mejor sea la capacidad del agente para razonar sobre código y generarlo, más competente será en todo tipo de trabajo técnico y de conocimiento
  • El reto clave actual: la brecha entre las capacidades de los modelos de frontera y lo fácil que resulta para las personas usarlos en la práctica
  • Codex fue diseñado para cerrar esa brecha, permitiendo dirigir, supervisar y aplicar con facilidad toda la inteligencia del modelo a tareas reales
  • Se enfocaron en crear el mejor agente de programación, que servirá como base para agentes potentes orientados a trabajo de conocimiento más amplio

9 comentarios

 
xguru 2026-02-03

Yo también últimamente uso Codex como principal y está muy bueno. Ojalá salga pronto una versión para Windows.

Cuando lo inicias por primera vez, importa de una todos los proyectos en los que ya estabas trabajando con Codex y te los muestra en la izquierda organizados por proyecto/hilo, así que es ideal para poner varias tareas a correr al mismo tiempo.

 
tested 2026-02-03

¿Hay alguna razón por la que Codex sea el principal y no Claude Code?

 
xguru 2026-02-03

Yo suelo dejarles trabajo armando documentos de planificación largos, y Codex me quedó mejor para ese tipo de uso.
Y además, claramente casi nunca me pega el rate limit, incluso cuando corro varios proyectos al mismo tiempo con una cuenta barata.

 
tested 2026-02-03

Oh, gracias por el comentario.

Además, el creador de OpenClaw también usa Codex
> MoltBot 제작자: “나는 읽지 않은 코드를 배포한다”

Parece que Codex tampoco tiene malas reseñas, pero viendo los comentarios en Hacker News, da la impresión de que quizá no sea así...

 
unknowncyder 2026-02-03

2222 por favor para Windows/Linux T_T
También quería probar Atlas, el navegador de ChatGPT, pero dijeron que Windows llegaría pronto y desde entonces no ha habido noticias por un buen rato

 
treestae 2026-02-03

Lo probé hoy y está buenísimo, ¿no?
Parece que los forks de VSCode van a tener que prepararse para desaparecer.
Claro, también podría reducirse el empleo para los desarrolladores.

 
m00nlygreat 2026-02-03

Parece que en Windows es difícil hacer algo porque no tiene tecnología de sandbox.

 
cshj55 2026-02-03

Que saquen WSL o Windows...

 
GN⁺ 2026-02-03
Opiniones en Hacker News
  • No entiendo por qué las empresas de IA con decenas de miles de millones de dólares todavía no pueden hacer apps nativas
    La mayoría apenas tienen una UI de chat simple, pero con Electron es difícil llamar directamente a APIs del SO (por ejemplo, Win32), así que no se puede lograr una integración profunda
    Software complejo como Blender, Godot, Unity o UE5 corre de forma nativa, así que desespera que estas empresas solo pongan excusas
    • El entorno de desarrollo de escritorio es un desastre. Microsoft ha sacado demasiados frameworks a medias, así que nadie sabe qué usar
      En Windows, Electron es el estándar de facto, y hasta Microsoft lo usa con frecuencia
      macOS es mucho mejor, pero al final el equipo queda atrapado en Mac o elige Electron para tener algo multiplataforma
    • Hoy en día mucha UI de videojuegos también está basada en HTML/JS
      La UI de UE5 casi no se siente nativa, y tampoco diría que sea mejor que Electron
      En Electron también se pueden hacer llamadas a APIs nativas
      A la mayoría de los usuarios no les importa si una app es nativa o no, y para las empresas es una gran ventaja poder reutilizar desarrolladores web para desarrollo de apps de escritorio
    • Yo lo veo al revés. Si conviertes todo en una interfaz de texto, el modelo puede aprender las herramientas de forma natural
      Una TUI o GUI es una capa de abstracción innecesaria que dificulta la automatización
      Lo importante es la invocación simple de comandos y el registro de logs. El [modo headless o los logs de sesión] van más en esa dirección
    • La realidad es que el resultado hecho con IA termina siendo una app de Electron con una sola caja de entrada
    • No me queda claro qué funciones tan importantes podría ofrecer una app nativa
      A la mayoría no le importa si una app está hecha con tecnologías web o no
      Electron también facilita mucho el port a Linux. Si insistieran solo en nativo, eso no habría sido posible
  • He usado bastante Codex en los últimos dos meses y me pareció bastante impresionante
    No es perfecto, pero entrega resultados de nivel de un ingeniero intermedio de forma consistente
    Eso sí, la app se queda congelada en “Loading projects…”
    El enlace a la documentación también estaba roto, pero este enlace ya funciona
    Como uso varios entornos VM con VS Code Remote, parece que tendré que ajustar un poco la configuración del offset de puertos
    • Uso ChatGPT ($20/mes) junto con Claude ($200/año), y con Codex todavía no me he topado con límites de uso
      Codex suele quedarse atrapado en loops mientras resuelve problemas, y Claude suele cerrarlos bien
      Ir alternando entre los dos modelos resulta bastante eficiente
    • Recibí una respuesta agradeciendo que reportara el problema del enlace. También dijeron que están mejorando la velocidad de carga
    • Codex es fuerte en backend o tareas lógicas, pero se equivoca seguido en trabajos simples de UI frontend
      Aun así, mejora constantemente, así que tengo expectativas
    • Yo voy a seguir usando Cursor. OpenAI debería enfocarse más en corregir bugs de sus apps existentes que en sacar una nueva
  • Codex parece un competidor del estilo de Claude Cowork
    Cowork llama a Claude Code desde una VM, mientras que Codex ejecuta la CLI dentro de un sandbox del SO
    El stack técnico incluye Electron 40, React 19, TypeScript, Node.js, SQLite, Vite y más
    Para macOS usa Sparkle, Squirrel y Sentry
    • Por el nombre y su diseño centrado en diff/worktree, se nota que está muy orientado a desarrolladores
    • Se siente como un stack de nivel bootcamp, y eso decepciona un poco
    • Me pregunto si la integración con Sentry es nativa o a través de MCP
    • Tener vista de git y terminal es una gran ventaja para quienes usan CLI. También tengo expectativas con la función de skills
  • Probé Codex y me frustró al punto de darme rabia de lo lento y tonto que se siente
    No sigue instrucciones, se detiene a mitad del proceso o lanza código sin sentido
    Como no tiene datos recientes sobre Nuxt 4+, sigue produciendo errores
    La función Undo tampoco funciona bien y no hay feedback
    Claude Code resolvió la misma tarea de una sola vez, mientras que Codex tardó mucho y lo hizo fatal
    Esto me recordó cuando usaba el viejo Nokia N800: había potencial, pero el nivel de terminación era tan bajo que me preocupa la dirección de OpenAI
  • El Codex de OpenAI es básicamente una versión oficializada de productos como Emdash y Conductor
    Me pregunto si Anthropic también lanzará una app multiagente de Claude Code similar
    • Ya existe Claude Code Desktop
    • Creo que el enfoque multiagente está sobrevalorado
      Si hay contratos claros (como definiciones de API), es más eficiente trabajar en paralelo con sesiones independientes
    • Cuando usas Claude Code con GUI, me pregunto si usa todo el harness de Claude Code o solo el modelo
    • Es la primera vez que escucho de Emdash, pero hay tantas herramientas de este tipo que es difícil promocionarlas y el mercado es ruidoso
      Estuve a punto de construir algo parecido
    • La versión web de Claude Code ya está disponible como vista previa de investigación
  • La función de agentes no me interesa mucho
    El punto clave del paper de Recursive Language Models es gestionar requisitos, diseño y planificación como objetos inmutables, no como contexto
    Yo manejo cada etapa (spec, analysis, plan, etc.) en archivos .md y lo opero con un proceso kanban con etapas de aprobación
    Así funciona bien incluso sin UI, se mantiene la calidad del código y, a largo plazo, la velocidad de desarrollo aumenta 10 veces
  • Parece que la función central de Codex es la ejecución paralela de agentes, pero yo ya llevo 9 meses usando Claude Code así
    Con .claude/commands y .claude/agents puedes correr varias tareas al mismo tiempo
    Codex detecta bien cosas que Claude pasa por alto, y usar ambos modelos de forma complementaria mejora mucho la eficiencia
    La ventaja de Codex es que es barato y tiene un uso casi ilimitado; Claude tiene mejor calidad
  • Yo uso sobre todo Claude Code, pero el mejor orquestador que he probado fue Zenflow de Zencoder.ai
    Construye el proceso a partir de plan.md y te deja agregar pasos o hooks de forma dinámica
    Es cómodo poder controlar la automatización de flujos de trabajo desde documentación
    • Pero cuando buscas, muchas veces termina siendo otra “app para vender paquetes de créditos de IA”
      Ya les pago a los tres modelos principales, así que no creo que este tipo de servicios dure mucho
    • Ya existen más de 500 servicios de integración de IA
  • En la parte inferior del demo del juego “Voxel Velocity” aparece “Enter start”, pero en realidad Enter solo cambia la selección
    Dicen que usaron 7 millones de tokens, así que sorprende que no detectaran un error de QA así
    • El juego en sí es impresionante, pero en los detalles se nota falta de control de calidad
      Este tipo de problemas sutiles es difícil de detectar con un test harness o un agente de QA
    • Entre las versiones de 60 mil, 800 mil y 7 millones de tokens casi no hay diferencias en la jugabilidad
      Aunque aumentaron los tokens, solo mejoró el acabado; el gameplay es el mismo. Me pregunto en qué se fueron esos tokens extra
  • Soy usuario de Linux, así que me decepciona que Codex sea solo para Mac
    Me pregunto si planean que la versión CLI también soporte las mismas funciones
    • Respondió directamente Romain de OpenAI. Como está basado en Electron, dijeron que el soporte para Windows y Linux también llegará pronto
    • Por ahora, ni siquiera corre en Mac con chips Intel
    • macOS es adecuado para experimentación. Como la configuración de hardware es uniforme, hay menos bugs de edge cases
  • Es una lástima que todo corra solo en local
    Estaría bien tener una función de clúster administrado que opere solo dentro de la red interna
    También sería ideal poder compartir el progreso del trabajo con el equipo
    • Yo hago algo parecido con ssh y tmux
      Si la herramienta ofreciera esto de forma nativa, sería mucho más cómodo
  • OpenAI y Codex lideraron la innovación al principio, pero ahora Claude y Gemini van más adelante
    La calidad reciente de GPT-5.x también ha bajado, y en este anuncio decepciona que el lanzamiento haya sido solo para Mac
    El artículo también tiene muchos errores tipográficos, y molesta que no hayan publicado los prompts reales usados
    Aun así, si mejora, estaría dispuesto a volver a probarlo
    • Se notó mucho que la parte de generación de código en el video estaba editada a más de 5x de velocidad
      Supongo que es porque ya estamos acostumbrados a la velocidad de Sonnet o Gemini 3.0 Flash
    • Yo más bien siento que Codex es más estable que Claude Code o Gemini para manejar tareas complejas
      El ChatGPT de 20 dólares me resulta más eficiente que Claude de 200 dólares
    • OpenAI ya había hecho antes esta política de lanzar primero en macOS