Codex para casi todo
(openai.com)- La app de Codex recibió una gran actualización y ahora permite realizar todo el proceso de desarrollo de software en un solo espacio de trabajo
- Controla directamente la computadora, usa junto con herramientas y apps de trabajo diarias, y agrega generación de imágenes, aprendizaje de acciones pasadas y ejecución de tareas repetitivas para automatizar y ampliar el flujo de trabajo de desarrollo
- La app de escritorio incluye revisión de PR, vista de múltiples archivos/terminales, conexión SSH a devbox remoto y navegador integrado, acelerando el diseño frontend y la iteración de apps/juegos
- Se integraron más de 90 plugins y el modelo gpt-image-1.5, ofreciendo un entorno conectado desde la escritura de código hasta diseño, pruebas y colaboración
- La reutilización de hilos de conversación existentes, la programación automática de tareas de largo plazo y la vista previa de memoria aseguran continuidad para trabajos de varios días o semanas
Principales actualizaciones de Codex
- La app de Codex recibió una gran actualización para macOS y Windows, ampliándose como herramienta para respaldar todo el proceso de desarrollo de software para más de 3 millones de desarrolladores activos por semana
- La nueva versión añade funciones de control de computadora, generación de imágenes, memoria, plugins y navegador integrado para acelerar el flujo de trabajo de los desarrolladores
- Se reforzaron las funciones centradas en desarrollo, como revisión de PR, vistas de múltiples archivos y terminales, y conexión a devbox remoto mediante SSH
- Todas las mejoras se integran para realizar escritura de código, verificación de resultados, revisión de cambios y colaboración en un solo espacio de trabajo
-
Control de computadora y trabajo en paralelo
- Con la función de control de computadora en segundo plano, puede hacer clic, escribir y navegar directamente en la computadora del usuario
- Usa su propio cursor para operar apps, permitiendo pruebas o tareas repetitivas incluso en apps sin API
- Varios agentes pueden trabajar en paralelo al mismo tiempo en Mac sin interferir con el trabajo del usuario en otras apps
- Es útil para iterar cambios de frontend, probar apps y trabajar en entornos sin API
- Con la función de control de computadora en segundo plano, puede hacer clic, escribir y navegar directamente en la computadora del usuario
-
Integración web y de navegador
- Se integra de forma nativa con la web y, mediante el navegador integrado, permite añadir anotaciones directamente sobre páginas web para dar instrucciones específicas a Codex
- Actualmente es útil para desarrollo frontend y de juegos, y más adelante planea expandirse más allá de apps web en localhost hacia el control total del navegador
-
Generación de imágenes y flujo visual
- Usa el modelo gpt-image-1.5 para generar imágenes y realizar iteraciones
- Combinado con capturas de pantalla y código, permite crear conceptos de producto, diseño frontend, mockups y visuales de juegos dentro del mismo flujo de trabajo
-
Expansión mediante plugins
- Se añadieron más de 90 nuevos plugins, con soporte para integración con diversas apps y servidores MCP
- Plugins destacados: Atlassian Rovo (gestión de JIRA), CircleCI, CodeRabbit, GitLab Issues, Microsoft Suite, Neon by Databricks, Remotion, Render, Superpowers
- Los plugins permiten que Codex reúna más contexto y ejecute más tareas automáticas
-
Refuerzo del flujo de trabajo para desarrolladores
- Soporta gestión de comentarios de revisión en GitHub, ejecución de múltiples pestañas de terminal y conexión a devbox remoto por SSH (en fase alfa)
- Permite abrir archivos directamente desde la barra lateral y ofrece vista previa enriquecida de PDF, hojas de cálculo, diapositivas y documentos
- Añade un nuevo panel de resumen (summary pane) para rastrear planes, fuentes y resultados del agente
- Al poder moverse entre escritura de código, verificación de resultados, revisión de cambios y colaboración con agentes en un solo espacio de trabajo, mejora la velocidad de transición entre etapas del ciclo de desarrollo
-
Automatización y trabajo de largo plazo
- La función de automatización se amplió para reutilizar hilos de conversación existentes y mantener el contexto acumulado
- Codex puede programar por sí mismo tareas futuras y reanudarlas automáticamente, lo que permite continuidad en trabajos de largo plazo de varios días o semanas
- Casos de uso en equipos: fusionar PR abiertos, dar seguimiento a tareas y rastrear conversaciones rápidas en herramientas como Slack, Gmail y Notion
-
Memoria y personalización
- Con la función de vista previa de memoria (preview of memory), Codex recuerda contexto útil del pasado, como preferencias personales, correcciones e información recopilada
- Esto permitirá lograr en tareas futuras un nivel de calidad y velocidad que antes solo era posible con instrucciones personalizadas extensas
- Codex propone de forma proactiva retomar desde puntos de interrupción, y usando contexto del proyecto, plugins conectados y memoria, genera automáticamente sugerencias de trabajo y listas priorizadas
- Ejemplo: identificar comentarios pendientes de revisión en Google Docs → recopilar contexto relacionado en Slack, Notion y la base de código → ofrecer una lista de acciones priorizada
- Con la función de vista previa de memoria (preview of memory), Codex recuerda contexto útil del pasado, como preferencias personales, correcciones e información recopilada
-
Plan de despliegue y alcance
- Ya se está desplegando gradualmente para usuarios de la app de escritorio de Codex que inician sesión con una cuenta de ChatGPT
- Las funciones de personalización (sugerencias con reconocimiento de contexto y memoria) llegarán pronto para usuarios Enterprise, Edu, EU y UK
- La función de control de computadora estará disponible primero en macOS y luego se expandirá a las regiones EU y UK
La evolución y el objetivo de Codex
- A un año de su lanzamiento, Codex amplió su alcance más allá de escribir código hacia comprensión de sistemas, recopilación de contexto, revisión, depuración, colaboración y gestión de trabajo de largo plazo
- OpenAI tiene como objetivo lograr que la AGI beneficie a toda la humanidad, y esta actualización fue diseñada para reducir la brecha entre lo que las personas imaginan y lo que realmente pueden construir
- En el futuro, Codex seguirá integrándose más estrechamente con las herramientas, flujos de trabajo y decisiones del proceso de creación de software
6 comentarios
¿Es la versión de pago de Opecnclaw…?
¿Windows todavía no, verdad? ¿Es una actualización para Mac, no?
¿Cuándo van a corregir eso de que, cada vez que le pides un diseño web, siempre lo implementa con estilo de tarjetas? Si solo arreglaran eso, creo que dejaría de usar Claude por completo.
Solo lo usé conectado desde VSCode, así que tendré que probar la app.
Como últimamente uso Codex como principal, es una actualización muy bienvenida.
openai-oauth - Cómo usar gratis la API de OpenAI con una cuenta de ChatGPT
Si usas esto, ahora también será posible generar imágenes
Comentarios en Hacker News
Al leer los comentarios, parece que mucha gente no sabe que Claude Desktop y Cowork ya ofrecen este tipo de funciones
Codex da la impresión de que más que innovar, solo se está poniendo al día
OpenAI tiene menos clientes enterprise, así que puede subsidiar más recursos de cómputo para usuarios personales
Al final, cuando aumente la cantidad de usuarios, va a terminar como Anthropic. Por ahora es solo una estrategia de PR
Codex puede hacer clic en apps y escribir en segundo plano, y varios agentes pueden trabajar al mismo tiempo
Como dije en mi post del blog, la IA tiene que trabajar de forma más proactiva
Por ejemplo, resumir Slack, integrar minutas de reuniones y generar automáticamente notas de preparación para meetings ya es posible, pero nadie lo está haciendo
Al final lo importante es la gestión de la atención, y la IA debería ayudarnos a decidir en qué enfocarnos
Si ves las UI últimamente, hay una fuerte tendencia a ocultar el código
El prompt es la verdadera fuente, y el código se trata como un producto intermedio molesto
Así todo va más rápido y el resultado sale como si yo mismo hubiera escrito el código
Nosotros ya sabemos automatizar, pero la mayoría de la gente no
Ahora los lenguajes de alto nivel pueden sentirse raros, pero al final esto es solo otra capa más de abstracción
El prompt engineering también termina siendo otro sistema de lenguaje artificial
Aunque hay mucho escepticismo, yo creo que esto se va a masificar
Llevo 25 años usando CLI, pero últimamente dejo que Codex haga el trabajo de terminal por mí
Si hacen bien una versión GUI, los usuarios comunes se van a acostumbrar muy rápido
Antes una configuración me tomaba horas, ahora se resuelve en segundos
Salvo las apps que realmente necesitan GUI, la mayoría de las tareas se pueden hacer bien con IA basada en texto
Me pregunto si de verdad queremos que Codex controle directamente la computadora y las apps
Yo sigo dándole mucha importancia a la seguridad por sandbox
Parece que OpenAI prepara lanzamientos privados para que coincidan con los anuncios de la competencia
Los tiempos con prensa e influencers sí se coordinan por adelantado
El prompt del segundo video era “reduce la longitud de la tipografía y el tagline”
Dan ganas de pensar: ¿ahora estamos usando LLM para ajustar el tamaño de fuente?
En el tercer video dice “genera la imagen de la sección hero”,
y usar imágenes generadas por IA en la descripción de un producto se siente demasiado falso
Sinceramente, no sé bien para qué usar esto
Como ayuda para programar puede servir, pero no quiero que manipule directamente mi computadora
Tal vez para resumir Slack, pero por ahora parece una solución buscando resolver un problema que no existe
Creo que los agentes especializados como Cowork/Codex van a ser la categoría de producto que más rápido crezca para no desarrolladores
Este tipo de agentes va a encargarse de manejar software en lugar de humanos
Como también se resume en este artículo,
al final la estructura misma del mercado de software va a cambiar
Y eso hace que la amenaza de seguridad sea aún mayor
Lee correos y minutas de reuniones, planifica y ejecuta tareas, y luego hasta manda un resumen
Eso es posible porque la mayor parte del trabajo de conocimiento al final puede expresarse en forma de código
Si conectas bien los datos, se abre el mercado de B2B SaaS
Me pregunto si Codex todavía lee archivos sensibles sin consentimiento del usuario
Hay un issue relacionado en GitHub
Lo más seguro es ejecutarlo en una máquina separada sin datos sensibles
El nombre Codex es confuso
Uno es una herramienta de programación tipo agente, y el otro es una app GUI para Mac/Windows, pero ambos tienen el mismo nombre