14 puntos por GN⁺ 13 일 전 | 6 comentarios | Compartir por WhatsApp
  • La app de Codex recibió una gran actualización y ahora permite realizar todo el proceso de desarrollo de software en un solo espacio de trabajo
  • Controla directamente la computadora, usa junto con herramientas y apps de trabajo diarias, y agrega generación de imágenes, aprendizaje de acciones pasadas y ejecución de tareas repetitivas para automatizar y ampliar el flujo de trabajo de desarrollo
  • La app de escritorio incluye revisión de PR, vista de múltiples archivos/terminales, conexión SSH a devbox remoto y navegador integrado, acelerando el diseño frontend y la iteración de apps/juegos
  • Se integraron más de 90 plugins y el modelo gpt-image-1.5, ofreciendo un entorno conectado desde la escritura de código hasta diseño, pruebas y colaboración
  • La reutilización de hilos de conversación existentes, la programación automática de tareas de largo plazo y la vista previa de memoria aseguran continuidad para trabajos de varios días o semanas

Principales actualizaciones de Codex

  • La app de Codex recibió una gran actualización para macOS y Windows, ampliándose como herramienta para respaldar todo el proceso de desarrollo de software para más de 3 millones de desarrolladores activos por semana
  • La nueva versión añade funciones de control de computadora, generación de imágenes, memoria, plugins y navegador integrado para acelerar el flujo de trabajo de los desarrolladores
  • Se reforzaron las funciones centradas en desarrollo, como revisión de PR, vistas de múltiples archivos y terminales, y conexión a devbox remoto mediante SSH
  • Todas las mejoras se integran para realizar escritura de código, verificación de resultados, revisión de cambios y colaboración en un solo espacio de trabajo
  • Control de computadora y trabajo en paralelo

    • Con la función de control de computadora en segundo plano, puede hacer clic, escribir y navegar directamente en la computadora del usuario
      • Usa su propio cursor para operar apps, permitiendo pruebas o tareas repetitivas incluso en apps sin API
      • Varios agentes pueden trabajar en paralelo al mismo tiempo en Mac sin interferir con el trabajo del usuario en otras apps
    • Es útil para iterar cambios de frontend, probar apps y trabajar en entornos sin API
  • Integración web y de navegador

    • Se integra de forma nativa con la web y, mediante el navegador integrado, permite añadir anotaciones directamente sobre páginas web para dar instrucciones específicas a Codex
    • Actualmente es útil para desarrollo frontend y de juegos, y más adelante planea expandirse más allá de apps web en localhost hacia el control total del navegador
  • Generación de imágenes y flujo visual

    • Usa el modelo gpt-image-1.5 para generar imágenes y realizar iteraciones
    • Combinado con capturas de pantalla y código, permite crear conceptos de producto, diseño frontend, mockups y visuales de juegos dentro del mismo flujo de trabajo
  • Expansión mediante plugins

    • Se añadieron más de 90 nuevos plugins, con soporte para integración con diversas apps y servidores MCP
    • Plugins destacados: Atlassian Rovo (gestión de JIRA), CircleCI, CodeRabbit, GitLab Issues, Microsoft Suite, Neon by Databricks, Remotion, Render, Superpowers
    • Los plugins permiten que Codex reúna más contexto y ejecute más tareas automáticas
  • Refuerzo del flujo de trabajo para desarrolladores

    • Soporta gestión de comentarios de revisión en GitHub, ejecución de múltiples pestañas de terminal y conexión a devbox remoto por SSH (en fase alfa)
    • Permite abrir archivos directamente desde la barra lateral y ofrece vista previa enriquecida de PDF, hojas de cálculo, diapositivas y documentos
    • Añade un nuevo panel de resumen (summary pane) para rastrear planes, fuentes y resultados del agente
    • Al poder moverse entre escritura de código, verificación de resultados, revisión de cambios y colaboración con agentes en un solo espacio de trabajo, mejora la velocidad de transición entre etapas del ciclo de desarrollo
  • Automatización y trabajo de largo plazo

    • La función de automatización se amplió para reutilizar hilos de conversación existentes y mantener el contexto acumulado
    • Codex puede programar por sí mismo tareas futuras y reanudarlas automáticamente, lo que permite continuidad en trabajos de largo plazo de varios días o semanas
    • Casos de uso en equipos: fusionar PR abiertos, dar seguimiento a tareas y rastrear conversaciones rápidas en herramientas como Slack, Gmail y Notion
  • Memoria y personalización

    • Con la función de vista previa de memoria (preview of memory), Codex recuerda contexto útil del pasado, como preferencias personales, correcciones e información recopilada
      • Esto permitirá lograr en tareas futuras un nivel de calidad y velocidad que antes solo era posible con instrucciones personalizadas extensas
    • Codex propone de forma proactiva retomar desde puntos de interrupción, y usando contexto del proyecto, plugins conectados y memoria, genera automáticamente sugerencias de trabajo y listas priorizadas
    • Ejemplo: identificar comentarios pendientes de revisión en Google Docs → recopilar contexto relacionado en Slack, Notion y la base de código → ofrecer una lista de acciones priorizada
  • Plan de despliegue y alcance

    • Ya se está desplegando gradualmente para usuarios de la app de escritorio de Codex que inician sesión con una cuenta de ChatGPT
    • Las funciones de personalización (sugerencias con reconocimiento de contexto y memoria) llegarán pronto para usuarios Enterprise, Edu, EU y UK
    • La función de control de computadora estará disponible primero en macOS y luego se expandirá a las regiones EU y UK

La evolución y el objetivo de Codex

  • A un año de su lanzamiento, Codex amplió su alcance más allá de escribir código hacia comprensión de sistemas, recopilación de contexto, revisión, depuración, colaboración y gestión de trabajo de largo plazo
  • OpenAI tiene como objetivo lograr que la AGI beneficie a toda la humanidad, y esta actualización fue diseñada para reducir la brecha entre lo que las personas imaginan y lo que realmente pueden construir
  • En el futuro, Codex seguirá integrándose más estrechamente con las herramientas, flujos de trabajo y decisiones del proceso de creación de software

6 comentarios

 
iolothebard 12 일 전

¿Es la versión de pago de Opecnclaw…?

 
cshj55 12 일 전

¿Windows todavía no, verdad? ¿Es una actualización para Mac, no?

 
slowandsnow 13 일 전

¿Cuándo van a corregir eso de que, cada vez que le pides un diseño web, siempre lo implementa con estilo de tarjetas? Si solo arreglaran eso, creo que dejaría de usar Claude por completo.

 
bluenyx 13 일 전

Solo lo usé conectado desde VSCode, así que tendré que probar la app.

 
xguru 13 일 전

Como últimamente uso Codex como principal, es una actualización muy bienvenida.

openai-oauth - Cómo usar gratis la API de OpenAI con una cuenta de ChatGPT

Si usas esto, ahora también será posible generar imágenes

 
GN⁺ 13 일 전
Comentarios en Hacker News
  • Al leer los comentarios, parece que mucha gente no sabe que Claude Desktop y Cowork ya ofrecen este tipo de funciones
    Codex da la impresión de que más que innovar, solo se está poniendo al día

    • La razón por la que Codex está ganando popularidad últimamente en HN es que Anthropic bajó el rate limit para usuarios individuales
      OpenAI tiene menos clientes enterprise, así que puede subsidiar más recursos de cómputo para usuarios personales
      Al final, cuando aumente la cantidad de usuarios, va a terminar como Anthropic. Por ahora es solo una estrategia de PR
    • Codex tiene más funciones que Claude Cowork. Por ejemplo, puede manipular directamente la computadora en segundo plano
    • Claude todavía no tiene esa capacidad
      Codex puede hacer clic en apps y escribir en segundo plano, y varios agentes pueden trabajar al mismo tiempo
    • Se siente como si ambos productos estuvieran convergiendo. Hace poco la UI de la app de Claude para Mac cambió y ahora es casi idéntica a la de Codex
    • En realidad, en este momento ninguno de los dos está haciendo una innovación de verdad
      Como dije en mi post del blog, la IA tiene que trabajar de forma más proactiva
      Por ejemplo, resumir Slack, integrar minutas de reuniones y generar automáticamente notas de preparación para meetings ya es posible, pero nadie lo está haciendo
      Al final lo importante es la gestión de la atención, y la IA debería ayudarnos a decidir en qué enfocarnos
  • Si ves las UI últimamente, hay una fuerte tendencia a ocultar el código
    El prompt es la verdadera fuente, y el código se trata como un producto intermedio molesto

    • Yo lo abordo justo al revés. Mantengo la estructura del código en la cabeza y converso con la IA como si estuviera haciendo pair programming
      Así todo va más rápido y el resultado sale como si yo mismo hubiera escrito el código
    • El hecho de que la app de Codex todavía no funcione en Linux hace pensar que sus usuarios objetivo son gente que no sabe mucho de código
    • En realidad, este tipo de herramientas benefician más a los no desarrolladores
      Nosotros ya sabemos automatizar, pero la mayoría de la gente no
    • Si quieres una experiencia más auténtica de desarrollador, puedes trabajar comparando con git diff en vim
    • Hubo una época en que se creía que solo el ensamblador era código de verdad
      Ahora los lenguajes de alto nivel pueden sentirse raros, pero al final esto es solo otra capa más de abstracción
      El prompt engineering también termina siendo otro sistema de lenguaje artificial
  • Aunque hay mucho escepticismo, yo creo que esto se va a masificar
    Llevo 25 años usando CLI, pero últimamente dejo que Codex haga el trabajo de terminal por mí
    Si hacen bien una versión GUI, los usuarios comunes se van a acostumbrar muy rápido

    • Yo también, como usuario de Linux, disfruto mucho poder controlar el OS en lenguaje natural
      Antes una configuración me tomaba horas, ahora se resuelve en segundos
    • En los próximos 3 a 5 años creo que va a cambiar la idea de lo que es la calidad del código, y el uso de IDE va a caer muchísimo
    • Este enfoque sí se siente como el verdadero uso de computadoras
      Salvo las apps que realmente necesitan GUI, la mayoría de las tareas se pueden hacer bien con IA basada en texto
    • En especial arreglar errores de Docker-compose se siente realmente mágico
    • Pero este enfoque también es más lento, consume más recursos de cómputo y tiene el riesgo de que los datos queden registrados afuera
  • Me pregunto si de verdad queremos que Codex controle directamente la computadora y las apps
    Yo sigo dándole mucha importancia a la seguridad por sandbox

    • Los programadores en general no lo quieren, pero la gente común sí quiere comandos de voz estilo Star Trek
    • En Mac, que haga clic en un botón no me da miedo. Más bien me parece más riesgoso dejar corriendo programas autoaprobados
    • Yo más bien quiero que la IA haga clic por mí. Las tareas repetitivas son demasiado aburridas
    • Algunas personas incluso ejecutan cosas como OpenClaw por su cuenta. Yo por lo menos lo aíslo con Docker
    • De hecho, una vez Codex corrigió automáticamente un problema de permisos en mi Mac
  • Parece que OpenAI prepara lanzamientos privados para que coincidan con los anuncios de la competencia

    • (Empleado de OpenAI) En realidad no es algo tan calculado. Se desarrolla internamente y luego se publica externamente según el calendario
      Los tiempos con prensa e influencers sí se coordinan por adelantado
    • Aun así, viendo el timing de los lanzamientos recientes, también hay quienes opinan que cuesta creer que sea coincidencia
    • También hay comentarios de que la empresa opera centrada en el hype
    • Al final, hay acuerdo en que esto es una pelea por el control mediático
    • Ya demostraron su olfato mediático con la adquisición de TBPN
  • El prompt del segundo video era “reduce la longitud de la tipografía y el tagline”
    Dan ganas de pensar: ¿ahora estamos usando LLM para ajustar el tamaño de fuente?
    En el tercer video dice “genera la imagen de la sección hero”,
    y usar imágenes generadas por IA en la descripción de un producto se siente demasiado falso

  • Sinceramente, no sé bien para qué usar esto
    Como ayuda para programar puede servir, pero no quiero que manipule directamente mi computadora
    Tal vez para resumir Slack, pero por ahora parece una solución buscando resolver un problema que no existe

  • Creo que los agentes especializados como Cowork/Codex van a ser la categoría de producto que más rápido crezca para no desarrolladores
    Este tipo de agentes va a encargarse de manejar software en lugar de humanos
    Como también se resume en este artículo,
    al final la estructura misma del mercado de software va a cambiar

    • Pero para que estos agentes tengan éxito, necesitan acceso total
      Y eso hace que la amenaza de seguridad sea aún mayor
    • Soy CEO con formación en ingeniería mecánica y con Claude Code automatizo campañas sociales completas
      Lee correos y minutas de reuniones, planifica y ejecuta tareas, y luego hasta manda un resumen
      Eso es posible porque la mayor parte del trabajo de conocimiento al final puede expresarse en forma de código
    • La mayoría de los trabajadores del conocimiento no va a querer aprender a usar estas herramientas
    • El LLM es la mejor UI/UX. No hace falta diseñar una interfaz aparte
      Si conectas bien los datos, se abre el mercado de B2B SaaS
    • Yo también uso mucho Codex para tareas no relacionadas con programación, pero funciona bien solo si tienes una forma de pensar de programador
  • Me pregunto si Codex todavía lee archivos sensibles sin consentimiento del usuario
    Hay un issue relacionado en GitHub

    • Ahora que en esta actualización se agregó la función de control de computadora, el modelo de permisos se vuelve todavía más importante
    • Con búsqueda de archivos, acceso al navegador y otras cosas, los límites son poco claros y cuesta saber qué permisos se están abriendo
    • También hubo casos como este en Reddit, donde Claude criticó la seguridad del usuario
      Lo más seguro es ejecutarlo en una máquina separada sin datos sensibles
    • A mí también me pasó ayer. Ese problema todavía existe
  • El nombre Codex es confuso
    Uno es una herramienta de programación tipo agente, y el otro es una app GUI para Mac/Windows, pero ambos tienen el mismo nombre

    • Aun así, creo que está un poco mejor que la forma de nombrar productos de Microsoft