23 puntos por GN⁺ 2026-05-17 | 9 comentarios | Compartir por WhatsApp
  • Pasé 3 meses programando principalmente con Claude/Anthropic, pero en tareas a escala de repo la confiabilidad bajó y terminé necesitando un flujo de trabajo aparte para supervisarlo
  • En la etapa de 4.7 alucinaba que algo estaba terminado cuando la implementación real era de apenas ~40%, y mostraba demasiada confianza alrededor de stubs/placeholders
  • Incluso pagando Max x20, el aumento en consumo de tokens y en carga de supervisión terminó pesando más que la productividad, así que el 12 de mayo me cambié a GPT-5.5 + Codex
  • Codex entiende mejor el código adyacente sin prompts excesivos, detecta mejor las regresiones y volvió manejables el bucle de lint/tests y los refactors grandes
  • La migración prácticamente se redujo a mover CLAUDE.md→AGENTS.md y mantener los hooks, y en este flujo de trabajo no pienso volver atrás

Cómo cambió mi flujo de desarrollo después de pasar de Claude a Codex

  • Durante los últimos 3 meses programé principalmente con Claude/Anthropic, y cuando salió Opus 4.6 se sentía fuerte en comprensión de arquitectura, manejo de contexto grande e implementación rápida de funciones
  • Con el tiempo, la confiabilidad bajó en tareas a escala de repo, y terminé necesitando un flujo de trabajo separado para vigilar al modelo
    • varios agentes para revisar regresiones en archivos adyacentes
    • un agente “senior reviewer” en cada commit importante
    • validación continua para revisar drift en la implementación e implementaciones incompletas
    • un pipeline de lint/tests para atrapar tareas que el modelo aseguraba con confianza que ya estaban terminadas
  • En la etapa de 4.7 los problemas crecieron todavía más en mi flujo de trabajo personal
    • alucinaba que una función estaba terminada cuando la implementación real rondaba apenas el 40%
    • mostraba una confianza infundada alrededor de stubs/placeholders
    • aparecían conductas evasivas como decir que “se necesita una sesión aparte” o estimar plazos excesivos incluso para cambios realistas
  • Estaba pagando Max x20, pero más que una mejora de productividad lo que sentí fue un aumento en el consumo de tokens y en la carga de supervisión
  • Al final, el 12 de mayo me pasé a GPT-5.5 + Codex, y programar con IA por primera vez en meses volvió a sentirse más cómodo que estresante

Ventajas que sentí con GPT-5.5 + Codex

  • Codex entiende bien el código adyacente incluso sin prompts excesivos y detecta mejor las regresiones
  • El bucle de retroalimentación de lint/tests funciona de forma más estricta, y los refactors a gran escala de verdad se vuelven manejables
  • Las decisiones de infraestructura y los cambios de arquitectura avanzan con una dirección consistente en vez de sentirse fragmentados, y se acerca más a terminar el trabajo de verdad que a fingir que ya quedó listo
  • Casi siempre evito /fast porque parece que agotaría rápido el uso semanal, pero incluso solo con high/xhigh la mejora de productividad fue grande
  • Si metes el zip del repositorio completo en GPT-5.5 Pro extended thinking, ayuda a resolver problemas con los que otros modelos fallaron repetidamente
  • La migración tampoco tuvo mucha fricción
    • CLAUDE.md pasó a AGENTS.md
    • los hooks siguieron igual
    • casi no hubo necesidad de cambiar el flujo de trabajo completo
  • No significa que todo el mundo deba cambiarse de inmediato, pero en este flujo de trabajo no planeo volver por ahora

9 comentarios

 
summerz 2026-05-18

Desde cierto punto, parece que codex es muy superior en varios aspectos.

 
skageektp 2026-05-18

¿Soy el único que termina yendo y viniendo entre suscripciones? jajaja El número uno cambia a cada rato jajajaja

 
skageektp 2026-05-18

Pero como este post de Codex es de Reddit, hay que verlo con algo de cautela. En Reddit, según el subreddit, la diferencia en cuánto le hacen barra(?) a algo suele ser enorme.

 
holywork 2026-05-18

Cuando antes usaba Cursor, solía alternar entre varios modelos, pero desde GPT-5 los modelos de OpenAI se sienten relativamente muy cautelosos y a la vez diligentes.

 
gkhcdef 2026-05-17

Yo también pagué extra porque Codex tiene más tokens disponibles y encuentra bien los defectos en los planes o el código que arma Claude, así que hasta pensé en cambiarme por completo.
Todavía mantengo esa idea, pero tampoco he podido dejar Claude del todo. Como uso Codex como principal, ahora Claude me encuentra defectos en los planes o el código de Codex.

 
xguru 2026-05-17

Yo seguía usando Codex como principal, y últimamente siento que cada vez se vuelve más inteligente.

Me acaba de pasar: ahora hasta automatiza bien por su cuenta. Toqué algunos ajustes relacionados con el CDN y, como si nada, configuró automáticamente un temporizador para ejecutarse 4320 minutos después diciendo que lo revisaría en 3 días.

La app de Codex para Mac es comodísima. Ahora que también funciona bien en móvil, siento que voy a terminar trabajando más.

 
helloppfm 2026-05-17

Claude era el rey, pero con la llegada de Codex 5.5, parece que Codex pasó a la cima.

Uso ambos, pero últimamente casi no uso Claude Code. Siento que Codex lo hace mejor y, sobre todo, los tokens simplemente no se terminan.

¿El próximo mes será Gemini, que todavía no ha logrado quedarse con el trono?

 
kaydash 2026-05-17

"Alucina que está terminado cuando la implementación real va como en un 40%, o muestra una confianza excesiva alrededor de stubs/placeholders"
La alucinación sobre el nivel real de finalización da muchísima bronca y es demasiado relatable

 
GN⁺ 2026-05-17
Opiniones de Hacker News
  • Las herramientas de IA no son algo para hinchar por un solo lado como si eligieras tu equipo deportivo favorito. Lo ideal es aprender ambas, o mejor aún todas, y usar la que mejor te funcione esta semana
    El próximo mes puede ser distinto. Yo pago dos suscripciones, pero también entiendo que no todo el mundo puede hacerlo

    • Ahora mismo de verdad se siente así, pero creo que en general se debe a esa tendencia humana de sentir que si alguien elige otra opción, te estuviera diciendo que tú estás equivocado
      Todas las herramientas están bien, algunas personas obtienen mejores resultados con una u otra y, como dijiste, la próxima semana todo podría cambiar por completo
    • A mí me da igual mientras sea la que mejor me funcione en este momento; sigo probando y sigo experimentando
    • Exacto. Los modelos siguen cambiando. Hoy es Anthropic, mañana OpenAI, luego otra vez Anthropic, la próxima semana algún nuevo retador de China y el mes siguiente Google quizá por fin reaccione. Y así sigue el ciclo
    • Llevo como una semana probando Codex y Gemini y, hasta ahora, Codex es el que mejor me funciona
      Eso sí, también uso Gemini porque encontré en Kinguin un cupón premium de 18 meses por 15€, así que cuando llego al límite de cuota, le paso algunas tareas a Gemini
  • Opus 4.7 da la impresión de estar enfocado en parecer útil y productivo, y en el rendimiento para la galería
    Codex sí saca el trabajo adelante de verdad

  • Ojalá pudieras compartir un poco más tu flujo de trabajo. Me gustaría aprender qué haces y cómo lo haces para intentar replicarlo
    También me intriga por qué metes todo el repositorio en GPT y qué tecnologías y libros usas
    Yo suelo poner el prompt y esperar a que Codex termine, y luego vuelvo a preguntarle si hizo esas tareas periféricas y obvias que antes hacía yo mismo. Ahí recién las resuelve, y después dedico tiempo a /review y a pruebas manuales antes de pasar otra vez a unidades de trabajo pequeñas. Para funciones grandes uso plan, también uso la extensión de VSCode, y probé tanto 5.4 como 5.5, pero siento que la primera me queda mejor

  • ¿Cómo se pueden usar aquí modelos que no sean de OpenAI?

  • El problema de Claude es que no sigue ejecutándose como Codex. Claude puede que sea mejor, pero Codex intenta completar la tarea hasta el final
    Claude simplemente se detiene y, aunque tuviera esa capacidad, probablemente sería demasiado caro, así que no habría mucha diferencia. Tal vez sea parecido o incluso mejor, pero ya no lo tengo claro y ya no lo uso. 4.5 era lo mejor cuando salió por primera vez

  • A mí también Codex me pareció magia, pero solo espera a que se rompa. Hasta hace 3 días yo sentía lo mismo, pero ahora sinceramente me parece que se puso peor que Claude
    Lo uso 24 horas con 5 cuentas Pro, así que lo digo con certeza: ya no es como hace una semana, ahora de verdad está mucho peor

    • Altman admitió que el jueves/viernes el estado de Codex era un desastre, y que estaban tratando de averiguar qué había cambiado
    • Hubo una caída de rendimiento por un problema de caché, y hasta publicaron un tuit al respecto. Dicen que ya hicieron rollback y que el rendimiento volvió al nivel base
    • ¿Cinco cuentas Pro? ¿Te refieres a cuentas Plus?