- OpenAI activó el modo “código rojo” para mejorar la calidad de ChatGPT y recuperar la ventaja que se estaba debilitando frente a la persecución de Google.
- Actualmente son urgentes mejoras en funciones clave como personalización, velocidad, confiabilidad y ampliación del rango de preguntas, por lo que todos los nuevos proyectos, como publicidad, Pulse, Health y el agente de compras, se suspendieron o se retrasaron.
- Gemini 3 de Google quedó por delante de los modelos de OpenAI en numerosos benchmarks recientes, y el éxito del modelo de imágenes Nano Banana, que impulsó el MAU de 450 millones a 650 millones, emergió como una amenaza principal.
- OpenAI también enfrenta mayor presión financiera por un compromiso de inversión en centros de datos de cientos de miles de millones de dólares, y una proyección interna que exige US$200.000 millones en ingresos anuales para 2030, además de que el crecimiento de clientes empresariales de Anthropic también pesa en la competencia.
- OpenAI puso en marcha un sistema de revisión diaria y reubicó equipos; además, informó internamente que el nuevo modelo de razonamiento (reasoning) que se publicará pronto está por delante de la última versión de Gemini, dejando la recuperación del liderazgo como una encrucijada crítica.
Activación de código rojo y plan de mejora de ChatGPT
- Un memorándum interno reveló que OpenAI activó código rojo, el nivel más alto del modo de emergencia para corregir problemas de ChatGPT.
- OpenAI usa un sistema de alertas en 3 niveles: amarillo → naranja → rojo, y esta medida fue un escalón más alto que código naranja.
- El alcance incluye reforzar la experiencia general del usuario con más personalización, mayor velocidad de respuesta, mayor confiabilidad del servidor y ampliación de las preguntas a las que pueda responder.
- Para ello, todos los proyectos nuevos, incluidos publicidad, Pulse (asistente personal), Health y shopping agents, quedaron en segundo plano.
- Se incentivó la reubicación de personal en toda la empresa y se decidió operar una llamada diaria (daily call) dedicada a revisar el estado de desarrollo cada día.
- También se incluyó recalibrar el tono del modelo y su capacidad de cumplir instrucciones, tras recientes reclamos sobre el tono frío y errores en preguntas básicas de GPT-5.
Persecución de Google Gemini y presión competitiva
- El modelo más reciente de Google, Gemini 3, superó a OpenAI en múltiples benchmarks de la industria, mostrando un cambio importante en el equilibrio competitivo.
- Tras el anuncio de Gemini, las acciones de Google subieron y su rendimiento destacó con fuerza en el mercado.
- Desde el lanzamiento en agosto del modelo de imágenes Nano Banana, los datos muestran que el MAU total mensual de Google AI pasó de 450 millones en julio a 650 millones en octubre.
- Anthropic también está expandiéndose en su base de clientes empresariales, revelando una tendencia de debilitamiento de la ventaja de un esquema centrado en OpenAI.
- Se describe como irónico que el “código rojo” que Google había anunciado justo después del lanzamiento de ChatGPT ahora haya regresado al lado de OpenAI.
Presión de inversión, finanzas y nervios de mercado
- OpenAI firmó con Microsoft y Amazon un contrato de energía para centros de datos de 36 GW, lo que podría generar costos de alquiler de centros de datos de hasta US$620 mil millones anuales en el futuro.
- También se compartió la previsión interna de que se necesitan unos US$200 mil millones de ingresos anuales para alcanzar beneficios en 2030.
- Aunque OpenAI no planea cotizar, esta estructura financiera está estrechamente ligada a la evolución bursátil de empresas tecnológicas clave como Nvidia, Oracle y Microsoft, e impacta al mercado en general.
- OpenAI sigue operando con pérdidas y se la califica como una estructura que tendría dificultades de supervivencia sin una financiación continua y de gran escala.
Anuncio del nuevo modelo y confianza interna
- Altman indicó en el memo que el nuevo modelo de razonamiento (reasoning) que se publicará la próxima semana va por delante de la versión más reciente de Google Gemini.
- Se lo presenta como un impulso para la moral interna y como una reafirmación de la intención de impulsar el crecimiento y recuperar el control.
- ChatGPT aún mantiene una base fuerte con más de 800 millones de usuarios semanales.
- OpenAI planea volver a potenciarlo con mejoras de velocidad, precisión y personalización para sostener su crecimiento.
Contexto general
- En la combinación de competencia creciente (Google y Anthropic), controversia sobre la calidad del producto e infraestructuras de costo masivo, recuperar la calidad base de ChatGPT aparece como la estrategia de supervivencia y la prioridad más urgente para OpenAI.
3 comentarios
Los problemas de ChatGPT
Tiene demasiados bugs. A veces presiono enviar y no genera el mensaje, o durante el streaming del mensaje aparece un error y desaparece todo, etc. Deep Research tiene incluso menos fuentes que el modo de razonamiento. Ya no hay motivo para usar Deep Research.
Los problemas de Codex
Es demasiado lento. Un trabajo que en Claude Code toma 5 minutos, en Codex tarda más de 10 minutos. Es demasiado tonto.
Pero, ¿Gemini no es más incómodo de usar que ChatGPT en cuanto a la UI y en general..?
Opiniones de Hacker News
La semana pasada un cliente envió una consulta sobre una función que yo había escrito en parte. Un ingeniero de soporte generó la respuesta con Claude y, aunque había sido entrenado con documentación interna y pública, produjo disparates convincentes con muchísima seguridad
Mientras yo explicaba por qué estaba mal, otro ingeniero lo probó con Augment, y esta vez volvió a soltar otro disparate con total seguridad. Al final solo intercambiamos emojis de llanto, y yo seguiré usando mi propia inteligencia
Escuché el rumor de que OpenAI no ha logrado un pre-training exitoso desde mediados de 2024. Si le preguntas a ChatGPT 5.1 sobre eventos actuales sin internet, dice que su corte de conocimiento es de junio de 2024. No sé si eso se debe a un modelo pequeño, pero a estas alturas, 18 meses atrás parece una señal preocupante
openaiParece que la salida de investigadores clave de OpenAI, que viene desde el año pasado, ya está empezando a sentirse de verdad. Sam Altman es un vendedor, no un investigador. Ilya ya no está, y figuras importantes se fueron a Google, Meta y Anthropic o fundaron sus propias empresas. Los que quedan son buenos para mejoras iterativas, pero queda la duda de si podrán liderar por sí mismos el próximo gran salto
El OpenAI actual se parece a Netscape. Es innovador, pero no tiene un modelo de ingresos sostenible. Por un lado, empresas como Google empaquetan la IA gratis dentro de productos ya existentes, y por el otro Deepseek y Qwen bajan los precios con open source. Al final está bajo presión por ambos lados
Hay algo que de verdad me da curiosidad. ¿Cómo puede ser que OpenAI falle en pre-training? Ya tienen experiencia exitosa y el talento es de primer nivel; ¿no bastaría con volver a entrenar un modelo de 2024?
En mi experiencia, un “Code Red” normalmente era una forma de maquillar que toda la empresa había perdido el rumbo. La gerencia media no sabe qué hacer, así que la carga termina cayendo sobre los ingenieros
El verdadero Code Red no es que Google haya superado a OpenAI, sino que quedó claro que no hay foso defensivo en la industria de la IA. Al final todos están compitiendo en una carrera al fondo más cara del mundo
OpenAI asumió compromisos de gasto de largo plazo por 500 mil millones de dólares a través del proyecto Stargate y otros planes. Se prevé que destine 250 mil millones de dólares a Microsoft Azure y varios miles de millones más a GPUs de AMD. Para esto, Oracle obtuvo 18 mil millones de dólares en bonos y 9.6 mil millones en préstamos
Si OpenAI se queda atrás, no podrá sostener esos contratos y aparecerá un riesgo de quiebras en cadena. Incluso podría haber intervención del gobierno
Dicen que OpenAI está posponiendo proyectos como publicidad, compras, agentes de salud y Pulse para enfocarse en mejorar ChatGPT, pero en el fondo el personal clave es reducido y el resto puede encargarse de publicidad o funciones comerciales. No necesariamente chocan entre sí
Según el WSJ, OpenAI está posponiendo publicidad, IA para salud y compras, y el asistente personal Pulse. Si además se considera su colaboración de hardware con Jony Ive, da la impresión de que su foco está disperso
Si la publicidad genera dinero, OpenAI se convertiría en una empresa del nivel de las Mag 7, pero si fracasa, quedará expuesta la realidad.
Si los resultados de sus pruebas publicitarias ya están por debajo de lo esperado, entonces este ‘Code Red’ podría ser una señal para ganar tiempo y ocultarlo.
ChatGPT no es un punto de entrada de búsqueda como Google, ni puede hacer publicidad basada en feed como Meta.
Al final, es muy probable que repita el fracaso de Alexa.