5 puntos por flyingsquirrel 6 일 전 | 6 comentarios | Compartir por WhatsApp

OpenAI anunció GPT-5.5, un nuevo modelo más inteligente e intuitivo. Este modelo se enfoca en maximizar sus capacidades como un “agente”, yendo más allá de la simple generación de texto.

Características principales:

  • Capacidades de agente mejoradas: se ha mejorado significativamente su capacidad para planificar y ejecutar por sí mismo tareas complejas de múltiples pasos en áreas como programación, uso de computadoras, trabajo de conocimiento e investigación científica inicial.
  • Rendimiento y eficiencia: mantiene la misma latencia por token que GPT-5.4, pero ofrece una inteligencia mucho mayor. Además, utiliza menos tokens para realizar la misma tarea.
  • Resultados en benchmarks: registró 82.7% en Terminal-Bench 2.0 y 58.6% en SWE-Bench Pro, demostrando su capacidad para manejar flujos de trabajo complejos en CLI y resolver issues reales de GitHub.
  • Información de lanzamiento: actualmente se está desplegando de forma gradual para usuarios de ChatGPT Plus, Pro, Business y Enterprise, así como para usuarios de Codex; la API se lanzará próximamente.

OpenAI enfatiza que GPT-5.5 será una pieza clave de la infraestructura de “IA agéntica”, yendo más allá de ser una simple herramienta para entender más rápido la intención del usuario y completar tareas por sí mismo.

6 comentarios

 
click 5 일 전

Aunque nadie lo use, sigo desarrollando con ganas por mi cuenta mi librería npm de compañía, y la estoy optimizando en rendimiento.
La hipótesis que se me había ocurrido terminó siendo que casi ninguna funciona después de correr los benchmarks, así que voy a intentar sacar con esto algunas medidas adicionales de optimización de rendimiento.

 
wedding 6 일 전

Tengo expectativas... ojalá vuelva a recuperar el lugar de SOTA y se arme un panorama competitivo de nuevo..

 
brainer 6 일 전

Hace mucho que dejó de ocupar el lugar de SOTA..

 
kaydash 6 일 전

Opus 4.6...

 
emptybynature 5 일 전

Afirmar que Codex no es SOTA solo lo puede decir alguien que no lo ha usado o que no tiene interés en este tema.

 
genderfluid 4 일 전

Estoy de acuerdo jaja