- GPT-4.5 es el modelo más reciente de OpenAI, una versión con mejor escalabilidad en el pre-training y el post-training
- Amplía la escala del aprendizaje no supervisado (unsupervised learning) para reforzar el reconocimiento de patrones y la intuición creativa
- Permite conversaciones más naturales, entiende mejor la intención del usuario y mejora la inteligencia emocional (EQ)
- Puede aprovecharse en diversas tareas como redacción, programación y resolución de problemas
- Se espera que reduzca la tasa de alucinaciones (hallucinations)
- Se ofrece como research preview, con el objetivo de explorar las fortalezas y limitaciones del modelo y recopilar diversos casos de uso
Expansión del aprendizaje no supervisado
- Para avanzar la IA, se están ampliando dos ejes: el aprendizaje no supervisado y el razonamiento (reasoning)
- Refuerzo del razonamiento: el modelo se entrena para pensar de forma sistemática al resolver problemas complejos de STEM
- Modelos como OpenAI o1 y OpenAI o3-mini han desarrollado este enfoque
- Expansión del aprendizaje no supervisado: mejora la intuición del modelo y la precisión de su conocimiento del mundo mediante más datos
- GPT-4.5 fue entrenado en una supercomputadora Microsoft Azure AI y cuenta con un conocimiento más amplio y una comprensión más profunda
- Como resultado, reduce las alucinaciones y ofrece resultados más confiables en una variedad de temas
Expansión del paradigma GPT
- GPT-4.5 posee un conocimiento superior al de modelos anteriores
- Ofrece una visión más profunda sobre preguntas históricas como el origen del lenguaje
- Ante preguntas como "¿Cuál fue el primer lenguaje?":
- Es muy probable que no haya existido un único primer lenguaje
- Se estima que el lenguaje surgió en África hace más de 100 mil años
- Es probable que los proto-lenguajes (proto-languages) se desarrollaran a partir de gestos, sonidos y señales
- Como no hay registros, no es posible conocer con exactitud su origen
- Así, GPT-4.5 también puede ofrecer respuestas profundas en áreas como la lingüística y la historia
Conocimiento del mundo más profundo
- En los resultados de la evaluación SimpleQA, GPT-4.5 registró mayor precisión que otros modelos
- Comparación de precisión (Accuracy):
- GPT-4.5: 62.5%
- GPT-4o: 38.2%
- OpenAI o1: 47%
- OpenAI o3-mini: 15%
- Comparación de tasa de alucinación (Hallucination Rate) (más bajo es mejor):
- GPT-4.5: 37.1%
- GPT-4o: 61.8%
- OpenAI o1: 44%
- OpenAI o3-mini: 80.3%
- GPT-4.5 mantiene una mayor precisión y reduce la tasa de alucinaciones en preguntas que requieren verificación factual
Entrenamiento para colaborar con humanos
- GPT-4.5 fue entrenado para comprender mejor las necesidades e intenciones humanas
- Interpreta con más precisión la intención del usuario y permite conversaciones más naturales
- En comparación con modelos anteriores, mejora la inteligencia emocional (EQ) y entiende mejor los matices sutiles
- Destaca por su intuición creativa y sentido estético en tareas de escritura y diseño
- Evaluación comparativa (Win-rate vs GPT-4o)
- Tareas creativas: 56.8%
- Preguntas profesionales: 63.2%
- Preguntas cotidianas: 57.0%
- GPT-4.5 colabora de forma natural con las personas y capta con mayor precisión la intención del usuario dentro de la conversación
Perspectiva futura: capacidades de razonamiento más potentes
- GPT-4.5 no es un modelo que piense lógicamente antes de responder
- Es un enfoque distinto al de los modelos centrados en razonamiento como OpenAI o1 y OpenAI o3-mini
- Se prevé que, en modelos futuros, la combinación de pre-training y razonamiento (reasoning) será clave
Refuerzo de la seguridad
- GPT-4.5 fue entrenado con nuevas técnicas de supervisión que incluyen SFT (supervised fine-tuning) y RLHF (reinforcement learning from human feedback)
- Antes del despliegue del modelo, se realizaron pruebas de seguridad para evaluar riesgos potenciales
- También se publicó una system card con los resultados de la evaluación para fomentar la investigación y la retroalimentación
Cómo usar GPT-4.5 en ChatGPT
- Desde hoy, los usuarios de ChatGPT Pro pueden seleccionar GPT-4.5 en web, móvil y escritorio
- La próxima semana estará disponible para usuarios Plus y Team
- La semana siguiente estará disponible para usuarios Enterprise y Edu
- Funciones principales:
- Posibilidad de buscar información actualizada
- Soporte para carga de archivos e imágenes
- Posibilidad de escribir y programar usando canvas
- Sin soporte para modo de voz, video ni pantalla compartida
Cómo usar GPT-4.5 en la API
- Está disponible para desarrolladores a través de Chat Completions API, Assistants API y Batch API
- Funciones principales:
- Function Calling
- Structured Outputs
- Streaming
- System Messages
- Soporte de visión mediante entrada de imágenes
- Casos de uso para desarrolladores:
- Aplicaciones donde la inteligencia emocional y la creatividad son importantes (por ejemplo, asistentes de escritura, coaching de aprendizaje, brainstorming)
- Trabajo de código complejo (por ejemplo, flujos de trabajo de programación en múltiples etapas, automatización)
- Consideraciones sobre su disponibilidad en la API:
- GPT-4.5 es un modelo con alta carga computacional y costo elevado, por lo que no reemplaza a GPT-4o
- Se está evaluando si seguirá disponible en la API a largo plazo, y la retroalimentación de los usuarios será importante
Conclusión
- GPT-4.5 es un modelo que amplía los límites del aprendizaje no supervisado, con el que se pueden explorar capacidades nuevas y creativas
- Explora nuevas posibilidades para la tecnología de IA, con expectativa por ver casos de uso innovadores por parte de los usuarios.
4 comentarios
Comentarios de Hacker News
El precio de GPT 4.5 es muy alto
Impresiones al usar GPT-4.5
Enfoque en la inteligencia emocional (EQ)
Decepción con la publicación del blog y la demo en vivo
Enfoques distintos de OpenAI y Anthropic
Rendimiento de GPT-4.5 en el benchmark de Kagi LLM
Cómo usar GPT-4.5 a través de la API
uvxComparación de rendimiento en programación
Entender el intento de OpenAI
Precio de GPT-4.5 (por 1M de tokens)
Si lo comparas con el precio de 4o, la entrada es 30 veces más cara y la salida 15 veces más cara.
Pero parece que hay muchas quejas porque el rendimiento no mejora en esa misma proporción.
Dicen que al usar GPT-4.5 en Cursor, funciona de manera eficiente incluso en casos donde otros modelos fallan.
Claro, como es tan caro, hay que pagar según el uso. La reacción fue algo como: "si le pongo tareas de programación complejas, me voy a la quiebra".
https://x.com/cursor_ai/status/1895210110714290302
Creo que al ver el precio de Claude Code pensé algo parecido. Si eres asalariado, ¿no es bancarrota si supera tu pago por hora? 😵💫
Parece que por suerte es así. Según el precio del modelo, también va nuestro valor...;;;