OpenAI presenta GPT-4.5

xguru · 2025-02-28T09:19:15+09:00

GPT-4.5 es el modelo más reciente de OpenAI, una versión con mejor escalabilidad en el pre-training y el post-training Amplía la escala del aprendizaje no supervisado (unsupervised learning) para reforzar el reconocimiento de patrones y la intuición creativa Permite conversaciones más naturales, entiende mejor la intención del usuario y mejora la inteligencia emocional (EQ) Puede aprovecharse en diversas tareas como redacción, programación y resolución de problemas Se espera que reduzca la tasa de alucinaciones (hallucinations) Se ofrece como research preview, con el objetivo de explorar las fortalezas y limitaciones del modelo y recopilar diversos casos de uso Expansión del aprendizaje no supervisado Para avanzar la IA, se están ampliando dos ejes: el aprendizaje no supervisado y el razonamiento (reasoning) Refuerzo del razonamiento: el modelo se entrena para pensar de forma sistemática al resolver problemas complejos de STEM Modelos como OpenAI o1 y OpenAI o3-mini han desarrollado este enfoque Expansión del aprendizaje no supervisado: mejora la intuición del modelo y la precisión de su conocimiento del mundo mediante más datos GPT-4.5 fue entrenado en una supercomputadora Microsoft Azure AI y cuenta con un conocimiento más amplio y una comprensión más profunda Como resultado, reduce las alucinaciones y ofrece resultados más confiables en una variedad de temas Expansión del paradigma GPT GPT-4.5 posee un conocimiento superior al de modelos anteriores Ofrece una visión más profunda sobre preguntas históricas como el origen del lenguaje Ante preguntas como "¿Cuál fue el primer lenguaje?": Es muy probable que no haya existido un único primer lenguaje Se estima que el lenguaje surgió en África hace más de 100 mil años Es probable que los proto-lenguajes (proto-languages) se desarrollaran a partir de gestos, sonidos y señales Como no hay registros, no es posible conocer con exactitud su origen Así, GPT-4.5 también puede ofrecer respuestas profundas en áreas como la lingüística y la historia Conocimiento del mundo más profundo En los resultados de la evaluación SimpleQA, GPT-4.5 registró mayor precisión que otros modelos Comparación de precisión (Accuracy): GPT-4.5: 62.5% GPT-4o: 38.2% OpenAI o1: 47% OpenAI o3-mini: 15% Comparación de tasa de alucinación (Hallucination Rate) (más bajo es mejor): GPT-4.5: 37.1% GPT-4o: 61.8% OpenAI o1: 44% OpenAI o3-mini: 80.3% GPT-4.5 mantiene una mayor precisión y reduce la tasa de alucinaciones en preguntas que requieren verificación factual Entrenamiento para colaborar con humanos GPT-4.5 fue entrenado para comprender mejor las necesidades e intenciones humanas Interpreta con más precisión la intención del usuario y permite conversaciones más naturales En comparación con modelos anteriores, mejora la inteligencia emocional (EQ) y entiende mejor los matices sutiles Destaca por su intuición creativa y sentido estético en tareas de escritura y diseño Evaluación comparativa (Win-rate vs GPT-4o) Tareas creativas: 56.8% Preguntas profesionales: 63.2% Preguntas cotidianas: 57.0% GPT-4.5 colabora de forma natural con las personas y capta con mayor precisión la intención del usuario dentro de la conversación Perspectiva futura: capacidades de razonamiento más potentes GPT-4.5 no es un modelo que piense lógicamente antes de responder Es un enfoque distinto al de los modelos centrados en razonamiento como OpenAI o1 y OpenAI o3-mini Se prevé que, en modelos futuros, la combinación de pre-training y razonamiento (reasoning) será clave Refuerzo de la seguridad GPT-4.5 fue entrenado con nuevas técnicas de supervisión que incluyen SFT (supervised fine-tuning) y RLHF (reinforcement learning from human feedback) Antes del despliegue del modelo, se realizaron pruebas de seguridad para evaluar riesgos potenciales También se publicó una system card con los resultados de la evaluación para fomentar la investigación y la retroalimentación Cómo usar GPT-4.5 en ChatGPT Desde hoy, los usuarios de ChatGPT Pro pueden seleccionar GPT-4.5 en web, móvil y escritorio La próxima semana estará disponible para usuarios Plus y Team La semana siguiente estará disponible para usuarios Enterprise y Edu Funciones principales: Posibilidad de buscar información actualizada Soporte para carga de archivos e imágenes Posibilidad de escribir y programar usando canvas Sin soporte para modo de voz, video ni pantalla compartida Cómo usar GPT-4.5 en la API Está disponible para desarrolladores a través de Chat Completions API, Assistants API y Batch API Funciones principales: Function Calling Structured Outputs Streaming System Messages Soporte de visión mediante entrada de imágenes Casos de uso para desarrolladores: Aplicaciones donde la inteligencia emocional y la creatividad son importantes (por ejemplo, asistentes de escritura, coaching de aprendizaje, brainstorming) Trabajo de código complejo (por ejemplo, flujos de trabajo de programación en múltiples etapas, automatización) Consideraciones sobre su disponibilidad en la API: GPT-4.5 es un modelo con alta carga computacional y costo elevado, por lo que no reemplaza a GPT-4o Se está evaluando si seguirá disponible en la API a largo plazo, y la retroalimentación de los usuarios será importante Conclusión GPT-4.5 es un modelo que amplía los límites del aprendizaje no supervisado, con el que se pueden explorar capacidades nuevas y creativas Explora nuevas posibilidades para la tecnología de IA, con expectativa por ver casos de uso innovadores por parte de los usuarios.

(openai.com)

4 puntos por xguru 2025-02-28 | 4 comentarios | Compartir por WhatsApp

GPT-4.5 es el modelo más reciente de OpenAI, una versión con mejor escalabilidad en el pre-training y el post-training
Amplía la escala del aprendizaje no supervisado (unsupervised learning) para reforzar el reconocimiento de patrones y la intuición creativa
Permite conversaciones más naturales, entiende mejor la intención del usuario y mejora la inteligencia emocional (EQ)
Puede aprovecharse en diversas tareas como redacción, programación y resolución de problemas
Se espera que reduzca la tasa de alucinaciones (hallucinations)
Se ofrece como research preview, con el objetivo de explorar las fortalezas y limitaciones del modelo y recopilar diversos casos de uso

Expansión del aprendizaje no supervisado

Para avanzar la IA, se están ampliando dos ejes: el aprendizaje no supervisado y el razonamiento (reasoning)
- Refuerzo del razonamiento: el modelo se entrena para pensar de forma sistemática al resolver problemas complejos de STEM
  - Modelos como OpenAI o1 y OpenAI o3-mini han desarrollado este enfoque
- Expansión del aprendizaje no supervisado: mejora la intuición del modelo y la precisión de su conocimiento del mundo mediante más datos
GPT-4.5 fue entrenado en una supercomputadora Microsoft Azure AI y cuenta con un conocimiento más amplio y una comprensión más profunda
- Como resultado, reduce las alucinaciones y ofrece resultados más confiables en una variedad de temas

Expansión del paradigma GPT

GPT-4.5 posee un conocimiento superior al de modelos anteriores
- Ofrece una visión más profunda sobre preguntas históricas como el origen del lenguaje
- Ante preguntas como "¿Cuál fue el primer lenguaje?":
  - Es muy probable que no haya existido un único primer lenguaje
  - Se estima que el lenguaje surgió en África hace más de 100 mil años
  - Es probable que los proto-lenguajes (proto-languages) se desarrollaran a partir de gestos, sonidos y señales
  - Como no hay registros, no es posible conocer con exactitud su origen
Así, GPT-4.5 también puede ofrecer respuestas profundas en áreas como la lingüística y la historia

Conocimiento del mundo más profundo

En los resultados de la evaluación SimpleQA, GPT-4.5 registró mayor precisión que otros modelos
- Comparación de precisión (Accuracy):
  - GPT-4.5: 62.5%
  - GPT-4o: 38.2%
  - OpenAI o1: 47%
  - OpenAI o3-mini: 15%
- Comparación de tasa de alucinación (Hallucination Rate) (más bajo es mejor):
  - GPT-4.5: 37.1%
  - GPT-4o: 61.8%
  - OpenAI o1: 44%
  - OpenAI o3-mini: 80.3%
GPT-4.5 mantiene una mayor precisión y reduce la tasa de alucinaciones en preguntas que requieren verificación factual

Entrenamiento para colaborar con humanos

GPT-4.5 fue entrenado para comprender mejor las necesidades e intenciones humanas
- Interpreta con más precisión la intención del usuario y permite conversaciones más naturales
- En comparación con modelos anteriores, mejora la inteligencia emocional (EQ) y entiende mejor los matices sutiles
- Destaca por su intuición creativa y sentido estético en tareas de escritura y diseño
Evaluación comparativa (Win-rate vs GPT-4o)
- Tareas creativas: 56.8%
- Preguntas profesionales: 63.2%
- Preguntas cotidianas: 57.0%
GPT-4.5 colabora de forma natural con las personas y capta con mayor precisión la intención del usuario dentro de la conversación

Perspectiva futura: capacidades de razonamiento más potentes

GPT-4.5 no es un modelo que piense lógicamente antes de responder
Es un enfoque distinto al de los modelos centrados en razonamiento como OpenAI o1 y OpenAI o3-mini
Se prevé que, en modelos futuros, la combinación de pre-training y razonamiento (reasoning) será clave

Refuerzo de la seguridad

GPT-4.5 fue entrenado con nuevas técnicas de supervisión que incluyen SFT (supervised fine-tuning) y RLHF (reinforcement learning from human feedback)
Antes del despliegue del modelo, se realizaron pruebas de seguridad para evaluar riesgos potenciales
También se publicó una system card con los resultados de la evaluación para fomentar la investigación y la retroalimentación

Cómo usar GPT-4.5 en ChatGPT

Desde hoy, los usuarios de ChatGPT Pro pueden seleccionar GPT-4.5 en web, móvil y escritorio
La próxima semana estará disponible para usuarios Plus y Team
La semana siguiente estará disponible para usuarios Enterprise y Edu
Funciones principales:
- Posibilidad de buscar información actualizada
- Soporte para carga de archivos e imágenes
- Posibilidad de escribir y programar usando canvas
- Sin soporte para modo de voz, video ni pantalla compartida

Cómo usar GPT-4.5 en la API

Está disponible para desarrolladores a través de Chat Completions API, Assistants API y Batch API
Funciones principales:
- Function Calling
- Structured Outputs
- Streaming
- System Messages
- Soporte de visión mediante entrada de imágenes
Casos de uso para desarrolladores:
- Aplicaciones donde la inteligencia emocional y la creatividad son importantes (por ejemplo, asistentes de escritura, coaching de aprendizaje, brainstorming)
- Trabajo de código complejo (por ejemplo, flujos de trabajo de programación en múltiples etapas, automatización)
Consideraciones sobre su disponibilidad en la API:
- GPT-4.5 es un modelo con alta carga computacional y costo elevado, por lo que no reemplaza a GPT-4o
- Se está evaluando si seguirá disponible en la API a largo plazo, y la retroalimentación de los usuarios será importante

Conclusión

GPT-4.5 es un modelo que amplía los límites del aprendizaje no supervisado, con el que se pueden explorar capacidades nuevas y creativas
Explora nuevas posibilidades para la tecnología de IA, con expectativa por ver casos de uso innovadores por parte de los usuarios.

4 comentarios

GN⁺ 2025-02-28

Comentarios de Hacker News

El precio de GPT 4.5 es muy alto
- Entrada: $75.00 por 1 millón de tokens
- Entrada en caché: $37.50 por 1 millón de tokens
- Salida: $150.00 por 1 millón de tokens
- La diferencia de precio es grande en comparación con GPT 4o
- GPT-4.5 es un modelo muy grande e intensivo en cómputo, y se está evaluando si seguirá disponible en la API a largo plazo
- La retroalimentación de los usuarios es importante
Impresiones al usar GPT-4.5
- Es muy lento, no es adecuado para interacción en tiempo real
- Mejoró el estilo de escritura, es más casual y accesible
- En comparaciones de borradores de libros, la diferencia entre GPT4o y GPT4.5 se nota
Enfoque en la inteligencia emocional (EQ)
- Se nota una tendencia a convertirse en un "amable amigo de IA"
- Anthropic y Grok también se están moviendo en esa dirección
- Ojalá ese comportamiento no se filtre en las respuestas de la API
Decepción con la publicación del blog y la demo en vivo
- El nuevo modelo no impresiona
- Parece difícil que OpenAI logre mantenerse por delante de sus competidores
- Sorprende que el precio sea tan alto
Enfoques distintos de OpenAI y Anthropic
- Anthropic cree que un solo paradigma (razonamiento) puede servir para todos los casos de uso
- OpenAI cree que se necesita un ensamble de modelos con distintas capacidades
- GPT 4.5 es más grande, así que puede almacenar más datos factuales
Rendimiento de GPT-4.5 en el benchmark de Kagi LLM
- A pesar del alto precio y la velocidad, el rendimiento es sobresaliente
- En algunas tareas todavía se queda corto
Cómo usar GPT-4.5 a través de la API
- Se puede ejecutar usando la herramienta uvx
- Es necesario configurar la API key
Comparación de rendimiento en programación
- ChatGPT 4.5 es un poco mejor que ChatGPT 4o para programar
- Anthropic Claude 3.7 muestra un mejor rendimiento
Entender el intento de OpenAI
- GPT 4.5 fue un intento importante para explorar las leyes de escalado del preentrenamiento
- Es un regalo que contribuye a la ciencia

xguru 2025-02-28

Precio de GPT-4.5 (por 1M de tokens)

$75 por entrada
$37.50 por entrada en caché
$150 por salida
Si lo comparas con el precio de 4o, la entrada es 30 veces más cara y la salida 15 veces más cara.

Pero parece que hay muchas quejas porque el rendimiento no mejora en esa misma proporción.

Dicen que al usar GPT-4.5 en Cursor, funciona de manera eficiente incluso en casos donde otros modelos fallan.
Claro, como es tan caro, hay que pagar según el uso. La reacción fue algo como: "si le pongo tareas de programación complejas, me voy a la quiebra".
https://x.com/cursor_ai/status/1895210110714290302

bearmett 2025-02-28

Creo que al ver el precio de Claude Code pensé algo parecido. Si eres asalariado, ¿no es bancarrota si supera tu pago por hora? 😵‍💫

botplaysdice 2025-02-28

Parece que por suerte es así. Según el precio del modelo, también va nuestro valor...;;;