4 puntos por xguru 2025-02-28 | 4 comentarios | Compartir por WhatsApp
  • GPT-4.5 es el modelo más reciente de OpenAI, una versión con mejor escalabilidad en el pre-training y el post-training
  • Amplía la escala del aprendizaje no supervisado (unsupervised learning) para reforzar el reconocimiento de patrones y la intuición creativa
  • Permite conversaciones más naturales, entiende mejor la intención del usuario y mejora la inteligencia emocional (EQ)
  • Puede aprovecharse en diversas tareas como redacción, programación y resolución de problemas
  • Se espera que reduzca la tasa de alucinaciones (hallucinations)
  • Se ofrece como research preview, con el objetivo de explorar las fortalezas y limitaciones del modelo y recopilar diversos casos de uso

Expansión del aprendizaje no supervisado

  • Para avanzar la IA, se están ampliando dos ejes: el aprendizaje no supervisado y el razonamiento (reasoning)
    • Refuerzo del razonamiento: el modelo se entrena para pensar de forma sistemática al resolver problemas complejos de STEM
      • Modelos como OpenAI o1 y OpenAI o3-mini han desarrollado este enfoque
    • Expansión del aprendizaje no supervisado: mejora la intuición del modelo y la precisión de su conocimiento del mundo mediante más datos
  • GPT-4.5 fue entrenado en una supercomputadora Microsoft Azure AI y cuenta con un conocimiento más amplio y una comprensión más profunda
    • Como resultado, reduce las alucinaciones y ofrece resultados más confiables en una variedad de temas

Expansión del paradigma GPT

  • GPT-4.5 posee un conocimiento superior al de modelos anteriores
    • Ofrece una visión más profunda sobre preguntas históricas como el origen del lenguaje
    • Ante preguntas como "¿Cuál fue el primer lenguaje?":
      • Es muy probable que no haya existido un único primer lenguaje
      • Se estima que el lenguaje surgió en África hace más de 100 mil años
      • Es probable que los proto-lenguajes (proto-languages) se desarrollaran a partir de gestos, sonidos y señales
      • Como no hay registros, no es posible conocer con exactitud su origen
  • Así, GPT-4.5 también puede ofrecer respuestas profundas en áreas como la lingüística y la historia

Conocimiento del mundo más profundo

  • En los resultados de la evaluación SimpleQA, GPT-4.5 registró mayor precisión que otros modelos
    • Comparación de precisión (Accuracy):
      • GPT-4.5: 62.5%
      • GPT-4o: 38.2%
      • OpenAI o1: 47%
      • OpenAI o3-mini: 15%
    • Comparación de tasa de alucinación (Hallucination Rate) (más bajo es mejor):
      • GPT-4.5: 37.1%
      • GPT-4o: 61.8%
      • OpenAI o1: 44%
      • OpenAI o3-mini: 80.3%
  • GPT-4.5 mantiene una mayor precisión y reduce la tasa de alucinaciones en preguntas que requieren verificación factual

Entrenamiento para colaborar con humanos

  • GPT-4.5 fue entrenado para comprender mejor las necesidades e intenciones humanas
    • Interpreta con más precisión la intención del usuario y permite conversaciones más naturales
    • En comparación con modelos anteriores, mejora la inteligencia emocional (EQ) y entiende mejor los matices sutiles
    • Destaca por su intuición creativa y sentido estético en tareas de escritura y diseño
  • Evaluación comparativa (Win-rate vs GPT-4o)
    • Tareas creativas: 56.8%
    • Preguntas profesionales: 63.2%
    • Preguntas cotidianas: 57.0%
  • GPT-4.5 colabora de forma natural con las personas y capta con mayor precisión la intención del usuario dentro de la conversación

Perspectiva futura: capacidades de razonamiento más potentes

  • GPT-4.5 no es un modelo que piense lógicamente antes de responder
  • Es un enfoque distinto al de los modelos centrados en razonamiento como OpenAI o1 y OpenAI o3-mini
  • Se prevé que, en modelos futuros, la combinación de pre-training y razonamiento (reasoning) será clave

Refuerzo de la seguridad

  • GPT-4.5 fue entrenado con nuevas técnicas de supervisión que incluyen SFT (supervised fine-tuning) y RLHF (reinforcement learning from human feedback)
  • Antes del despliegue del modelo, se realizaron pruebas de seguridad para evaluar riesgos potenciales
  • También se publicó una system card con los resultados de la evaluación para fomentar la investigación y la retroalimentación

Cómo usar GPT-4.5 en ChatGPT

  • Desde hoy, los usuarios de ChatGPT Pro pueden seleccionar GPT-4.5 en web, móvil y escritorio
  • La próxima semana estará disponible para usuarios Plus y Team
  • La semana siguiente estará disponible para usuarios Enterprise y Edu
  • Funciones principales:
    • Posibilidad de buscar información actualizada
    • Soporte para carga de archivos e imágenes
    • Posibilidad de escribir y programar usando canvas
    • Sin soporte para modo de voz, video ni pantalla compartida

Cómo usar GPT-4.5 en la API

  • Está disponible para desarrolladores a través de Chat Completions API, Assistants API y Batch API
  • Funciones principales:
    • Function Calling
    • Structured Outputs
    • Streaming
    • System Messages
    • Soporte de visión mediante entrada de imágenes
  • Casos de uso para desarrolladores:
    • Aplicaciones donde la inteligencia emocional y la creatividad son importantes (por ejemplo, asistentes de escritura, coaching de aprendizaje, brainstorming)
    • Trabajo de código complejo (por ejemplo, flujos de trabajo de programación en múltiples etapas, automatización)
  • Consideraciones sobre su disponibilidad en la API:
    • GPT-4.5 es un modelo con alta carga computacional y costo elevado, por lo que no reemplaza a GPT-4o
    • Se está evaluando si seguirá disponible en la API a largo plazo, y la retroalimentación de los usuarios será importante

Conclusión

  • GPT-4.5 es un modelo que amplía los límites del aprendizaje no supervisado, con el que se pueden explorar capacidades nuevas y creativas
  • Explora nuevas posibilidades para la tecnología de IA, con expectativa por ver casos de uso innovadores por parte de los usuarios.

4 comentarios

 
GN⁺ 2025-02-28

Comentarios de Hacker News

  • El precio de GPT 4.5 es muy alto

    • Entrada: $75.00 por 1 millón de tokens
    • Entrada en caché: $37.50 por 1 millón de tokens
    • Salida: $150.00 por 1 millón de tokens
    • La diferencia de precio es grande en comparación con GPT 4o
    • GPT-4.5 es un modelo muy grande e intensivo en cómputo, y se está evaluando si seguirá disponible en la API a largo plazo
    • La retroalimentación de los usuarios es importante
  • Impresiones al usar GPT-4.5

    • Es muy lento, no es adecuado para interacción en tiempo real
    • Mejoró el estilo de escritura, es más casual y accesible
    • En comparaciones de borradores de libros, la diferencia entre GPT4o y GPT4.5 se nota
  • Enfoque en la inteligencia emocional (EQ)

    • Se nota una tendencia a convertirse en un "amable amigo de IA"
    • Anthropic y Grok también se están moviendo en esa dirección
    • Ojalá ese comportamiento no se filtre en las respuestas de la API
  • Decepción con la publicación del blog y la demo en vivo

    • El nuevo modelo no impresiona
    • Parece difícil que OpenAI logre mantenerse por delante de sus competidores
    • Sorprende que el precio sea tan alto
  • Enfoques distintos de OpenAI y Anthropic

    • Anthropic cree que un solo paradigma (razonamiento) puede servir para todos los casos de uso
    • OpenAI cree que se necesita un ensamble de modelos con distintas capacidades
    • GPT 4.5 es más grande, así que puede almacenar más datos factuales
  • Rendimiento de GPT-4.5 en el benchmark de Kagi LLM

    • A pesar del alto precio y la velocidad, el rendimiento es sobresaliente
    • En algunas tareas todavía se queda corto
  • Cómo usar GPT-4.5 a través de la API

    • Se puede ejecutar usando la herramienta uvx
    • Es necesario configurar la API key
  • Comparación de rendimiento en programación

    • ChatGPT 4.5 es un poco mejor que ChatGPT 4o para programar
    • Anthropic Claude 3.7 muestra un mejor rendimiento
  • Entender el intento de OpenAI

    • GPT 4.5 fue un intento importante para explorar las leyes de escalado del preentrenamiento
    • Es un regalo que contribuye a la ciencia
 
xguru 2025-02-28

Precio de GPT-4.5 (por 1M de tokens)

  • $75 por entrada
  • $37.50 por entrada en caché
  • $150 por salida
    Si lo comparas con el precio de 4o, la entrada es 30 veces más cara y la salida 15 veces más cara.

Pero parece que hay muchas quejas porque el rendimiento no mejora en esa misma proporción.

Dicen que al usar GPT-4.5 en Cursor, funciona de manera eficiente incluso en casos donde otros modelos fallan.
Claro, como es tan caro, hay que pagar según el uso. La reacción fue algo como: "si le pongo tareas de programación complejas, me voy a la quiebra".
https://x.com/cursor_ai/status/1895210110714290302

 
bearmett 2025-02-28

Creo que al ver el precio de Claude Code pensé algo parecido. Si eres asalariado, ¿no es bancarrota si supera tu pago por hora? 😵‍💫

 
botplaysdice 2025-02-28

Parece que por suerte es así. Según el precio del modelo, también va nuestro valor...;;;