Lanzamiento de ChatGPT Pro

(openai.com)

12 puntos por GN⁺ 2024-12-06 | 7 comentarios | Compartir por WhatsApp

A medida que la tecnología de IA sigue avanzando, ahora puede resolver problemas más complejos e importantes, y hacer eso requiere una cantidad considerable de recursos de cómputo
ChatGPT Pro es un plan de $200 al mes que permite un uso ampliado de los modelos y herramientas más recientes de OpenAI
- o1: el modelo más inteligente
- También incluye o1-mini, GPT-4o y Advanced Voice
- o1 pro mode: utiliza más recursos de cómputo para pensar con mayor profundidad y ofrecer respuestas más sofisticadas para problemas complejos
- En el futuro se agregarán funciones de productividad aún más potentes
Está diseñado para investigadores, ingenieros y personas que realizan trabajo centrado en investigación, para ayudarles a aumentar la productividad y situarse en la primera línea del avance de la IA
El o1 pro mode de ChatGPT Pro es un modelo avanzado que ofrece respuestas con alta confiabilidad
- En particular, brinda respuestas precisas y completas en ciencia de datos, programación y análisis legal
- En comparación con o1 y o1-preview, muestra un mejor rendimiento en difíciles benchmarks de aprendizaje automático en matemáticas, ciencia y programación

Comparación principal de rendimiento (según precisión pass@1)

Competencia de matemáticas (AIME 2024)
- o1-preview: 50
- o1: 78
- o1 pro mode: 86
Competencia de código (Codeforces)
- o1-preview: 62
- o1: 89
- o1 pro mode: 90
Preguntas científicas de nivel doctoral (GPQA Diamond)
- o1-preview: 74
- o1: 76
- o1 pro mode: 79

Mejora de confiabilidad: evaluación "4/4 reliability"

Se introdujo un criterio de evaluación más estricto: solo se considera resuelto si acierta la respuesta en los 4 de 4 intentos

Comparación principal de rendimiento (según confiabilidad 4/4)

Competencia de matemáticas (AIME 2024)
- o1-preview: 37
- o1: 67
- o1 pro mode: 80
Competencia de código (Codeforces)
- o1-preview: 26
- o1: 64
- o1 pro mode: 75
Preguntas científicas de nivel doctoral (GPQA Diamond)
- o1-preview: 58
- o1: 67
- o1 pro mode: 74

7 comentarios

christallire 2024-12-11

Lo probé con la versión Pro, pero la ventana de contexto tan corta es un problema fatal. Sí escribe contenido largo, pero después de cierto punto empieza a desarmarse poco a poco el contenido o el formato que venía usando originalmente.

riki3 2024-12-06

OpenAI se está alejando cada vez más de lo "open".
Supongo que esta es la realidad.

tsboard 2024-12-06

Como no daba para cubrir el costo, pensé que iban a subir la cuota de suscripción de Plus, pero no: parece que van a apuntar a eso creando una línea aún más cara. La verdad es que lo uso muchísimo en el día a día, pero no creo necesitar la versión Pro. Jaja

windrod 2024-12-06

Yo uso Plus desde antes. Desde hace un tiempo, aunque ejecuto el mismo tipo de prompts con el mismo tipo de motor, siento que los resultados cambiaron. Me da la impresión de que ya no rinde tanto como antes.

Me da la impresión de que están recortando los modelos disponibles en el Plus original y vendiéndolos por separado.

Cuanto más caro es el costo, normalmente hay cierta confianza en el rendimiento, pero los servicios de IA no tienen eso. Parece muy probable que la IA también termine yendo por ese camino, como cuando un día te aplican límites a la conexión de internet sin avisarte.

vndk2234 2024-12-09

Yo también estoy usando Plus, pero ¿cómo decirlo?, ¿la línea general de las respuestas? Aunque el nombre sigue siendo el mismo, o1, la sensación en conjunto cambió por completo frente al preview. Incluso me da la impresión de que alguien está limitando la salida de tokens.

reagea0 2024-12-09

Estoy de acuerdo. Yo también siento que, incluso usando la misma versión al mismo tiempo, el rendimiento va y viene sin ningún aviso aparte. Es un tema un poco distinto, pero en cuanto a que ciertos servicios no recopilan información, tampoco hay forma de comprobarlo, así que al final no deja de ser una cuestión de fe.

GN⁺ 2024-12-06

Comentarios en Hacker News

OpenAI está compitiendo entre la velocidad de avance de las alternativas de código abierto y la necesidad de generar ingresos. Que tenga éxito o no depende de si las grandes empresas elegirán la solución de IA integrada y segura de OpenAI. Esto es similar a la estrategia de IBM en la computación empresarial.
Molesta que la ventana de contexto de la versión Pro sea corta. Como usuario de Plus, esperaba una ventana de contexto más larga, pero no hay ninguna discusión al respecto. Recomiendo fuertemente a la competencia considerar la ventana de contexto como un diferenciador.
La primera impresión tras comprar la suscripción Pro es que el nuevo modelo o1-Pro es un escritor excelente. Maneja muy bien prompts largos y análisis de datos complejos.
El plan para ofrecer más poder de cómputo puede explicarse como una táctica de precios basada en el efecto señuelo. Introducen una opción cara para hacer que los otros planes parezcan más razonables.
Pago 166 euros al mes por Claude Teams. Es por la función de proyectos, combinada con la posibilidad de subir muchos archivos y hacer preguntas dentro de un contexto específico. Esa función es tan poderosa como tener investigadores al alcance de la mano.
Obtengo un mejor rendimiento de Anthropic a un costo mucho más bajo. Soy escéptico ante la afirmación de que el nuevo GPT sea 10 veces mejor que Claude.
Hay dudas sobre si OpenAI podrá alcanzar una IA "general" antes de que los inversionistas se cansen. Es posible que, con el éxito de ChatGPT, hayan insinuado que tenían una ruta para lograrlo.
La principal dificultad de fijar un precio mensual de suscripción para uso "ilimitado" de un producto es el 1% de usuarios intensivos que hacen un uso extremo. El precio de ChatGPT Pro está dirigido a usuarios intensivos y empresas.
Pasé 4.5 horas escribiendo fórmulas complejas de Google Sheets. Si el nuevo modo de ChatGPT Pro es más rápido, eso representa una gran ventaja en términos de ahorro de tiempo.
Hay casos en los que se realizan entrevistas usando el modelo o1 en una fábrica de entrevistas. Para este tipo de caso de uso, una tarifa mensual de $200 puede sentirse barata.