Sobre Strawberry de OpenAI y el razonamiento

xguru · 2024-09-14T10:02:02+09:00

Tuve acceso anticipado al sistema de razonamiento mejorado de OpenAI, "Strawberry", y ahora que ya es público puedo compartir mis ideas El nuevo modelo de IA, o1-preview, permite que la IA "piense" antes de resolver un problema Esto le permite abordar problemas muy difíciles que requieren planificación e iteración, y de hecho puede superar a expertos humanos con doctorado al resolver problemas de física muy difíciles Este sistema es asombroso, pero sigue siendo limitado, y sugiere hacia dónde podría avanzar en el futuro Sin embargo, o1-preview no es mejor en todos los aspectos; por ejemplo, no escribe mejor que GPT-4o Los crucigramas son especialmente difíciles para los LLM Porque requieren un proceso de resolución iterativo en el que se prueban y descartan muchas respuestas que se afectan entre sí Los LLM no pueden hacer esto porque solo pueden añadir un token/palabra a la vez a la respuesta Los LLM generales como Claude no pueden resolver correctamente los crucigramas Pero Strawberry, después de "pensar" durante 108 segundos, resolvió un crucigrama casi a la perfección o1-preview hace posible cosas que eran imposibles sin Strawberry, pero todavía no es perfecto Los errores y las alucinaciones siguen ocurriendo, y está limitado por la “inteligencia” del modelo base, GPT-4o Incluso después de recibir el nuevo modelo, sigo usando Claude para la crítica de estilo de escritura, y Claude sigue siendo superior en estilo Pero dejé de usar Claude para tareas relacionadas con planificación compleja o resolución de problemas, lo que representa un gran salto En Co-Intelligence.. Al usar o1-preview, uno se enfrenta a un cambio de paradigma en la IA Planificar es una forma de acción en la que la IA deduce por sí sola cómo resolver un problema Se siente que el papel del socio humano se reduce, porque la IA entrega un resultado completo por medio de mucho razonamiento y trabajo La IA propone la respuesta por sí sola, y aunque el usuario puede revisar su proceso de razonamiento para detectar errores, disminuye la sensación de conexión con el resultado y el grado de aporte a la dirección de la solución Este cambio no es necesariamente malo, pero es diferente a lo anterior A medida que estos sistemas evolucionen hacia verdaderos agentes autónomos, tendremos que pensar cómo involucrarnos para detectar errores y entender el flujo del problema que queremos resolver A pesar de sus limitaciones actuales, o1-preview está mostrando capacidades de la IA que no habíamos anticipado La pregunta importante es cómo evolucionaremos nuestra forma de colaborar con la IA a medida que esta avance Esta es una parte que o1-preview todavía no puede resolver

(oneusefulthing.org)

6 puntos por xguru 2024-09-14 | 2 comentarios | Compartir por WhatsApp

Tuve acceso anticipado al sistema de razonamiento mejorado de OpenAI, "Strawberry", y ahora que ya es público puedo compartir mis ideas
El nuevo modelo de IA, o1-preview, permite que la IA "piense" antes de resolver un problema
Esto le permite abordar problemas muy difíciles que requieren planificación e iteración, y de hecho puede superar a expertos humanos con doctorado al resolver problemas de física muy difíciles
Este sistema es asombroso, pero sigue siendo limitado, y sugiere hacia dónde podría avanzar en el futuro
Sin embargo, o1-preview no es mejor en todos los aspectos; por ejemplo, no escribe mejor que GPT-4o
Los crucigramas son especialmente difíciles para los LLM
- Porque requieren un proceso de resolución iterativo en el que se prueban y descartan muchas respuestas que se afectan entre sí
- Los LLM no pueden hacer esto porque solo pueden añadir un token/palabra a la vez a la respuesta
- Los LLM generales como Claude no pueden resolver correctamente los crucigramas
- Pero Strawberry, después de "pensar" durante 108 segundos, resolvió un crucigrama casi a la perfección
o1-preview hace posible cosas que eran imposibles sin Strawberry, pero todavía no es perfecto
- Los errores y las alucinaciones siguen ocurriendo, y está limitado por la “inteligencia” del modelo base, GPT-4o
- Incluso después de recibir el nuevo modelo, sigo usando Claude para la crítica de estilo de escritura, y Claude sigue siendo superior en estilo
- Pero dejé de usar Claude para tareas relacionadas con planificación compleja o resolución de problemas, lo que representa un gran salto

En Co-Intelligence..

Al usar o1-preview, uno se enfrenta a un cambio de paradigma en la IA
Planificar es una forma de acción en la que la IA deduce por sí sola cómo resolver un problema
Se siente que el papel del socio humano se reduce, porque la IA entrega un resultado completo por medio de mucho razonamiento y trabajo
La IA propone la respuesta por sí sola, y aunque el usuario puede revisar su proceso de razonamiento para detectar errores, disminuye la sensación de conexión con el resultado y el grado de aporte a la dirección de la solución
Este cambio no es necesariamente malo, pero es diferente a lo anterior
A medida que estos sistemas evolucionen hacia verdaderos agentes autónomos, tendremos que pensar cómo involucrarnos para detectar errores y entender el flujo del problema que queremos resolver
A pesar de sus limitaciones actuales, o1-preview está mostrando capacidades de la IA que no habíamos anticipado
La pregunta importante es cómo evolucionaremos nuestra forma de colaborar con la IA a medida que esta avance
Esta es una parte que o1-preview todavía no puede resolver

2 comentarios

bluekai17 2024-09-19

"La pregunta importante es cómo haremos evolucionar la forma en que colaboramos con la IA a medida que esta avance"

Está difícil.

xguru 2024-09-14

El autor es Ethan Mollick, profesor de la Wharton School de la Universidad de Pensilvania. Investiga sobre emprendimiento e innovación, así como sobre IA.
El contenido anterior fue publicado en su Substack, One Useful Thing, y este boletín tiene alrededor de 190 mil suscriptores.

Sobre Strawberry de OpenAI y el razonamiento

En Co-Intelligence..

Lecturas relacionadas

2 comentarios