- Tuve acceso anticipado al sistema de razonamiento mejorado de OpenAI, "Strawberry", y ahora que ya es público puedo compartir mis ideas
- El nuevo modelo de IA, o1-preview, permite que la IA "piense" antes de resolver un problema
- Esto le permite abordar problemas muy difíciles que requieren planificación e iteración, y de hecho puede superar a expertos humanos con doctorado al resolver problemas de física muy difíciles
- Este sistema es asombroso, pero sigue siendo limitado, y sugiere hacia dónde podría avanzar en el futuro
- Sin embargo, o1-preview no es mejor en todos los aspectos; por ejemplo, no escribe mejor que GPT-4o
- Los crucigramas son especialmente difíciles para los LLM
- Porque requieren un proceso de resolución iterativo en el que se prueban y descartan muchas respuestas que se afectan entre sí
- Los LLM no pueden hacer esto porque solo pueden añadir un token/palabra a la vez a la respuesta
- Los LLM generales como Claude no pueden resolver correctamente los crucigramas
- Pero Strawberry, después de "pensar" durante 108 segundos, resolvió un crucigrama casi a la perfección
- o1-preview hace posible cosas que eran imposibles sin Strawberry, pero todavía no es perfecto
- Los errores y las alucinaciones siguen ocurriendo, y está limitado por la “inteligencia” del modelo base, GPT-4o
- Incluso después de recibir el nuevo modelo, sigo usando Claude para la crítica de estilo de escritura, y Claude sigue siendo superior en estilo
- Pero dejé de usar Claude para tareas relacionadas con planificación compleja o resolución de problemas, lo que representa un gran salto
En Co-Intelligence..
- Al usar o1-preview, uno se enfrenta a un cambio de paradigma en la IA
- Planificar es una forma de acción en la que la IA deduce por sí sola cómo resolver un problema
- Se siente que el papel del socio humano se reduce, porque la IA entrega un resultado completo por medio de mucho razonamiento y trabajo
- La IA propone la respuesta por sí sola, y aunque el usuario puede revisar su proceso de razonamiento para detectar errores, disminuye la sensación de conexión con el resultado y el grado de aporte a la dirección de la solución
- Este cambio no es necesariamente malo, pero es diferente a lo anterior
- A medida que estos sistemas evolucionen hacia verdaderos agentes autónomos, tendremos que pensar cómo involucrarnos para detectar errores y entender el flujo del problema que queremos resolver
- A pesar de sus limitaciones actuales, o1-preview está mostrando capacidades de la IA que no habíamos anticipado
- La pregunta importante es cómo evolucionaremos nuestra forma de colaborar con la IA a medida que esta avance
- Esta es una parte que o1-preview todavía no puede resolver
2 comentarios
"La pregunta importante es cómo haremos evolucionar la forma en que colaboramos con la IA a medida que esta avance"
Está difícil.
El autor es Ethan Mollick, profesor de la Wharton School de la Universidad de Pensilvania. Investiga sobre emprendimiento e innovación, así como sobre IA.
El contenido anterior fue publicado en su Substack, One Useful Thing, y este boletín tiene alrededor de 190 mil suscriptores.