Introducción a mathstodon.xyz
- mathstodon.xyz es parte de una red social descentralizada basada en Mastodon y es una instancia para usuarios relacionados con las matemáticas.
- Soporta renderizado de LaTeX en la interfaz web.
- Administrador: Christian Lawson-Perfect (@christianp)
- Estadísticas del servidor: 3K usuarios activos
Experimentos de Terence Tao con GPT-o1
- GPT-o1: una nueva versión de GPT de OpenAI que realiza una etapa inicial de razonamiento antes de ejecutar el LLM.
- Experimento 1: en una respuesta a una pregunta matemática ambigua, identificó correctamente el teorema de Cramér y dio una respuesta satisfactoria.
- En versiones anteriores mencionaba conceptos relacionados, pero los detalles eran incorrectos.
- Experimento 2: ante el reto de un problema complejo de análisis, llegó a la solución correcta con muchas pistas y guía, pero no pudo generar por sí solo la idea conceptual principal e hizo algunos errores.
- Mejoró frente al modelo anterior, pero aún es insuficiente.
- Con unas cuantas mejoras más en el futuro, podría llegar a ser útil para trabajo de nivel de investigación.
- Experimento 3: en la tarea de formalizar resultados en Lean, entendió bien el problema e hizo bien la descomposición inicial, pero por falta de información actualizada sobre Lean, el código tenía varios errores.
- Podría ser muy útil en un IDE integrado con un modelo especializado en Lean y Mathlib.
Discusión adicional
- Avance de las herramientas de IA: se espera la aparición de un ecosistema de herramientas de IA capaz de manejar diversas tareas de investigación.
- Actualmente llaman la atención los LLM grandes y de propósito general, pero también se espera que los modelos ligeros de código abierto ajustados a aplicaciones específicas jueguen un papel importante.
- Comparación entre IA y estudiantes de posgrado: discusión sobre si las herramientas de IA pueden contribuir al nivel de un estudiante de posgrado.
- Actualmente requieren más esfuerzo que un estudiante de posgrado, pero existe la posibilidad de que esa proporción baje a 1 o menos en los próximos años.
# Resumen de GN⁺
- Terence Tao probó el nuevo modelo GPT-o1 de OpenAI para evaluar su capacidad de resolver problemas matemáticos.
- GPT-o1 ha mejorado respecto a versiones anteriores, pero todavía tiene algunas limitaciones.
- Con unas cuantas mejoras más en el futuro, podría llegar a ser útil para trabajo de nivel de investigación.
- Se espera la aparición de un ecosistema en el que diversas herramientas de IA puedan apoyar tareas de investigación.
- Actualmente llaman la atención los LLM grandes y de propósito general, pero también se espera que los modelos ligeros de código abierto ajustados a aplicaciones específicas jueguen un papel importante.
1 comentarios
Opiniones de Hacker News
Hay expectativas de que, si GPT se ajusta en Lean (asistente de pruebas) como se hizo con Python, será más útil para matemáticas de nivel de investigación
Imagina volver a 2019 y leer que la experiencia de interactuar con Alexa era "parecida a asesorar a un estudiante de posgrado mediocre pero no completamente incompetente"
El modelo o1 es muy sorprendente
La experiencia con el modelo O1 varía mucho
Es novedoso que los LLM, en muchos temas, sean "parecidos a asesorar a un estudiante de posgrado mediocre pero no completamente incompetente"
Los humanos también pueden beneficiarse del razonamiento tipo "cadena de pensamiento"
Se está de acuerdo con la opinión de Terence Tao
Hay entusiasmo por volver a estudiar matemáticas como hobby independiente
La opinión de Terence Tao resulta sorprendente
Daniel Litt quedó impresionado con o1-preview, pero todavía no ha tenido suerte resolviendo problemas matemáticos interesantes