- Los libros de texto tienen la limitación inherente de ser un medio uniforme, y Google está explorando cómo usar IA generativa para crear automáticamente expresiones alternativas y ejemplos personalizados que aumenten la efectividad del aprendizaje y el nivel de involucramiento
- El experimento de investigación Learn Your Way reorganiza los libros de texto según el nivel e intereses del estudiante y los transforma en contenido de múltiples representaciones (multimodal) para fomentar un aprendizaje activo
- El núcleo es un pipeline de personalización que reordena el contenido por grado escolar y reemplaza ejemplos según intereses, sentando la base para generar múltiples formas de presentación como diapositivas, narración, audio y mapas mentales
- Con LearnLM + Gemini 2.5 Pro como eje, combina flujos de trabajo con agentes y modelos especializados para producir representaciones de aprendizaje de alta calidad como ilustraciones educativas, quizzes y narraciones
- Los resultados del RCT mostraron mejoras significativas, como una mejora de 11 puntos porcentuales en memoria de largo plazo, lo que sugiere el potencial de evolucionar materiales estáticos hacia experiencias de aprendizaje interactivas y guiadas por el propio estudiante
Antecedentes y planteamiento del problema
- Los libros de texto tienen limitaciones estructurales: por costos de producción y restricciones de tiempo, carecen de perspectivas alternativas, formatos diversos y adaptaciones personalizadas
- Se propone un enfoque que usa IA generativa (GenAI) para generar automáticamente expresiones adaptadas al interés y nivel del estudiante, manteniendo al mismo tiempo la integridad del texto original
- El objetivo es ofrecer un entorno donde el estudiante elija por sí mismo el formato y la ruta de aprendizaje, mejorando así la efectividad y la motivación
Resumen del enfoque: dos pilares
- Generación de múltiples representaciones: se aplica un diseño que promueve la conexión entre conceptos mediante representaciones multimodales como texto, diapositivas, audio, mapas mentales y quizzes
- Con base en la Dual Coding Theory y estudios posteriores, las conexiones entre distintas representaciones contribuyen a fortalecer los esquemas conceptuales
- Personalización: se busca reforzar la motivación y el aprendizaje profundo mediante la reestructuración del texto según grado e intereses, junto con adaptación de quizzes basada en respuestas
Arquitectura técnica: LearnLM + Gemini 2.5 Pro
- Se aplica una arquitectura en capas basada en Gemini 2.5 Pro con LearnLM integrado
- Etapa 1, pipeline de personalización: el material original, como PDFs, se reajusta de nivel según el grado escolar y los ejemplos generales se sustituyen por ejemplos alineados con intereses, usándose luego como texto base para generar otras representaciones
- Etapa 2, generación de múltiples representaciones:
- Para mapas mentales y líneas de tiempo se aprovechan las capacidades generales del modelo base
- Para diapositivas y narración se usa un flujo de trabajo multiagente orientado a optimizar la efectividad educativa
- Para ilustraciones educativas, dado que los modelos de imagen de propósito general tienen limitaciones, se incorpora además un modelo de imagen ajustado finamente y especializado
- Como resultado, la combinación de modelo base potente + etapas con agentes + componentes especializados permite generar en volumen representaciones multimodales de aprendizaje de alta calidad
Cómo está compuesta la experiencia Learn Your Way
- Immersive text: unidades de lectura segmentadas, imágenes generadas y preguntas integradas convierten la lectura pasiva en una experiencia activa
- Section-level quizzes: promueven el aprendizaje activo mediante retroalimentación inmediata y detección de brechas de conocimiento
- Slides & narration: ofrecen diapositivas que cubren todo el contenido, actividades de completar espacios en blanco y narración con estilo de clase grabada
- Audio lesson: usa diálogo simulado entre profesor de IA y estudiante, junto con apoyos visuales, para ayudar a refinar conceptos erróneos
- Mind map: permite explorar con flexibilidad tanto la visión general como los detalles mediante una estructuración jerárquica del conocimiento
- Todos los componentes aplican personalización según grado escolar e intereses, y los quizzes interactivos reajustan la ruta de aprendizaje según el desempeño en tiempo real
Evaluación del diseño instruccional
- Se transformaron 10 libros de texto originales de OpenStax en 3 condiciones de personalización, aplicándolo a diversas materias desde historia hasta física
- Tres expertos en educación evaluaron aspectos como precisión, cobertura y principios de ciencia del aprendizaje (LearnLM), y el resultado fue una puntuación positiva de 0.85 o más en promedio en todos los rubros
- La evaluación detallada adicional se presenta en el tech report adjunto
Estudio de efectividad (RCT)
- Se asignó aleatoriamente una muestra de 60 jóvenes de 15 a 18 años del área de Chicago, con niveles de lectura similares, para realizar hasta 40 minutos de estudio
- Comparación: Learn Your Way vs lector PDF convencional
- Desempeño inmediato: el grupo de Learn Your Way obtuvo 9 puntos porcentuales más en promedio
- Retención a largo plazo (3–5 días después): el grupo de Learn Your Way obtuvo 11 puntos porcentuales más (78% vs 67%)
- Evaluación subjetiva: comodidad 100% vs 70% e intención de reutilización 93% vs 67%, confirmando una ventaja en satisfacción
- Para complementar los indicadores cuantitativos, se recopilaron hallazgos cualitativos mediante entrevistas en profundidad de 30 minutos, donde se confirmó retroalimentación positiva sobre valor de aprendizaje e inmersión
Por qué funcionó
- El pipeline de personalización ajustó el nivel del texto y los ejemplos al contexto del estudiante, contribuyendo a reducir la carga cognitiva y aumentar la relevancia
- Las múltiples representaciones facilitaron la conexión entre conceptos, incrementando las pistas para recuperar recuerdos y la posibilidad de transferencia
- La adaptación de quizzes y el ciclo de retroalimentación apoyaron la regulación metacognitiva y la corrección de conceptos erróneos
Limitaciones y siguientes pasos
- Por ahora está en una etapa inicial de investigación, por lo que se necesita validación repetida con muestras, materias y grupos de edad más amplios
- Se plantea expandirlo hacia un sistema adaptativo continuo que ajuste de manera sostenida las representaciones y la dificultad según el progreso y los patrones de error del estudiante
- A futuro, se planea seguir combinando principios pedagógicos y medición de efectividad con estrategias de localización adaptadas al contexto regional
Implicaciones y puntos de aplicación
- El activo clave es un pipeline operativo que convierte materiales estáticos en artefactos de aprendizaje interactivos y guiados por el propio estudiante
- Escuelas, editoriales y empresas edtech pueden escalarlo mediante un sistema de producción estandarizado que combine reajuste de nivel del contenido + sustitución de ejemplos según intereses + despliegue multimodal + adaptación de quizzes
- Desde la ingeniería, serán clave el diseño de orquestación de agentes, pipelines de generación modulares y bucles de control de calidad/precisión
2 comentarios
Hablo desde la experiencia de haber hecho esto: para la personalización se necesita mucha información, incluso más de 2 gigabytes.
Comentarios en Hacker News
Tengo una herramienta llamada asXiv. Permite hacer preguntas a artículos de arXiv.org y también ofrece preguntas sugeridas en la pantalla principal para ayudar a entender o explorar un paper. También hay una demo del popular paper Attention Is All You Need. Todo el código es open source, y para reducir costos usa el modelo Google 2.5 flash lite (actualmente completamente gratis). Si hace falta, también puede ejecutarse localmente con otro modelo cambiando una variable de entorno.
asXiv está interesante. Agregué el post de Show HN al second-chance pool. Por eso aparecerá de forma aleatoria en la portada de HN. Explicación del second-chance pool
asXiv también está muy bien, pero algo parecido también se puede hacer en alphaxiv con la función assistant. Solo hay que ir al paper y hacer clic en tools → assistant. Ejemplo en alphaxiv
Se ve bien y de verdad quiero probarlo después. Una duda: me da curiosidad saber por qué no lo hiciste como un SaaS comercial
Parece una herramienta realmente fantástica. Yo también hice un producto parecido, Ruminate(www.tryruminate.com), para leer arXiv/epub/pdf. Me gustaría escuchar opiniones
De verdad me da curiosidad en qué se diferencia del RAG tradicional
Vi en el ejemplo de fundamentos de ciencias computacionales una situación donde a un estudiante de 7º grado le gusta la comida. Por ejemplo, decía cosas como "una lista puede usarse para recetas", "un set sirve para una lista única de ingredientes para una semana", "un map puede usarse en un libro de cocina", "una priority queue es adecuada para gestionar pedidos en una cocina ocupada" o "un grafo de maridaje de alimentos muestra qué ingredientes combinan bien". Creo que están sobreestimando los gustos de un alumno de 7º grado. Yo me aburriría muy rápido
Definitivamente, cuando yo viví ciencias computacionales en la secundaria, hace 20 años, era muy aburrido. En ese entonces había un ambiente de "hay que aprender Microsoft Office sí o sí". Tras muchos años de voluntariado educativo, muchos chicos hacían preguntas muy prácticas como "¿para qué se usan realmente las funciones trigonométricas?". Los ejemplos de clase y de examen estaban tan desconectados de la vida real que parecían no tener sentido. Mostrar cómo se aplican realmente los conceptos en el mundo real claramente tiene valor pedagógico. La ventaja de los LLM es que pueden transformar esos ejemplos prácticos según los intereses personales. Por ejemplo, me gusta mucho cómo la serie de Red Blob Games explica la búsqueda de rutas con A* usando el caso atractivo de los videojuegos
Yo he usado la herramienta de estudio con generación de quizzes incluida en gemini. Para lo típico que aparecería en un libro escolar K-12, sí sirve bastante. Las primeras 30 o 40 preguntas de opción múltiple son bastante útiles, pero después se empiezan a repetir las preguntas, los distractores y las explicaciones, y también aparecen respuestas incorrectas o varias respuestas posibles. Las explicaciones también están dentro de lo esperable y parece que les falta QA. Si el usuario revisa todo por su cuenta, todavía puede servir. Pero si lo acepta sin verificar, incluso podría ser perjudicial
Desde el ejemplo de “una lista puede usarse para recetas”, honestamente no entiendo qué significa. Creo que más bien confundiría a estudiantes de 7º grado
Me hace pensar en el efecto Hawthorne (efecto de novedad). No está claro si los estudiantes dicen que este tipo de contenido es más interesante porque realmente es mejor o simplemente porque es algo distinto. Wiki del efecto Hawthorne
En especial, el ejemplo del set seguramente confundiría a estudiantes de 7º grado (más aún si ni siquiera conocen el concepto de set). Decir que "pones una lista única de ingredientes en un set" es técnicamente correcto, pero en una compra real necesitas cantidades, así que no ayuda mucho. Tampoco hace intuitivo qué es un set y, cuando quieras explicar "la diferencia entre lista y set", podría causar todavía más confusión. Incluso la expresión "ingredientes únicos" podría no ser clara para niños de esa edad
Soy exprofesor de física. La capacidad técnica impresiona, pero creo que esto es una innovación con poca efectividad pedagógica. Cuando les enseñas a adolescentes las leyes del movimiento de Newton, la verdadera dificultad es la idea de que la fricción no siempre está presente. Los estudiantes llegan después de toda una vida observando objetos reales en movimiento y traen incorporada una 'teoría del ímpetu' (theory of impetus, enlace wiki). Una IA que identificara las ideas de cada alumno y lanzara preguntas para refutar la teoría del ímpetu sí sería realmente útil, pero lo que Google presentó esta vez no es más que una variante de clase de pizarrón tipo "diapositivas + quiz". El hecho de que en educación se discuta bajo la premisa de que "todas las materias pueden enseñarse de la misma manera" es una de las razones por las que dejé la docencia. Ya llegamos al límite del enfoque neutral respecto a la materia; de aquí en adelante, la clave para mejorar será enfocarnos en la esencia de "qué enseñar y cómo enseñarlo" realmente
¿Ese encargado de lenguas que dijo "un buen profesor puede enseñar cualquier materia" era de idiomas extranjeros? Coincido mucho contigo, pero incluso en un enfoque neutral respecto a la materia, métodos de aprendizaje eficaces que no se ponen en práctica, como la repetición espaciada o la evaluación basada en recuperación, siguen sin aparecer en el 80% de las clases de menor nivel. Ya sabemos mucho gracias a la teoría de la educación y del aprendizaje, pero eso todavía no se refleja en el sistema escolar
Como estudiante, lo entiendo totalmente. La razón por la que me cuesta aprender no es la falta de personalización, sino simplemente que hay demasiado contenido y es difícil. Lo importante es que alguien compruebe con precisión si realmente entendí cada parte del avance (yo lo describiría como un enfoque de "tamaño bocado") y que traduzca el lenguaje de fórmulas o la terminología a palabras sencillas. El Study mode de ChatGPT cumple bastante bien esa función en ciertas materias
Ten cuidado al hablar de experiencia educativa, porque a la gente de Edutech le da enojo. Llevan 15 años prometiendo una revolución
En ese momento debiste pedirle al encargado de lenguas que enseñara cálculo tensorial
Me da curiosidad por qué ese encargado de lenguas dijo eso, si tuvo impacto también en el departamento de ciencias, y si de verdad dejaste la docencia de física por ese comentario
Viendo los servicios de IA de estos días y los cambios forzados en la política de costos de Copilot, me da la impresión de que toda la industria de la IA está desesperada por hacer que el público use un juguete caro. Me pregunto por qué todavía no aparece la clásica advertencia de PG (Paul Graham) de que "la solución está buscando un problema"
Pienso que la IA todavía no es lo bastante confiable como para usarla activamente en el aprendizaje. Le pedí que organizara 100 citas de un paper y borró 10, además de inventarse otras 10 sin fundamento. En una situación así, ni siquiera puedo imaginarla sustituyendo un libro de texto
Sacar la conclusión de que "la IA no puede resumir ni explicar libros de texto" solo por haber tenido una experiencia de "la IA hizo mal una tarea de citas" es un salto lógico. Mucha gente no sabe organizar citas, pero sí resume y explica libros de texto con soltura
Yo he tenido muchas experiencias usando LLM para que me expliquen bien contenido de libros de texto. Si pego una parte que no entiendo y hago preguntas, suelen responder bastante bien
Me da curiosidad qué modelo usaste, cuál fue el prompt y cuándo lo intentaste
Me encanta aprender. Llegué hasta la universidad gracias a Khan Academy y todavía uso ChatGPT, Claude y otros cuando estudio papers. Pero los ejemplos de Google me decepcionaron rápido.
No fue culpa tuya. Todas las opciones están mal. La sociología estudia la sociedad, la cultura, el comportamiento grupal, etc. Esto es una alucinación del LLM
Todas las respuestas del solucionario están mal. Este sistema quiere que la respuesta sea "C) psicología = genética, sociología = interacción", pero no es cierto que la psicología se centre en la genética
El propio texto tampoco define psicología y sociología, ni las contrapone. Dice que respondas solo con base en el texto, pero solo se puede resolver trayendo conocimiento externo. Este tipo de generación de preguntas surge porque el LLM interpreta de manera torpe los datos de entrenamiento. El modelo no distingue entre modo reading comprehension (comprensión del texto) y modo didactic (enseñanza), así que este problema no es un bug simple, sino una limitación estructural
Puede parecer un bug menor, pero en educación la precisión es muy importante. Que se dejen pasar errores tan básicos hace difícil superar el umbral de confianza
Esta tecnología parece tener un potencial considerable. Los profesores humanos no tienen paciencia infinita. Cuando estaba en la preparatoria le pregunté a mi profesor de química "por qué ocurría esa reacción" y me respondió "solo acéptalo y memorízalo, no intentes entenderlo". Después de eso no me convertí en químico. Pero ahora, al contrario, la química me parece interesante. En ese momento, por culpa de un profesor que me apagó por completo la curiosidad, al elegir carrera universitaria evité cualquier cosa relacionada con química. Si hubiera existido una herramienta de IA así en ese entonces, tal vez mi vida habría sido distinta. En cambio, la IA no podría igualar las clases tan personales de mi profesor de historia, que llegaba con armadura medieval y una espada real para demostrar esgrima en vivo. De nuestros 20 compañeros, 2 terminaron siendo doctor en historia y arqueólogo, así que realmente era un profesor extraordinario. Personas así son raras
Dices que te frustró la respuesta de "solo memorízalo", pero tal vez eso tenga que ver con el fenómeno de 'lie-to-children'(explicación). Querías una comprensión profunda, pero antes de adquirir conceptos avanzados puede ser necesario cierto nivel de memorización básica
Yo era del tipo que no quería solo el resultado, sino una explicación más profunda de cómo se llegó a él, quién lo descubrió y por qué, etc. La IA generativa podría tener el potencial de ofrecer incluso el contexto y el trasfondo histórico de la información en forma de relato
Me pregunto cómo funcionará esta tecnología en el contexto actual de deterioro de la comprensión lectora, antiintelectualismo y aislamiento social. Por buena que sea la tecnología, también podría terminar siendo un retroceso. Tal vez sea una visión pesimista, pero siento que esto no irá hacia asistir al profesor, sino hacia reemplazarlo
Ese pronóstico pesimista sobre la alfabetización y la comprensión lectora (ese obituario social) siempre llega demasiado pronto. Al contrario, algunos lectores están orientándose a leer obras extensas en idioma original o contenidos profundos como una forma de resistencia intelectual. Yo estoy ampliando mi vocabulario y capacidad de expresión con 'Word Power Made Easy' de Norman Lewis y 'The Well-Spoken Thesaurus' de Tom Heehler. En ese proceso uso ChatGPT y Gemini como tutores personales. Si les das instrucciones concretas, ayudan a sugerir neologismos o a aclarar frases. De hecho siento que, gracias a la tecnología, mi expresión y comunicación se han fortalecido. Yo, que antes solo escribía correos o diario personal, ahora uso la IA como colaborador y andamiaje para reconstruir episodios de mi vida en cuentos cortos o transformarlos al estilo de autores que admiro. Esto no es reemplazo del docente, sino más bien la base de un renacimiento del aprendizaje autodirigido
Si te preocupa la caída de la comprensión lectora, el problema no es si se introduce o no más tecnología, sino los valores de la sociedad en su conjunto. Una sociedad que valora la lectura no se deja llevar por demos o promoción en blogs. En cambio, si una sociedad no valora la comprensión, la especialización o a los profesores, siempre buscará atajos para reemplazarlos
No creo que este enfoque sea el mejor, pero coincido mucho con la preocupación de fondo. Yo también recuerdo con claridad que, en primaria y secundaria, los profesores muchas veces dejaban pasar mis preguntas sin dar mucha explicación. Mi mente se quedaba atascada en esas dudas molestas y no podía concentrarse en el tema principal, y el profesor quizá no tenía tiempo para seguir mi pregunta en el contexto de la educación pública, o no estaba lo bastante preparado. El papel que yo quiero para los LLM es ser una herramienta de apoyo que guíe de manera segura la exploración que se desvía del currículo tradicional (distracciones, curiosidad, etc.), pero que al final lleve al estudiante a los objetivos de aprendizaje deseados.
En mi experiencia, esas curiosidades pequeñas llevan a una comprensión mucho más profunda.
El TFA (artículo original) plantea: "¿Y si el estudiante pudiera diseñar por sí mismo su propio recorrido de aprendizaje?"
En realidad, en el ámbito de la no ficción y los libros de texto, eso ya es posible.
Yo no conocí el libro 'How to Read a Book'(wiki) hasta la preparatoria, y ese libro me abrió los ojos a la idea de que "leer todo de corrido no siempre es la única respuesta".
Espero que con la IA más estudiantes descubran que existen muchas formas de aprender, incluso fuera del currículo establecido
Espero que en el futuro realmente llegue una tecnología como "A Young Lady's Illustrated Primer" de Diamond Age
¿Será que el autor de esa novela ya había predicho el futuro desde entonces? Es una historia sobre un mundo lleno de nanotecnología y nanobots
Incluso cuando compré un pinenote imaginaba ese futuro. Pensaba que sería divertido tener un dispositivo como el diario de Tom Riddle que ayudara a estudiar matemáticas. Pero el desarrollo del lado Linux para pinenote va lento, y yo también me ocupé con otras cosas, así que perdí el interés