Learn Your Way: reimaginando los libros de texto con IA generativa

(research.google)

3 puntos por GN⁺ 2025-09-20 | 2 comentarios | Compartir por WhatsApp

Los libros de texto tienen la limitación inherente de ser un medio uniforme, y Google está explorando cómo usar IA generativa para crear automáticamente expresiones alternativas y ejemplos personalizados que aumenten la efectividad del aprendizaje y el nivel de involucramiento
El experimento de investigación Learn Your Way reorganiza los libros de texto según el nivel e intereses del estudiante y los transforma en contenido de múltiples representaciones (multimodal) para fomentar un aprendizaje activo
El núcleo es un pipeline de personalización que reordena el contenido por grado escolar y reemplaza ejemplos según intereses, sentando la base para generar múltiples formas de presentación como diapositivas, narración, audio y mapas mentales
Con LearnLM + Gemini 2.5 Pro como eje, combina flujos de trabajo con agentes y modelos especializados para producir representaciones de aprendizaje de alta calidad como ilustraciones educativas, quizzes y narraciones
Los resultados del RCT mostraron mejoras significativas, como una mejora de 11 puntos porcentuales en memoria de largo plazo, lo que sugiere el potencial de evolucionar materiales estáticos hacia experiencias de aprendizaje interactivas y guiadas por el propio estudiante

Antecedentes y planteamiento del problema

Los libros de texto tienen limitaciones estructurales: por costos de producción y restricciones de tiempo, carecen de perspectivas alternativas, formatos diversos y adaptaciones personalizadas
Se propone un enfoque que usa IA generativa (GenAI) para generar automáticamente expresiones adaptadas al interés y nivel del estudiante, manteniendo al mismo tiempo la integridad del texto original
El objetivo es ofrecer un entorno donde el estudiante elija por sí mismo el formato y la ruta de aprendizaje, mejorando así la efectividad y la motivación

Resumen del enfoque: dos pilares

Generación de múltiples representaciones: se aplica un diseño que promueve la conexión entre conceptos mediante representaciones multimodales como texto, diapositivas, audio, mapas mentales y quizzes
- Con base en la Dual Coding Theory y estudios posteriores, las conexiones entre distintas representaciones contribuyen a fortalecer los esquemas conceptuales
Personalización: se busca reforzar la motivación y el aprendizaje profundo mediante la reestructuración del texto según grado e intereses, junto con adaptación de quizzes basada en respuestas

Arquitectura técnica: LearnLM + Gemini 2.5 Pro

Se aplica una arquitectura en capas basada en Gemini 2.5 Pro con LearnLM integrado
Etapa 1, pipeline de personalización: el material original, como PDFs, se reajusta de nivel según el grado escolar y los ejemplos generales se sustituyen por ejemplos alineados con intereses, usándose luego como texto base para generar otras representaciones
Etapa 2, generación de múltiples representaciones:
- Para mapas mentales y líneas de tiempo se aprovechan las capacidades generales del modelo base
- Para diapositivas y narración se usa un flujo de trabajo multiagente orientado a optimizar la efectividad educativa
- Para ilustraciones educativas, dado que los modelos de imagen de propósito general tienen limitaciones, se incorpora además un modelo de imagen ajustado finamente y especializado
Como resultado, la combinación de modelo base potente + etapas con agentes + componentes especializados permite generar en volumen representaciones multimodales de aprendizaje de alta calidad

Cómo está compuesta la experiencia Learn Your Way

Immersive text: unidades de lectura segmentadas, imágenes generadas y preguntas integradas convierten la lectura pasiva en una experiencia activa
Section-level quizzes: promueven el aprendizaje activo mediante retroalimentación inmediata y detección de brechas de conocimiento
Slides & narration: ofrecen diapositivas que cubren todo el contenido, actividades de completar espacios en blanco y narración con estilo de clase grabada
Audio lesson: usa diálogo simulado entre profesor de IA y estudiante, junto con apoyos visuales, para ayudar a refinar conceptos erróneos
Mind map: permite explorar con flexibilidad tanto la visión general como los detalles mediante una estructuración jerárquica del conocimiento
Todos los componentes aplican personalización según grado escolar e intereses, y los quizzes interactivos reajustan la ruta de aprendizaje según el desempeño en tiempo real

Evaluación del diseño instruccional

Se transformaron 10 libros de texto originales de OpenStax en 3 condiciones de personalización, aplicándolo a diversas materias desde historia hasta física
Tres expertos en educación evaluaron aspectos como precisión, cobertura y principios de ciencia del aprendizaje (LearnLM), y el resultado fue una puntuación positiva de 0.85 o más en promedio en todos los rubros
La evaluación detallada adicional se presenta en el tech report adjunto

Estudio de efectividad (RCT)

Se asignó aleatoriamente una muestra de 60 jóvenes de 15 a 18 años del área de Chicago, con niveles de lectura similares, para realizar hasta 40 minutos de estudio
Comparación: Learn Your Way vs lector PDF convencional
Desempeño inmediato: el grupo de Learn Your Way obtuvo 9 puntos porcentuales más en promedio
Retención a largo plazo (3–5 días después): el grupo de Learn Your Way obtuvo 11 puntos porcentuales más (78% vs 67%)
Evaluación subjetiva: comodidad 100% vs 70% e intención de reutilización 93% vs 67%, confirmando una ventaja en satisfacción
Para complementar los indicadores cuantitativos, se recopilaron hallazgos cualitativos mediante entrevistas en profundidad de 30 minutos, donde se confirmó retroalimentación positiva sobre valor de aprendizaje e inmersión

Por qué funcionó

El pipeline de personalización ajustó el nivel del texto y los ejemplos al contexto del estudiante, contribuyendo a reducir la carga cognitiva y aumentar la relevancia
Las múltiples representaciones facilitaron la conexión entre conceptos, incrementando las pistas para recuperar recuerdos y la posibilidad de transferencia
La adaptación de quizzes y el ciclo de retroalimentación apoyaron la regulación metacognitiva y la corrección de conceptos erróneos

Limitaciones y siguientes pasos

Por ahora está en una etapa inicial de investigación, por lo que se necesita validación repetida con muestras, materias y grupos de edad más amplios
Se plantea expandirlo hacia un sistema adaptativo continuo que ajuste de manera sostenida las representaciones y la dificultad según el progreso y los patrones de error del estudiante
A futuro, se planea seguir combinando principios pedagógicos y medición de efectividad con estrategias de localización adaptadas al contexto regional

Implicaciones y puntos de aplicación

El activo clave es un pipeline operativo que convierte materiales estáticos en artefactos de aprendizaje interactivos y guiados por el propio estudiante
Escuelas, editoriales y empresas edtech pueden escalarlo mediante un sistema de producción estandarizado que combine reajuste de nivel del contenido + sustitución de ejemplos según intereses + despliegue multimodal + adaptación de quizzes
Desde la ingeniería, serán clave el diseño de orquestación de agentes, pipelines de generación modulares y bucles de control de calidad/precisión

2 comentarios

trr245 2025-09-22

Hablo desde la experiencia de haber hecho esto: para la personalización se necesita mucha información, incluso más de 2 gigabytes.

GN⁺ 2025-09-20

Comentarios en Hacker News

Tengo una herramienta llamada asXiv. Permite hacer preguntas a artículos de arXiv.org y también ofrece preguntas sugeridas en la pantalla principal para ayudar a entender o explorar un paper. También hay una demo del popular paper Attention Is All You Need. Todo el código es open source, y para reducir costos usa el modelo Google 2.5 flash lite (actualmente completamente gratis). Si hace falta, también puede ejecutarse localmente con otro modelo cambiando una variable de entorno.
- asXiv está interesante. Agregué el post de Show HN al second-chance pool. Por eso aparecerá de forma aleatoria en la portada de HN. Explicación del second-chance pool
- asXiv también está muy bien, pero algo parecido también se puede hacer en alphaxiv con la función assistant. Solo hay que ir al paper y hacer clic en tools → assistant. Ejemplo en alphaxiv
- Se ve bien y de verdad quiero probarlo después. Una duda: me da curiosidad saber por qué no lo hiciste como un SaaS comercial
- Parece una herramienta realmente fantástica. Yo también hice un producto parecido, Ruminate(www.tryruminate.com), para leer arXiv/epub/pdf. Me gustaría escuchar opiniones
- De verdad me da curiosidad en qué se diferencia del RAG tradicional
Vi en el ejemplo de fundamentos de ciencias computacionales una situación donde a un estudiante de 7º grado le gusta la comida. Por ejemplo, decía cosas como "una lista puede usarse para recetas", "un set sirve para una lista única de ingredientes para una semana", "un map puede usarse en un libro de cocina", "una priority queue es adecuada para gestionar pedidos en una cocina ocupada" o "un grafo de maridaje de alimentos muestra qué ingredientes combinan bien". Creo que están sobreestimando los gustos de un alumno de 7º grado. Yo me aburriría muy rápido
- Definitivamente, cuando yo viví ciencias computacionales en la secundaria, hace 20 años, era muy aburrido. En ese entonces había un ambiente de "hay que aprender Microsoft Office sí o sí". Tras muchos años de voluntariado educativo, muchos chicos hacían preguntas muy prácticas como "¿para qué se usan realmente las funciones trigonométricas?". Los ejemplos de clase y de examen estaban tan desconectados de la vida real que parecían no tener sentido. Mostrar cómo se aplican realmente los conceptos en el mundo real claramente tiene valor pedagógico. La ventaja de los LLM es que pueden transformar esos ejemplos prácticos según los intereses personales. Por ejemplo, me gusta mucho cómo la serie de Red Blob Games explica la búsqueda de rutas con A* usando el caso atractivo de los videojuegos
- Yo he usado la herramienta de estudio con generación de quizzes incluida en gemini. Para lo típico que aparecería en un libro escolar K-12, sí sirve bastante. Las primeras 30 o 40 preguntas de opción múltiple son bastante útiles, pero después se empiezan a repetir las preguntas, los distractores y las explicaciones, y también aparecen respuestas incorrectas o varias respuestas posibles. Las explicaciones también están dentro de lo esperable y parece que les falta QA. Si el usuario revisa todo por su cuenta, todavía puede servir. Pero si lo acepta sin verificar, incluso podría ser perjudicial
- Desde el ejemplo de “una lista puede usarse para recetas”, honestamente no entiendo qué significa. Creo que más bien confundiría a estudiantes de 7º grado
- Me hace pensar en el efecto Hawthorne (efecto de novedad). No está claro si los estudiantes dicen que este tipo de contenido es más interesante porque realmente es mejor o simplemente porque es algo distinto. Wiki del efecto Hawthorne
- En especial, el ejemplo del set seguramente confundiría a estudiantes de 7º grado (más aún si ni siquiera conocen el concepto de set). Decir que "pones una lista única de ingredientes en un set" es técnicamente correcto, pero en una compra real necesitas cantidades, así que no ayuda mucho. Tampoco hace intuitivo qué es un set y, cuando quieras explicar "la diferencia entre lista y set", podría causar todavía más confusión. Incluso la expresión "ingredientes únicos" podría no ser clara para niños de esa edad
Soy exprofesor de física. La capacidad técnica impresiona, pero creo que esto es una innovación con poca efectividad pedagógica. Cuando les enseñas a adolescentes las leyes del movimiento de Newton, la verdadera dificultad es la idea de que la fricción no siempre está presente. Los estudiantes llegan después de toda una vida observando objetos reales en movimiento y traen incorporada una 'teoría del ímpetu' (theory of impetus, enlace wiki). Una IA que identificara las ideas de cada alumno y lanzara preguntas para refutar la teoría del ímpetu sí sería realmente útil, pero lo que Google presentó esta vez no es más que una variante de clase de pizarrón tipo "diapositivas + quiz". El hecho de que en educación se discuta bajo la premisa de que "todas las materias pueden enseñarse de la misma manera" es una de las razones por las que dejé la docencia. Ya llegamos al límite del enfoque neutral respecto a la materia; de aquí en adelante, la clave para mejorar será enfocarnos en la esencia de "qué enseñar y cómo enseñarlo" realmente
- ¿Ese encargado de lenguas que dijo "un buen profesor puede enseñar cualquier materia" era de idiomas extranjeros? Coincido mucho contigo, pero incluso en un enfoque neutral respecto a la materia, métodos de aprendizaje eficaces que no se ponen en práctica, como la repetición espaciada o la evaluación basada en recuperación, siguen sin aparecer en el 80% de las clases de menor nivel. Ya sabemos mucho gracias a la teoría de la educación y del aprendizaje, pero eso todavía no se refleja en el sistema escolar
- Como estudiante, lo entiendo totalmente. La razón por la que me cuesta aprender no es la falta de personalización, sino simplemente que hay demasiado contenido y es difícil. Lo importante es que alguien compruebe con precisión si realmente entendí cada parte del avance (yo lo describiría como un enfoque de "tamaño bocado") y que traduzca el lenguaje de fórmulas o la terminología a palabras sencillas. El Study mode de ChatGPT cumple bastante bien esa función en ciertas materias
- Ten cuidado al hablar de experiencia educativa, porque a la gente de Edutech le da enojo. Llevan 15 años prometiendo una revolución
- En ese momento debiste pedirle al encargado de lenguas que enseñara cálculo tensorial
- Me da curiosidad por qué ese encargado de lenguas dijo eso, si tuvo impacto también en el departamento de ciencias, y si de verdad dejaste la docencia de física por ese comentario
Viendo los servicios de IA de estos días y los cambios forzados en la política de costos de Copilot, me da la impresión de que toda la industria de la IA está desesperada por hacer que el público use un juguete caro. Me pregunto por qué todavía no aparece la clásica advertencia de PG (Paul Graham) de que "la solución está buscando un problema"
- Si ya están involucrados los grupos con poder establecido (grandes empresas, VC, etc.), es natural que no quieran mencionar las limitaciones o debilidades de la tecnología. Su papel es difundir activamente la narrativa positiva de los productos en los que invirtieron, y esa actitud "selectiva" es una forma común de deshonestidad en Big Tech
Pienso que la IA todavía no es lo bastante confiable como para usarla activamente en el aprendizaje. Le pedí que organizara 100 citas de un paper y borró 10, además de inventarse otras 10 sin fundamento. En una situación así, ni siquiera puedo imaginarla sustituyendo un libro de texto
- Sacar la conclusión de que "la IA no puede resumir ni explicar libros de texto" solo por haber tenido una experiencia de "la IA hizo mal una tarea de citas" es un salto lógico. Mucha gente no sabe organizar citas, pero sí resume y explica libros de texto con soltura
- Yo he tenido muchas experiencias usando LLM para que me expliquen bien contenido de libros de texto. Si pego una parte que no entiendo y hago preguntas, suelen responder bastante bien
- Me da curiosidad qué modelo usaste, cuál fue el prompt y cuándo lo intentaste
Me encanta aprender. Llegué hasta la universidad gracias a Khan Academy y todavía uso ChatGPT, Claude y otros cuando estudio papers. Pero los ejemplos de Google me decepcionaron rápido.
- El ejemplo decía: "Nacemos con rasgos genéticos y características biológicas, pero nuestra identidad como seres humanos se desarrolla a través de la interacción en la sociedad. Tanto la psicología como la sociología consideran importante el proceso de self-development"
- Justo después venía la pregunta: "Según el texto dado, ¿cuál es la principal diferencia entre la psicología y la sociología respecto al self-development?"
  - A) La sociología trata los rasgos genéticos y la psicología las normas sociales
  - B) La psicología trata la función social y la sociología la identidad individual
  - C) La psicología se enfoca en las características genéticas y la sociología en la interacción social
  - D) Ambas estudian únicamente características biológicas innatas
- Al leer la pregunta, D me pareció la más plausible y la elegí, pero estaba mal. Me dejó inseguro sobre si había entendido mal. También existe un botón para ver el PDF completo, pero el objetivo de este servicio no es precisamente dividir el contenido en partes pequeñas para repetir y reforzar lo esencial? Además, casi no hay función de retroalimentación, así que resulta muy frustrante. Si yo fuera estudiante, esto me causaría una frustración enorme
- No fue culpa tuya. Todas las opciones están mal. La sociología estudia la sociedad, la cultura, el comportamiento grupal, etc. Esto es una alucinación del LLM
- Todas las respuestas del solucionario están mal. Este sistema quiere que la respuesta sea "C) psicología = genética, sociología = interacción", pero no es cierto que la psicología se centre en la genética
- El propio texto tampoco define psicología y sociología, ni las contrapone. Dice que respondas solo con base en el texto, pero solo se puede resolver trayendo conocimiento externo. Este tipo de generación de preguntas surge porque el LLM interpreta de manera torpe los datos de entrenamiento. El modelo no distingue entre modo reading comprehension (comprensión del texto) y modo didactic (enseñanza), así que este problema no es un bug simple, sino una limitación estructural
- Puede parecer un bug menor, pero en educación la precisión es muy importante. Que se dejen pasar errores tan básicos hace difícil superar el umbral de confianza
Esta tecnología parece tener un potencial considerable. Los profesores humanos no tienen paciencia infinita. Cuando estaba en la preparatoria le pregunté a mi profesor de química "por qué ocurría esa reacción" y me respondió "solo acéptalo y memorízalo, no intentes entenderlo". Después de eso no me convertí en químico. Pero ahora, al contrario, la química me parece interesante. En ese momento, por culpa de un profesor que me apagó por completo la curiosidad, al elegir carrera universitaria evité cualquier cosa relacionada con química. Si hubiera existido una herramienta de IA así en ese entonces, tal vez mi vida habría sido distinta. En cambio, la IA no podría igualar las clases tan personales de mi profesor de historia, que llegaba con armadura medieval y una espada real para demostrar esgrima en vivo. De nuestros 20 compañeros, 2 terminaron siendo doctor en historia y arqueólogo, así que realmente era un profesor extraordinario. Personas así son raras
- Dices que te frustró la respuesta de "solo memorízalo", pero tal vez eso tenga que ver con el fenómeno de 'lie-to-children'(explicación). Querías una comprensión profunda, pero antes de adquirir conceptos avanzados puede ser necesario cierto nivel de memorización básica
- Yo era del tipo que no quería solo el resultado, sino una explicación más profunda de cómo se llegó a él, quién lo descubrió y por qué, etc. La IA generativa podría tener el potencial de ofrecer incluso el contexto y el trasfondo histórico de la información en forma de relato
Me pregunto cómo funcionará esta tecnología en el contexto actual de deterioro de la comprensión lectora, antiintelectualismo y aislamiento social. Por buena que sea la tecnología, también podría terminar siendo un retroceso. Tal vez sea una visión pesimista, pero siento que esto no irá hacia asistir al profesor, sino hacia reemplazarlo
- Ese pronóstico pesimista sobre la alfabetización y la comprensión lectora (ese obituario social) siempre llega demasiado pronto. Al contrario, algunos lectores están orientándose a leer obras extensas en idioma original o contenidos profundos como una forma de resistencia intelectual. Yo estoy ampliando mi vocabulario y capacidad de expresión con 'Word Power Made Easy' de Norman Lewis y 'The Well-Spoken Thesaurus' de Tom Heehler. En ese proceso uso ChatGPT y Gemini como tutores personales. Si les das instrucciones concretas, ayudan a sugerir neologismos o a aclarar frases. De hecho siento que, gracias a la tecnología, mi expresión y comunicación se han fortalecido. Yo, que antes solo escribía correos o diario personal, ahora uso la IA como colaborador y andamiaje para reconstruir episodios de mi vida en cuentos cortos o transformarlos al estilo de autores que admiro. Esto no es reemplazo del docente, sino más bien la base de un renacimiento del aprendizaje autodirigido
- Si te preocupa la caída de la comprensión lectora, el problema no es si se introduce o no más tecnología, sino los valores de la sociedad en su conjunto. Una sociedad que valora la lectura no se deja llevar por demos o promoción en blogs. En cambio, si una sociedad no valora la comprensión, la especialización o a los profesores, siempre buscará atajos para reemplazarlos
No creo que este enfoque sea el mejor, pero coincido mucho con la preocupación de fondo. Yo también recuerdo con claridad que, en primaria y secundaria, los profesores muchas veces dejaban pasar mis preguntas sin dar mucha explicación. Mi mente se quedaba atascada en esas dudas molestas y no podía concentrarse en el tema principal, y el profesor quizá no tenía tiempo para seguir mi pregunta en el contexto de la educación pública, o no estaba lo bastante preparado. El papel que yo quiero para los LLM es ser una herramienta de apoyo que guíe de manera segura la exploración que se desvía del currículo tradicional (distracciones, curiosidad, etc.), pero que al final lleve al estudiante a los objetivos de aprendizaje deseados.
- "¿Cómo y por qué supimos de la existencia del spin del electrón?"
- "¿Por qué esa palabra en inglés se usa de manera excepcionalmente distinta?"
- "¿Qué diferencia de tamaño hay entre un dinosaurio saurópodo y una ballena azul?"
  En mi experiencia, esas curiosidades pequeñas llevan a una comprensión mucho más profunda.
  El TFA (artículo original) plantea: "¿Y si el estudiante pudiera diseñar por sí mismo su propio recorrido de aprendizaje?"
  En realidad, en el ámbito de la no ficción y los libros de texto, eso ya es posible.
  Yo no conocí el libro 'How to Read a Book'(wiki) hasta la preparatoria, y ese libro me abrió los ojos a la idea de que "leer todo de corrido no siempre es la única respuesta".
  Espero que con la IA más estudiantes descubran que existen muchas formas de aprender, incluso fuera del currículo establecido
- Otra anécdota: en la universidad tomé teoría de circuitos (1 y 2) antes que ecuaciones diferenciales (cálculo 4). Gracias a eso, el contenido que veía en clase, como transformadas de Laplace y de Fourier, se conectaba enseguida con otro campo (diseño de circuitos), y la clase me resultaba mucho más interesante
Espero que en el futuro realmente llegue una tecnología como "A Young Lady's Illustrated Primer" de Diamond Age
- ¿Será que el autor de esa novela ya había predicho el futuro desde entonces? Es una historia sobre un mundo lleno de nanotecnología y nanobots
- Incluso cuando compré un pinenote imaginaba ese futuro. Pensaba que sería divertido tener un dispositivo como el diario de Tom Riddle que ayudara a estudiar matemáticas. Pero el desarrollo del lado Linux para pinenote va lento, y yo también me ocupé con otras cosas, así que perdí el interés