MIT 6.S184: Introducción al flow matching y a los modelos de difusión
(diffusion.csail.mit.edu)Introducción al flow matching y a los modelos de difusión
- La clase de ciencias de la computación 6.S184 de MIT es un curso sobre IA generativa que utiliza ecuaciones diferenciales estocásticas.
- Los modelos de difusión y basados en flujo se han consolidado como tecnología de punta de la IA generativa en diversas modalidades de datos, como imágenes, video y música.
- Este curso tiene como objetivo construir desde cero las bases matemáticas de estos modelos, y al final de la clase los estudiantes habrán construido por sí mismos un modelo de difusión de imágenes de juguete.
- Este curso es ideal para estudiantes que buscan comprender de forma rigurosa la teoría y la práctica de la IA generativa.
Notas de clase
- Las notas de clase son el eje central del curso y ofrecen una explicación independiente de todo el material.
- Las diapositivas de clase se proporcionan como apoyo visual y no son material independiente.
Clases
-
Clase 1: Modelos de flujo y difusión
- Introducción a los modelos generativos
- Ecuaciones diferenciales ordinarias y estocásticas
- Muestreo en modelos de flujo y difusión
-
Clase 2: Construcción de objetivos de entrenamiento
- Trayectorias de probabilidad condicionales y marginales
- Ecuación de continuidad y ecuación de Fokker-Planck
- Campos vectoriales marginales y función de score marginal
-
Clase 3: Entrenamiento de modelos de flujo y difusión
- Flow matching
- Score matching
- Diversos enfoques de modelos de difusión
-
Clase 4: Construcción de un generador de imágenes
- Guiado y generación condicional
- Arquitecturas de redes neuronales
- Revisión de modelos de vanguardia
-
Clase 5: Robótica generativa
- Clase invitada de Benjamin Burchfiel
- Modelos de acción a gran escala
- Modelos de difusión para robótica
-
Clase 6: Diseño generativo de proteínas
- Clase invitada de Jason Yim
- Diseño de nuevas proteínas con IA
- Flow matching para la generación de estructuras de proteínas
Prácticas
- Hay 3 prácticas incluidas con el curso, que permiten construir paso a paso modelos de flow matching y difusión.
- Las prácticas pueden abrirse y realizarse en Google Colab.
Instructores
- Peter y Ezra imparten el curso en conjunto, y Tommi Jaakkola participa como patrocinador y asesor.
- Peter Holderrieth es estudiante de doctorado, y Ezra Erives es estudiante de maestría en ingeniería.
Requisitos previos
- Se requieren álgebra lineal, análisis real y teoría básica de probabilidad, además de experiencia con Python y PyTorch.
Aviso
- Este curso no trata sobre modelos de lenguaje grandes (LLM). Aunque los LLM incluyen datos discretos como texto, este curso se centra en datos de espacios continuos como imágenes, video y estructuras de proteínas.
Agradecimientos
- Este curso no habría sido posible sin el apoyo de muchas personas y organizaciones.
- Se expresa agradecimiento al profesor Tommi Jaakkola, a Lisa Bella y Ellen Reid de MIT EECS, y a muchas otras personas.
1 comentarios
Opiniones en Hacker News
La clase de MIT "6.S184: Introduction to Flow Matching and Diffusion Models" fue publicada en YouTube
Los flujos normalizantes condicionales son una de las soluciones más elegantes para los problemas de diseño inverso
La última década ha sido una época dorada para la educación en deep learning
Es una gran clase, quiero tomarla pronto
Me pregunto si existe alguna colección que reúna todos los cursos públicos sobre las tecnologías de IA más recientes
Estoy muy agradecido con MIT OCW y sus colaboradores
Parece que los LLMs han desviado mucha atención, a pesar de que esta tecnología es muy útil
Es excelente que MIT ofrezca contenido oportuno y relevante de forma gratuita
Muchas gracias, me pregunto si hay otros cursos de OCW sobre IA moderna
Bien hecho, felicidades