Inteligencia artificial probabilística
-
La inteligencia artificial se refiere a la ciencia e ingeniería de sistemas artificiales capaces de realizar tareas que requieren inteligencia humana. En los últimos años ha habido avances interesantes en enfoques de aprendizaje centrados en datos y basados en el aprendizaje, y el aprendizaje automático y el aprendizaje profundo han hecho posible nuevas formas en que los sistemas computacionales perciben el mundo. El aprendizaje por refuerzo ha logrado avances decisivos en juegos complejos como el Go y en tareas de robótica.
-
Un aspecto central de la inteligencia es no solo hacer predicciones, sino también comprender la incertidumbre de esas predicciones y tomarla en cuenta al tomar decisiones. Este artículo trata sobre la "inteligencia artificial probabilística".
Enfoque probabilístico
- La primera parte aborda el enfoque probabilístico del aprendizaje automático. Se analiza la diferencia entre la incertidumbre "epistémica" causada por la falta de datos y la incertidumbre "aleatoria", que surge, por ejemplo, de observaciones y resultados con ruido. Se discuten enfoques concretos para la inferencia probabilística y enfoques modernos para una inferencia aproximada eficiente.
Consideración de la incertidumbre en tareas de decisión secuencial
- La segunda parte trata sobre cómo considerar la incertidumbre en tareas de decisión secuencial. Se examinan el aprendizaje activo y la optimización bayesiana, que son enfoques para recopilar datos proponiendo experimentos informativos con el fin de reducir la incertidumbre epistémica. Se consideran el aprendizaje por refuerzo y los enfoques modernos de deep RL que usan aproximación funcional con redes neuronales. Se discuten enfoques modernos de RL basado en modelos, que aprovechan la incertidumbre epistémica y aleatoria para guiar la exploración y considerar la seguridad.
1 comentarios
Comentarios de Hacker News
El texto tiene excelentes diagramas explicativos y parece ofrecer una visión general de alta calidad del aprendizaje automático desde la perspectiva de la probabilidad
Encontré este material hace unos días y buscaba una excusa para revisarlo en serio, porque Andreas Krause ha hecho trabajo profundo e interesante sobre Gaussian Processes y Bandits
La realidad existencial es una distribución de potenciales, no un arreglo de estados
Pregunta sobre si un LLM (es decir, una red neuronal) puede decir la probabilidad de la respuesta que acaba de soltar
Creo que se necesita una GUI para democratizar la interpretabilidad de los modelos y permitir que incluso los gamers la exploren
Creo que los Gaussian Processes con el kernel adecuado pueden ser muy potentes incluso con unos pocos puntos de datos y un conjunto pequeño de parámetros
Parece coincidir en parte con la mejor referencia sobre el tema. Se menciona "An Introduction to Statistical Learning", de Gareth James y otros
Kevin Murphy está renombrando su serie Probabilistic Machine Learning
Gemini 2.0 Experimental 02-05 vio esto con "solo" 107K tokens
La Laplace Approximation es una forma "rápida y simple" de convertir una distribución de probabilidad compleja en una Gaussian simple (curva de campana)
Tomé este curso en ETH Zurich y es una de mis clases favoritas