Análisis de datos bayesianos, 3.ª edición (2013) [pdf]

(sites.stat.columbia.edu)

2 puntos por GN⁺ 2025-09-29 | 1 comentarios | Compartir por WhatsApp

Análisis de datos bayesianos es un libro de texto ampliamente utilizado en los campos de la estadística y la ciencia de datos
Este libro se enfoca en el modelado probabilístico y la inferencia bayesiana, y aborda diversos métodos de análisis aplicables en la práctica
Cubre ampliamente técnicas computacionales e implementaciones basadas en casos reales, como MCMC
Ofrece un equilibrio entre teoría y ejemplos prácticos para que pueda ser comprendido desde principiantes hasta expertos
También tiene una alta utilidad en áreas como aprendizaje automático, medicina y ciencias sociales

Introducción

Análisis de datos bayesianos, 3.ª edición es un texto fundamental que introduce de forma sistemática la inferencia bayesiana en los campos de la estadística, las ciencias de la computación y la ingeniería
Enfatiza el pensamiento probabilístico y el análisis de datos bajo incertidumbre

Conceptos de modelado bayesiano

El libro parte de los conceptos de probabilidad previa (prior) y probabilidad posterior (posterior), y explica en detalle métodos de inferencia basados en datos reales
Presenta la teoría básica para tratar diversas distribuciones de probabilidad, la estimación de parámetros y los problemas de predicción

Aplicaciones del análisis de datos reales

Incluye diversos estudios de caso y ejemplos de aplicación utilizando conjuntos de datos reales
También profundiza en técnicas prácticas como el diseño de modelos, el preprocesamiento de datos y MCMC (Markov Chain Monte Carlo) para cómputo
Proporciona fragmentos de código aplicables en entornos prácticos como R y Python

Temas avanzados

También cubre ampliamente modelos estadísticos avanzados como modelos jerárquicos, análisis multivariado y métodos bayesianos no paramétricos
Describe además métodos prácticos de diagnóstico de modelos y optimización

Uso e impacto

Este libro sigue utilizándose de forma constante como referencia en una amplia variedad de campos como aprendizaje automático, bioinformática, estadística médica, negocios y ciencias sociales
Permite aprender de forma sistemática herramientas y procesos de análisis bayesiano aplicables al trabajo real

1 comentarios

GN⁺ 2025-09-29

Comentarios de Hacker News

Es mi libro de estadística favorito. El autor, Andrew Gelman, creó una nueva área de la estadística bayesiana moderna a partir de su investigación teórica sobre modelos bayesianos jerárquicos, y también presentó Stan para su aplicación práctica. Yo lo estudié poco a poco durante cerca de un año, incluyendo los apéndices. Después, me sirvió muchísimo como base para investigar modelos bayesianos jerárquicos. Más que un libro introductorio, lo recomiendo muchísimo a quienes quieran llevar sus habilidades de estadística al siguiente nivel. Si primero lees los capítulos 1 al 5, puedes entender muy bien la filosofía de modelado de Gelman, y recomiendo elegir después temas de interés revisando el índice
- Me gusta mucho Gelman, pero decir que "fundó una nueva área de la estadística bayesiana" es una afirmación algo exagerada
- Pregunta si hay algún libro o curso de estadística recomendable para leer antes de poder entender este libro
- Tiene curiosidad por saber si hay algún buen libro enfocado en estadística aplicada a pruebas reales en áreas como investigación médica, optimización o manufactura
Conocí a Gelman por primera vez gracias a una excelente explicación visual de la regresión lineal. Ahí también se cita Regression and Other Stories, pero como no cubre los capítulos relacionados con Bayes, me dieron ganas de leer más sobre eso
He comprobado en carne propia lo útil que puede ser el análisis bayesiano. Una vez nuestro equipo tuvo que decidir cuántos elementos había que muestrear entre varios millones para poder validar la calidad, y ahí encontramos una solución muy elegante con análisis bayesiano. La matemática en sí no era difícil, y aun así me sorprendió ver lo conservadores que fueron los ingenieros para aprender una técnica tan básica. Eso a pesar de que todos habían aprendido bien las matemáticas de primer año de universidad
- Tiene curiosidad por saber qué era lo que rechazaban los ingenieros y por qué deberían aprenderlo. Muchos ingenieros toman por lo menos un curso introductorio de estadística, pero no está claro por qué tendrían que aprender estadística bayesiana. Incluso interpretar correctamente p-value, coeficientes de regresión o efectos de interacción ya es difícil, y su utilidad real podría ser limitada. Al contrario, tampoco hace falta que un científico de datos haga toda la parte de ingeniería, como pipelines de despliegue automatizado, pods de Kubernetes o entrenamiento distribuido de modelos de pytorch; para eso existe la división del trabajo
BDA es el mejor libro para aprender modelado bayesiano de manera rigurosa y profunda. Además, hay enfoques diversos como Statistical Rethinking de Richard McElreath y Regression and Other Stories de Gelman y Aki. Yo escribí un libro centrado en código y ejemplos, y está disponible gratis en acceso abierto
Los materiales del curso relacionados se pueden ver aquí
Me gusta el blog de estadística que Gelman impulsa principalmente en Columbia. En statmodeling.stat.columbia.edu hay muchas discusiones interesantes sobre estadística
- Gracias por compartirlo; también pide recomendaciones de publicaciones especialmente memorables si alguien tiene alguna
Para principiantes, Doing Bayesian Data Analysis de John Kruschke me pareció mucho mejor porque es fácil de entender y agradable de leer
- BDA es un libro para posgrado, y aunque la matemática no sea especialmente difícil, asume lectores que al menos hayan llevado un primer curso de estadística matemática
Me interesa mucho, pero este texto se me hace demasiado pesado. Ojalá existiera un curso exprés para aprender solo las técnicas bayesianas necesarias para un ingeniero de rendimiento de sistemas. Si alguien conoce bien ambas áreas, me gustaría saber qué temas debería incluir y si puede recomendar materiales para estudiar por cuenta propia
- El libro que siempre uso cuando enseño estadística es Statistical Rethinking. Se enfoca en cómo pensar realmente el modelado: cómo analizar hipótesis y entender qué hipótesis implica un modelo. Tiene partes difíciles, pero también ahí está lo interesante, y el libro lo enseña muy bien. La desventaja es que no es gratis (aunque las clases del autor están gratis en YouTube, así que recomiendo mucho verlas incluso sin el libro). Además, Regression and Other Stories, del que Gelman es uno de los autores, explica este tema de forma más accesible. También recomiendo Think Bayes y Bayesian Methods for Hackers para principiantes con experiencia en programación. En aprendizaje automático, recomiendo Probabilistic Machine Learning de Kevin Murphy, porque se enfoca en las ventajas de los métodos probabilísticos (bayesianos). Solo leí la edición anterior, pero he oído muy buenos comentarios de la nueva
- También valen la pena Bayesian Methods for Hackers (GitHub) y los materiales en línea de O'Reilly Bayesian Methods for Hackers
El pensamiento cuantitativo básico y la intuición estadística siguen siendo importantes. Aunque no se aprendan en Bayes, hay que aprenderlos en algún lado. Según la "regla de la raíz cuadrada de n", la relación señal-ruido mejora en proporción a la raíz cuadrada del número de mediciones. Pero, como decía mi padre, "mientras más promedias datos malos, más probable es que te acerques cada vez más a una respuesta equivocada", así que hay que tener cuidado
Un foundation model puede verse como una especie de estimador aproximado de probabilidad posterior (interference), donde la incertidumbre normalmente se omite. Si se aprovechara mejor un enfoque bayesiano, quizá el rendimiento podría mejorar
Hay muchos problemas donde los datasets no son gigantes, así que los foundation model no son adecuados para todos los casos; dependiendo de la tarea, los métodos bayesianos siguen siendo muy válidos
La regla de Bayes es fundamental para la inferencia probabilística, así que los métodos bayesianos son necesarios para tratar cuantitativamente la incertidumbre. Todavía faltan métodos eficientes para aplicarlos a modelos de deep learning, pero en principio podrían dar mejores resultados
También es totalmente posible ajustar modelos bayesianos (como con inferencia variacional) usando datos grandes y redes neuronales, así que siguen siendo relevantes
Estoy esperando el libro Bayesian workflow

Análisis de datos bayesianos, 3.ª edición (2013) [pdf]

Introducción

Conceptos de modelado bayesiano

Aplicaciones del análisis de datos reales

Temas avanzados

Uso e impacto

Lecturas relacionadas

1 comentarios

Comentarios de Hacker News