Saltar al contenido

Crítica del libro: Estadísticas Bayesianas a la manera de la diversión por Will Kurt

22 de julio de 2020

«Estadísticas Bayesianas a la manera divertida»: Understanding Statistics and Probability with Star Wars, Lego, and Rubber Ducks», de Will Kurt (2019 No Starch Press) es una excelente introducción a temas críticos para todos los científicos de datos. ¡Will Kurt, de hecho, es un científico de datos! Siempre aconsejo a mis clases de ciencia de datos en la UCLA que se dediquen a estos importantes temas para obtener una exposición completa a las disciplinas en las que se basa la ciencia de los datos. Ya he añadido este título a mi bibliografía oficial de recursos de aprendizaje para mis estudiantes.

Los libros que promocionaba eran una guía para principiantes en la aplicación de la estadística a situaciones del mundo real, con ejercicios que colocan al rader en situaciones hipotéticas divertidas y familiares para demostrar las aplicaciones prácticas del Teorema de Bayes. Pienso en el libro como una divertida caja de herramientas escrita por un científico de datos para científicos de datos novatos. Encontrarán que las herramientas y técnicas tienen sentido intuitivo, útiles para convertir datos abstractos o limitados en información práctica. El libro tiene un sitio web asociado que incluye soluciones a los ejercicios del libro y al final de cada capítulo.

«Todo el mundo puede beneficiarse de pensar en los problemas de una manera bayesiana», dijo el autor Will Kurt. «Quería que este libro fuese algo que alguien pudiese estudiar en un vuelo y un aterrizaje de avión capaz de tomar decisiones sólidas que implicasen probabilidades e incertidumbre».

He visto otros libros que se esfuerzan por introducir estos temas, pero el libro de Kurt es algo especial en el enfoque fácil de entender que se ha tomado a lo largo de todo. Hay pocas matemáticas que sean totalmente apropiadas al nivel que se pretende para el lector (hay mucho tiempo para un tratamiento más riguroso matemáticamente en el futuro). Hay una modesta cantidad de código de programación de R (que comienza en el capítulo 4) integrado suavemente en el texto, junto con el Apéndice A que contiene una muy breve introducción a R (más sobre esto a continuación). Tenga en cuenta que este no es un libro de programación, sino más bien un libro descriptivo.

Un recurso brillante para el aprendizaje

Una de las formas en que el libro brilla es su muy lúcida descripción de temas más bien técnicos. Uno de mis capítulos favoritos fue: Capítulo 6 sobre la probabilidad condicional cuando se introduce el Teorema de Bayes. Es uno de los mejores resúmenes que he leído (ciertamente un prerrequisito para leer el trabajo original de Bayes de 1763). También me gustó el Capítulo 8 que amplía el uso del razonamiento Bayesiano. Y los posteriores debates sobre la estimación de parámetros y la prueba de hipótesis son muy útiles para cualquier científico de datos en ciernes.

Otra forma en que los libros brillan es con todos los ejemplos de casos de uso simples y familiares que sirven para solidificar el conocimiento del lector de la forma bayesiana de resolver problemas. Tomemos por ejemplo estos ejemplos bien elaborados: Las probabilidades de C3PO de navegar con éxito por un campo de asteroides en la Guerra de las Galaxias, el razonamiento sobre los ladrillos de LEGO, el Vidente Místico en el episodio «El Nick del Tiempo» de la Dimensión Desconocida, la equidad de los juegos de carnaval (por ejemplo, el billar de patos de goma), etc. La mayoría de los lectores pueden aceptar fácilmente estos ejemplos, y esta accesibilidad reduce la barrera del tema.

Se incluyen los siguientes capítulos:

Parte 1: Introducción a la probabilidad
Capítulo 1: ¿Qué crees y cómo lo cambias?
Capítulo 2: Medición de la incertidumbre
Capítulo 3: La lógica de la incertidumbre
Capítulo 4: Distribuciones de probabilidad 1
Capítulo 5: Distribuciones de probabilidad 2

Parte 2: Probabilidad Bayesiana y Probabilidades Previas
Capítulo 6: Probabilidad condicional
Capítulo 7: Teorema de Bayes con LEGO
Capítulo 8: Posterior, Probabilidad y Anterior
Capítulo 9: Trabajando con distribuciones de probabilidad previas

Parte 3: Estimación de parámetros
Capítulo 10: Introducción a la estimación de parámetros
Capítulo 11: Medición de la difusión de los datos
Capítulo 12: Distribución normal y confianza
Capítulo 13: Herramientas de estimación de parámetros
Capítulo 14: Estimación de parámetros con los Priores

Parte 4: Prueba de hipótesis: El corazón de las estadísticas
Capítulo 15: De la estimación de parámetros a la prueba de hipótesis
Capítulo 16: Comparando las hipótesis con el factor Bayes
Capítulo 17: Razonamiento Bayesiano en la Dimensión Desconocida
Capítulo 18: Cuando los datos no te convencen
Capítulo 19: De la prueba de hipótesis a la estimación de parámetros

Apéndice A: Un curso de choque en R
Apéndice B: Suficientes cálculos para salir adelante

Un par de pequeñas cuevas

Realmente no hay ningún inconveniente en este libro, pero si tuviera que elegir algo para cambiar, sería omitir los dos capítulos del Apéndice. Apéndice A – Una rápida introducción a R es demasiado breve para ser de utilidad real para un lector que no sabe nada de R. Soy un científico de datos que usa R en gran medida y enseño R en mis clases de ciencia de datos y se necesitan al menos 4 clases de instrucción para ponerse al día y ser productivo. Yo simplemente habría recomendado tutoriales, clases o videos para consumir en lugar de tratar de enseñar R en un capítulo de 18 páginas. Apéndice B – Suficiente cálculo para salir adelante es aún menos útil. ¿En serio? ¿Cálculo en 12 páginas? Curiosamente, el lector de este libro ni siquiera necesita entender el cálculo, así que, ¿por qué molestarse?

Conclusión

Las estadísticas bayesianas a la manera divertida demuestra que las estadísticas no tienen por qué ser aburridas y restaura su lugar legítimo como ciencia viva que puede beneficiar a todo el mundo. Un libro muy recomendado para todos, especialmente para los científicos de datos en etapa inicial.

Recomendado:  Desafíos de IO en la cadena de suministro conectada