‘Executive Data Science‘ es un libro que entiendo está hecho expresamente como libro de texto para el programa de especialización del mismo nombre que sus autores, profesores de la Johns Hopkins University, ofrecen sobre la plataforma Coursera y esa es, precisamente, la vía por la que llegué a esta obra y la leí, como apoyo a la realización del curso.
- ‘A crash course on data science‘ centra el significado de la disciplina de Ciencia de los Datos y cómo se relaciona con la estadística, el ‘machine learning’ o la ingeniería de software. También habla de cómo se estructura un proyecto de Ciencia de Datos, qué resultados se obtienen y cómo identificar si el proyecto ha sido exitoso o no. Además proporciona algunas sugerencias sobre herramientas que se pueden utilizar.
- ‘Building the Data Science Team‘ Se centra en la constitución y gestión de los equipos humanos, identificando los diferentes roles, y cómo gestionar tanto las relaciones dentro del equipo como de éste con otros actores.
- ‘Managing Data Analysis‘ Se centra en el proceso de trabajo, con sus fases y la mejor forma de ejecutarlas. Concede mucha importancia a la formulación de la pregunta que se desea contestar con el análisis e identifica la tipología de preguntas posibles. Se detiene también bastante en el análisis exploratorio inicial y en la diferenciación entre análisis asociacionales y análisis predictivos.
- ‘Data Science in real Life‘ contrariamente a lo que el título sugiere, es probablemente el capítulo más tecnico y complejo. La idea es comparar el proyecto de análisis de datos ideal con lo que se suelen encontrar los científicos de datos en la práctica pero, en esa comparativa, se identifican muchas técnicas, algunas complejas, para ayudar a gestionar esas ‘imperfecciones’.
![]() |
Brian Caffo |
El doctor Brian Caffo es profesor en el departamento de Bioestadística en la Johns Hopkins University Bloomberg School of Public Health. Se graduó en Estadística por la Universidad de Florida en 2001. Trabaja en los campors de estadística computacional y neuroinformática y es creador del grupo de trabajo SMART (www.smart-stats.org) y ha recibido varios premios como el Presidential Early Career Award for Scientist and Engineers (PECASE), Bloomberg School of Public Health Golden Apple y AMTRA teaching.
![]() |
Roger D. Peng |
Roger D. Peng es profesor de Bioestadística en la Johns Hopkins Bloomberg School of Public Health y co-editor del blog ‘Simply Statistics‘. Recibió su doctorado en estadística de la Universidad de California en Los Ángeles y es un investigador destacado en las áreas de contaminación del aire y evaluación del riesgo para la salud así como en métodos estadísticos para los datos de medioambiente. Recibió en 2016 el premio Mortimer Spiegelman de la American Public Health Association que premia a estadísticos que han hecho una aportación destacada a la estadística de la salud.
![]() |
Jeffrey T. Leek |
Jeef Leek es profesor ayudante de Bioestadística en la Johns Hopkins Bloomberg School of Public Health y coeditor del blog ‘Simply Statistics’. Recibió su doctorado en Bioestadística por la Universidad de washington y es reconocido por sus aportaciones en análaisis de datos genómicos y métodos estadísticos para medicina personalizada. Sus análisis de datos han ayudado a entender los mecanismos moleculares que hay detrás del desarrollo del cerebro, la autoirenovación de células madre y la respuesta inmune a grandes traumatismos. Su trabajo ha aparecido en destacadas revistas científicas y médicas como Nature, Proceedings of the National Academy of Sciences, Genome Biology, y PLoS Medicine. Creó el módulo de Análisis de Datos como parte del itinerario de un año en métodos estadísticos para estudiantes en la Universidad Johns Hopkins, curso que ha recibido un premio de excelencia en educación, como resultado de la votación de los estudiantes en la Johns Hopkins.