Ciencia de Datos: Herramientas Avanzadas de Análisis Estadístico
A confirmar (1er cuatrimestre 2021)
Modalidad Virtual
Dr. Andrés Farall
El curso estará a cargo del Dr. Andrés Farall, Profesor Adjunto en Matemática Industrial y Ciencia de Datos de la FCEyN.
HORARIO: Martes y jueves de 15 a 18 hs. (A CONFIRMAR- SUJETA A CONFIRMACION DEPARTAMENTAL)
*Se dictará durante el primer cuatrimestre del año 2021, y cuenta con una carga horaria de 96 (noventa y seis) horas, distribuidas en 6 hs semanales, en 2 encuentros de 3 horas cada uno.
El curso procura brindar herramientas aplicadas, provenientes principalmente de la estadística y del machine learning, útiles para la descripción, el análisis y el modelado de datos en un contexto científico interdisciplinario. Todas las técnicas estudiadas son implementadas en R, y ejemplificadas con conjuntos de datos reales y simulados. El enfoque particular del curso se centra en los datos y en la selección de métodos de análisis que se ajustan a ellos. Se intentará dotar al estudiante del conocimiento de una amplia variedad de técnicas útiles en el contexto de la ciencia de datos. Un énfasis especial se dedica a las novedosas técnicas de descripción y visualización de datos disponibles en el entorno R.
El enfoque del curso es “hands-on” e incremental en complejidad. El curso se divide en Módulos de creciente complejidad en los que se aprenden desde el inicio del curso técnicas que obedecen a los tres componentes fundamentales de la Ciencia de Datos:
Descriptivo: Análisis y descripción de los datos.
Explicativo: Inferencia y modelado de los datos.
Predictivo: Entrenamiento de algoritmos para aplicar en futuras predicciones.
Estos tres componentes se alternan intencionalmente a lo largo de los módulos, con la finalidad de representar el proceso real del trabajo de campo en Ciencia de Datos.
Contenidos del Curso
Módulo 0: Introducción
El Eje Descripción-Predicción-Explicación (DPE)
Oposición Explicación Versus Predicción
Enfoque Descriptivo, caracterización y ejemplos.
Enfoque Explicativo, caracterización y ejemplos.
Enfoque Predictivo, caracterización y ejemplos.
Herramientas Explicativas del Enfoque Predictivo
Efectos Parciales
Valores SHAP
Herramientas Predictivas del Enfoque Explicativo
Selección de Modelos
Feature Engineering- Smoothers
Metaheurísticas: Bagging Vs, Boosting
La Optimización como denominador común, del Gradiente Descendente a los Algoritmos Genéticos