Vectores aleatorios. Función de probabilidad y de densidad conjunta. Independencia. Sumas de variables aleatorias. Esperanza condicional. Distribución normal multivariada, Ley de los Grandes Números, Teorema Central del Límite y Teorema Central del Límite Multivariado. Método Delta Multivariado.
Métodos exploratorios de datos. Medidas resumen. Boxplot. Frecuencia relativa. Histogramas. Estimación de densidad. Clasificación Bayes Naive. Modelos de Regresión. Estimación de la función de regresión. Estimadores no paramétricos: Nadaraya, KNN. Clusters por el método de k-medias.
Estimación. Sesgo, varianza y error cuadrático medio. Compromiso sesgo-varianza. Estimación en modelos paramétricos: máxima verosimilitud, momentos, M estimadores. Propiedades asintóticas: consistencia y distribución asintótica. Intervalos de confianza para la media de una distribución normal con varianza conocida. Intervalos de confianza para la media de una distribución normal con varianza desconocida: Distribución t de Student. Intervalos de confianza de nivel asintótico basados en estadísticos asintóticamente normales. Intervalos de confianza para proporciones. Intervalos de confianza para dos muestras. Bootstrap.
Hipótesis nula y alternativa. Tipos de errores. Nivel y potencia de un test. Valor "p". Tests para la media de una población normal con varianza conocida y con varianza desconocida. Tests de Wald (basados en estadísticos asintóticamente normales). Tests e intervalos de confianza para dos muestras. Relación entre tests e intervalos de confianza. Comparación del vector de medias de dos poblaciones multivariadas. El problema de comparaciones múltiples o cubrimiento simultáneo. Tests no paramétricos.
Óptimo lineal poblacional. Mínimos cuadrados. Supuestos. Inferencia para los parámetros del modelo: bajo normalidad y teoría asintótica. Predicción. Regresión no lineal. Ajuste y sobreajuste. Métodos de regularización (Ridge, Lasso, etc.). Técnicas y métricas de evaluación de modelos-métodos (validación cruzada, etc.)
Cluster,T-sne. Clasificación. Curvas ROC. Reducción de la dimensión: componentes principales, correlación canónica, projection pursuit.
Árboles de decisión. Regresión logística: estimación de parámetros por máxima verosimilitud. Redes Neuronales. Modelo lineal generalizado. Técnicas y métricas de evaluación de modelos-métodos (validación cruzada, etc.)
En esta materia los alumnos se familiarizarán con la aplicación a problemas reales de las técnicas de inferencia estadística y análisis de datos estudiados en las materias previas.
Una vez aprobadas todas las asignaturas y a partir de la experiencia adquirida en las mismas, los alumnos deberán elaborar y presentar un Trabajo Final Integrador de manera individual. Este trabajo tendrá como objetivo permitir la integración de todos los conocimientos adquiridos durante la Carrera. Para esto se propondrá a cada alumno un conjunto de datos reales solicitando que se los analice usando los métodos estadísticos más adecuados para el mismo teniendo en cuenta un determinado propósito en vista. Los alumnos deberán presentar por escrito un informe con el análisis realizado y las conclusiones obtenidas, describiendo en forma detallada las metodologías aplicadas y la justificación de las conclusiones finales.
Su evaluación estará a cargo de la Comisión Académica y recibirá una calificación de 0 a 10. Se establece un plazo de seis meses para la entrega del trabajo final integrador a partir del momento en el que el trabajo es asignado.
Offline Website Builder