Seminario de Estadística Matemática 4

27 de junio 2024

Instituto de Cálculo - Edificio 0 + Infinito – Facultad de Ciencias Exactas y Naturales – Ciudad Universitaria (UBA)

Dani Gamerman

El Seminario de Estadística Matemática Multisede en Argentina es un espacio diseñado para ser un punto de encuentro para la estadística matemática en nuestro país. Es organizado conjuntamente por la Facultad de Ingeniería Química de la Universidad Nacional del Litoral, la Universidad de San Andrés, la Universidad Torcuato Di Tella y el Instituto de Cálculo (UBA-Conicet).

El objetivo de este espacio es la actualización permanente sobre los avances dentro de la disciplina y fomentar la conexión con el trabajo de la comunidad estadística en diferentes lugares de Argentina. 

El cuarto encuentro se realizará el 27 de junio a las 12hs, en modalidad virtual. Estará a cargo de Dani Gamerman de la Universidad Federal de Río de Janeiro.

En esta oportunidad, el expositor hablará sobre "Análisis espacial exacto mediante aumento de procesos". El avance de la estadística bayesiana ha crecido considerablemente en las últimas décadas dando lugar a modelos con una complejidad cada vez mayor. Este crecimiento vino acompañado de la necesidad de aproximaciones y nos acostumbramos a ellas. Algunas de ellas son computacionales para la extracción de información de la distribución posterior, pero otras aproximaciones son causadas por la supuesta incapacidad de manejar los modelos tal como fueron planteados. Un ejemplo importante lo proporcionan los patrones de puntos (PP). Esta es una de las estructuras de datos más comunes en el análisis espacial, donde se observan las ubicaciones de ocurrencia de un determinado fenómeno de interés. La estimación de la intensidad de la ocurrencia es el interés principal en muchos entornos habituales. Sin embargo, la probabilidad de la intensidad no paramétrica no está disponible analíticamente. Generalmente se aplican aproximaciones, lo que induce sesgos y pérdidas en todos los procedimientos inferenciales basados en la probabilidad. Esta ineficiencia la heredan todos los modelos que contienen componentes de PP.

El uso de procesos gaussianos (GP) para inducir suavidad en la función de intensidad aporta mayor complejidad.

Esta charla abordará estas complicaciones y propondrá procedimientos exactos para remediar la situación. Estos procedimientos se basan en el aumento con procesos latentes y, lo que es más importante, evitan aproximaciones de modelos.

Esta idea abre un marco para manejar una variedad de modelos que involucran componentes de PP sin comprometer su integridad. Los ejemplos incluyen el uso de regresión PP con coeficientes que varían en el espacio, geoestadísticas con preferencia de muestreo, análisis de datos de solo presencia en Ecología y funciones de intensidad no estacionarias/discontinuas. Se requirieron diferentes procesos de aumento para los contextos anteriores. Se presentan resultados de pruebas con datos sintéticos, comparación contra alternativas y aplicaciones a datos reales.

Se abordan brevemente los problemas asociados con el costo de la computación con GP, la paralelización y el software.