[general_dat] Seminario ModEsto - Esteban Tabak
Pablo Groisman
pgroisma at dm.uba.ar
Mon Aug 7 13:13:25 -03 2023
Seminario de modelos estocásticos
Viernes 11/8, 12hs, Sala de conferencias del Departamento de Matemática.
Esteban Tabak (Courant Institute)
*Explicación de variabilidad y descubrimiento de factores latentes en datos
a través del transporte óptimo*
*Resumen*: Determinar cómo un conjunto x de variables de interés depende de
factores z es un problema central en el análisis de datos. Nos permite
predecir valores futuros de x, tales como el estado del tiempo este fin de
semana, elegir valores de z sobre los que tenemos control, como
tratamientos médicos o políticas ambientales, y encontrar factores z
ocultos, por ejemplo para caracterizar mejor la reacción esperable de un
paciente particular a un tratamiento, o para reducir la dimensión de los
datos x a la de unos pocos z que expliquen una gran fracción de su
variabilidad, como en componentes principales.
En esta charla, discutiremos cómo el problema del baricentro en transporte
óptimo provee una formulación natural y versátil para esta tarea,
caracterizando la dependencia entre x y z a través de una distribución
condicional P(x | z) y buscando un mapa y = T(x | z) que remueva de x toda
variabilidad que z pueda explicar. En particular, nos permite extender
significativamente herramientas clásicas de regresión, clasificación,
separación en clases y reducción dimensional.
Más información sobre la lista de distribución general_dat