[general_dat] Invitación a cursar Procesamiento de señales, audio y habla

Pablo Riera priera at dc.uba.ar
Thu Feb 13 13:57:37 -03 2025


Hola,

En este cuatrimestre se vuelve a ofertar una materia optativa sobre
procesamiento del habla y en esta ocasión con nuevos contenidos sobre
procesamiento de señales y audio! Quedan todos invitados a cursar Procesamiento
de señales, audio y habla. Web del curso
https://sites.google.com/view/audioexactas

Detalles del curso:

   -

   Días y horarios: Jueves de 9 a 13 h (presencial)
   -

   Carga horaria: 4 horas semanales
   -

   Evaluación: ejercicios semanales + un parcial + un trabajo final con
   presentación

Créditos y puntos:

   -

   3 puntos de optativa para Licenciatura en Computación (plan 93).
   -

   64 créditos para Licenciatura en Computación (plan 2023).
   -

   64 horas para la carrera de Ciencia de Datos.
   -

   puntos a confirmar para el Doctorado en Computación.

Correlativas obligatorias:

   -

   Para Lic. en Computación: Probabilidad y Estadística, Métodos Numéricos
   y Algoritmos III.
   -

   Para Lic. en Ciencia de Datos: Probabilidad, Álgebra Lineal
   Computacional y Algoritmos III.
   -

   Para Lic. en Física: Laboratorio 5, Física Teórica 3 y Cálculo Numérico.


Resumen:

La materia tiene como objetivo introducir a los estudiantes en conceptos
esenciales relacionados con el procesamiento de señales, audio y habla,
abordando tanto enfoques tradicionales como las técnicas actuales basadas
en redes neuronales. Este curso proporcionará a los participantes una
primera exposición a los fundamentos del procesamiento de señales,
incluyendo filtros y análisis de Fourier y modelos clásicos para el
modelado de secuencias como cadenas de Markov ocultas y procesamiento de
secuencias con autómatas. Luego se pasará a ver métodos actuales basados en
redes neuronales como el aprendizaje de representaciones auto-supervisado,
codecs neuronales y síntesis de audio. Así mismo se verán temas de
acústica, producción de habla, modelos de lenguaje y buenas prácticas de
aprendizaje automático. Dentro de las aplicaciones, se verán temas
como reconocimiento y síntesis de habla, reconocimiento de géneros
musicales, detección de emociones, entre otros.

Contenidos principales:

   -

   Análisis de señales en el dominio del tiempo y de la frecuencia,
   procesamiento de señales en tiempo real, análisis espectral.
   -

   Acústica, producción y percepción del sonido, sistema fonador, fonética.
   -

   Modelado de lenguaje, secuencias y series de tiempo (ARMA, HMM, N-GRAMS,
   FSTs)
   -

   Aprendizaje profundo en señales, redes neuronales, CNNs, RNNs,
   transformers.
   -

   Reconocimiento automático y síntesis de habla
   -

   Aprendizaje de representaciones, autoencoders, transferencia de
   aprendizaje a problemas de habla y audio
   -

   Modelos generativos, audio-LMs, síntesis de música, compresión de audio,
   denoising.

Bibliografía: detalles en la web
<https://sites.google.com/view/audioexactas/p%C3%A1gina-principal#h.l18qb4ol3vv5>

Saludos
Pablo Riera


Más información sobre la lista de distribución general_dat