[general_dat] Invitación a cursar Procesamiento de señales, audio y habla
Pablo Riera
priera at dc.uba.ar
Thu Feb 13 13:57:37 -03 2025
Hola,
En este cuatrimestre se vuelve a ofertar una materia optativa sobre
procesamiento del habla y en esta ocasión con nuevos contenidos sobre
procesamiento de señales y audio! Quedan todos invitados a cursar Procesamiento
de señales, audio y habla. Web del curso
https://sites.google.com/view/audioexactas
Detalles del curso:
-
Días y horarios: Jueves de 9 a 13 h (presencial)
-
Carga horaria: 4 horas semanales
-
Evaluación: ejercicios semanales + un parcial + un trabajo final con
presentación
Créditos y puntos:
-
3 puntos de optativa para Licenciatura en Computación (plan 93).
-
64 créditos para Licenciatura en Computación (plan 2023).
-
64 horas para la carrera de Ciencia de Datos.
-
puntos a confirmar para el Doctorado en Computación.
Correlativas obligatorias:
-
Para Lic. en Computación: Probabilidad y Estadística, Métodos Numéricos
y Algoritmos III.
-
Para Lic. en Ciencia de Datos: Probabilidad, Álgebra Lineal
Computacional y Algoritmos III.
-
Para Lic. en Física: Laboratorio 5, Física Teórica 3 y Cálculo Numérico.
Resumen:
La materia tiene como objetivo introducir a los estudiantes en conceptos
esenciales relacionados con el procesamiento de señales, audio y habla,
abordando tanto enfoques tradicionales como las técnicas actuales basadas
en redes neuronales. Este curso proporcionará a los participantes una
primera exposición a los fundamentos del procesamiento de señales,
incluyendo filtros y análisis de Fourier y modelos clásicos para el
modelado de secuencias como cadenas de Markov ocultas y procesamiento de
secuencias con autómatas. Luego se pasará a ver métodos actuales basados en
redes neuronales como el aprendizaje de representaciones auto-supervisado,
codecs neuronales y síntesis de audio. Así mismo se verán temas de
acústica, producción de habla, modelos de lenguaje y buenas prácticas de
aprendizaje automático. Dentro de las aplicaciones, se verán temas
como reconocimiento y síntesis de habla, reconocimiento de géneros
musicales, detección de emociones, entre otros.
Contenidos principales:
-
Análisis de señales en el dominio del tiempo y de la frecuencia,
procesamiento de señales en tiempo real, análisis espectral.
-
Acústica, producción y percepción del sonido, sistema fonador, fonética.
-
Modelado de lenguaje, secuencias y series de tiempo (ARMA, HMM, N-GRAMS,
FSTs)
-
Aprendizaje profundo en señales, redes neuronales, CNNs, RNNs,
transformers.
-
Reconocimiento automático y síntesis de habla
-
Aprendizaje de representaciones, autoencoders, transferencia de
aprendizaje a problemas de habla y audio
-
Modelos generativos, audio-LMs, síntesis de música, compresión de audio,
denoising.
Bibliografía: detalles en la web
<https://sites.google.com/view/audioexactas/p%C3%A1gina-principal#h.l18qb4ol3vv5>
Saludos
Pablo Riera
Más información sobre la lista de distribución general_dat