[general_dat] Invitación a cursar

Cecilia Ruz cruz at dc.uba.ar
Sun Jul 28 15:16:12 -03 2024


Hola! Los invito a cursar la materia bimestral “Calidad de Datos”  que se
dictará durante el cuarto bimestre.
Horario: miércoles de 18:30 a 21:30
Fechas de Dictado : desde el 2/10 al 27/11
Es recommendable tener conocimientos de Phyton o R para el Desarrollo de
los trabajos prácticos.
Modalidad de dictado : La materia contara con clases teórico-prácticas y
actividades virtuales. Las clases serán, en su mayoría, presenciales.

Objetivos
La materia estará orientada a conseguir que el alumno sea capaz de:
a) Efectuar un diagnóstico de la calidad de una fuente de datos
b) Resolver los principales problemas de calidad de datos
c) Enriquecer sets de datos utilizando fuentes externas
d) Definir los principales aspectos del gobierno de datos.

Método de evaluación: tareas sobre la plataforma Moodle, trabajo practico y
examen final

Puntaje: 2 puntos para licenciatura, 1.5 puntos para doctorado
Correlativas: Algoritmos y Estructuras de Datos II

Programa
Unidad 1: Introducción
Tipos de datos, principales herramientas disponibles para analizar los
mismos.
Unidad 2: Data profiling
Principales objetivos del data profiling. Análisis por columnas y análisis
estructural.
Herramientas para trabajar sobre la calidad de datos. Dimensiones
intrínsecas de la calidad. Datos faltantes y datos erróneos.
Enriquecimiento con fuentes externas. Open Data.
Unidad 3: Data Quality Management
Actividades principales. Definición de métricas de calidad y
establecimiento de SLAs. Monitoreo de la calidad y administración de los
issues.
Unidad 4: Gobierno de Datos
Definición de administrador de datos, principales funciones. Principales
aspectos de un programa de gobierno de datos. Seguridad de datos:
principales normas nacionales e internacionales. Anonimización.


Bibliografía

• The DAMA Guide to the Data Management Body of Knowledge ,
https://technicspub.com/dmbok/, Julio 2017
• Olson , Data quality, the accuracy dimension, Morgan Kaufmann, 2003,
• Ronald K. Pearson. 2006. The problem of disguised missing data. SIGKDD
Explor. Newsl. 8, 1 (June 2006), 83-92. DOI=
http://dx.doi.org/10.1145/1147234.1147247
• Ley 25.326
• Hadley Wickham, Tidy Data, Journal of Statistical Software, (
http://dx.doi.org/10.18637/jss.v059.i10), 2014
• Daniel Yankelevich; Anónimos, pero no tanto (
https://www.fund.ar/publicacion/anonimimos-pero-no-tanto/), abril 2021
• Bernd Heinrich, Diana Hristova, Mathias Klier, Alexander Schiller, and
Michael Szubartowicz. 2018. Requirements for Data Quality Metrics. J. Data
and Information Quality 9, 2, Article 12 (January 2018), 32 pages. DOI:
https://doi.org/10.1145/3148238
• Silvola, Risto & Harkonen, Janne & Vilppola, Olli & Kropsu-Vehkaperä,
Hanna & Haapasalo, Harri. (2016). Data quality assessment and improvement.
International Journal of Business Information Systems. 22. 62–81.
10.1504/IJBIS.2016.075718.

Los espero!
Cecilia Ruz


Más información sobre la lista de distribución general_dat