Curso virtual: Calidad de Datos

Fecha de inicio: 4 de Noviembre de 2024 (sujeto a que se complete el cupo necesario)  

Docente: Roxana Martínez

Días y horarios: Las clases sincrónicas se dictarán los viernes de 17.00 a 19.00 hs. y las
actividades asincrónicas quedarán disponibles en plataforma.

Descripción: Este curso brindará las herramientas y conocimientos necesarios para
transformar los datos en un activo valioso para tu organización. Además, se identificarán y
analizarán los problemas más comunes de calidad de datos, como valores faltantes,
duplicados, inconsistencias y errores de formato. Se explorarán técnicas avanzadas de
limpieza y transformación de datos utilizando herramientas de visualización. Además, se
enfocará en la evaluación de la calidad de los datos mediante el cálculo de métricas claves, y
a implementar procesos de gobernanza de datos para asegurar la integridad y confiabilidad
a largo plazo.

Objetivo: Este curso está diseñado tanto para profesionales con experiencia en el manejo de
datos como para aquellos que desean iniciarse en este campo. A través de ejercicios
prácticos y proyectos reales, aplicarás los conceptos aprendidos a casos de estudio del
mundo real. Al finalizar el curso, serás capaz de:
● Evaluar la calidad de los datos: Identificar y cuantificar los problemas de calidad en
tus conjuntos de datos.
● Limpiar y transformar datos: Aplicar técnicas de limpieza y transformación para
preparar los datos para el análisis.
● Implementar procesos de gobernanza de datos: Establecer políticas y procedimientos
para garantizar la calidad de los datos a largo plazo.
● Utilizar herramientas de análisis de datos.

Modalidad: Las clases se desarrollarán en modalidad virtual con encuentros sincrónicos y
asincrónicos a través del campus de SADIO.
Se utilizarán como recursos, además de las clases sincrónicas guiadas por un profesor,
videos, presentaciones, foros, lecturas, ejercicios, etc. que los participantes deberán
apropiar con anterioridad y además se aportará bibliografía complementaria para quien
quiera profundizar. Todos los recursos quedarán disponibles en la plataforma virtual.
Las clases sincrónicas se grabarán y quedarán disponibles para los participantes hasta un
mes después de la finalización del curso. Las clases grabadas no podrán descargarse, sólo
estarán disponibles en la plataforma.

Duración: El curso completo tiene una carga horaria de 16 horas durante cuatro semanas
con un ritmo semanal de: – una clase sincrónica de dos horas – una clase grabada más un
ejercicio y un foro que requerirán otras dos horas. Se espera que los participantes dediquen
al menos una carga horaria adicional semejante para el estudio y desarrollo de casos.

Destinatarias/os: Profesionales con interés y/o necesidades de conocer las buenas prácticas en calidad de datos. Este curso está dirigido a: Analistas de datos, Científicos de datos,
Ingenieros de datos, Profesionales de negocios que trabajan con datos y/o Estudiantes
interesados en el análisis de datos.

Requisitos: Es deseable el conocimiento de aspectos básicos de programación y lenguajes
de consulta a base de datos, de todas formas, se proporcionarán los fundamentos
necesarios.

Software a utilizar:
Herramientas para la Manipulación y Limpieza de Datos:
– Python
– SQL
– Excel
Herramientas para la Visualización de Datos:
– Tableau
– Power BI
– Python
Herramientas para la Gestión de la Calidad de Datos:
– Talend
– Herramientas de profilado de datos

Fundamentos: En un mundo cada vez más impulsado por los datos, garantizar su calidad es
fundamental para tomar decisiones informadas y estratégicas. En cuanto a los fundamentos
teóricos, es esencial comprender el ciclo de vida de los datos, la gestión de datos, los
conceptos de calidad de datos y las herramientas básicas de tratamiento. Desde el punto de
vista práctico, dominar herramientas como SQL, Python y Excel, junto con plataformas de
visualización como Tableau y Power BI, es fundamental. Además, se deben cubrir temas
como la limpieza, transformación y validación de datos, así como la implementación de
buenas prácticas de gobernanza de datos. Al combinar estos conocimientos, los estudiantes
podrán desarrollar las habilidades necesarias para garantizar la calidad de los datos en
cualquier organización.

Contenidos: El curso está dividido en tres módulos como se describen a continuación.
TEMARIO
MÓDULO 1: FUNDAMENTOS DE LA CALIDAD DE DATOS

1.1 ¿Qué es calidad de datos? Definición, importancia y dimensiones de la calidad.
1.2 Ciclo de vida de los datos: Desde la generación hasta la eliminación.
1.3 Gestión de datos: Conceptos básicos y buenas prácticas.
1.4 Gestión de calidad de datos y DAMA DMBOK.
1.5 Un marco simple para la mejora de la calidad de los datos
1.6 El impacto de los datos deficientes
1.7 Herramientas básicas:Tableau, Power BI, Python para análisis de datos.
Duración: Una semana

MÓDULO 2: TÉCNICAS DE LIMPIEZA Y TRANSFORMACIÓN DE DATOS
2.1 Identificación y corrección de errores: Valores faltantes, duplicados, inconsistencias.
2.2. Transformación de datos: estandarización.
2.3 ¿Qué tan buena debe ser la calidad de los datos?
2.4 Comprender la corrección de datos
2.5 Desmitificando la limpieza de datos
2.6 Profilado de datos: Análisis exploratorio de datos. Herramienta Talend.
2.7 Validación de datos: Verificación de la integridad y consistencia de los datos.
2.8 Herramientas de limpieza: Python, SQL, Excel.
Duración: Una semana y media

MÓDULO 3: GOBERNANZA Y VISUALIZACIÓN DE DATOS
3.1 ¿Están vinculados el gobierno de datos y la calidad de los datos?
3.2 Gobernanza de datos: Políticas y procedimientos para garantizar la calidad de los datos.
3.3 Metadatos: Gestión de la información sobre los datos.
3.4 Visualización de datos: Creación de dashboards y reportes con Tableau, Power BI.
3.5 Medición de la calidad de los datos
3.6 Características de los indicadores de calidad de datos (DQI)
3.7 Casos de uso: Aplicación de la calidad de datos en diferentes industrias.
3.8 Proyectos prácticos: Desarrollo de proyectos para consolidar conocimientos adquiridos.
Duración: Una semana y media

Certificados y trabajos finales: Aprobación del trabajo final.

Formulario de inscripción: https://tinyurl.com/sm5dhkmm

Aranceles
Inscripción temprana (hasta el 28 de Octubre de 2024)
* AR$ 70.000.- (para nacionales)
* USD 84.- (para extranjeros)

Inscripción tardía (desde el 29 de Octubre de 2024)
* AR$ 77.000.- (para nacionales)
* USD 93.- (para extranjeros)

50% Descuento para socios de SADIO (con 12 meses de antigüedad)
Los socios de AADECA gozan de los mismos derechos que los socios de SADIO
 

Medios de pago disponibles solo para residentes en Argentina

– Pago por Transferencias Bancarias
SADIO (CUIT 30-64931218-0)
BBVA – Sucursal 330 Tribunales
Cta. Cte. Pesos: 502/7
CBU: 0170330420000000050276
Alias: SOCIEDAD.SADIO

– Pago con Tarjeta de crédito/débito
(Visa, Master o Cabal). Solicitar el botón de pago a informacion@sadio.org.ar
Es posible pagar en cuotas con interés. Consulte.
 

Medios de pago disponibles para extranjeros
– PAYPAL
Solicite el link de pago.

¡Cupos limitados! Reserva tu vacante con el pago de tu inscripción
 

Antecedentes del docente: Doctora en Ciencias Informáticas de la Universidad Nacional de La Plata (UNLP). Magister en Tecnología Informática. Ingeniera en Sistemas Informáticos.  Docente de grado y posgrado en varias Universidades del país por más de 15 años (UdeMM, UAI, UNQ, UADE, Siglo 21 y UTN). Investigadora y Directora de Proyectos de Investigación en 3 Universidades (UAI, UADE, Siglo 21). En el contexto profesional, más de 22 años en el área de Tecnología, y actualmente, se desempeña como Líder de Procesos IT en la UIF, Unidad de Información Financiera de la Nación Argentina. LinkedIn: https://www.linkedin.com/in/roxana-martinez-b36561a/

Scroll al inicio