Introducción a la Analítica de datos


 

I. Datos generales

Instructor o docente: Adrián Soto Girón

Modalidad de impartición: Virtual

Duración total de taller: 5 sesiones virtuales de 2 hrs. C/U 

Área: Otra

Fechas: 26, 27, 30 de septiembre, 1 Y 4 de octubre

II. Descripción

Destinatarios:

  • El curso está dirigido a profesionales de Tecnologías de la Información y Comunicación (TIC), docentes y
    público en general que deseen adquirir habilidades y conocimientos en el análisis de datos. No se
    requiere experiencia previa en análisis de datos, pero se recomienda tener conocimientos básicos en
    manejo de equipo de cómputo y hojas de cálculo.

 

Objetivo(s) o competencia(s):

Proporcionar a los participantes las competencias necesarias para realizar análisis de datos, permitiendo
llevar a cabo la exploración, limpieza y procesamiento de los datos para la identificación y presentación
de indicadores en conjuntos de datos.

Al finalizar el curso, el participante será capaz de:

  • Comprender y aplicar conceptos fundamentales del análisis de datos.
  • Recopilar, limpiar y preparar datos para su análisis.
  • Realizar análisis exploratorios y descriptivos de datos.
  • Desarrollar y evaluar modelos predictivos utilizando técnicas estadísticas y de machine learning.
  • Interpretar y comunicar resultados de manera clara y efectiva utilizando visualizaciones de datos.

 

Metodología y Actividades:

La metodología del curso se basa en un enfoque práctico y participativo, combinando teoría con ejercicios prácticos y actividades colaborativas. Las actividades del curso incluyen: 

  • Exposiciones teóricas: Presentaciones y explicaciones de los conceptos fundamentales del análisis de datos.
  • Demostraciones prácticas: Ejemplos prácticos y demostraciones en tiempo real utilizando herramientas como Excel, Python y Google Colab.
  • Actividades en equipo: Ejercicios y proyectos en equipo para fomentar la colaboración y el intercambio de conocimientos.
  • Trabajo independiente: Tareas y ejercicios prácticos que los participantes deben realizar de manera independiente.
  • Proyecto: El proyecto final será un análisis de datos completo que se desarrollará a lo largo de las sesiones.

Mecanismo y criterios de evaluación:

La evaluación del curso se basará en la participación activa, la calidad de los trabajos y ejercicios prácticos realizados, y un proyecto final. Los mecanismos y criterios de evaluación incluyen:

  • Participación en clase (20%): Evaluación de la participación activa y la contribución en las discusiones grupales.
  • Ejercicios prácticos (30%): Evaluación de los ejercicios y tareas prácticas realizados durante el
    curso.
  • Proyecto final (50%): Desarrollo y presentación de un proyecto de análisis de datos que demuestre la aplicación de los conocimientos y habilidades adquiridas. Los criterios de evaluación para el proyecto final incluirán la calidad de los datos utilizados, la correcta aplicación de técnicas de análisis, la interpretación de resultados y la claridad de la presentación.

III. Temario

Temario:

Número de sesión Fecha Hora Tema
Sesión 1 26 de septiembre 16:00 - 18:00 horas Sesión 1: Introducción al Análisis de Datos y Planteamiento del Proyecto Final

  • Definición de análisis de datos
  • Importancia del análisis de datos en la toma de decisiones
  • Aplicaciones del análisis de datos en diferentes sectores
  • Tipos de análisis de datos
  • Herramientas y software utilizados
  • Planteamiento del proyecto final:
    Descripción de los objetivos y estructura del proyecto
Sesión 2 27 de septiembre 16:00 - 18:00 horas Sesión 2: Recolección y Limpieza de Datos y Propuestas de Proyecto

  • Fuentes de datos (internas, externas, públicas)
  • Métodos de recolección de datos
  • Calidad de los datos (precisión, completitud, consistencia)
  • Técnicas de limpieza de datos (tratamiento de valores nulos, duplicados, errores)
  • Herramientas y métodos para la limpieza de datos (Excel, Python)
  • Presentación y discusión de las propuestas de proyectos
Sesión 3 30 de septiembre 16:00 - 18:00 horas Sesión 3: Análisis Exploratorio de Datos (EDA) y Presentación de Fuentes de Datos

  • Definición y propósito del EDA
  • Técnicas de EDA
  • Herramientas para EDA
  • Interpretación de resultados del EDA
  • Presentación de las fuentes de datos seleccionadas por los estudiantes para sus proyectos
Sesión 4 1 de octubre 16:00 - 18:00 horas Sesión 4: Modelado y Análisis Predictivo y Trabajo en ETL

  • Introducción al modelado predictivo
  • Tipos de modelos predictivos (regresión, clasificación)
  • Algoritmos comunes (regresión lineal, árboles de decisión, k-NN)
  • Validación de modelos y métricas de evaluación
  • Implementación de modelos usando herramientas (Python, Colab)
  • Trabajo en ETL (Extracción, Transformación y Carga) realizado por los estudiantes para sus proyectos
Sesión 5 4 de octubre 16:00 - 18:00 horas Sesión 5: Comunicación y Visualización de Resultados y Presentación de Hallazgos

  • Importancia de la comunicación en el análisis de datos
  • Principios de visualización de datos
  • Herramientas de visualización
  • Técnicas de narración de datos (data storytelling)
  • Buenas prácticas para la comunicación de resultados
  • Análisis y exposición de hallazgos del proyecto final

 

Bibliografía:

o Data Analytics Made Easy, Andrea De Mauro
o Introduction to Data Analysis Handbook, Migrant & Seasonal Head Start
o Storytelling with Data: A Data Visualization Guide for Business Professionals, Cole Nussbaumer Knaflic
o The Art of Statistics: How to Learn from Data, David Spiegelhalter
o Data Analytics Made Accessible, Dr. Anil Maheshwari

Recursos y materiales requeridos:

o Equipo de cómputo
o Excel 2019 o superior
o Buena conexión a internet
o Navegador de internet