Revisando requisitos
Requisito previo
Este curso pertenece al siguiente programa:
Es necesario que te inscribas al programa antes de poder tomar este curso
Requisitos previos
Horarios disponibles
Selecciona un horario de la siguiente lista
Inscripción terminada
Inscripción no realizada
Si considera que esto es un error comunicarse al correo: jmrincon@ia.center
Curso Básico de Ciencia de Datos con Python y Anaconda
El objetivo de este curso es adquirir los conocimientos básicos para usar Python en el ambiente de trabajo Anaconda en los procesos de importar, limpiar, transformar, visualizar y modelar datos. El curso se orientará de manera híbrida, de forma presencial en el IA.Center (hasta 40 personas) y vía teams sin límite de acceso.
Inicia sesión para inscribirte Descargar información (PDF Flyer)Inicio
07/08/2023
Duración
36 horas
Dedicación
6 horas por semana
Precio
Beca BOSCH
Idioma
Español
Modalidad
Curso masivo en línea
Horarios
-
Lunes, Miércoles - 18:00 a 21:00. Horario híbrido (presencial/virtual)
Inicia 07/08/2023
Prerequisitos
Requisitos
Perfil de ingreso
Perfil de egreso
Obtén certificados oficiales
Contenido del curso
Módulo 1: Python para la Ciencia de datos I
- Presentar el entorno de trabajo de Anconda - Identificar y practicar con las diferentes estructuras de datos en Python - Listas, Diccionarios y Tuplas - Conjuntos - Identificar y practicar con funciones en Python - Argumentos y alcance
Módulo 2: Python para la Ciencia de datos II
- Identificar y practicar con funciones y paquetes en Python - Pandas, Numpy, Matplotlib - Identificar y practicar con diferentes formas de manejar los datos como. - Seleccionar variables - Subconjuntos - Manejo de listas - Remplazar / Eliminar elementos
Módulo 3: Importar datos en Python
- Conocer y practicar con los diferentes formatos que Python puede importar datos - tsv, csv, Excel, Json, Rds, Sav, Dta, Mat
Módulo 4: Limpieza de datos en Python:
- Identificar problemas comunes en la limpieza de datos - Conversión de tipo de datos - Identificación de duplicados y problemas con datos categóricos - Remplazar y remover caracteres - Datos nulos
Módulo 5: Visualización de datos I
- Introducción a la gramática de gráficos con Matplotlib/Seaborn - Identificación y practica de uso y personalización de ejes - Leyendas anotaciones y estilos - Modificando colormaps - Introducción a Seaborn - Graficar regresión lineal - Visualizar distribuciones multivariadas - Visualizar correlaciones
Módulo 6: Visualización de datos II
- Introducción a la gramática de gráficos con ggplot - Identificación y práctica con mapeos estéticos - Introducción y práctica con las geometrías más comunes como gráficos de dispersión, de barras y gráficos de líneas - Conocer y practicar el concepto de la capa de temas en las visualizaciones lizaciones
Módulo 7: Análisis exploratorio
- Identificar y practicar con variables categóricas. - Selección de variables - Conteo vs Proporción - Distribución de las variables - Identificar y practicar con variables numéricas. - Histográmas con capas facet, Boxplots - Gráficos de densidad - Outliers - Resúmenes numéricos - Medidas de tendencia central y dispersión - Calcular la medida de propagación - Transformaciones
Módulo 8: Análisis exploratorio: Caso de Uso.
- Recolección y limpieza de datos de interés aplicadas a un área de dominio - Unión y análisis de diferentes fuentes de datos. - Visualización de datos - Modelado de datos para análisis estadístico - Interpretación de resultados
Módulo 9: Aprendizaje automático para todos
- Qué es el aprendizaje automático. - Flujo de trabajo del aprendizaje automático. - Aprendizaje supervisado y no supervisado - Regresión - Clasificación - Agrupamiento - Tipos de algoritmos para datos estructurados y no estructurados.
Instructor del curso
Dr. Alan Benito Ponce
Investigador y profesor de tiempo completo e en la Universidad Autónoma de Cd. Juárez (UACJ), tiene un doctorado en la Universidad de Southampton en el Reino Unido, cuenta con varias certificaciones técnicas en el área de ciencia de datos y ha trabajado en el sector público, privado y académico en la transformación y manejo de datos para la toma de decisiones y publicaciones académicas.