Revisando requisitos
Requisito previo
Este curso pertenece al siguiente programa:
Es necesario que te inscribas al programa antes de poder tomar este curso
Horarios disponibles
Selecciona un horario de la siguiente lista
Inscripción terminada
Inscripción no realizada
Si considera que esto es un error comunicarse al correo: jmrincon@ia.center
Curso Básico de Ciencia de Datos con Python y Anaconda
El objetivo de este curso es adquirir los conocimientos básicos para usar Python en el ambiente de trabajo Anaconda en los procesos de importar, limpiar, transformar, visualizar y modelar datos. El curso se orientará de manera híbrida, de forma presencial en el IA.Center (hasta 40 personas) y vía teams sin límite de acceso.
Inicia sesión para inscribirteInicio
01/08/2021
Duración
36 horas
Dedicación
6 horas por semana
Precio
Beca Microsoft
Idioma
Español
Modalidad
Vía Teams
Horarios
-
Viernes de 17:00 a 19:00 y Sábado de 12:00 a 14:00
Inicia 01/08/2021
Prerequisitos
Los interesados en participar en esta capacitación deberán tener conocimiento básico de estadística (descriptiva), conocimientos básicos de programación (declaración de variables, ciclos, funciones) y del uso de dispositivos y herramientas digitales (equipo de cómputo, internet)
Requisitos
• Ser estudiante universitario.
• Deseable estar en los últimos semestres.
• Haber tomado el curso de Python fast track o acreditar el examen de suficiencia en Python
Perfil de ingreso
La persona tiene interés en conocer que es la ciencia de datos y su alcance de aplicación, así como interés en desarrollar habilidades en el manejo y transformación de datos usando el lenguaje de programación Python y el ambiente de trabajo Anaconda.
Perfil de egreso
La persona tiene el conocimiento de identificar las diferentes estructuras de los datos usando el lenguaje de programación Python, así como tiene el conocimiento de importar diversos tipos de formatos (tsv, csv, Excel) para su limpieza, visualización y análisis usando el ambiente de trabajo Anaconda.
Obtén certificados oficiales
Contenido del curso
Módulo 1: Python para la Ciencia de datos I
- Presentar el entorno de trabajo de Anconda - Identificar y practicar con las diferentes estructuras de datos en Python - Listas, Diccionarios y Tuplas - Conjuntos - Identificar y practicar con funciones en Python - Argumentos y alcance
Módulo 2: Python para la Ciencia de datos II
- Identificar y practicar con funciones y paquetes en Python - Pandas, Numpy, Matplotlib - Identificar y practicar con diferentes formas de manejar los datos como. - Seleccionar variables - Subconjuntos - Manejo de listas - Remplazar / Eliminar elementos
Módulo 3: Importar datos en Python
- Conocer y practicar con los diferentes formatos que Python puede importar datos - tsv, csv, Excel, Json, Rds, Sav, Dta, Mat
Módulo 4: Limpieza de datos en Python:
- Identificar problemas comunes en la limpieza de datos - Conversión de tipo de datos - Identificación de duplicados y problemas con datos categóricos - Remplazar y remover caracteres - Datos nulos
Módulo 5: Visualización de datos I
- Introducción a la gramática de gráficos con Matplotlib/Seaborn - Identificación y practica de uso y personalización de ejes - Leyendas anotaciones y estilos - Modificando colormaps - Introducción a Seaborn - Graficar regresión lineal - Visualizar distribuciones multivariadas - Visualizar correlaciones
Módulo 6: Visualización de datos II
- Introducción a la gramática de gráficos con ggplot - Identificación y práctica con mapeos estéticos - Introducción y práctica con las geometrías más comunes como gráficos de dispersión, de barras y gráficos de líneas - Conocer y practicar el concepto de la capa de temas en las visualizaciones lizaciones
Módulo 7: Análisis exploratorio
- Identificar y practicar con variables categóricas. - Selección de variables - Conteo vs Proporción - Distribución de las variables - Identificar y practicar con variables numéricas. - Histográmas con capas facet, Boxplots - Gráficos de densidad - Outliers - Resúmenes numéricos - Medidas de tendencia central y dispersión - Calcular la medida de propagación - Transformaciones
Módulo 8: Análisis exploratorio: Caso de Uso.
- Recolección y limpieza de datos de interés aplicadas a un área de dominio - Unión y análisis de diferentes fuentes de datos. - Visualización de datos - Modelado de datos para análisis estadístico - Interpretación de resultados
Módulo 9: Aprendizaje automático para todos
- Qué es el aprendizaje automático. - Flujo de trabajo del aprendizaje automático. - Aprendizaje supervisado y no supervisado - Regresión - Clasificación - Agrupamiento - Tipos de algoritmos para datos estructurados y no estructurados.