Revisando requisitos
Requisito previo
Este curso pertenece al siguiente programa:
Es necesario que te inscribas al programa antes de poder tomar este curso
Requisitos previos
Horarios disponibles
Selecciona un horario de la siguiente lista
Inscripción terminada
Inscripción no realizada
Si considera que esto es un error comunicarse al correo: jmrincon@ia.center
Ciencia de datos usando R y Rstudio, nivel básico - PDT22 Verano
El objetivo de este curso es adquirir conocimiento sobre que es la ciencia de datos y su aplicación interdisciplinaria. De igual manera, conocer el cómo el lenguaje de programación R implementa diferentes estructuras de datos para el manejo y transformación de datos en información. En este curso se implementará el conjunto básico de librerías que componen el ecosistema de Tidyverse para apoyarnos en los procesos de importar, limpiar, visualizar, y analizar datos que servirán de base para la futura implementación de algoritmos de machine o deep learning
Inicia sesión para inscribirte Descargar información (PDF Flyer)Inicio
21/06/2022
Duración
8 semanas
Dedicación
5 horas por semana
Precio
Beca Microsoft Completa
Idioma
Español
Modalidad
Vía Teams
Horarios
-
Martes y Jueves de 18:00 a 20:30
Inicia 21/06/2022
Prerequisitos
Requisitos
Perfil de ingreso
Perfil de egreso
Obtén certificados oficiales
Contenido del curso
Introducción a la Ciencia de datos
• Presentación del temario del curso, de los participantes y de la metodología de trabajo durante el curso. • Identificar el rol de la ciencia de datos desde una perspectiva técnica e interdisciplinaria
Introducción a R
• Presentar el entorno de trabajo de RStudio • Identificar y practicar con las diferentes estructuras de datos en R o Vectores, o Matrices, o Factores o Dataframes o Listas
Introducción a Tidyverse
• Reconocer e implementar las diferentes librerías que componen el ecosystema de Tidyverse: • Estructura de datos “tidy”. • Identificar y practicar los verbos que componen la gramática de la manipulación de los datos.
Importar datos en R
• Conocer y practicar con los diferentes formatos que R puede importar datos o tsv. o csv o Excel o Json o Rds o Sav o Dta o Mtp
Limpieza de datos en R
• Identificar problemas comunes en la limpieza de datos: o Conversión de tipo de datos o Identificación de duplicados o Problemas con datos categóricos o Remplazar caracteres o Remover caracteres o Datos nulos
Visualización de datos I
• Introducción a la gramática de gráficos con ggplot: o Identificación y practica con mapeos estéticos o Introducción y practica con las geometrías más comunes como gráficos de dispersión, de barras y gráficos de líneas o Conocer y practicar el concepto de la capa de temas en las visualizaciones
Visualización de datos II
• En este curso se complementarán cálculos estadísticos apoyándose en conceptos como las capas de coordenadas y las facetas que apoyan la comunicación visual con datos. • Capa de coordenadas, “smoothing”, posición de objetos • Capa de facetas, manejo de diferentes variables, etiquetado de facetas, márgenes. • Identificación de mejores prácticas en la visualización de datos.
Análisis exploratorio
• Identificar y practicar con variables categóricas. o Selección de variables o Conteo vs Proporción o Distribución de las variables • Identificar y practicar con variables numéricas. o Histogramas con capas facet o Boxplots o Gráficos de densidad o Outliers • Resúmenes numéricos o Medidas de tendencia central y dispersión o Calcular la medida de propagación o Transformaciones
Análisis exploratorio: Caso de Uso.
• Recolección y limpieza de datos en datos de interés aplicadas a un área de dominio. • Unión y análisis de diferentes fuentes de datos. • Visualización de datos. • Modelado de datos para análisis estadístico
Aprendizaje automático para todos
• Que es el aprendizaje automático. • Flujo de trabajo del aprendizaje automático. • Aprendizaje supervisado y no supervisado o Regresión o Clasificación o Agrupamiento • Tipos de algoritmos para datos estructurados y no estructurados.
Instructor del curso
Dr. Alan Benito Ponce
Investigador y profesor de tiempo completo e en la Universidad Autónoma de Cd. Juárez (UACJ), tiene un doctorado en la Universidad de Southampton en el Reino Unido, cuenta con varias certificaciones técnicas en el área de ciencia de datos y ha trabajado en el sector público, privado y académico en la transformación y manejo de datos para la toma de decisiones y publicaciones académicas.