Revisando requisitos
Requisito previo
Este curso pertenece al siguiente programa:
Es necesario que te inscribas al programa antes de poder tomar este curso
Horarios disponibles
Selecciona un horario de la siguiente lista
Inscripción terminada
Inscripción no realizada
Si considera que esto es un error comunicarse al correo: jmrincon@ia.center
Ciencia de datos usando R y Rstudio, nivel básico
<p>El objetivo de este curso es adquirir los conocimientos básicos del lenguaje R usando el entorno de desarrollo RStudio en los procesos de importar, limpiar, transformar, visualizar y modelar datos.</p>
Inicia sesión para inscribirteInicio
01/06/2021
Duración
10 semanas
Dedicación
10 horas por semana
Precio
Gratis con beca microsoft
Idioma
Español
Modalidad
Vía Teams
Horarios
-
martes y jueves de 11:30-14:00
Inicia 01/06/2021
Prerequisitos
<p>Los interesados en participar en esta capacitacion deberan tener conocimiento basico de estadistica (descriptiva) y del uso de dispositivos y herramientas digitales.</p>
Requisitos
<p>Equipo de computo, internet, paquetes estadisticos como SPSS, Eviews, Stata.</p>
Perfil de ingreso
<p>La persona tiene interes en conocer que es la ciencia de datos y su alcance de aplicación, asi como interes en desrrollar habilidades en el manejo y transformacion de datos usando el lenguaje de programacion R y el entorno de trabajo RStudio</p>
Perfil de egreso
<p>La persona tiene el conocimiento de identificar las diferentes estructuras de los datos usando el lenguaje de programacion R, asi como tiene el conocimiento de importar diversos tipos de formatos (tsv, csv, excell) para su limpieza, visualizacion y analisis usando el entorno de trabajo Rstudio.</p>
Obtén certificados oficiales
Contenido del curso
Módulo 1: Introducción a la Ciencia de datos
Presentación del temario del curso, de los participantes y de la metodología de trabajo durante el curso. Identificar el rol de la ciencia de datos desde una perspectiva técnica e interdisciplinaria
Módulo 2: Introducción a R
• Presentar el entorno de trabajo de RStudio • Identificar y practicar con las diferentes estructuras de datos en R o Vectores, o Matrices, o Factores o Dataframes o Listas
Módulo 3: Introducción a Tidyverse
• Reconocer e implementar las diferentes librerias que componen el ecosystema de Tidyverse: • Estructura de datos “tidy”. • Identificar y practicar los verbos que componen la gramatica de la manipulacion de los datos.
Módulo 4: Importar datos en R
• Conocer y practicar con los diferetnes formatos que R puede importar datos o tsv. o csv o Excell o Json o Rds o Sav o Dta o Mtp
Módulo 5: Limpieza de datos en R
• Identificar problemas comunes en la limpieza de datos: o Conversion de tipo de datos o Identificacion de duplicados o Problemas con datos categoricos o Remplazar caracteres o Remover caracteres o Datos nulos
Módulo 6: Visualización de datos I
• Introduccion a la gramatica de graficos con ggplot: o Identificacion y practica con mapeos esteticos o Introducion y practica con las geometrias mas comunes como graficos de dispersion, de barras y graficos de lineas o Conocer y practicar el concepto de la capa de temas en las visualizaciones
Módulo 7: Visualización de datos II
• En este curso se complementaran calculos estadisticos apoyandose en conceptos como las capas de coordenadas y las facetas que apoyan la comunicación visual con datos. • Capa de coordenadas, “smoothing”, posicion de objetos • Capa de facetas, manejo de differentes variables, etiquetado de facetas, margenes. • Identificacion de mejores practicas en la visualizacion de datos.
Módulo 8: Análisis exploratorio
• Identificar y practicar con variales categoricas. o Selección de variables o Conteo vs Proporcion o Distribucion de las variables • Identificar y practicar con variables numericas. o Histogramas con capas facet o Boxplots o Graficos de densidad o Outliers • Resumenes numericos o Medidas de tendencia central y dispersion o Calcular la medida de propagacion o Transformaciones
Módulo 9: Análisis exploratorio: Caso de Uso.
• Recoleccion y limpieza de datos en datos de interes aplicadas a un area de dominio. • Unión y analisis de diferentes fuentes de datos. • Visualizacion de datos. • Modelado de datos para analisis estadistico • Interpretacion de resultados
Módulo 10: Aprendizaje automático para todos
• Que es el aprendizaje automatico. • Flujo de trabajo del aprendizaje automatico. • Aprendizaje supervisado y no supervisado o Regression o Classificacion o Agrupamiento • Tipos de algoritmos para datos estructurados y no estrucutrados.