Programa curso: R BÁSICO
Monitor: Richard Andres Gonzalez Rodríguez
Con el auge de la ciencia de datos en los últimos tiempos, El lenguaje R se ha convertido en
uno de los lenguajes más populares para el análisis de datos, su software de código abierto,
interfaz amigable con el usuario con Rstudio, hace que R sea fundamental para todo aquel
que trabaje con datos. El objetivo del curso es que lo estudiantes aprendan las herramientas
más importantes que provee R y Rstudio para las diferentes etapas que debe tener un
correcto análisis de datos.
Se revisarán temas como realizar un análisis exploratorio de los datos en R, Estadística
descriptiva e inferencial, visualización de datos y análisis de regresión.
Sesiones
1. Introducción a RStudio
a. Interfaz
b. Ayuda en RStudio
c. Clasificación de objetos
d. Tipos de Objetos
e. Coerciones
f. Variables lógicas y operadores lógicos
g. Fases de la exploración de datos
2. Manejo de bases de datos.
a. Bases de datos y exportación de datos:
i. Excel
ii. Stata
iii. SPSS
iv. txt
b. Data frames y Tibbles
c. Manipulación de data frames con dplyr
d. Organización de bases de datos con tidyr
3. Objetos y Modos en R
a. Vectores
b. Matrices
c. Dataframes
d. Listas
e. Factores con Forcats
f. Strings con StringR
g. Tiempos con hml
h. Manipulaciones avanzadas con Lubridate
4. Estadística descriptiva
a. Población y muestra
b. Tipos de variables
c. Escalas de medida
d. Estadísticos descriptivos
i. Medidas de tendencia central
ii. Medidas de dispersión
iii. Medidas de asimetría y curtosis
iv. Medidas de posición
5. Funciones y bucles en R
a. Crear funciones simples
b. Funciones con bucles
i. for
ii. while
iii. if
6. Gráficas
a. Variables cualitativas (Nominal y Ordinal)
i. Diagrama de sectores
ii. Diagrama de barras
b. Variables cuantitativas (De intervalo y de razón)
i. qqplot
ii. Tallo y hojas
iii. Box-plot
iv. Histograma
c. Dos Variables
i. Gráfico de dispersión
ii. Matrices de dispersión
d. Gráficos especiales
7. Probabilidad
a. Variables aleatorias
b. Probabilidades laplacianas
c. Distribuciones
i. Discretas
ii. Continuas
d. TLC
8. Inferencia
a. Muestras aleatorias
b. Estimación puntual
c. Estimación por intervalos
9. Inferencia
a. Pruebas de hipótesis
10. Regresión
a. Lineal
i. r
ii. R^2
b. Ejemplos: Exponencial, Logarítmica, Polinómica
c. Múltiple
Calificación:
Actividades en Clase 40%
Talleres Semanales 30%
Trabajo Final 30%
Referencias:
Para la estructuración de los temas del curso se utilizaron los siguientes, artículos, páginas
y libros
1. de Vries, A., Meys, J., & de Vries, A. (2012). R For Dummies. Hoboken, NJ, Estados
Unidos: Wiley.
2. Grolemund, G. (2017, enero 12). R for Data Science. Recuperado de
[Link]
3. Mariano Méndez. (2018, enero). Análisis de datos con R. Avda. de Valdenigrales,
s/n. 28223 Pozuelo de Alarcón (Madrid)
4. Phil Spector. (2011). Data manipulation with R University of Califonia, Berkeley
California 94720.