Introducción a R y a RStudio
Kit de Supervivencia en R
M. en C.C. Carlos O. Rivera Villa
Mayo de 2019
Plan para hoy:
Instalación de R y RStudio
Exploración de la interfaz RStudio
Kit de supervivencia:
o Instalación de paquetes
o Lectura de datos
o Manipulaciones básicas
o Funciones fundamentales
o Visualización para principiantes
Instalación de R
Instrucciones:
Para instalar R da clic aquí.
Selecciona la opción que corresponda con tu sistema operativo.
Sigue las instrucciones del instalador.
Instalación de RStudio
Instrucciones:
Para instalar RStudio da clic aquí.
Selecciona la opción free y escoge el link que corresponda con tu sistema operativo.
Sigue las instrucciones del instalador.
Script
¿Para qué sirve?
Aquí se colocan las instrucciones o funciones que quieres que R ejecute.
R sólo reconoce su lenguaje.
Si deseas escribir un comentario para ti utiliza el #.
Consola
¿Para qué sirve?
Aquí ocurre la acción.
Puedes escribir las instrucciones directamente.
Obtienes el resultado de inmediato.
Ambiente
¿Para qué sirve?
Se muestran las variables almacenadas en la memoria temporal de R.
En historia están las últimas lineas de código ejecutadas.
También aquí puedes importar bases de datos.
Panel de gráficos
¿Para qué sirve?
Muestra los gráficos que hayas construido.
En archivos está el contenido de tu directorio de trabajo.
En paquetes se muestran librerías almacenadas.
Las secciones de ayuda y el visor las verás pronto en acción.
Kit de Supervivencia: Paquetes
¿Qué son?
Son compendios de funciones adicionales para hacer más poderoso a R.
Prueba escribiendo [Link]("psych") en tu consola.
# Para usar una librería debes usar la función:
library(psych) # librería que descargaste
# Prueba la nueva función
describe(cars)
## vars n mean sd median trimmed mad min max range skew
## speed 1 50 15.40 5.29 15 15.47 5.93 4 25 21 -0.11
## dist 2 50 42.98 25.77 36 40.88 23.72 2 120 118 0.76
## kurtosis se
## speed -0.67 0.75
## dist 0.12 3.64
Paquetes
¿Qué paquetes debería instalar?
Algunos paquetes que serán de utilidad para el presente curso son:
# Para instalar y cargar paquetes rápidamente.
[Link]("pacman")
# Carga la librería
library(pacman)
# Instala y carga los paquetes que usaremos
p_load(tidyverse, car, psych, foreign, readxl, statisticalModeling)
Si deseas explorar más paquetes da clic aquí.
Lectura de datos
Archivos .csv necesitas usar read_csv().
Archivos de SPSS terminación .sav usa [Link]().
Archivos de Excel .xlsx necesitas read_xlsx().
# Lectura de un archivo de excel
datos <- read_xlsx("[Link]")
# Observa los datos
head(datos, n = 3)
## # A tibble: 3 x 5
## SUJETO REPASO EXAMEN ANSIEDAD SEXO
## <dbl> <dbl> <dbl> <dbl> <dbl>
## 1 1 4 40 86.30 1
## 2 2 11 65 88.72 2
## 3 3 27 80 70.18 1
Manipulaciones básicas
# Selecciona las variables que te interesan:
select(datos, SUJETO, ANSIEDAD)
## # A tibble: 103 x 2
## SUJETO ANSIEDAD
## <dbl> <dbl>
## 1 1 86.30
## 2 2 88.72
## 3 3 70.18
## 4 4 61.31
## 5 5 89.52
## 6 6 60.51
## 7 7 81.46
## 8 8 75.82
## 9 9 69.37
## 10 10 82.27
## # ... with 93 more rows
Funciones básicas
Obten tu primera media y desviación estándar con mean() y sd().
El operador $ te permite seleccionar variables dentro de una base de datos.
# La media de ansiedad
mean(datos$ANSIEDAD)
## [1] 74.3435
# La desviación estándar
sd(datos$ANSIEDAD)
## [1] 17.18177
Visualización para principiantes
Con el script lograremos hacer el siguiente gráfico.
Contacto:
Escríbeme:
o heroedeleyendas@[Link]
Sígueme en Twitter:
o [Link]