Curso Primeros Pasos en R
Clase 1: Introducción a R
Profesora: Ana María Alvarado
Pontificia Universidad Católica de Chile
Noviembre 2021
1 / 42
Clase 1: Introducción a R
Recomendaciones iniciales Paquetes
Introducción Cálculos
R, RStudio y RStudioCloud Actividades practicas
Directorios de trabajo y proyectos Referencias y material
complementario
2 / 42
Recomendaciones Iniciales
3 / 42
Recomendaciones Iniciales
Usaremos un script de R compartido para que puedas seguir la ejecución del
código. Los scripts se compartirán en la carpeta que está en el siguiente link.
Usaremos el Chat de Zoom para consultas y comentarios del contenido que se
está viendo en la clase.
Usaremos el foro de la plataforma del curso para consultas y comentarios de
contenidos complementarios a la clase
Participa en el curso a través de las encuestas de zoom, botones de participación y
chat.
Trata de tener más de una pantalla, puede ser tu celular, una tablet o incluso un
televisor. Esto te permitirá ver al mismo tiempo las clases y ejecutar el código.
4 / 42
Introducción
5 / 42
¿Qué es Data Science?
6 / 42
Flujo de Trabajo
Ilustración por Allison Horst basada en el esquema de flujo del libro R for Data Science
de Grolemund & Wickham.
7 / 42
Herramientas y software para Data Science
¡Entre otros!
8 / 42
¿Por qué R?
Gratuito y de código abierto.
Herramienta estadística poderosa, hecha por y para estadísticos.
Eficiente y fácil de usar.
Integración con otros sistemas.
Sólida y amplia comunidad mundial.
Muchas más...
9 / 42
Ejemplos...
Modelamiento y análisis estadístico
10 / 42
Ejemplos...
Gráficos animados
11 / 42
Ejemplos...
Creación de documentos, presentaciones e informes automatizados.
Más información en RMarkdown.
12 / 42
Ejemplos...
Libros y libros electrónicos a partir de documentos de R Markdown.
Más información en bookdown. 13 / 42
Ejemplos...
Creación de aplicaciones web interactivas
Más ejemplos en el siguiente Link
14 / 42
R, RStudio y RStudioCloud
15 / 42
R y RStudio
R RStudio
Es un lenguaje y entorno para Es un entorno de desarrollo integrado
computación estadística y gráficos. En (IDE) para R. Incluye varios elementos
este entorno se implementan técnicas que facilitan las tareas durante el flujo
estadísticas y se extiende muy de trabajo.
fácilmente a través de paquetes. Está
disponible como software libre.
16 / 42
Instalación (Video)
En el siguiente video se puede ver el paso a paso de donde descargar e instalar R y
RStudio:
0:00 / 1:10
Los links de descargas se pueden encontrar a continuación:
Descargar R
Decargar RStudio
17 / 42
R
Así se ve R:
Tenemos una ventana que corresponde a la consola y otra que es el editor o script.
18 / 42
RStudio
Así se ve RStudio:
Tenemos varios espacios de trabajo dispuestos en 3 paneles:
Consola .
Environment (ambiente de trabajo).
Panel de visualización y ayuda.
19 / 42
RStudioCloud
Si no queremos/podemos instalar R en
nuestros equipos, tenemos la opción de
usar su versión en la nube, llamada
RStudioCloud
A diferencia de RStudio, para empezar a
trabajar con RStudioCloud necesitamos
crear un proyecto.
El plan gratuito de RStudioCloud es
suficiente para el trabajo que
realizaremos en este curso, puedes
crear una cuenta accediendo al
siguiente link
20 / 42
RStudioCloud
Así se ve RStudioCloud, es prácticamente igual a RStudio:
Tenemos varios espacios de trabajo dispuestos en 3 paneles:
Consola.
Environment (ambiente de trabajo).
Panel de visualización y ayuda.
21 / 42
Personalización
Un aspecto importante de RStudio y RStudioCloud es que podemos personalizar la
apariencia de nuestro entorno. Como estaremos expuestos a muchas horas de
programación es recomendable cambiar el tema predeterminado a uno oscuro, esto se
hace en: Tools > Global Options > Appearence
22 / 42
Actividad práctica
1. Abre RStudio o RStudioCloud.
2. Escribe (Copia y Pega) en la consola el siguiente código y presiona Enter
print("Hola R")
print("Hola R")
paste("Hola"
paste("Hola",
, "R"
"R",
, sep="
sep=" ")
")
Al hacerlo, obtendrás en la consola lo siguiente despues de cada ejecuión:
## [1] "Hola R"
Ahora teclea la secuencia Ctrl+L / Cmd+L ¿Qué ocurrió?
23 / 42
Script (archivo .R)
Un script es un editor de texto en donde escribimos el código que queremos conservar.
Para crear un nuevo script podemos hacer cualquiera de estas opciones:
Click en File > New File > R Script
Teclear Ctrl/Cmd + Shift + N
Ahora tenemos cuatro paneles, el script aparece en el bloque de la esquina superior
izquierda.
24 / 42
Script (archivo .R)
Para ejecutar (“correr”) código en el script de R, tenemos distintas opciones:
Ctrl/Cmd + Enter → Ejecutar línea de código/expresión seleccionada
Ctrl/Cmd + Shift + N → Ejecutar todo el código (source)
Para guardar nuestro script podemos teclear Ctrl + S o hacer click en el ícono de
guardar que está sobre el script, esto guardará un archivo .R con el nombre que le
asignemos.
En RStudio tenemos diagnóstico de errores en la sintáxis de código y autocompletado:
Diagnóstico de errores Autocompletado
25 / 42
Comentarios y Secciones
En R podemos comentar lineas de código anteponiendo el símbolo #, esto nos permite
ordenar nuestro código, hacer descripciones de que estamos ejecutando o guardar
código que no queramos ejecutar:
### Este es un comentario de R, puedes usarlo para poner títulos!
5+5 ## También para comentar despúes de operaciones/código!
# print("Diplomado en Data Science UC")
Tambien uno puede comentar una o múltiples líneas seleccionando el código y
tecleando Ctrl/Cmd + Shift + C.
Finalmente, la secuencia Ctrl/Cmd + R nos permite seccionar fácilmente nuestro
código. Al teclearlo aparecerá una ventana emergente donde podemos ingresar el
nombre de la sección.
# Sección 1: --------------------------------------------------------
26 / 42
Actividad práctica
1. Crea un nuevo script
2. Guárdalo con el nombre "Sesion1"
3. Añade una sección con tu nombre (Ctrl/Cmd + R)
4. Copia, pega y ejecuta este código en el script:
poleras <- c(254
c(254,
,203
203,
,182
182,
,50
50)
)
meses <- c("Ene"
c("Ene",
, "Feb"
"Feb",
, "Mar"
"Mar",, "Abr"
"Abr"))
min(poleras)
plot(poleras)
barplot(poleras, names.arg = meses, col="orange"
col="orange"))
27 / 42
Directorios de trabajo y proyectos
28 / 42
Directorios de trabajo
El directorio de trabajo es donde R:
Busca los arcivos que le pedimos leer.
Coloca los archivos que le pedimos guardar.
Las rutas y directorios pueden causar complicaciones principalmente porque se
escriben de manera diferente según el sistema operativo y porque es muy difícil que
alguien más tenga la misma configuración de directorios que nosotros.
Ejecuta el código: getwd() para conocer tu directorio de trabajo actual.
29 / 42
Proyectos de RStudio
Durante nuestro flujo de trabajo lo ideal es mantener todos los archivos relacionados a
un análisis en un mismo lugar, es por esto que trabajaremos con los Proyectos de
RStudio. Trabajar con proyectos es una buena práctica que nos ahorrará muchos
dolores de cabeza.
En el siguiente video se muestra como crear un proyecto:
0:00 / 0:51
30 / 42
Actividad práctica
1. Crea un nuevo proyecto para esta clase, llámalo ProyectoClase1
2. Abre el proyecto y ejecuta el siguiente código getwd()
3. Crea un nuevo script y ejecuta el siguiente código:
poleras <- c(254
c(254,
,203
203,
,182
182,
,50
50)
)
meses <- c("Ene"
c("Ene",
, "Feb"
"Feb",
, "Mar"
"Mar",, "Abr"
"Abr"))
min(poleras)
plot(poleras)
barplot(poleras,names.arg = meses,col="orange"
meses,col="orange"))
Ahora crea una carpeta dentro de tu proyecto llamada datos y ejecuta el siguiente
código.
write.csv(cbind(meses, poleras),"datos/poleras.csv"
poleras),"datos/poleras.csv"))
read.csv("datos/poleras.csv"
read.csv("datos/poleras.csv")
)
31 / 42
Paquetes de R
32 / 42
Paquetes de R
Para hacer efectiva la actualización del
software, y basado en el foco académico,
R utiliza librerías como conjunto de
funciones, datos y documentación que
denominaremos paquetes o packages.
Cuando iniciamos R se carga solo un
conjunto de funciones, datos y
documentación que se conoce como R
Base.
Para extender las posibilidades de R
Base tenemos que instalar otros
paquetes.
33 / 42
Paquetes de R
A la fecha de hoy, el total de packages disponibles en el CRAN de R es:
18.365
34 / 42
Paquetes de R
Los packages se pueden instalar directamente desde el software o descargarlos de
forma manual, esto último se puede hacer desde dos fuentes:
CRAN GitHub
Comprehensive R Archive Network Plataforma para desarrollo de software.
Muchos paquetes solo se comparten por
Es el repositorio oficial de paquetes de acá. En Github también podemos
R. Para estar acá los paquetes deben ser acceder a la versión en desarrollo de
aprobados. paquetes que están en CRAN.
install.packages("nombrepaquete") install.packages("remotes")
remotes::install_github("usuario/paque
Los paquetes se instalan solo una vez en nuestro equipo (pero se deben actualizar cada
cierto tiempo).
35 / 42
Paquetes de R
Para usar las funciones y datos contenidos en un paquete tenemos que “activarlo” en
nuestra sesión de R:
library(nombrepaquete)
Luego de esto, aparecerán disponibles en nuestra sesión las funciones de ese paquete.
Hay tantos paquetes en R que a veces pueden existir múltiples funciones con el mismo
nombre, si tenemos ambos paquetes cargados esto puede causar problemas en
nuestro código. Podemos especificar de qué paquete viene una función usando :: de la
siguiente forma:
nombrepaquete::nombrefuncion
36 / 42
Actividad Práctica
Instalemos el paquete ggplot2
install.packages("ggplot2"
install.packages("ggplot2")
)
Para activar el paquete usamos:
library(ggplot2)
library(ggplot2)
37 / 42
Cálculos en R
38 / 42
Cálculos en R
R se puede usar como una calculadora.
Algunas operaciones que podemos realizar son:
Operación
+ suma
- resta
* multiplicación
/ división
%/% división entera
^ potencia
sqrt() raíz cuadrada
log() logaritmo base e
exp() exponencial
abs() Valor Absoluto
39 / 42
Actividad práctica
Calcule en R
3
a. − 2 + 4 × 5 − e
π
b. − log(
log (5) +
√5
Solución
2 + (4
(4*5) - exp(3
exp(3)
## [1] 1.914463
log(55) + pi/sqrt(5
log( pi/sqrt(5)
## [1] 3.014401
40 / 42
Referencias y Material Complementario
1. R para Ciencia de Datos : Libro en línea, en español.
2. RStudio cheatsheets : “Torpedos”; en la parte inferior de la página hay versiones
en español disponibles.
3. RStudio Primers: Ejercicios interactivos; en inglés.
4. Hands-on Programming with R : Libro en línea de introducción a la programación
en R que no requiere conocimientos previos; en inglés.
41 / 42
¡Gracias!
Ana María Alvarado Celis
[email protected] Esteban Rucan
[email protected]
42 / 42