0% encontró este documento útil (0 votos)
96 vistas42 páginas

Introducción a R: Curso Básico de Data Science

Cargado por

jacqueline lillo
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
96 vistas42 páginas

Introducción a R: Curso Básico de Data Science

Cargado por

jacqueline lillo
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Curso Primeros Pasos en R

Clase 1: Introducción a R
Profesora: Ana María Alvarado
Pontificia Universidad Católica de Chile

Noviembre 2021

1 / 42
Clase 1: Introducción a R
Recomendaciones iniciales Paquetes

Introducción Cálculos

R, RStudio y RStudioCloud Actividades practicas

Directorios de trabajo y proyectos Referencias y material


complementario

2 / 42
Recomendaciones Iniciales

3 / 42
Recomendaciones Iniciales
Usaremos un script de R compartido para que puedas seguir la ejecución del
código. Los scripts se compartirán en la carpeta que está en el siguiente link.

Usaremos el Chat de Zoom para consultas y comentarios del contenido que se


está viendo en la clase.

Usaremos el foro de la plataforma del curso para consultas y comentarios de


contenidos complementarios a la clase

Participa en el curso a través de las encuestas de zoom, botones de participación y


chat.

Trata de tener más de una pantalla, puede ser tu celular, una tablet o incluso un
televisor. Esto te permitirá ver al mismo tiempo las clases y ejecutar el código.

4 / 42
Introducción

5 / 42
¿Qué es Data Science?

6 / 42
Flujo de Trabajo

Ilustración por Allison Horst basada en el esquema de flujo del libro R for Data Science
de Grolemund & Wickham.
7 / 42
Herramientas y software para Data Science

¡Entre otros!

8 / 42
¿Por qué R?
Gratuito y de código abierto.

Herramienta estadística poderosa, hecha por y para estadísticos.


Eficiente y fácil de usar.

Integración con otros sistemas.


Sólida y amplia comunidad mundial.
Muchas más...

9 / 42
Ejemplos...
Modelamiento y análisis estadístico

10 / 42
Ejemplos...
Gráficos animados

11 / 42
Ejemplos...
Creación de documentos, presentaciones e informes automatizados.

Más información en RMarkdown.


12 / 42
Ejemplos...
Libros y libros electrónicos a partir de documentos de R Markdown.

Más información en bookdown. 13 / 42


Ejemplos...
Creación de aplicaciones web interactivas

Más ejemplos en el siguiente Link


14 / 42
R, RStudio y RStudioCloud

15 / 42
R y RStudio

R RStudio
Es un lenguaje y entorno para Es un entorno de desarrollo integrado
computación estadística y gráficos. En (IDE) para R. Incluye varios elementos
este entorno se implementan técnicas que facilitan las tareas durante el flujo
estadísticas y se extiende muy de trabajo.
fácilmente a través de paquetes. Está
disponible como software libre.

16 / 42
Instalación (Video)
En el siguiente video se puede ver el paso a paso de donde descargar e instalar R y
RStudio:

0:00 / 1:10

Los links de descargas se pueden encontrar a continuación:

Descargar R
Decargar RStudio
17 / 42
R
Así se ve R:

Tenemos una ventana que corresponde a la consola y otra que es el editor o script.

18 / 42
RStudio
Así se ve RStudio:

Tenemos varios espacios de trabajo dispuestos en 3 paneles:

Consola .
Environment (ambiente de trabajo).
Panel de visualización y ayuda.
19 / 42
RStudioCloud
Si no queremos/podemos instalar R en
nuestros equipos, tenemos la opción de
usar su versión en la nube, llamada
RStudioCloud

A diferencia de RStudio, para empezar a


trabajar con RStudioCloud necesitamos
crear un proyecto.

El plan gratuito de RStudioCloud es


suficiente para el trabajo que
realizaremos en este curso, puedes
crear una cuenta accediendo al
siguiente link

20 / 42
RStudioCloud
Así se ve RStudioCloud, es prácticamente igual a RStudio:

Tenemos varios espacios de trabajo dispuestos en 3 paneles:

Consola.
Environment (ambiente de trabajo).
Panel de visualización y ayuda.
21 / 42
Personalización
Un aspecto importante de RStudio y RStudioCloud es que podemos personalizar la
apariencia de nuestro entorno. Como estaremos expuestos a muchas horas de
programación es recomendable cambiar el tema predeterminado a uno oscuro, esto se
hace en: Tools > Global Options > Appearence

22 / 42
Actividad práctica
1. Abre RStudio o RStudioCloud.

2. Escribe (Copia y Pega) en la consola el siguiente código y presiona Enter

print("Hola R")
print("Hola R")
paste("Hola"
paste("Hola",
, "R"
"R",
, sep="
sep=" ")
")

Al hacerlo, obtendrás en la consola lo siguiente despues de cada ejecuión:


## [1] "Hola R"

Ahora teclea la secuencia Ctrl+L / Cmd+L ¿Qué ocurrió?

23 / 42
Script (archivo .R)
Un script es un editor de texto en donde escribimos el código que queremos conservar.

Para crear un nuevo script podemos hacer cualquiera de estas opciones:

Click en File > New File > R Script


Teclear Ctrl/Cmd + Shift + N

Ahora tenemos cuatro paneles, el script aparece en el bloque de la esquina superior


izquierda.
24 / 42
Script (archivo .R)
Para ejecutar (“correr”) código en el script de R, tenemos distintas opciones:

Ctrl/Cmd + Enter → Ejecutar línea de código/expresión seleccionada


Ctrl/Cmd + Shift + N → Ejecutar todo el código (source)

Para guardar nuestro script podemos teclear Ctrl + S o hacer click en el ícono de
guardar que está sobre el script, esto guardará un archivo .R con el nombre que le
asignemos.

En RStudio tenemos diagnóstico de errores en la sintáxis de código y autocompletado:

Diagnóstico de errores Autocompletado

25 / 42
Comentarios y Secciones
En R podemos comentar lineas de código anteponiendo el símbolo #, esto nos permite
ordenar nuestro código, hacer descripciones de que estamos ejecutando o guardar
código que no queramos ejecutar:

### Este es un comentario de R, puedes usarlo para poner títulos!


5+5 ## También para comentar despúes de operaciones/código!
# print("Diplomado en Data Science UC")

Tambien uno puede comentar una o múltiples líneas seleccionando el código y


tecleando Ctrl/Cmd + Shift + C.

Finalmente, la secuencia Ctrl/Cmd + R nos permite seccionar fácilmente nuestro


código. Al teclearlo aparecerá una ventana emergente donde podemos ingresar el
nombre de la sección.

# Sección 1: --------------------------------------------------------

26 / 42
Actividad práctica
1. Crea un nuevo script
2. Guárdalo con el nombre "Sesion1"
3. Añade una sección con tu nombre (Ctrl/Cmd + R)
4. Copia, pega y ejecuta este código en el script:

poleras <- c(254


c(254,
,203
203,
,182
182,
,50
50)
)
meses <- c("Ene"
c("Ene",
, "Feb"
"Feb",
, "Mar"
"Mar",, "Abr"
"Abr"))
min(poleras)
plot(poleras)
barplot(poleras, names.arg = meses, col="orange"
col="orange"))

27 / 42
Directorios de trabajo y proyectos

28 / 42
Directorios de trabajo
El directorio de trabajo es donde R:

Busca los arcivos que le pedimos leer.


Coloca los archivos que le pedimos guardar.

Las rutas y directorios pueden causar complicaciones principalmente porque se


escriben de manera diferente según el sistema operativo y porque es muy difícil que
alguien más tenga la misma configuración de directorios que nosotros.

Ejecuta el código: getwd() para conocer tu directorio de trabajo actual.

29 / 42
Proyectos de RStudio
Durante nuestro flujo de trabajo lo ideal es mantener todos los archivos relacionados a
un análisis en un mismo lugar, es por esto que trabajaremos con los Proyectos de
RStudio. Trabajar con proyectos es una buena práctica que nos ahorrará muchos
dolores de cabeza.

En el siguiente video se muestra como crear un proyecto:

0:00 / 0:51

30 / 42
Actividad práctica
1. Crea un nuevo proyecto para esta clase, llámalo ProyectoClase1
2. Abre el proyecto y ejecuta el siguiente código getwd()
3. Crea un nuevo script y ejecuta el siguiente código:

poleras <- c(254


c(254,
,203
203,
,182
182,
,50
50)
)
meses <- c("Ene"
c("Ene",
, "Feb"
"Feb",
, "Mar"
"Mar",, "Abr"
"Abr"))
min(poleras)
plot(poleras)
barplot(poleras,names.arg = meses,col="orange"
meses,col="orange"))

Ahora crea una carpeta dentro de tu proyecto llamada datos y ejecuta el siguiente
código.

write.csv(cbind(meses, poleras),"datos/poleras.csv"
poleras),"datos/poleras.csv"))
read.csv("datos/poleras.csv"
read.csv("datos/poleras.csv")
)

31 / 42
Paquetes de R

32 / 42
Paquetes de R
Para hacer efectiva la actualización del
software, y basado en el foco académico,
R utiliza librerías como conjunto de
funciones, datos y documentación que
denominaremos paquetes o packages.

Cuando iniciamos R se carga solo un


conjunto de funciones, datos y
documentación que se conoce como R
Base.

Para extender las posibilidades de R


Base tenemos que instalar otros
paquetes.

33 / 42
Paquetes de R

A la fecha de hoy, el total de packages disponibles en el CRAN de R es:

18.365

34 / 42
Paquetes de R
Los packages se pueden instalar directamente desde el software o descargarlos de
forma manual, esto último se puede hacer desde dos fuentes:

CRAN GitHub
Comprehensive R Archive Network Plataforma para desarrollo de software.
Muchos paquetes solo se comparten por
Es el repositorio oficial de paquetes de acá. En Github también podemos
R. Para estar acá los paquetes deben ser acceder a la versión en desarrollo de
aprobados. paquetes que están en CRAN.

install.packages("nombrepaquete") install.packages("remotes")
remotes::install_github("usuario/paque

Los paquetes se instalan solo una vez en nuestro equipo (pero se deben actualizar cada
cierto tiempo).

35 / 42
Paquetes de R
Para usar las funciones y datos contenidos en un paquete tenemos que “activarlo” en
nuestra sesión de R:

library(nombrepaquete)

Luego de esto, aparecerán disponibles en nuestra sesión las funciones de ese paquete.

Hay tantos paquetes en R que a veces pueden existir múltiples funciones con el mismo
nombre, si tenemos ambos paquetes cargados esto puede causar problemas en
nuestro código. Podemos especificar de qué paquete viene una función usando :: de la
siguiente forma:

nombrepaquete::nombrefuncion

36 / 42
Actividad Práctica
Instalemos el paquete ggplot2

install.packages("ggplot2"
install.packages("ggplot2")
)

Para activar el paquete usamos:

library(ggplot2)
library(ggplot2)

37 / 42
Cálculos en R

38 / 42
Cálculos en R
R se puede usar como una calculadora.
Algunas operaciones que podemos realizar son:

Operación
+ suma
- resta
* multiplicación
/ división
%/% división entera
^ potencia
sqrt() raíz cuadrada
log() logaritmo base e
exp() exponencial
abs() Valor Absoluto

39 / 42
Actividad práctica
Calcule en R
3
a. − 2 + 4 × 5 − e

π
b. − log(
log (5) +
√5

Solución

2 + (4
(4*5) - exp(3
exp(3)

## [1] 1.914463

log(55) + pi/sqrt(5
log( pi/sqrt(5)

## [1] 3.014401

40 / 42
Referencias y Material Complementario
1. R para Ciencia de Datos : Libro en línea, en español.

2. RStudio cheatsheets : “Torpedos”; en la parte inferior de la página hay versiones


en español disponibles.

3. RStudio Primers: Ejercicios interactivos; en inglés.

4. Hands-on Programming with R : Libro en línea de introducción a la programación


en R que no requiere conocimientos previos; en inglés.

41 / 42
¡Gracias!

Ana María Alvarado Celis


[email protected]

Esteban Rucan
[email protected]

42 / 42

También podría gustarte