Instalación de R y RStudio
Para instalar R en nuestro ordenador, vamos a la página web de R
project: http://www.r-project.org
Para descargar R, hacemos clic en CRAN y seleccionamos el enlace del “espejo” más
próximo a nuestra ubicación. Ahora, en función del sistema operativo de nuestro
ordenador, seleccionamos la opción adecuada.
Instalar R en Windows.
Al hacer clic sobre Download R for Windows iremos a la página que se reproduce
más abajo. Hacemos clic sobre install R for the first time
En la siguiente ventana, hacemos clic sobre Download R 4.0.2 for Windows y
guardamos el archivo de instalación
Abrimos el archivo descargado (haciendo doble clic sobre fichero) para instalar R.
Instalar R en Mac.
Al hacer clic sobre Download R for (Mac) OS X iremos a la página que se reproduce
más abajo. Hacemos clic sobre R-4.0.2.pkg para descargarnos el fichero de
instalación.
Abrimos R-4.0.2.pkg y seguimos las instrucciones para instalar R.
Instalar RStudio.
Una vez que hemos instalado R, descargamos RStudio
desde https://posit.co/download/rstudio-desktop/#download
Para descargar el fichero ejecutable, seleccionamos la opción según nuestro sistema
operativo:
• RStudio 1.1.463 - Windows Vista/7/8/10
• RStudio 1.1.463 - Mac OS X 10.6+ (64-bit)
Primero, guardamos el fichero. A continuación, lo abrimos para instalar RStudio.
Seguimos las instrucciones de instalación.
Iniciar RStudio.
En general, trabajamos con la interfaz de RStudio antes que con la de R porque la
primera es “más amigable”.
Para iniciar RStudio, hacemos clic en el icono de RStudio:
Al abrir RStudio deberíamos ver algo parecido a:
RStudio está (normalmente) dividido en 4 paneles:
• Script
• Consola
• Entorno e historia
• Panel misceláneo: para visualizar ficheros, gráficos, paquetes, etc.
Por defecto, la consola se encuentra en el panel izquierdo. Primero aparece un texto
informativo y después el prompt del sistema (“>”). ¿Vemos el cursor intermitente?
Aquí es donde R espera que le demos instrucciones. Para ejecutar las instrucciones y
obtener el resultado pulsamos Enter.
Trabajar en la Consola es muy limitado ya que en la Consola las instrucciones
generalmente se escriben y ejecutan una por una. Lo habitual es trabajar con scripts
o ficheros de instrucciones. Estos ficheros tienen la extensión .R. Para crear un
script, seleccionamos File > New File > R Script
Ahora el panel del script se sitúa en la parte superior-izquierda de RStudio y la
Consola en el panel inferior-izquierdo. Por defecto, el nombre del nuevo script es
“Untitled1”.
En el script podemos escribir las instrucciones línea por línea.
Las instrucciones:
• las podemos ejecutar una a una;
• las podemos seleccionar todas (o algunas de ellas) y ejecutar la selección.
Para ejecutar una instrucción o selección de instrucciones hacemos clic en o
utilizamos la combinación de teclas (Ctrl+enter o Cmd+enter)
Trabajar con proyectos
Una vez hemos arrancado RStudio, deberíamos establecer el directorio de trabajo
para indicar a R y RStudio donde se encuentran nuestros datos, scripts, etc. Sin
embargo, en nuestra opinión, la mejor opción es crear un proyecto. Al crear un
proyecto todos los ficheros (de datos, scripts, etc.) y directorios quedan vinculados
directamente al proyecto. Es decir, todo el trabajo que realicemos en un proyecto
estará auto-contenido en el directorio del proyecto. De esta forma, fácilmente
podemos compartir nuestro proyecto con alguien más o podemos copiar y pegar
nuestro proyecto en otro ordenador, etc.
Para crear un proyecto en RStudio, seleccionamos File > New project… Se
abrirá una ventana similar a la que se muestra en la siguiente Figura.
Para crear un proyecto en un nuevo directorio, hacemos clic en el botón New
Directory. Seguidamente, seleccionamos el tipo de proyecto, en nuestro caso New
Project. Ahora, asignamos un nombre al directorio (carpeta) que se va a crear y que
al mismo tiempo será el nombre del proyecto de R. Para terminar, hacemos clic en el
botón Create Project. Al seguir este proceso se habrá creado una carpeta en
Documentos y dentro encontraremos el archivo: “nombre_carpeta.Rproj”.
Para crear un proyecto en una carpeta que ya existe, hacemos clic en el
botón Existing Directory y después seleccionamos el directorio o carpeta
ayudándonos del botón Browse…. Una vez elegida la carpeta, clicamos en el
botón Create Project.
Para abrir un proyecto, hacemos doble clic sobre el archivo con extensión .Rproj.
También podemos abrir el proyecto desde el menú de RStudio: File > Open Project…
Ventaja de los proyectos: cualquier fichero que guardemos trabajando en un proyecto
se guardará en la carpeta del proyecto.
Es muy conveniente crear un proyecto para cada trabajo que realicemos
Conceptos básicos de R-base.
Una vez nos hemos familiarizado con el entorno de trabajo, vamos a ver los conceptos
básicos de R. En esta sesión vamos a estudiar los diferentes tipos de datos y objetos
con los que trabja R, y algunas funciones básicas (pero potentes) para el tratamiento
de datos.
AQUÍ podéis descargaros una cheat cheet de R-base.
Vamos a comenzar utilizando R como una “super” calculadora, annque
evidentemente no es para esto para lo que vamos utilizarlo!!!
3 + 4
log(10)
exp(-0.5)
x <- 3 + 4
x # x es un vector cuya primera componente es 7. Enseguida vamos co
n los vectores!
y = 2 + 6
y
z <- c(x,y) # la función c() se utiliza para crear vectores
z
mean(z)
a <- mean(z)
a
b <- max(z)
b
(c <- rnorm(100))
round(c, 2)
set.seed(10)
d <- round(rnorm(100),2)
args(round) # para ver los argumentos de una función
R utiliza funciones para realizar operaciones. En el ejemplo anterior son funciones:
log(),exp(), c(),mean(),rnorm(),set.seed(), etc. Para utilizar una función deben
especificarse unos determinados argumentos (args()), que los escribimos dentro de
los paréntesis separados por comas. En el caso de la función round() hemos
especificado dos argumentos: el vector que queremos redondear (c) y el número de
decimales del redondeo (digits); en el caso de rnorm() sólo hemos especificado el
número de datos que queríamos, el resto de argumentos son fijados a los valores por
defecto.
El símbolo <- es el operador para asignar. También se puede utilizar = (o menos
frecuente ->), aunque es preferible utilizar el <-.
El símbolo # se utiliza para introducir un comentario. Todo lo que quede a la derecha
de # no se ejecutará.
Cuando se realiza una asignación se obtiene un objeto. Podemos ver el resultado o
contenido de un objeto de varias formas. Por ejemplo, para ver qué es el
objeto x podemos escribir en la consola:
• x
• print(x)
• (x <- 3 + 4)
También lo podemos ver en el panel de entorno del escritorio de RStudio.
2.2.1. Instalar y cargar paquetes
loadedNamespaces()
R está compuesto por un sistema base, pero para extender su funcionalidad es
necesario instalar paquetes adicionales.
Podemos instalar paquetes de varias formas:
• A través del menú: Tools > Install packages…
• En el escritorio de RStudio: Packages/Install. Vemos los paquetes que
tenemos actualmente instalados y aquellos que se encuentran cargados.
Figura. Listado paquetes instalados en R
• Utilizando la función install.packages(). El nombre del paquete que
queremos instalar debe ir entre comillas.
install.packages("dplyr") # dplyr es un paquete que se utiliza para man
ipular/gestionar datos.
En ocasiones, para nuestra sesión de trabajo necesitamos instalar varios paquetes.
install.packages(c("dplyr","ggplot2","rio"))
Es habitual iniciar la sesión de trabajo en R con un “pequeño programa” en el que se
indica que para la sesión se requiere una serie de paquetes y que si no están
instalados los instale. Aquí tenemos la versión más sencilla para hacer esto.
if(!require(dplyr)) {install.packages("dplyr")}
También es muy habitual instalar paquetes que se encuentran en GitHub
(generalmente, versiones de desarrollo). Para hacer esto, primero tenemos que tener
instalado el paquete devtools y luego …
# install.packages("devtools")
devtools::install_github("perezp44/personal.pjp")
Una vez instalado el paquete, hay que cargarlo para poderlo utilizar. Esto se hace con
la función library().
library(dplyr) # el nombre del paquete se puede poner entre comillas o
se pueden omitir.