PROGRAMA INTERNACIONAL DE ESTADÍSTICA APLICADA A
LA INVESTIGACIÓN CIENTÍFICA (2da. Edición)
MÓDULO: SOFTWARES PARA EL MANEJO DE DATOS
Linda Cabrera Orellana
Marzo, 2023
1 / 28
Contenido del módulo
Sección 1: Introducción a RStudio. Instalación de R y RStudio, Posit Cloud, Paquetes, Proyectos y Scripts.
Sección 2: Generalidades. Operadores, Variables, Funciones, Ayuda, Proceso del tidyverse.
Sección 3: Estructuras de datos. Importar datos, Vectores, Data.frames y Listas.
Sección 4: Tipos de datos. Numéricos, Caracteres, Factores, Fecha y Hora.
Sección 5: Manipulación de datos. Modificar el nombre de las variables, Seleccionar o descartar variables, Operador
pipe %>%, Filtrar observaciones, Agregar o editar variables, Resumir información, Agrupar o segmentar datos.
Adicional: Datos relacionales y Datos ordenados.
Sección 6: Gráficos con ggplot2. Gramática de gráficos, Datos, Estética, Geometría, Facetas, Transformaciones
Estadísticas, Coordenadas, Escalas y Temas.
Sección 7: Análisis exploratorio de datos. Histogramas, Gráfico de cajas, Gráfico de barras, Gráficos de dispersión,
Varias variables numéricas con una categórica. Adicional: Gráfico de violín, Gráfico de pastel, Lollipop, Gráfico de
cascada
Sección 8: Comunicando resultados en R. Introducción a Rmarkdown, Notebooks para ejecutar directamente
fragmentos de código de forma interactiva incluyendo gráficos y tablas, Diapositivas para presentaciones (HTML5,
LaTeX Beamer o PowerPoint), Formatos de artículos de revistas y libros. Adicional: ¿Qué es GitHub?, Conectar
RStudio y GitHub.
2 / 28
Horario del módulo
Duración: Del 13 al 30 de marzo de 2023.
Días: 13, 14, 15, 16, 22, 23, 29 y 30 de marzo de 2023.
Hora Contenido
19:00 a 20:10 Bloque 1
20:10 a 20:20 Receso
20:20 a 21:30 Bloque 2
3 / 28
Sección 1: Introducción a Rstudio
PROGRAMA INTERNACIONAL DE ESTADÍSTICA APLICADA A LA
INVESTIGACIÓN CIENTÍFICA (2da. Edición)
MÓDULO: SOFTWARES PARA EL MANEJO DE DATOS
Linda Cabrera Orellana
Marzo, 2023
4 / 28
¿Qué es R? y ¿Por qué R?
5 / 28
¿Qué es R?
Algunos datos importantes que debes conocer acerca de :
Fue desarrollado inicialmente por Robert Gentleman
y Ross Ihaka del Departamento de Estadística de la
Universidad de Auckland en 1993.
Es un lenguaje de programación de análisis de
datos.
Es un entorno de software libre y tiene licencia GNU
GLP (Licencia Pública General de GNU).
A Brief History R: Past and Future History
6 / 28
¿Por qué R?
Es uno de los lenguajes de programación más
utilizados en investigación científica.
Integra multitud de paquetes.
Capacidad gráfica.
GUI disponibles gratuitas para R, como Rcmdr y
Rattle.
Existen varias comunidades en el mundo para
fomentar el avance del conocimiento y el uso del
lenguaje de programación en R.
Top programming languages used in medical research || #30díasdegráficos || The R community
7 / 28
"Cuando comienzas a programar, es fácil
sentirte realmente frustrado... Es solo una
parte natural de la programación, le sucede a
todos y se vuelve cada vez menos con el
tiempo. No te culpes. Solo tómate un
descanso, haz algo divertido y luego regresa
e inténtalo de nuevo más tarde."
Hadley Wickham
R for Data Science
8 / 28
Instalación del software
9 / 28
10 / 28
Instalación de R
Es necesario realizar la instalación en el mismo orden que se indica aquí, es decir instalar primero R y luego RStudio.
1. Para descargar R, ingresa a CRAN al link https://cran.rstudio.com/ y elige el sistema operativo de tu computadora.
CRAN es un acrónimo de Comprehensive R Archive Network (Red integral de archivos R) para el lenguaje de
programación R.
2. Si tu sistema operativo es Windows, en la siguiente pantalla que te aparece elige la primera opción que indica base.
Luego haz clic para iniciar la descarga del instalador de la última versión de R para Windows.
3. Si tu sistema operativo es macOS, elige la primera opción que indica R-4.2.2-arm64.pkg para iniciar la descarga del
instalador.
4. Cuando se haya terminado de descargar el instalador, abre el ejecutable, elige el idioma español y sigue todos los
pasos para su instalación dando clic en siguiente. Asegúrate que la ruta de instalación no contenga espacios en
blancos, ni signos especiales. Este proceso de instalación puede durar algunos minutos.
5. Cuando se haya completado la instalación, para confirmar que se hizo correctamente nos dirigimos a las
aplicaciones y hacemos clic en Inicio -> Todas las aplicaciones -> R -> R X64 4.2.0.
11 / 28
Instalación de RStudio
1. Con R instalado, ahora procederemos a descargar RStudio desde https://posit.co/download/rstudio-desktop/.
2. Hacer clic en el ejecutable que se ha descargado e inicia la instalación siguiendo todos los pasos. Para confirmar que
la instalación se hizo correctamente nos dirigimos a las aplicaciones y hacemos clic en RStudio.
Posit Cloud
La plataforma se encuentra en internet y no necesitamos instalar ningún IDE, ni ninguna herramienta como R. Fue liberada
en el 2019 por RStudio.
1. Ingresar a Posit Cloud en el link https://posit.cloud/.
2. Crear una cuenta en Posit Cloud.
12 / 28
13 / 28
Entendiendo RStudio
14 / 28
15 / 28
Entendiendo RStudio
Entorno del espacio de trabajo Archivos de comandos
Incluye cualquier objeto definido por el usuario Los scripts son documentos de texto con la
(vectores, matrices, marcos de datos, listas, extensión de archivo .R, por ejemplo mi_script.R.
funciones).
Puedo crear un script:
Consola 1. Utilizando la ruta File -> New File -> R Script.
Se puede codificar directamente, pero no se 2. Utilizando el atajo Ctrl+Shift+N.
guardará el código. Puedo ingresar operaciones
Aparecerá un * en scripts no guardados.
matemáticas directamente:
8*4
## [1] 32
Editing and Executing Code in the RStudio IDE
16 / 28
Entendiendo RStudio
Pantallas varias plot(c(1,2,3))
Archivos: Le permite ver qué archivos están
disponibles en su directorio de trabajo.
Gráficos: Mostrará cualquier visualización que
produzca su código.
Paquetes: Mostrará una lista de todos los paquetes
descargados a su computadora y también los que
están cargados.
Ayuda: Permite buscar temas sobre los que necesita
ayuda y también mostrará las respuestas de ayuda.
17 / 28
PAUSA
No te desconectes, pero si aléjate de las pantallas
Volvemos en 10 minutos
18 / 28
Trabajando con paquetes
19 / 28
¿Qué son los Paquetes?
En R, la unidad fundamental del código compartible es el
paquete. Un paquete agrupa código, datos,
documentación y pruebas y proporciona un método fácil
para compartir con otros.
Esquema de R:
1. R base
2. Funciones adicionales con paquetes
Debes tener en cuenta que los paquetes:
1. Se instalan en RStudio (solo la primera vez) y,
2. Se cargan en RStudio (cada nueva sesión)
20 / 28
Instalando Paquetes
Desde CRAN Desde GitHub
Repositorio oficial compuesto de un conjunto de
install.packages("devtools")
servidores web y ftp mantenidos por la comunidad R a lo devtools::install_github("hadley/babynames")
largo de todo el mundo.
1. Por la interfaz gráfica
Desde Bioconductor
Desde la barra de Herramientas, escogemos la
opción Tools -> Install packages... Se trata de un repositorio específico para bioinformática.
Puede revisar más información en
Desde el panel de pantallas varias en la pestaña https://www.bioconductor.org/
de Packages
2. Con código.
install.packages("dplyr")
ftp: File Transfer Protocol (la traducción de significa Protocolo de transferencia de archivos) en lugar del HTTP. El servidor
FTP sirve para guardar archivos, imágenes e información importante y valiosa.
21 / 28
Cargando Paquetes
Una vez que el paquete se descarga en su computadora, puede acceder a las funciones y recursos proporcionados
mediante código:
# carga el paquete para usar en la sesión actual de R
library(dplyr)
# usar una función particular dentro de un paquete sin cargar el paquete
filter()
También puede cargar los paquetes desde el panel de pantallas varias en la pestaña de Packages.
RStudio compiló una guía con algunos de los mejores paquetes para cargar, manipular, visualizar, analizar e informar
datos, que la puedes encontrar en https://support.rstudio.com/hc/en-us/articles/201057987-Quick-list-of-useful-R-
packages.
22 / 28
23 / 28
Creando proyectos y scripts
24 / 28
Proyectos
Carpetas que contienen los scripts, archivos desde
donde se importan los datos y los archivos de
proyecto como el .RData (contiene los objetos con
los que se está trabajando) y .Rhistory (contiene el
historial de comandos).
Cada vez que se abre un proyecto existente, se
abren las ventanas que se encontraban activas en
ese proyecto.
Para crear un proyecto seguimos los siguientes
pasos: Project -> New Project... -> New
Directory -> Empty Project -> "Poner
nombre al proyecto y elegir ruta" ->
Create Project
La función getwd() sirve para conocer el directorio
en el que me encuentro actualmente
25 / 28
26 / 28
Scripts
Para ejecutar código:
1. La línea de código fuente donde reside el cursor, presione Ctrl+Enter (o use el botón Run).
2. Seleccione varias líneas a la vez y presione Ctrl+Enter.
3. Todo el documento, presione Ctrl+Shift+Enter (o use el botón Source).
Puede comentar y descomentar mediante el elemento de menú Código -> Comentar/Descommentar líneas o
presiones Ctrl+Shift+C o escribiendo el signo numeral.
Para crear secciones utiliza Ctrl+Shift+R.
27 / 28
Introducción a RStudio
Linda Cabrera Orellana
@socecuest @see_estadistica
@see_estadistica @sosecuest
28 / 28