100% encontró este documento útil (1 voto)
58 vistas28 páginas

Manejo de Datos en R: Guía Práctica

Gracias por la aclaración.

Cargado por

fabiola
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
100% encontró este documento útil (1 voto)
58 vistas28 páginas

Manejo de Datos en R: Guía Práctica

Gracias por la aclaración.

Cargado por

fabiola
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

PROGRAMA INTERNACIONAL DE ESTADÍSTICA APLICADA A

LA INVESTIGACIÓN CIENTÍFICA (2da. Edición)


MÓDULO: SOFTWARES PARA EL MANEJO DE DATOS

Linda Cabrera Orellana


Marzo, 2023

1 / 28
Contenido del módulo
Sección 1: Introducción a RStudio. Instalación de R y RStudio, Posit Cloud, Paquetes, Proyectos y Scripts.

Sección 2: Generalidades. Operadores, Variables, Funciones, Ayuda, Proceso del tidyverse.

Sección 3: Estructuras de datos. Importar datos, Vectores, Data.frames y Listas.

Sección 4: Tipos de datos. Numéricos, Caracteres, Factores, Fecha y Hora.

Sección 5: Manipulación de datos. Modificar el nombre de las variables, Seleccionar o descartar variables, Operador
pipe %>%, Filtrar observaciones, Agregar o editar variables, Resumir información, Agrupar o segmentar datos.
Adicional: Datos relacionales y Datos ordenados.

Sección 6: Gráficos con ggplot2. Gramática de gráficos, Datos, Estética, Geometría, Facetas, Transformaciones
Estadísticas, Coordenadas, Escalas y Temas.

Sección 7: Análisis exploratorio de datos. Histogramas, Gráfico de cajas, Gráfico de barras, Gráficos de dispersión,
Varias variables numéricas con una categórica. Adicional: Gráfico de violín, Gráfico de pastel, Lollipop, Gráfico de
cascada

Sección 8: Comunicando resultados en R. Introducción a Rmarkdown, Notebooks para ejecutar directamente


fragmentos de código de forma interactiva incluyendo gráficos y tablas, Diapositivas para presentaciones (HTML5,
LaTeX Beamer o PowerPoint), Formatos de artículos de revistas y libros. Adicional: ¿Qué es GitHub?, Conectar
RStudio y GitHub.
2 / 28
Horario del módulo
Duración: Del 13 al 30 de marzo de 2023.

Días: 13, 14, 15, 16, 22, 23, 29 y 30 de marzo de 2023.

Hora Contenido
19:00 a 20:10 Bloque 1
20:10 a 20:20 Receso
20:20 a 21:30 Bloque 2

3 / 28
Sección 1: Introducción a Rstudio
PROGRAMA INTERNACIONAL DE ESTADÍSTICA APLICADA A LA
INVESTIGACIÓN CIENTÍFICA (2da. Edición)
MÓDULO: SOFTWARES PARA EL MANEJO DE DATOS

Linda Cabrera Orellana

Marzo, 2023

4 / 28
¿Qué es R? y ¿Por qué R?

5 / 28
¿Qué es R?
Algunos datos importantes que debes conocer acerca de :

Fue desarrollado inicialmente por Robert Gentleman


y Ross Ihaka del Departamento de Estadística de la
Universidad de Auckland en 1993.

Es un lenguaje de programación de análisis de


datos.

Es un entorno de software libre y tiene licencia GNU


GLP (Licencia Pública General de GNU).

A Brief History R: Past and Future History

6 / 28
¿Por qué R?
Es uno de los lenguajes de programación más
utilizados en investigación científica.

Integra multitud de paquetes.

Capacidad gráfica.

GUI disponibles gratuitas para R, como Rcmdr y


Rattle.

Existen varias comunidades en el mundo para


fomentar el avance del conocimiento y el uso del
lenguaje de programación en R.

Top programming languages used in medical research || #30díasdegráficos || The R community

7 / 28
"Cuando comienzas a programar, es fácil
sentirte realmente frustrado... Es solo una
parte natural de la programación, le sucede a
todos y se vuelve cada vez menos con el
tiempo. No te culpes. Solo tómate un
descanso, haz algo divertido y luego regresa
e inténtalo de nuevo más tarde."

Hadley Wickham

R for Data Science

8 / 28
Instalación del software

9 / 28
10 / 28
Instalación de R
Es necesario realizar la instalación en el mismo orden que se indica aquí, es decir instalar primero R y luego RStudio.

1. Para descargar R, ingresa a CRAN al link https://cran.rstudio.com/ y elige el sistema operativo de tu computadora.
CRAN es un acrónimo de Comprehensive R Archive Network (Red integral de archivos R) para el lenguaje de
programación R.

2. Si tu sistema operativo es Windows, en la siguiente pantalla que te aparece elige la primera opción que indica base.
Luego haz clic para iniciar la descarga del instalador de la última versión de R para Windows.

3. Si tu sistema operativo es macOS, elige la primera opción que indica R-4.2.2-arm64.pkg para iniciar la descarga del
instalador.

4. Cuando se haya terminado de descargar el instalador, abre el ejecutable, elige el idioma español y sigue todos los
pasos para su instalación dando clic en siguiente. Asegúrate que la ruta de instalación no contenga espacios en
blancos, ni signos especiales. Este proceso de instalación puede durar algunos minutos.

5. Cuando se haya completado la instalación, para confirmar que se hizo correctamente nos dirigimos a las
aplicaciones y hacemos clic en Inicio -> Todas las aplicaciones -> R -> R X64 4.2.0.

11 / 28
Instalación de RStudio
1. Con R instalado, ahora procederemos a descargar RStudio desde https://posit.co/download/rstudio-desktop/.

2. Hacer clic en el ejecutable que se ha descargado e inicia la instalación siguiendo todos los pasos. Para confirmar que
la instalación se hizo correctamente nos dirigimos a las aplicaciones y hacemos clic en RStudio.

Posit Cloud
La plataforma se encuentra en internet y no necesitamos instalar ningún IDE, ni ninguna herramienta como R. Fue liberada
en el 2019 por RStudio.

1. Ingresar a Posit Cloud en el link https://posit.cloud/.

2. Crear una cuenta en Posit Cloud.

12 / 28
13 / 28
Entendiendo RStudio

14 / 28
15 / 28
Entendiendo RStudio

Entorno del espacio de trabajo Archivos de comandos


Incluye cualquier objeto definido por el usuario Los scripts son documentos de texto con la
(vectores, matrices, marcos de datos, listas, extensión de archivo .R, por ejemplo mi_script.R.
funciones).
Puedo crear un script:

Consola 1. Utilizando la ruta File -> New File -> R Script.

Se puede codificar directamente, pero no se 2. Utilizando el atajo Ctrl+Shift+N.


guardará el código. Puedo ingresar operaciones
Aparecerá un * en scripts no guardados.
matemáticas directamente:

8*4
## [1] 32

Editing and Executing Code in the RStudio IDE

16 / 28
Entendiendo RStudio

Pantallas varias plot(c(1,2,3))

Archivos: Le permite ver qué archivos están


disponibles en su directorio de trabajo.

Gráficos: Mostrará cualquier visualización que


produzca su código.

Paquetes: Mostrará una lista de todos los paquetes


descargados a su computadora y también los que
están cargados.

Ayuda: Permite buscar temas sobre los que necesita


ayuda y también mostrará las respuestas de ayuda.

17 / 28
PAUSA
No te desconectes, pero si aléjate de las pantallas

Volvemos en 10 minutos

18 / 28
Trabajando con paquetes

19 / 28
¿Qué son los Paquetes?
En R, la unidad fundamental del código compartible es el
paquete. Un paquete agrupa código, datos,
documentación y pruebas y proporciona un método fácil
para compartir con otros.

Esquema de R:

1. R base
2. Funciones adicionales con paquetes

Debes tener en cuenta que los paquetes:

1. Se instalan en RStudio (solo la primera vez) y,


2. Se cargan en RStudio (cada nueva sesión)

20 / 28
Instalando Paquetes

Desde CRAN Desde GitHub


Repositorio oficial compuesto de un conjunto de
install.packages("devtools")
servidores web y ftp mantenidos por la comunidad R a lo devtools::install_github("hadley/babynames")
largo de todo el mundo.

1. Por la interfaz gráfica


Desde Bioconductor
Desde la barra de Herramientas, escogemos la
opción Tools -> Install packages... Se trata de un repositorio específico para bioinformática.
Puede revisar más información en
Desde el panel de pantallas varias en la pestaña https://www.bioconductor.org/
de Packages

2. Con código.

install.packages("dplyr")

ftp: File Transfer Protocol (la traducción de significa Protocolo de transferencia de archivos) en lugar del HTTP. El servidor
FTP sirve para guardar archivos, imágenes e información importante y valiosa.
21 / 28
Cargando Paquetes
Una vez que el paquete se descarga en su computadora, puede acceder a las funciones y recursos proporcionados
mediante código:

# carga el paquete para usar en la sesión actual de R


library(dplyr)

# usar una función particular dentro de un paquete sin cargar el paquete


filter()

También puede cargar los paquetes desde el panel de pantallas varias en la pestaña de Packages.

RStudio compiló una guía con algunos de los mejores paquetes para cargar, manipular, visualizar, analizar e informar
datos, que la puedes encontrar en https://support.rstudio.com/hc/en-us/articles/201057987-Quick-list-of-useful-R-
packages.

22 / 28
23 / 28
Creando proyectos y scripts

24 / 28
Proyectos
Carpetas que contienen los scripts, archivos desde
donde se importan los datos y los archivos de
proyecto como el .RData (contiene los objetos con
los que se está trabajando) y .Rhistory (contiene el
historial de comandos).

Cada vez que se abre un proyecto existente, se


abren las ventanas que se encontraban activas en
ese proyecto.

Para crear un proyecto seguimos los siguientes


pasos: Project -> New Project... -> New
Directory -> Empty Project -> "Poner
nombre al proyecto y elegir ruta" ->
Create Project

La función getwd() sirve para conocer el directorio


en el que me encuentro actualmente

25 / 28
26 / 28
Scripts

Para ejecutar código:

1. La línea de código fuente donde reside el cursor, presione Ctrl+Enter (o use el botón Run).
2. Seleccione varias líneas a la vez y presione Ctrl+Enter.
3. Todo el documento, presione Ctrl+Shift+Enter (o use el botón Source).

Puede comentar y descomentar mediante el elemento de menú Código -> Comentar/Descommentar líneas o
presiones Ctrl+Shift+C o escribiendo el signo numeral.

Para crear secciones utiliza Ctrl+Shift+R.

27 / 28
Introducción a RStudio
Linda Cabrera Orellana

@socecuest @see_estadistica

@see_estadistica @sosecuest

28 / 28

También podría gustarte