Práctica - Introducción R y Rstudio
Para el desarrollo de la práctica se proporcionará un archivo excell con los datos correspondiente, para
acceder al archivo haz click en el siguiente enlace que encontrará la base de datos proporcionada
[Link] -
teWOkVCrc/edit?gid=2062610862#gid=2062610862
Para abrir un archivo excell (.xlsx) en Rstudio, proceder a utilizar el siguiente paquete:
[Link]("readxl")
Posteriormente, proceder a ejecutar el paquete con el siguiente script:
library(readxl)
Copia la dirección o ruta del archivo excell descargado.
archivo <- "ruta/al/[Link]" # Guardo la ruta de acceso en un objeto
# llamado 'archivo'
Tomando en consideración que el archivo de excell compartido es .xlsx, utiliza el siguiente script de la
función
read_excel ( ):
data <- read_excel(archivo) # Recuerda que 'archivo' contiene la ruta de acceso
Para corroborar que el archivo excell se haya subido correctamente, utiliza el siguiente script de la
función
View ():
View(data)
1
¡Ahora sí! Con la información cargada en Rstudio, procede a resolver los ejercicios propuestos:
1. ¿Cuál es la media, la mediana y la desviación estándar de la edad de los pacientes? Utiliza la
función mean () para calcular la media, median () para calcular la mediana y sd () para la
desviación estándar de la columna Edad.
2. ¿Cuántos pacientes masculinos y cuántos femeninos hay en la base de datos? Utiliza la
función count () de dplyr para contar cuántos pacientes hay de cada género. Count se
encarga de contar ocurrencias en dataframa o table.
3. ¿Cuántos pacientes tienen 40 años o más? Utiliza la función filter() de dplyr para filtrar los
pacientes con 40 años o más y luego cuenta cuántos son.
4. ¿Cuál es el peso promedio de cada una de las variables (columnas) para cada género de los
pacientes masculinos y femeninos? Utiliza las funciones group_by () y summarise () de
dplyr para agrupar por género y calcular el peso promedio.
5. ¿Cuál es la media, el mínimo, y el máximo de la presión arterial sistólica? Utiliza la función
summarise () de dplyr para calcular estas estadísticas.
6. ¿Cuál es el nivel promedio de colesterol de los pacientes que tienen más de 50 años? Usa
filter () para seleccionar pacientes mayores de 50 años y luego summarise () para calcular el
colesterol promedio.
Ejercicios adicionales
7. Elabora un boxplot comparando niveles de colesterol por género
8. Utilizar summarise y group_by para obtener la media de las presiones arteriales por grupo
de edad (por ejemplo, <40 años, 40-50 años, >50 años).
¡ÉXITOS, RECUERDA QUE LA PRÁCTICA AYUDA A REFORZAR LO APRENDIDO!