# Carga de Librerías --------
library(modeest) # Para calcular la moda(funcion mfv)
library(tictoc) # Permite medir tiempos
library(readr) # Leer archivos csv de forma rápida y eficiente.
library(tidyverse)# manipulación, limpieza, análisis y visualización de datos
#Comando "help" permite encontrar ayuda
help(tidyverse) #información sobre un paquete
help(mean) #información sobre una función
# Esto es un comentario
# Correr todo el código CTRL +SHIFT + ENTER
# Crear un archivo CSV con datos incompletos
archivo <- "datos_incompletos.csv"
contenido <- "Nombre;Edad;Altura; Nota
Carlos;18;1.75;8
Ana;25;19;7
Pedro;19;1.80;10
Juan;19;1.65;7
Flor;20;1.60;8"
# Guardar el contenido en un archivo
writeLines(contenido, archivo) # Se crea un archivo en nuestro directorio
# Leer archivo csv con R Base -----
df<-read.csv("datos_incompletos.csv",sep = ";",header= T)
View(df)
df1<-data.frame(Numeros=c(1,2,3,4,5,5,5),Col2=c(1:7))
df1
# Leer archivos con readr------
#read_csv("nombre archivo"): Lee archivos delimitados por comas
#read_tsv("nombre archivo): Lee archivos delimitados por tabulaciones
#read_delim("nombre archivo", delim="escribir delimitador"): Lee archivos
delimitados por cualquier delimitador que se especifique en delim
df_readr<-read_delim("datos_incompletos.csv",delim=";")
# Selección de columnas en un data frame ------
# Seleccionar una columna ($) en un data frame
df$Nota
# Seleccionar más de una columna en un data frame
df[c(1,3)]
# Omitir columnas en un data frame
df[-1]
df[c(-1,-4)]
df[-c(1,3)]
# Funciones de tendencia central ------
# Calculemos la media
mean(df$Nota)
sum(df$Nota) # Suma todos los números de un vector
length(df$Nota) # Longitud del vector
media_numeros<-sum(df$Nota)/length(df$Nota)
# Parámetro trim: recorda el % de datos que pueden ser outliers
x <- c(1, 2, 3, 4, 100)
mean(x)
# Resultado: 22
mean(x, trim = 0.2)
# Calcular la mediana
median(df$Nota)
# Calcular moda
mfv(df$Nota)
modeest::mfv(df1$Numeros)
mfv(df1$Col2)
# Funció apply()--------
#apply(x, MARGIN, FUN)
# x : matriz, dataframe, lista o vector.
# MARGIN: 1 para operar sobre las filas y 2 para operar sobre las columnas.
# FUN: Función que se aplica sobre filas o columnas.
apply(df,2,mfv)
apply(df, 2, mean) # Obtenemos un error puesto que no podemos sacar la media de
nombre
# Cálculo de la media por columnas
apply(df[-1],2,mean) # Seleccionamos el rango de celdas donde podemos calcular la
media