0% encontró este documento útil (0 votos)
19 vistas2 páginas

Script Clase.R

El documento presenta un script en R que incluye la carga de librerías para manipulación y análisis de datos, así como la creación y lectura de un archivo CSV con datos incompletos. Se explican funciones para calcular medidas de tendencia central como la media, mediana y moda, y se muestra cómo seleccionar y omitir columnas en un data frame. Además, se utiliza la función apply() para aplicar cálculos a las columnas del data frame.

Cargado por

cris
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como TXT, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
19 vistas2 páginas

Script Clase.R

El documento presenta un script en R que incluye la carga de librerías para manipulación y análisis de datos, así como la creación y lectura de un archivo CSV con datos incompletos. Se explican funciones para calcular medidas de tendencia central como la media, mediana y moda, y se muestra cómo seleccionar y omitir columnas en un data frame. Además, se utiliza la función apply() para aplicar cálculos a las columnas del data frame.

Cargado por

cris
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como TXT, PDF, TXT o lee en línea desde Scribd

# Carga de Librerías --------

library(modeest) # Para calcular la moda(funcion mfv)


library(tictoc) # Permite medir tiempos
library(readr) # Leer archivos csv de forma rápida y eficiente.
library(tidyverse)# manipulación, limpieza, análisis y visualización de datos

#Comando "help" permite encontrar ayuda


help(tidyverse) #información sobre un paquete
help(mean) #información sobre una función

# Esto es un comentario

# Correr todo el código CTRL +SHIFT + ENTER

# Crear un archivo CSV con datos incompletos


archivo <- "datos_incompletos.csv"
contenido <- "Nombre;Edad;Altura; Nota
Carlos;18;1.75;8
Ana;25;19;7
Pedro;19;1.80;10
Juan;19;1.65;7
Flor;20;1.60;8"

# Guardar el contenido en un archivo


writeLines(contenido, archivo) # Se crea un archivo en nuestro directorio

# Leer archivo csv con R Base -----


df<-read.csv("datos_incompletos.csv",sep = ";",header= T)
View(df)

df1<-data.frame(Numeros=c(1,2,3,4,5,5,5),Col2=c(1:7))

df1

# Leer archivos con readr------


#read_csv("nombre archivo"): Lee archivos delimitados por comas
#read_tsv("nombre archivo): Lee archivos delimitados por tabulaciones
#read_delim("nombre archivo", delim="escribir delimitador"): Lee archivos
delimitados por cualquier delimitador que se especifique en delim
df_readr<-read_delim("datos_incompletos.csv",delim=";")

# Selección de columnas en un data frame ------


# Seleccionar una columna ($) en un data frame
df$Nota

# Seleccionar más de una columna en un data frame


df[c(1,3)]

# Omitir columnas en un data frame


df[-1]

df[c(-1,-4)]

df[-c(1,3)]

# Funciones de tendencia central ------


# Calculemos la media
mean(df$Nota)

sum(df$Nota) # Suma todos los números de un vector

length(df$Nota) # Longitud del vector

media_numeros<-sum(df$Nota)/length(df$Nota)

# Parámetro trim: recorda el % de datos que pueden ser outliers


x <- c(1, 2, 3, 4, 100)

mean(x)
# Resultado: 22

mean(x, trim = 0.2)

# Calcular la mediana
median(df$Nota)

# Calcular moda

mfv(df$Nota)

modeest::mfv(df1$Numeros)

mfv(df1$Col2)

# Funció apply()--------
#apply(x, MARGIN, FUN)
# x : matriz, dataframe, lista o vector.
# MARGIN: 1 para operar sobre las filas y 2 para operar sobre las columnas.
# FUN: Función que se aplica sobre filas o columnas.

apply(df,2,mfv)

apply(df, 2, mean) # Obtenemos un error puesto que no podemos sacar la media de


nombre

# Cálculo de la media por columnas


apply(df[-1],2,mean) # Seleccionamos el rango de celdas donde podemos calcular la
media

También podría gustarte