Curso Introductorio de R para Análisis de Datos
Clase 1: ¿Qué es R y por qué usarlo?
Objetivo: Entender qué es R, sus ventajas, y cómo se compara con otras
herramientas.
¿Qué es R?
R es un lenguaje de programación y un entorno de software libre para el análisis
estadístico y la visualización de datos. Desarrollado originalmente por Ross Ihaka
y Robert Gentleman en la Universidad de Auckland, ha crecido hasta convertirse
en uno de los lenguajes más utilizados por estadísticos, epidemiólogos,
científicos sociales, y científicos de datos.
Ventajas de R
Es gratuito y de código abierto.
Amplísima comunidad de usuarios y paquetes.
Excelente para análisis estadísticos complejos.
Gráficos de alta calidad.
Integración con Markdown, LaTeX, bases de datos, APIs, etc.
¿R o Python?
Si tu foco es el análisis estadístico profundo, R suele ser más directo.
Si te interesa aplicaciones web, machine learning general o
automatización, Python puede ser más versátil.
¡Ambos se complementan!
Clase 2: Instalación y entorno de trabajo
Objetivo: Instalar R y RStudio, configurar el entorno y entender los componentes
básicos.
Instalación
1. Descarga R desde https://cran.r-project.org/
2. Instala RStudio (IDE recomendado): https://posit.co/download/rstudio-
desktop/
¿Qué es RStudio?
Es un entorno de desarrollo integrado para R. Está compuesto por:
Console: donde se ejecuta el código.
Source: donde se escriben scripts.
Environment/History: para ver objetos cargados y comandos previos.
Files/Plots/Packages/Help/Viewer: panel multifunción.
Primeros pasos
CopiarEditar
# Operaciones básicas
2+2
sqrt(25)
log(10)
# Asignaciones
x <- 5
y <- 10
z <- x + y
Clase 3: Tipos de datos y estructuras
Objetivo: Conocer los tipos de datos básicos y las estructuras de datos en R.
Tipos de datos
Numérico: x <- 3.14
Entero: y <- 5L
Lógico: z <- TRUE
Caracter: w <- "Hola"
CopiarEditar
class(x) # "numeric"
is.integer(y) # TRUE
Vectores
CopiarEditar
v <- c(1, 2, 3, 4)
length(v)
mean(v)
Listas
CopiarEditar
mi_lista <- list(nombre="Francisco", edad=30, activo=TRUE)
mi_lista$nombre
Data frames
CopiarEditar
df <- data.frame(nombre=c("Ana", "Luis"), edad=c(23, 45))
str(df)
df$edad
Clase 4: Importación y limpieza de datos
Objetivo: Aprender a importar, explorar y limpiar conjuntos de datos.
Importar datos
CopiarEditar
# CSV
datos <- read.csv("archivo.csv", stringsAsFactors = FALSE)
# Excel (requiere paquete readxl)
library(readxl)
datos <- read_excel("archivo.xlsx")
Exploración inicial
CopiarEditar
head(datos)
summary(datos)
str(datos)
Limpieza básica
CopiarEditar
datos <- na.omit(datos) # Eliminar NA
datos$variable <- as.numeric(datos$variable) # Convertir tipo
Consejo: Usa dplyr para una sintaxis más moderna y fluida.
CopiarEditar
library(dplyr)
datos <- datos %>%
filter(!is.na(edad)) %>%
mutate(edad_cat = ifelse(edad > 60, "Mayor", "Menor"))
Clase 5: Estadística descriptiva y visualización
Objetivo: Resumir información y representar gráficamente los datos.
Medidas de tendencia central
CopiarEditar
mean(datos$edad)
median(datos$edad)
table(datos$sexo)
Visualización con ggplot2
CopiarEditar
library(ggplot2)
ggplot(datos, aes(x=edad)) +
geom_histogram(binwidth=5) +
theme_minimal()
CopiarEditar
ggplot(datos, aes(x=sexo, fill=sexo)) +
geom_bar() +
labs(title="Distribución por sexo")
Clase 6: Estadística inferencial básica
Objetivo: Realizar pruebas estadísticas básicas en R.
Pruebas comunes
CopiarEditar
# Prueba t de medias
t.test(edad ~ sexo, data=datos)
# Prueba de chi-cuadrado
tabla <- table(datos$sexo, datos$grupo)
chisq.test(tabla)
Correlación
r
CopiarEditar
cor(datos$edad, datos$ingresos)
Clase 7: Exportar resultados y reproducibilidad
Objetivo: Aprender a exportar gráficos y datos, y crear reportes reproducibles.
Exportar gráficos
CopiarEditar
ggsave("grafico.png", width = 6, height = 4)
Guardar data
CopiarEditar
write.csv(datos, "datos_limpios.csv", row.names = FALSE)
RMarkdown
RMarkdown permite crear documentos integrando texto, código y resultados.
markdown
CopiarEditar
---
title: "Análisis Exploratorio"
output: html_document
---
```{r}
summary(datos)
yaml
CopiarEditar
---
## Cierre del curso básico
**¡Felicidades!** Ya dominas las bases de R para análisis de datos. Desde aquí
puedes avanzar hacia:
- Modelos estadísticos (regresión, ANOVA)
- Análisis multivariado
- Machine learning con `caret`, `tidymodels`
- Creación de dashboards con `shiny`
---
¿Te gustaría que hagamos una serie práctica paso a paso con ejercicios, o que
armemos la continuación de este curso hacia un nivel intermedio?
4o