UNIVERSIDAD NACIONAL AGRARIA
Dirección de Ciencia Animal
Seminario III
Introducción a R
Instalación y
comienzo con R
para Windowns
Ing. MSc. Juan Carlos Morán
Centeno
[Link]@[Link]
Febrero, 2025
Introducción a R
• Definición de R : Lenguaje de
programación y un entorno de
software libre diseñado para el
análisis estadístico y la visualización
de datos. Fue creado por Ross Ihaka
y Robert Gentleman en la
Universidad de Auckland, Nueva
Zelanda, en 1993
• Importancia en la ciencia de datos
• Versatilidad y Potencia (ejecuta una amplia
gama de tareas)
• Visualización de Datos (Alta capacidad de
visualización de Datos y generar gráficos)
• Extensibilidad (Se emplea Scripts y
documentos dinámicos)
• Comunidad y recursos (Comunidad grande y
activa con abundantes recursos)
• Integración con otras herramientas
(integración en Python, SQL)
Instalación de R
DESCARGA E CONFIGURACIÓN IDE RECOMENDADOS:
INSTALACIÓN INICIAL RSTUDIO
• Variables y tipos de datos
Numéricas:
Enteros: Números sin decimales, como 1, 2, 3.
Reales (o de punto flotante): Números con decimales, como 1.5, 2.75.
Categóricas:
Factores: Variables que toman un número limitado de valores
distintos, como "bajo", "medio", "alto". Son útiles para variables
cualitativas.
Conceptos Lógicas:
Básicos Booleanas: Variables que solo pueden tomar los valores TRUE o
FALSE.
Carácter:
Cadenas de texto: Secuencias de caracteres, como "Hola", "R es
genial".
Fechas y Tiempos:
Date: Representa fechas, como "2025-01-22".
POSIXct y POSIXlt: Representan fechas y tiempos, como "2025-01-22
[Link]"
• Operadores básicos
Operadores Aritméticos
Suma (+): Suma dos valores.
Resta (-): Resta un valor de otro.
Multiplicación (*): Multiplica dos valores.
División (/): Divide un valor entre otro.
Exponenciación (^ o **): Eleva un valor a la potencia de otro.
Módulo (%%): Devuelve el residuo de la división entre dos valores.
División entera (%/%): Devuelve el cociente entero de la división entre dos valores.
• Operadores de Asignación
Asignación (<- o =): Asigna un valor a una variable
Operadores de Comparación
• Igualdad (==): Comprueba si dos valores son iguales.
• Desigualdad (!=): Comprueba si dos valores son diferentes.
• Mayor que (>): Comprueba si un valor es mayor que otro.
• Menor que (<): Comprueba si un valor es menor que otro.
• Mayor o igual que (>=): Comprueba si un valor es mayor o igual que otro.
• Menor o igual que (<=): Comprueba si un valor es menor o igual que otro.
• Funciones y estructuras de control
Operadores Lógicos
• AND (& y &&): Devuelve TRUE si ambas expresiones son verdaderas.
• OR (| y ||): Devuelve TRUE si al menos una de las expresiones es verdadera.
• NOT (!): Invierte el resultado de una expresión lógica.
• Funciones y estructuras de control
Las funciones son bloques de
código reutilizables que realizan
una tarea específica.
Las estructuras de control
permiten controlar el flujo de
ejecución del código, tomando
decisiones y repitiendo
acciones según sea necesario
(if, else: Ejecuta un bloque de
código si se cumple una
condición)
Ambiente de
Programación
• Entorno de trabajo
• Scripts y proyectos
• Manejo de paquetes
Uso de R • Importación de datos (CSV, EXCEL, html, xml,
ETC)
• Manipulación de datos (Auxiliar de paquetes)
• Visualización de datos
Vectores en R
• Creación de vectores
(La forma más
sencilla de crear un
vector en R es
utilizando la función
c(), que se usa para
concatenar)
• Operaciones con vectores
Puedes realizar
operaciones aritméticas
básicas entre vectores
de la misma longitud
Funciones aplicadas a
vectores
Funciones estadísticas
Funciones matemáticas
Funciones de manipulación
Creación de matrices
Matrices en R
Operaciones con
matrices
Funciones aplicadas
a matrices
Creación de listas
Lista en R
Acceso a elementos
Funciones aplicadas
a listas
Data Frames en R
CREACIÓN DE DATA MANIPULACIÓN DE FUNCIONES
FRAMES DATA FRAMES APLICADAS A DATA
FRAMES
Importación y exportación de datos
LECTURA DE ARCHIVOS ESCRITURA DE DATOS CONEXIÓN A BASES DE
CSV, EXCEL, ETC. A ARCHIVOS DATOS
Manipulación de datos
SELECCIÓN Y FILTRADO DE ORDENAMIENTO Y RESUMEN AGRUPAMIENTO Y
DATOS DE DATOS OPERACIONES SOBRE
GRUPOS
Visualización de datos
CREACIÓN DE GRÁFICOS PERSONALIZACIÓN DE
BÁSICOS GRÁFICOS
Estadística descriptiva en R
MEDIDAS DE MEDIDAS DE VISUALIZACIÓN
TENDENCIA CENTRAL DISPERSIÓN ESTADÍSTICA
Pruebas t y
ANOVA
Pruebas
Estadística Correlación y
regresión lineal
s en R
Pruebas no
paramétricas
Modelado Estadístico en R
• Regresión lineal múltiple
• Modelos lineales
generalizados
• Selección y evaluación de
modelos
Análisis Multivariante
• Análisis de componentes
principales (PCA)
• Análisis discriminante lineal
(LDA)
• Clustering jerárquico y k-means
Buenas Prácticas en R
• Documentación y
comentarios
• Control de versiones con Git
(herramienta mejora el flujo
de trabajo)
• Optimización del rendimiento
Recursos Adicionales
• Comunidades y foros en
línea
• Cursos y tutoriales
recomendados
• Libros y publicaciones