100% encontró este documento útil (1 voto)
159 vistas27 páginas

Introducción a R y RStudio

Este documento introduce R y RStudio. Explica que R es un lenguaje de programación gratuito y de código abierto usado comúnmente para análisis estadísticos y de datos. Describe cómo instalar R y RStudio e introduce conceptos básicos como vectores, matrices, datos y funciones. Proporciona ejemplos de cómo usar estas herramientas para manipular y analizar datos.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PPTX, PDF, TXT o lee en línea desde Scribd
100% encontró este documento útil (1 voto)
159 vistas27 páginas

Introducción a R y RStudio

Este documento introduce R y RStudio. Explica que R es un lenguaje de programación gratuito y de código abierto usado comúnmente para análisis estadísticos y de datos. Describe cómo instalar R y RStudio e introduce conceptos básicos como vectores, matrices, datos y funciones. Proporciona ejemplos de cómo usar estas herramientas para manipular y analizar datos.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PPTX, PDF, TXT o lee en línea desde Scribd

Introducción a R y Rstudio

Diego Agudelo
Lizeth Llanos Herrera
Diego Fernando Agudelo
¿Por qué R?

• Es un entorno integrado, no una colección de herramientas,


especialmente desarrollado para el análisis de datos, los cálculos
estadísticos y las representaciones gráficas.
• Es un lenguaje de programación muy sencillo
• Es software LIBRE
• Disponible para diferentes plataformas (Unix, MacOS, Windows)
• Muy usado en la investigación científica
Instalacion de R.
• Directamente desde: The R Project for Statistical
Computing
• ([Link]
• Ver también CRAN (Comprehensive R Archive
Network)
• ([Link]
Interface de usuario para R, potente, sencillo
Software LIBRE. Versiones para linux, Mac,
Windows
[Link]

Diferentes ventanas para:


• Scripts
• Consola de comandos
• Lista de variables
• Variables individuales
• Historial
• Gráficas
• Manejo de paquetes
• Directorio
• Help
Caracteristicas principales de R

Se puede usar la tecla TAB para


completar comandos

En RStudio situando el ratón sobre las


diferentes opciones se obtiene información
Buscando AYUDA:

Directorios y entrada/salida
Estructura de datos.

• R es un lenguaje orientado a objetos (un objeto es algo que puede ser


asignado a una variable)

de tipo numeric,complex,
TIPOS DE ESTRUCTURAS logical, character)
• Vectores (unidimensionales)
• Matrices (bidimensionales)
• Arrays (multidimensionales)
• Factores (vectores de variables categóricas, para agrupar los
componentes de otro vector)
• Listas (colección de objetos, cada uno puede ser de un tipo)
• Data Frames (generalización de matrices; cada fila es un
elemento, cada columna una variable de
diferente tipo)
• Funciones (objetos creados para hacer operaciones)
Vectores numéricos. Mostrar valores
Asignación de valores

Las operaciones se ejecutan sobre


Refiriéndose a elementos:
todos los elementos de la variable:

Generando una secuencia:

Generando repeticiones:
Toma valores
TRUE o FALSE Vectores lógicos

Vectores con caracteres


Ejercicios de sobre vectores.
• Construya un objeto llamado Z que contenga el valor de 11.5.
• Imprima el objeto Z en la consola para consultar su valor.
• Construya un vector llamado A que contenga los valores
2,3,6,7,8.5 y 10.
• Imprima el objeto A en la consola para consultar los valores del
vector.
• Súmele 20 al vector A e imprima los resultados en la consola.
• Súmele 10 y divida por 2 el vector A, el resultado guárdelo en un
objeto llamado K.
• Obtenga el tercer valor del objeto K e imprima el resultado en la
consola.
• Obtenga el primer y ultimo valor del objeto K, el resultado
guárdelo en un objeto llamado R.
Matrices
Variable bidimensional Arrays
Variable n-dimensional

Los elementos se reciclan si hay menos


elementos que espacios a a rellenar.
Si no se dice lo contrario, se rellenan por columnas,
para hacerlo por filas incluir “byrow=TRUE”

Refiriéndose
a elementos:
Ejercicios de sobre Matrices.

• Construya una matriz de 3 filas y 3 columnas que


contenga los valores 1 al 9 organizados por
columna, guarde la matriz en un objeto llamado M.
• Construya la misma matriz M, pero ahora
asignando los valores por fila.
• Seleccione el valor correspondiente a la fila 1,
columna 3 y guárdelo en un objeto llamado D.
• Seleccione la columna 3 de la matriz M, el
resultado guárdelo en un objeto llamado T.
• Seleccione la fila 2 de la matriz M, el resultado
guárdelo en un objeto llamado F.
Factores
Vectores que contienen información categórica útil para agrupar los elementos de otros
vectores del mismo tamaño

Útil para identificar submuestras y realizar operaciones sólo sobre sus elementos
Listas
Colección ordenadas de objetos, donde se pueden agrupar objetos de diferentes tipos
(por ejemplo una combinación de vectores, matrices, factores, otras listas, etc.)

Muy versátiles porque pueden almacenar cualquier tipo de información, pero


pueden convertirse en estructuras muy complejas.
Data frames
• Sus componente son vectores, o factores, de igual longitud.
• La información se organiza en una tabla. Típicamente, cada fila corresponde a un
elemento de la muestra. Cada columna a una variable medida en toda (o parte de) la
muestra.
• Los elementos dentro de cada columna son del mismo tipo. Cada columna puede ser de
un tipo diferente.

Se crean con la función: “[Link](...)”

Cada columna (variable) tiene un título o nombre

En RStudio, pinchando sobre la


variable en la ventana
“Environment” se muestra la tabla
Data frames

Para referirse a las columnas: x[n],x[n1,n2],x[c(n1,n2)]


O por el nombre: x[c(“vector1”,”vector2”)],x$vector1
Función: “attach(x)”: en los comandos siguientes se usará el dataframe x por
defecto, sin dar su nombre. Ej. Vector1 se referirá a x$vector1
Función: “detach(x)”: termina la asignación automática
Se pueden identificar los elementos de la muestra (filas) indicando en qué
columna están los nombres:

Anotando dataframes:
• names(dataframe): da un vector con los nombres de las columnas
• names(dataframe)[n]<-...: cambia el nombre para la columna n
• [Link](dataframe): da un vector con los nombres de las filas
Añadiendo una nueva variable:
Valores especiales en R
Se puede seguir operando con estructuras
con elementos que tomen estos valores.

En muchas funciones el argumento [Link] se


puede usar para eliminar o no los NAs de los
cálculos
[Link]() sirve para comprobar si tenemos
NAs
[Link]() sirve para comprobar si tenemos
NaNs
[Link]() sirve para comprobar si
tenemos Infs
Subgrupos
Se pueden extraer subgrupos o elementos
particulares de otras estructuras de datos.
Gran utilidad

Para una matriz se usan dos


subíndices (fila, columna):

(los resultados son vectores, no matrices)


Subgrupos

Pueden accederse a elementos de


una matriz con índices almacenados
en matrices auxiliares:

Para extraer elementos de una lista:


Para extraer recursivamente
un elemento:

Nótese la diferencia entre


[] y [[ ]]
Subgrupos
Los nombres de las variables
pueden aproximarse a sus
primeros caracteres:

Ejemplo de extracción de
elementos de un dataframe:
Subgrupos: Eliminando NAs

Eliminando NAs con la función [Link]():

Para eliminarlos de vectores


multidimensionales:
[Link]

Para dataframes:
Algunas operaciones básicas
Las operaciones se pueden
vectorizar (gran flexibilidad):
Algunas operaciones básicas

Combinando objetos:

Ordenado los datos:


Programando en R: estructuras de control
Normalmente las instrucciones se ejecutan secuencialmente. Con las estructuras de control se
pueden repetir instrucciones o alterar su secuencia dependiendo de condiciones:

Ejecución condicional: Repeticiones y bucles:

Se pueden usar varias estructuras anidadas con {...}

ejemplo:
Flujo de control: comandos para interrumpir el
flujo y alterar las estructuras anteriores:
Funciones
Objetos que pueden ser creados por el usuario para hacer, y repetir, operaciones
específicas:

Ejemplo: función para


calcular la desviación
típica de un vector:

Se pueden usar y definir funciones dentro de funciones.

El valor devuelto por una función es el resultado de la última expresión evaluada o el


especificado con el comando return

Los argumentos de las funciones pueden especificarse por su posición o por su nombre. Puede
haber argumentos con valores por defecto.

Ej. Función sd de R (calcula la desviación típica):


Questions
& Answers

También podría gustarte