0% encontró este documento útil (0 votos)

49 vistas33 páginas

Capítulo 3 Conceptos Básicos de R Lms

El documento es un tutorial introductorio sobre R, que cubre conceptos básicos como la definición y operación con objetos, incluyendo vectores, matrices, listas y data frames. Se explica cómo realizar operaciones vectoriales, la creación de objetos, y cómo acceder y manipular estos objetos en R. Además, se introducen funciones esenciales y se enfatiza la importancia de trabajar con tipos de datos adecuados.

Cargado por

LuisSalinas

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

0% encontró este documento útil (0 votos)

49 vistas33 páginas

Capítulo 3 Conceptos Básicos de R Lms

Cargado por

LuisSalinas

Derechos de autor

Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.

Formatos disponibles

Descarga como PDF, TXT o lee en línea desde Scribd

15/11/23, 17:46 Curso de Introducción a R

Clica sobre la imagen para acceder a la web del libro

Capítulo 3 Conceptos básicos de R

3.1 Introducción.

El objetivo de este tutorial es familiarizarnos con los conceptos básicos de R. ¿Qué es un

objeto en R? ¿Con qué clases/tipos de objetos se trabaja en R? A lo largo de este tutorial
aprenderemos a definir vectores y operar con ellos; a crear matrices, listas y data frames; a
seleccionar elementos, añadir filas y columnas, etc. Como lo que se pretende es que se
entienda la filosofía y la práctica del trabajo con R, todos los conceptos que se introducen se
ilustran con ejemplos muy sencillos. No obstante, la selección de funciones que se realiza en
este tutorial tienen una aplicación directa en el tratamiento real de datos.

3.2 Lo más básico y fundamental!!!

Vamos a realizar paso a paso este sencillo ejercicio para introducir algunos conceptos
importantes.

[Link] 1/33
15/11/23, 17:46 Curso de Introducción a R

3+4
## [1] 7
log(10)
## [1] 2.302585
x <- 3+4

x # x es un vector cuya primera componente es 7. Enseguida vamos con los vectores!

## [1] 7
y = 2+6
y
## [1] 8
z <- c(x,y)

z
## [1] 7 8
mean(z)
## [1] 7.5
w <- mean(z)

w
## [1] 7.5
round(w, digits=0)
## [1] 8

R utiliza funciones para realizar operaciones. Una función es, por ejemplo, mean(). Para
utilizar una función deben especificarse unos argumentos, que es lo que escribimos dentro de
los paréntesis. En el caso de la función round() hemos especificado dos argumentos: el
vector que queremos redondear (w) y el número de decimales del redondeo (digits).

El símbolo <- es el operador para asignar. También se puede utilizar = (o menos frecuente ->),
aunque es preferible utilizar el <-.

El símbolo # se utiliza para introducir un comentario. Todo lo que quede a la derecha de # no

se ejecutará.

Cuando se realiza una asignación se obtiene un objeto. Podemos ver el resultado o

contenido de un objeto de varias formas. Por ejemplo, para ver qué es el objeto x podemos
escribir en la consola:

x
print(x)
(x <- 3+4)

[Link] 2/33
15/11/23, 17:46 Curso de Introducción a R

También lo podemos ver en el panel de entorno del escritorio de RStudio.

3.3 Como definir vectores…

Básicamente R trabaja con los siguientes tipos de objetos:

VECTORES
MATRICES y ARRAYS (variables indexadas)
LISTAS
FACTORES
DATA FRAME
FUNCIONES

Empezaremos viendo los objetos más sencillos, los vectores. Poco a poco iremos viendo el
resto de objetos.

La mayoría de las operaciones (+, -, *, /) y funciones en R están definidas con carácter

vectorial. ¿Qué significa esto? Que R opera componente a componente.

Antes de entender el concepto “caracter vectorial”, vamos a ver cómo se define/crea un

vector.

Para crear un vector se utiliza la función c() (c de concatenate). Por ejemplo:

x <- c(1,2,3,4)
x # x es un vector que tiene cuatro componentes

## [1] 1 2 3 4

y <- c(5,6,7,8)
y

## [1] 5 6 7 8

Volvemos sobre el tema del carácter vectorial, es decir, se opera componente a

componente. Pensemos, si

[Link] 3/33
15/11/23, 17:46 Curso de Introducción a R

z <- x + y

¿Qué resultado espero obtener para z?

Exacto!!! Como la operación se realiza vectorialmente (componente a componente, muy

importante!) el resultado es:

## [1] 6 8 10 12

Vamos a ver si lo entendemos de verdad. Supongamos que x e y son los siguientes vectores:

x <- c(1,2,3,4)
y <- c(1,2,3)

¿Qué longitud tienen los vectores x e y? Aquí la respuesta está clara, pero en aplicaciones
reales utilizaríamos la función length().

length(x) # esta función es muy útil, conviene recordarla.

## [1] 4
length(y)
## [1] 3

Los vectores no tienen la misma longitud, entonces.. ¿Cuál será el resultado de z <- x + y?

z <- x+y
## Warning in x + y: longitud de objeto mayor no es múltiplo de la longitud de
## uno menor
z
## [1] 2 4 6 5

R nos da un mensaje de aviso (warning), no es lo mismo que un error. Nos avisa que hay algo
que no cuadra pero…realiza la operación que nosotros queremos.

Una cuestión muy importante que siempre tenemos que tener en cuenta cuando trabajamos
con vectores es que en un vector sólo podemos concatenar elementos del mismo tipo. ¿Qué
tipos/clases de elementos (o datos) tenemos en R?

Carácter

[Link] 4/33
15/11/23, 17:46 Curso de Introducción a R

Numéricos
Enteros
Complejos
Lógicos

Veamos algunos ejemplos…

x <- c(1,2,3,4) # creamos el vector x

class(x) # devuelve el tipo de objeto

## [1] "numeric"

y <- c("a","b")

class(y)

## [1] "character"

z <- c(1L,2L,3L) # escribimos L detrás del número para obligar a que sea entero
class(z)

## [1] "integer"

w <- c(TRUE, F) # en general, puede escribirse TRUE/FALSE o T/F

class(w)

## [1] "logical"

t <- c(1+2i, 1+3i)

class(t)

## [1] "complex"

[Link] 5/33
15/11/23, 17:46 Curso de Introducción a R

En los ejemplos anteriores hemos definido un vector en el que todos sus elementos eran del
mismo tipo. Pero….¿qué pasa si tenemos los siguientes vectores?

x <- c(1,2,"a")
y <- c(FALSE, 1)
z <- c("a",T)

¿De qué tipo son ahora los vectores x, y, z?

class(x)

## [1] "character"
class(y)
## [1] "numeric"
class(z)
## [1] "character"

R ha forzado a que todos los elementos del vector sean del mismo tipo. A esto se le llama
implicit coercion. Fijémonos cúal es el resultado de los vectores que hemos definido antes.

x
## [1] "1" "2" "a"

y
## [1] 0 1
z
## [1] "a" "TRUE"

En ocasiones somos nosotros los que estamos interesados en forzar que todos los elementos
del vector sean del mismo tipo (esto es la explicit coercion). Para ello utilizamos las
funciones [Link]() , [Link](), [Link]() … Si el resultado no tiene sentido R
producirá un mensaje de error o warning. Un ejemplo:

[Link] 6/33
15/11/23, 17:46 Curso de Introducción a R

x <- c(1,2,"a")
x
## [1] "1" "2" "a"
[Link](x)
## [1] 1 2 NA

[Link](x)
## [1] "1" "2" "a"

Por último, podemos evaluar el tipo/clase de objeto con las funciones [Link](),
[Link](), etc.

3.3.1 Acceder a un elemento de un objeto.

Para seleccionar/acceder a un elemento de un objeto se suelen emplear: [], $, [[]].

Vamos a crear el objeto x que será un vector de cuatro componentes formado por los cuatro
primeros números pares. Así:

x <- c(2,4,6,8)

Si queremos acceder/seleccionar/extraer al/el segundo componente de x

x[2]

## [1] 4

¿Qué resultados darán los siguientes ejemplos?

z[6]
z # si primero z[6]<-12

z[-2]
length(z)
z # si primero length(z)<-3

Comprobemos nuestras respuestas!!

[Link] 7/33
15/11/23, 17:46 Curso de Introducción a R

## [1] NA
## [1] "a" "TRUE" NA NA NA "12"
## [1] "a" NA NA NA "12"
## [1] 6
## [1] "a" "TRUE" NA

Más tarde veremos con más profundidad cómo acceder a elementos de un objeto. ¡Esto es
esencial!

3.3.2 Listar y borrar objetos.

Las funciones ls() y objects() hacen lo mismo: listan los objetos que hemos definido en la
sesión.

ls()

## [1] "t" "w" "x" "y" "z"

objects()

## [1] "t" "w" "x" "y" "z"

Si queremos borrar objetos utilizamos la función rm()

rm(z) # borramos el objeto z

ls()

## [1] "t" "w" "x" "y"

y si estamos interesados en borrar todos los objetos que hemos definido:

rm(list=ls()) # o también rm(list=objects())

ls()

[Link] 8/33
15/11/23, 17:46 Curso de Introducción a R

## character(0)

3.4 Tipos de objetos: Vectores, Matrices, Listas,

Data frame y Factores.

De los vectores ya hemos hablado en el punto 2. Ahora vamos a ver algunas cuestiones
básicas relativas a otros tipos de objetos.

3.4.1 Matrices.

La función matrix() permite organizar los datos en una matriz con tantas filas y columnas
como se indiquen.

Vamos a pedir ayuda a R sobre la función matrix()

?matrix # una forma de obtener ayuda en R es escribiendo ? delante de la función de la q

[Link] Cómo crear y trabajar con matrices

Una vez hemos leído en la ayuda cómo usar la función matrix, vamos a practicarlo con el
siguiente ejemplo. Pero antes de ejecutarlo, pensemos en qué es lo que queremos hacer y,
sobre todo, pensemos en cuál es el resultado que esperamos obtener.

x <- matrix (data= c(1,2,3,4), nrow=2, ncol=2) # o x <- matrix (c(1,2,3,4), nrow=2, ncol
x

## [,1] [,2]
## [1,] 1 3
## [2,] 2 4

[Link] 9/33
15/11/23, 17:46 Curso de Introducción a R

Observemos que se ha creado una matrix de 2x2 (2 filas y 2 columnas) y, además, muy
importante, ¿cómo se ha completado la matriz? ¡Exacto! La matriz se ha rellenado por
columnas. Si queremos que se rellene por filas hay que incluir el argumento byrow en los
argumentos de la función.

y <- matrix (c(1,2,3,4), nrow=2, ncol=2, byrow=T)

## [,1] [,2]
## [1,] 1 2
## [2,] 3 4

Fijaros en la diferencia entre los objetos x e y.

Una forma más simple para definir una matrix es:

y <- matrix (c(1,2,3,4), 2, 2, byrow=T)

## [,1] [,2]
## [1,] 1 2
## [2,] 3 4

aunque también podíamos haber omitido el argumento relativo al número de filas o de

columnas, porque conocida una dimensión R completaría la matrix dados los datos con los
que se trabaja.

y <- matrix (c(1,2,3,4), 2, byrow=T) # no especificamos nrow porque por defecto es el p

## [,1] [,2]
## [1,] 1 2
## [2,] 3 4

[Link] 10/33
15/11/23, 17:46 Curso de Introducción a R

x <- matrix(c(1,2,3,4,5,6), ncol=3)

## [,1] [,2] [,3]

## [1,] 1 3 5
## [2,] 2 4 6

[Link] Nombres en filas/columnas

Si queremos asignar nombres a las filas y/o columnas…

y <- matrix (c(1,2,3,4), nrow=2, ncol=2, byrow=T, dimnames=list(c("X1","X2"),c("Y1", "Y2

## Y1 Y2
## X1 1 2
## X2 3 4

Para añadir o modificar el nombre de filas y columnas de una matriz se hace uso de las
funciones colnames() y rownames(). También se puede utilizar la función dinmanes(), como
en el ejemplo anterior) y asignar nombres a través de una lista (ver el punto 5.2 de este
tutorial).

y <- matrix (1:10, nrow=5)

## [,1] [,2]
## [1,] 1 6
## [2,] 2 7

## [3,] 3 8
## [4,] 4 9
## [5,] 5 10

[Link] 11/33
15/11/23, 17:46 Curso de Introducción a R

colnames(y) <- c("Variable 1", "Variable 2")

rownames(y) <- c("obs1","obs2","obs3","obs4","obs5")
y

## Variable 1 Variable 2
## obs1 1 6
## obs2 2 7
## obs3 3 8
## obs4 4 9

## obs5 5 10

[Link] Dimensión de una matriz

Vamos a comprobar la dimensión de una matriz con este otro ejemplo:

z <- matrix(1:20, 4)

¿Cuál es la dimensión de la matriz z?

dim(z)
## [1] 4 5
dim(z)[1] # seleccionamos el primer componente de dim(Z), es decir, las filas.
## [1] 4

dim(z)[2] # seleccionamos el segundo componente de dim(z), las columnas

## [1] 5

[Link] Añadir filas/columnas

Dos funciones muy útiles, se utilizan muchísimo, cuando se trabaja con matrices (o vectores o
dataframes) son rbind y cbind. La función rbind permite añadir filas, la función cbind permite
añadir columnas. Vamos a ver cómo se utilizan.

Creamos dos objetos, uno será una matriz y el otro un vector.

[Link] 12/33
15/11/23, 17:46 Curso de Introducción a R

x <- matrix(c(1,2,3,4),2,2)
y <- c(5,6)
x
## [,1] [,2]
## [1,] 1 3

## [2,] 2 4
y
## [1] 5 6

Si ahora queremos añadir, por filas, los datos contenidos en el objeto y al objeto x entonces
haremos…

z <- rbind(x,y)
z
## [,1] [,2]
## 1 3
## 2 4

## y 5 6

y si queremos añadir los datos de y a los de x por columnas:

z <- cbind(x,y)
z

## y
## [1,] 1 3 5
## [2,] 2 4 6

Cuidado!! En el caso que el número de filas (o columnas) del objeto que añadimos (objeto y)
no sea múltiplo del número de filas (o columnas) del objeto al que se añaden los datos (objeto
x), R nos dará un mensaje de aviso (Warning message). R no da un error, nos avisa de que
hay algo que “no cuadra”; con todo, realiza la operación. Vamos a comprobar esta
circunstancia.

[Link] 13/33
15/11/23, 17:46 Curso de Introducción a R

x <- c(4,5)
x
## [1] 4 5
y <- c(10,11,12)
y

## [1] 10 11 12

z <- rbind(x,y)
z
## [,1] [,2] [,3]
## x 4 5 4

## y 10 11 12

En otras ocasiones interesa crear una matriz directamente a partir de un vector (o vectores).
Esto lo podemos hacer al añadir un atributo de dimensión.

w <- 1:10 # w es un vector que se crea a partir de la secuencia del 1 al 10 (1:10)

w
## [1] 1 2 3 4 5 6 7 8 9 10
dim(w) <- c(2,5) # al dimensionar el vector w lo convertimos en una matriz
w
## [,1] [,2] [,3] [,4] [,5]

## [1,] 1 3 5 7 9
## [2,] 2 4 6 8 10

En otras ocasiones, sobre todo si definimos una función, interesa crear vectores o matrices
vacías. Para ello..

[Link] 14/33
15/11/23, 17:46 Curso de Introducción a R

x <- c() # crea un vector vacío. También podemos utilizar la función vector()
x
## NULL
y <- matrix(nrow=3, ncol=4) # crea una matriz vacía
y

## [,1] [,2] [,3] [,4]

## [1,] NA NA NA NA
## [2,] NA NA NA NA
## [3,] NA NA NA NA
dim(y)
## [1] 3 4

attributes(y)
## $dim
## [1] 3 4

[Link] Seleccionando elementos de una matriz

Lo primero, vamos a crear el objeto A que será una matriz.

A <- matrix(1:16,4,4)
A
## [,1] [,2] [,3] [,4]

## [1,] 1 5 9 13
## [2,] 2 6 10 14
## [3,] 3 7 11 15
## [4,] 4 8 12 16

Para seleccionar elementos de una matriz utilizamos el símbolo de los corchetes: [].

Pensemos un momento en el posible resultado de estos ejemplos antes de efectuarlos.

[Link] 15/33
15/11/23, 17:46 Curso de Introducción a R

A[2,3]
A[c(1,2),c(2,4)]
A[1:3,2:4]
A[1,]
A[1:2,]

A[,2:3]
A[-c(1,3),] # si utilizamos el signo *-* estamos indicando que queremos mantener todas

¿Coinciden nuestros resultados esperados con los obtenidos? Aquí va…

[Link] 16/33
15/11/23, 17:46 Curso de Introducción a R

A[2,3]
## [1] 10
A[c(1,2),c(2,4)]
## [,1] [,2]
## [1,] 5 13

## [2,] 6 14
A[1:3,2:4]
## [,1] [,2] [,3]
## [1,] 5 9 13
## [2,] 6 10 14
## [3,] 7 11 15

A[1,]
## [1] 1 5 9 13
A[1:2,]
## [,1] [,2] [,3] [,4]
## [1,] 1 5 9 13

## [2,] 2 6 10 14
A[,2:3]
## [,1] [,2]
## [1,] 5 9
## [2,] 6 10

## [3,] 7 11
## [4,] 8 12
A[-c(1,3),]
## [,1] [,2] [,3] [,4]
## [1,] 2 6 10 14
## [2,] 4 8 12 16

3.4.2 Listas.

A diferencia de los vectores o matrices, las listas pueden contener elementos/componentes de

distinto tipo. Observemos esta lista que tiene 5 componentes (pueden ser matrices, vectores,
dataframes,..).

[Link] 17/33
15/11/23, 17:46 Curso de Introducción a R

x <- list(c(1,2,3,4), "Curso", F, 1+2i, 3L)

## [[1]]
## [1] 1 2 3 4
##
## [[2]]
## [1] "Curso"
##

## [[3]]
## [1] FALSE
##
## [[4]]
## [1] 1+2i

##
## [[5]]
## [1] 3

Utilizamos el doble corchete [[]] para acceder al contenido concreto de una lista.

x[[3]] # accedemos al tercer componente de la lista

## [1] FALSE

x[[1]][2] # accedemos al segundo elemento del primer componente de la lista

## [1] 2

Vamos a crear otra lista para practicar.

y <- list( Titulacion = c("Economía", "Sociología", "Derecho"), Edad =c(25,26,27))

[Link] 18/33
15/11/23, 17:46 Curso de Introducción a R

## $Titulacion
## [1] "Economía" "Sociología" "Derecho"
##
## $Edad
## [1] 25 26 27

Fijémonos en la diferencia de presentación de las listas x e y. Como en la lista y hemos

nombrado los componentes, estos aparecen al ejecutar el objeto precedidos del símbolo $.
Ahora también podemos acceder a un componente de la lista por su nombre.

y$Titulacion
## [1] "Economía" "Sociología" "Derecho"

y[[1]]
## [1] "Economía" "Sociología" "Derecho"
y[1]
## $Titulacion
## [1] "Economía" "Sociología" "Derecho"

y[[1]][1]
## [1] "Economía"
y$Titulacion[1]
## [1] "Economía"

Evidentemente, también podemos realizar operaciones con listas.

y[[2]]*3

## [1] 75 78 81

Podemos crear una lista vacía con una determinada longitud:

z <- vector("list", length= 3)

Las listas combinadas con funciones como apply (la veremos en otro tutorial) son muy útiles.

[Link] 19/33
15/11/23, 17:46 Curso de Introducción a R

3.4.3 Data Frame.

Los data frame se usan para almacenar datos en forma de tablas (filas / columnas), como
estamos habituados en Excel, Spss, etc.

Los data frame pueden almacenar objetos/datos de distinto tipo: numéricos, carácter, … En
las matrices todos los elementos tenían que ser enteros o numéricos.

Los data frame pueden entenderse como un tipo especial de lista donde cada elemento de la
lista tiene que tener la misma longitud. Cada elemento de la lista sería una columna y la
longitud de cada elemento de la lista serían las filas.

Aunque normalmente los data frame los creamos al cargar/leer una base de datos (ver el
tutorial), vamos crear una data frame para ver su estructura.

x <- [Link](Titulacion = c("Economía", "ADE", "Sociología", "Magisterio"), Edad = c(

## Titulacion Edad
## 1 Economía 25
## 2 ADE 27
## 3 Sociología 25

## 4 Magisterio 24

class(x)

## [1] "[Link]"

¿Cuál es la dimensión del objeto x (que es una data frame)?

nrow(x) # número de filas

## [1] 4
ncol(x) # número de columnas
## [1] 2
dim(x) # número de filas y columnas

## [1] 4 2

[Link] 20/33
15/11/23, 17:46 Curso de Introducción a R

Para acceder a los elementos de un data frame utilizamos los símbolos $ o []. La forma de
proceder es similar a la que se ha visto con vectores o matrices.

Si queremos seleccionar la variable Titulacion del objeto x (que es un data frame):

x$Titulacion

## [1] Economía ADE Sociología Magisterio

## Levels: ADE Economía Magisterio Sociología

# También lo podemos hacer así:

x[1]

## Titulacion
## 1 Economía
## 2 ADE

## 3 Sociología
## 4 Magisterio

y para seleccionar sus dos primeros elementos:

x$Titulacion[1:2]

## [1] Economía ADE

## Levels: ADE Economía Magisterio Sociología

Si trabajamos con una base de datos (o data frame), para no tener que acceder a una
variable utilizando la expresión objeto$variable, que a veces resulta farragoso, puede hacerse
un attach al objeto. Esto nos permitirá acceder directamente a las variables de la base de
datos por su nombre.

[Link] 21/33
15/11/23, 17:46 Curso de Introducción a R

## Titulacion Edad
## 1 Economía 25
## 2 ADE 27
## 3 Sociología 25
## 4 Magisterio 24

# si escribo Titulacion dará: Error: object 'Titulacion' not found

attach(x)
Titulacion # ahora puedo acceder directamente a las variables por su nombre

## [1] Economía ADE Sociología Magisterio

## Levels: ADE Economía Magisterio Sociología

Por avanzar alguna cosas que veremos más adelante en la práctica, podemos incluir
directamente una nueva variable a nuestro data frame. Por ejemplo, vamos a añadir la
variable id (de identificador) al objeto x. Esto lo podemos hacer directamente utilizando el
símbolo $.

x$id <- 1:4

## Titulacion Edad id
## 1 Economía 25 1
## 2 ADE 27 2
## 3 Sociología 25 3
## 4 Magisterio 24 4

o podemos crear la nueva variable, por ejemplo la variable obs (de observación) y después
combinarla con nuestro data frame x.

obs <- 1:4

x <- cbind(obs,x)
x

[Link] 22/33
15/11/23, 17:46 Curso de Introducción a R

## obs Titulacion Edad id

## 1 1 Economía 25 1
## 2 2 ADE 27 2
## 3 3 Sociología 25 3
## 4 4 Magisterio 24 4

[Link] Ver el contenido de un data frame: head y tail.

Normalmente los data frames con los que trabajamos tienen muchas filas (individuos) y
muchas columnas (variables). Si directamente escribimos el nombre del objeto (data frame)
para ver su contenido lo que ocurrirá es que veremos poca cosa, apenas si observaremos
como R nos lista todo el contenido de forma continua. Para entender lo que queremos decir,
vamos a ver el siguiente ejemplo en el que cargamos los datos EuStockMarkets. Estos datos
hacen referencia al precio de cierre diario entre los años 1991 y 1998 de las principales
bolsas europeas.

data(EuStockMarkets) # cargamos los datos EuStockMarkets

EuStockMarkets # para ver el contenido del objeto

¿Hemos visto algo?

Para echar un vistazo al contenido de un data frame (en este caso EuStockMarket) suelen
utilizarse las funciones head() y tail(). Por defecto, la primera permite ver las 6 primeras
observaciones y la segunda las 6 últimas. También podemos indicar el número de
observaciones que queremos visualizar

head(EuStockMarkets)

## DAX SMI CAC FTSE

## [1,] 1628.75 1678.1 1772.8 2443.6
## [2,] 1613.63 1688.5 1750.5 2460.2

## [3,] 1606.51 1678.6 1718.0 2448.2

## [4,] 1621.04 1684.1 1708.1 2470.4
## [5,] 1618.16 1686.6 1723.1 2484.7
## [6,] 1610.61 1671.6 1714.3 2466.8

[Link] 23/33
15/11/23, 17:46 Curso de Introducción a R

tail(EuStockMarkets)

## DAX SMI CAC FTSE

## [1855,] 5598.32 7952.9 4041.9 5680.4

## [1856,] 5460.43 7721.3 3939.5 5587.6
## [1857,] 5285.78 7447.9 3846.0 5432.8
## [1858,] 5386.94 7607.5 3945.7 5462.2
## [1859,] 5355.03 7552.6 3951.7 5399.5
## [1860,] 5473.72 7676.3 3995.0 5455.0

head(EuStockMarkets,10)

## DAX SMI CAC FTSE

## [1,] 1628.75 1678.1 1772.8 2443.6
## [2,] 1613.63 1688.5 1750.5 2460.2

## [3,] 1606.51 1678.6 1718.0 2448.2

## [4,] 1621.04 1684.1 1708.1 2470.4
## [5,] 1618.16 1686.6 1723.1 2484.7
## [6,] 1610.61 1671.6 1714.3 2466.8
## [7,] 1630.75 1682.9 1734.5 2487.9

## [8,] 1640.17 1703.6 1757.4 2508.4

## [9,] 1635.47 1697.5 1754.0 2510.5
## [10,] 1645.89 1716.3 1754.3 2497.4

tail(EuStockMarkets,10)

[Link] 24/33
15/11/23, 17:46 Curso de Introducción a R

## DAX SMI CAC FTSE

## [1851,] 5774.38 8139.2 4095.0 5809.7
## [1852,] 5718.70 8170.2 4047.9 5736.1
## [1853,] 5614.77 7943.2 3976.4 5632.5
## [1854,] 5528.12 7846.2 3968.6 5594.1

## [1855,] 5598.32 7952.9 4041.9 5680.4

## [1856,] 5460.43 7721.3 3939.5 5587.6
## [1857,] 5285.78 7447.9 3846.0 5432.8
## [1858,] 5386.94 7607.5 3945.7 5462.2
## [1859,] 5355.03 7552.6 3951.7 5399.5
## [1860,] 5473.72 7676.3 3995.0 5455.0

Ahora, vamos a crear una lista con el mismo contenido que el data frame para que podamos
ver la diferencia.

## $Titulacion
## [1] "Economía" "ADE" "Sociología" "Magisterio"

##
## $Edad
## [1] 25 27 25 24

Podemos convertir la lista en una data frame:

y <- [Link](lista)
y

## Titulacion Edad

## 1 Economía 25
## 2 ADE 27
## 3 Sociología 25
## 4 Magisterio 24

[Link] Nombres de filas/columnas

En los data frame que hemos creado las columnas representarían variables y las filas
representarían individuos (observaciones).

[Link] 25/33
15/11/23, 17:46 Curso de Introducción a R

Si las columnas de un data frame no tienen nombres (en nuestro ejemplo son Titulación y
Edad), podemos incluirlos utilizando la función names(). Para incluir nombres a las filas se
utiliza la función [Link]()

lista2 <- list(c("Economía", "ADE", "Sociología", "Magisterio"), c(25, 27, 25, 24))
z <- [Link](lista2)
z

## c..Economía....ADE....Sociología....Magisterio.. c.25..27..25..24.
## 1 Economía 25
## 2 ADE 27
## 3 Sociología 25

## 4 Magisterio 24

# Para incluir los nombre a las columnas:

names(z) <- c("Titulación", "Edad")

## Titulación Edad
## 1 Economía 25
## 2 ADE 27
## 3 Sociología 25
## 4 Magisterio 24

También se puede crear un data frame entrando directamente los datos (o para modificarlos)
utilizando la función edit()

x <- edit([Link](x)) # para modificar un data frame (en este caso el objeto x)
y <- edit([Link]()) # para crear un nuevo data frame

o podemos visualizar los datos con la función View()

View(x)

[Link] 26/33
15/11/23, 17:46 Curso de Introducción a R

[Link] Eliminando valores NA

En R los valores perdidos se denotan por NA (Not Available). Cuando trabajamos con datos,
una de las tareas más importantes que hay que realizar es la de limpiar la base de datos y
prepararla para los posteriores análisis (lo veremos más adelante en el curso).

Vamos a hacer una breve introducción a cómo eliminar los valores NA a través del siguiente
ejemplo:

x <- c(1,2,NA,NA,5)
malos <- [Link](x) # identificamos los NA. La función [Link]() es una función lógica.
malos

## [1] FALSE FALSE TRUE TRUE FALSE

x[!malos] # el símbolo ! equivale a "lo contrario". Por tanto, en esta línea estamos di

## [1] 1 2 5

## [1] 1 2 NA NA 5

Ahora supongamos que tenemos dos objetos (dos vectores), que tienen NAs, y nos queremos
quedar únicamente con los casos completos. Esta situación se ilustra en el siguiente ejemplo:

x <- c(1,2,NA,4,NA,6)
y <- c("a","b",NA,"d",NA,"f" )

completos <- [Link](x,y) # [Link]() es una función lógica

completos

## [1] TRUE TRUE FALSE TRUE FALSE TRUE

[Link] 27/33
15/11/23, 17:46 Curso de Introducción a R

x[completos]

## [1] 1 2 4 6

y[completos]

## [1] "a" "b" "d" "f"

Por último, vamos a ver lo anterior aplicado a un caso más práctico. Cargamos los datos
airquality que se encuentran en el paquete datasets y vamos a seleccionar únicamente los
casos que están completos.

data("airquality")
head(airquality)

## Ozone Solar.R Wind Temp Month Day

## 1 41 190 7.4 67 5 1
## 2 36 118 8.0 72 5 2
## 3 12 149 12.6 74 5 3

## 4 18 313 11.5 62 5 4
## 5 NA NA 14.3 56 5 5
## 6 28 NA 14.9 66 5 6

length(airquality) # nos dará el número de variables

## [1] 6

dim(airquality) # indicará el número de observaciones (filas) y de variables (columnas)

## [1] 153 6

[Link] 28/33
15/11/23, 17:46 Curso de Introducción a R

summary(airquality) # la función summary() proporciona un resumen de todas las variable

## Ozone Solar.R Wind Temp

## Min. : 1.00 Min. : 7.0 Min. : 1.700 Min. :56.00

## 1st Qu.: 18.00 1st Qu.:115.8 1st Qu.: 7.400 1st Qu.:72.00
## Median : 31.50 Median :205.0 Median : 9.700 Median :79.00
## Mean : 42.13 Mean :185.9 Mean : 9.958 Mean :77.88
## 3rd Qu.: 63.25 3rd Qu.:258.8 3rd Qu.:11.500 3rd Qu.:85.00
## Max. :168.00 Max. :334.0 Max. :20.700 Max. :97.00

## NA's :37 NA's :7

## Month Day
## Min. :5.000 Min. : 1.0
## 1st Qu.:6.000 1st Qu.: 8.0
## Median :7.000 Median :16.0

## Mean :6.993 Mean :15.8

## 3rd Qu.:8.000 3rd Qu.:23.0
## Max. :9.000 Max. :31.0
##

completos <- [Link](airquality) # nos dirá si tenemos datos de todas las variab
head(completos)

## [1] TRUE TRUE TRUE TRUE FALSE FALSE

datos <- airquality[completos,] # de airquality, selecciona todas las columnas de los ca

head(datos)

[Link] 29/33
15/11/23, 17:46 Curso de Introducción a R

## Ozone Solar.R Wind Temp Month Day

## 1 41 190 7.4 67 5 1
## 2 36 118 8.0 72 5 2
## 3 12 149 12.6 74 5 3
## 4 18 313 11.5 62 5 4

## 7 23 299 8.6 65 5 7
## 8 19 99 13.8 59 5 8

dim(datos) # observad que han sido eliminados 42 casos.

## [1] 111 6

[Link] Selección de datos (Subsetting)

Vamos a aprovechar que hemos cargado los datos de airquality para recordar algunas ideas
sobre la selección de datos (observaciones y/o variables) en un data frame e introducir
algunas otras.

En primer lugar, seleccionamos las variables: Ozone, Solar.R y Wind.

datos2 <- datos[,1:3]

Ahora, seleccionamos del objeto datos las variables: Ozone, Solar.R y Temp.

datos3 <- datos[,c(1,2,4)]

Sin en lugar de seleccionar variables (columnas) estamos interesados en seleccionar

individuos/observaciones (filas):

datos4 <- datos[1:6,]

datos5 <- datos[seq(1,nrow(datos),5),] # ¿qué observaciones estamos seleccionando?

Para seleccionar tanto observaciones como variables no tenemos más que combinar las
estrategias anteriores:

[Link] 30/33
15/11/23, 17:46 Curso de Introducción a R

datos6 <- datos[seq(1,nrow(datos),5), c(1,2,4)]

En ocasiones estamos interesados en seleccionar los casos para los que cierta variable toma
determinado valor. Por ejemplo, queremos seleccionar las variables Ozone y Temp para todas
las observaciones en las que la variable Wind satisfaga un valor:

datos7 <- datos[datos$Wind<=4, c(1,2)]

datos8 <- datos[datos$Wind>=2 & datos$Wind<=5.1, c(1,2)]

datos9 <- datos[datos$Wind==4 , c(1,2)]

Para seleccionar subconjuntos de datos en un data frame también podemos utilizar la función
subset().

datos10 <- subset(datos, Month==5 & Day<=15, select=c(Ozone,Solar.R,Temp))

datos11 <- subset(datos, Month !=5 & Day <=15)

3.4.4 Factores

Los factores, que pueden ser ordenados o no ordenados, se utilizan para representar
variables de naturaleza categórica.

factor_nominal <- factor(rep(c("Ford","Seat","Renault"),10))

levels(factor_nominal) # ordena los factores por orden alfabético

## [1] "Ford" "Renault" "Seat"

nuevo_factor_nominal <- factor(factor_nominal, levels=c("Seat","Renault","Ford")) # reo

levels(nuevo_factor_nominal)

[Link] 31/33
15/11/23, 17:46 Curso de Introducción a R

## [1] "Seat" "Renault" "Ford"

Vamos a cargar la base de datos iris, que se encuentra en el paquete datasets(). Iris contiene
información sobre longitud y anchura de pétalos y sépalos y especie de un total de 150 lirios.

data("iris")

str(iris)

## '[Link]': 150 obs. of 5 variables:

## $ [Link]: num 5.1 4.9 4.7 4.6 5 5.4 4.6 5 4.4 4.9 ...

## $ [Link] : num 3.5 3 3.2 3.1 3.6 3.9 3.4 3.4 2.9 3.1 ...
## $ [Link]: num 1.4 1.4 1.3 1.5 1.4 1.7 1.4 1.5 1.4 1.5 ...
## $ [Link] : num 0.2 0.2 0.2 0.2 0.2 0.4 0.3 0.2 0.2 0.1 ...
## $ Species : Factor w/ 3 levels "setosa","versicolor",..: 1 1 1 1 1 1 1 1 1 1 ...

Como podemos ver, el tipo de especie (Species) es una variable categórica (o factor) que
tiene tres niveles (levels): setosa, versicolor, virginica. Vamos a ver la distribución del tipo de
especie con una tabla

levels(iris$Species)

## [1] "setosa" "versicolor" "virginica"

table(iris$Species)

## setosa versicolor virginica

## 50 50 50

En ocasiones, cuando cargamos variables que son carácter se crean como factores.

Si vamos a realizar un análisis de regresión es conveniente guardar las variables categóricas

como factores (R codificará internamente los distintos niveles del factor como enteros).
Además, puede que sea de nuestro interés cambiar el orden de los niveles. Para aprender
[Link] 32/33
15/11/23, 17:46 Curso de Introducción a R

más sobre factores aquí.

3.5 Referencias útiles

Introducción a R de [Link], D.M. Smith and the R Development Core Team.. La

versión en inglés aquí
Albert, J. y Rizzo, M. (2012). R by Example. Concepts to Code. Springer. (Este manual
está disponible en línea para usuarios de la Universitat de València).
R para principiantes de Emmanuel Paradis (Université Montpellier II). La versión en inglés
aquí.
Curso de introducción al entorno R de David Conesa (Universitat de València).
Curso básico de R de Francesc Carmona (Universitat de Barcelona).

[Link] 33/33

También podría gustarte

Creación de Dataframes en R
Aún no hay calificaciones
Creación de Dataframes en R
13 páginas
Módulo 2 - Conceptos Básicos de R
Aún no hay calificaciones
Módulo 2 - Conceptos Básicos de R
26 páginas
Clase 2 - Operaciones Básicas Con R PDF
Aún no hay calificaciones
Clase 2 - Operaciones Básicas Con R PDF
82 páginas
Archivos de R
Aún no hay calificaciones
Archivos de R
5 páginas
Básicos de R
Aún no hay calificaciones
Básicos de R
6 páginas
Práctica 1 - R
Aún no hay calificaciones
Práctica 1 - R
20 páginas
3.tipos de Datos
Aún no hay calificaciones
3.tipos de Datos
11 páginas
R y EPH: Introducción y Funciones Básicas
Aún no hay calificaciones
R y EPH: Introducción y Funciones Básicas
17 páginas
Tarea R 1 CD
Aún no hay calificaciones
Tarea R 1 CD
21 páginas
Clase 2
Aún no hay calificaciones
Clase 2
8 páginas
Introducción a R para Estadística
100% (1)
Introducción a R para Estadística
35 páginas
Unidad 1
Aún no hay calificaciones
Unidad 1
28 páginas
Introducción a R y RStudio
100% (1)
Introducción a R y RStudio
27 páginas
1-Elementos Básicos de R (Día 1)
Aún no hay calificaciones
1-Elementos Básicos de R (Día 1)
7 páginas
Taller 1 de R Studio
Aún no hay calificaciones
Taller 1 de R Studio
28 páginas
Introduccion R 2022
Aún no hay calificaciones
Introduccion R 2022
20 páginas
R Programación Estadística
Aún no hay calificaciones
R Programación Estadística
5 páginas
Seccion 2 02 Estructuras de Datos e Indexacion - HTML
Aún no hay calificaciones
Seccion 2 02 Estructuras de Datos e Indexacion - HTML
15 páginas
Práctica 1 - Empezando en R
Aún no hay calificaciones
Práctica 1 - Empezando en R
5 páginas
Apuntes R PDF
Aún no hay calificaciones
Apuntes R PDF
22 páginas
Introducción A R
Aún no hay calificaciones
Introducción A R
18 páginas
Introduccion A R Studio
Aún no hay calificaciones
Introduccion A R Studio
4 páginas
Introducción A R
Aún no hay calificaciones
Introducción A R
60 páginas
Introducción A "R"
Aún no hay calificaciones
Introducción A "R"
12 páginas
Comandos Estadistica en R
Aún no hay calificaciones
Comandos Estadistica en R
86 páginas
Tutorial R: Comentarios, Vectores y Matrices
Aún no hay calificaciones
Tutorial R: Comentarios, Vectores y Matrices
25 páginas
Introduccion R - Tutoría
Aún no hay calificaciones
Introduccion R - Tutoría
15 páginas
Piad-511 Material 001
Aún no hay calificaciones
Piad-511 Material 001
43 páginas
Introducción a R y Vectores
Aún no hay calificaciones
Introducción a R y Vectores
12 páginas
Intro R
Aún no hay calificaciones
Intro R
28 páginas
Taller Datos R
Aún no hay calificaciones
Taller Datos R
21 páginas
Introducción a R y RStudio
Aún no hay calificaciones
Introducción a R y RStudio
43 páginas
Introducción al Lenguaje R en RStudio
Aún no hay calificaciones
Introducción al Lenguaje R en RStudio
56 páginas
Manual R
Aún no hay calificaciones
Manual R
21 páginas
Curso Primeros Pasos en R - Clase 3
Aún no hay calificaciones
Curso Primeros Pasos en R - Clase 3
40 páginas
Introducción al Lenguaje R
Aún no hay calificaciones
Introducción al Lenguaje R
24 páginas
Clase 1
Aún no hay calificaciones
Clase 1
14 páginas
Universidad Nacional San Antonio Abad Del Cusco: Facultad de Ingenieria Electrica, Electronica, Informatica y Mecanica
Aún no hay calificaciones
Universidad Nacional San Antonio Abad Del Cusco: Facultad de Ingenieria Electrica, Electronica, Informatica y Mecanica
36 páginas
Seccion 2 01 Tipos de Datos
Aún no hay calificaciones
Seccion 2 01 Tipos de Datos
12 páginas
Objetos y Asignaciones en R
Aún no hay calificaciones
Objetos y Asignaciones en R
16 páginas
Ejercicios Básicos de R
Aún no hay calificaciones
Ejercicios Básicos de R
5 páginas
v1 IntroduccionR
Aún no hay calificaciones
v1 IntroduccionR
37 páginas
Intro
Aún no hay calificaciones
Intro
9 páginas
Laboratorio 1
Aún no hay calificaciones
Laboratorio 1
40 páginas
Introducciónnn Al Prrograma R
Aún no hay calificaciones
Introducciónnn Al Prrograma R
19 páginas
Curso - Analisis Estadístico de Datos Usando R Studio - 20182
Aún no hay calificaciones
Curso - Analisis Estadístico de Datos Usando R Studio - 20182
91 páginas
CURSO - ANALISIS ESTAD+ìSTICO DE DATOS USANDO R
Aún no hay calificaciones
CURSO - ANALISIS ESTAD+ìSTICO DE DATOS USANDO R
99 páginas
2.operaciones Basicas Con R2
Aún no hay calificaciones
2.operaciones Basicas Con R2
6 páginas
0130 Programacion en R
0% (1)
0130 Programacion en R
81 páginas
Guía Básica de R y RStudio para Principiantes
Aún no hay calificaciones
Guía Básica de R y RStudio para Principiantes
75 páginas
Guía Básica de R para Principiantes
Aún no hay calificaciones
Guía Básica de R para Principiantes
9 páginas
Notas R-Isaac
Aún no hay calificaciones
Notas R-Isaac
7 páginas
Guía Completa de Programación en R
Aún no hay calificaciones
Guía Completa de Programación en R
114 páginas
Factores y Vectores
Aún no hay calificaciones
Factores y Vectores
13 páginas
Guía de Visualización de Datos - Conceptos Básicos de R
Aún no hay calificaciones
Guía de Visualización de Datos - Conceptos Básicos de R
42 páginas
Sintaxis
Aún no hay calificaciones
Sintaxis
3 páginas
Fundamentos de R para Análisis de Datos
Aún no hay calificaciones
Fundamentos de R para Análisis de Datos
44 páginas
Manual de Excel Básico
Aún no hay calificaciones
Manual de Excel Básico
28 páginas
Power Bi Consumer
Aún no hay calificaciones
Power Bi Consumer
467 páginas
Práctica 1 Encender y Apagar Un LED Con Arduino
Aún no hay calificaciones
Práctica 1 Encender y Apagar Un LED Con Arduino
7 páginas
Arduino Básico: 30 Ejercicios
Aún no hay calificaciones
Arduino Básico: 30 Ejercicios
18 páginas
Unidad I. Hoja de Calculo
Aún no hay calificaciones
Unidad I. Hoja de Calculo
111 páginas
Listas de Validación Autoajustables en Excel
Aún no hay calificaciones
Listas de Validación Autoajustables en Excel
22 páginas
CPMCD Clase
Aún no hay calificaciones
CPMCD Clase
3 páginas
Método de Ruta Crítica en Proyectos
Aún no hay calificaciones
Método de Ruta Crítica en Proyectos
10 páginas
0185 Programacion Orientada A Objetos
Aún no hay calificaciones
0185 Programacion Orientada A Objetos
37 páginas
Metodologia Utilizada
Aún no hay calificaciones
Metodologia Utilizada
11 páginas
Formatos de Campo en Word
Aún no hay calificaciones
Formatos de Campo en Word
56 páginas
Calculo Potencia Bomba Anexo-8
Aún no hay calificaciones
Calculo Potencia Bomba Anexo-8
12 páginas
Sistema de Bombeo en Hoja de Calculo - R1
Aún no hay calificaciones
Sistema de Bombeo en Hoja de Calculo - R1
10 páginas
Cómo Organizar Tablas Dinámicas en Excel
Aún no hay calificaciones
Cómo Organizar Tablas Dinámicas en Excel
9 páginas
Autonuméricos Personalizados en Access
100% (1)
Autonuméricos Personalizados en Access
23 páginas
Consolidación de Datos en Excel
Aún no hay calificaciones
Consolidación de Datos en Excel
6 páginas
Proceso Curva Tromp
Aún no hay calificaciones
Proceso Curva Tromp
85 páginas
Campos CPTR (Valor Acumulado o VA) MS Project
Aún no hay calificaciones
Campos CPTR (Valor Acumulado o VA) MS Project
5 páginas
Formato Solicitud de Servicio
Aún no hay calificaciones
Formato Solicitud de Servicio
1 página
Pruebas ROCOF con SVERKER 900
Aún no hay calificaciones
Pruebas ROCOF con SVERKER 900
3 páginas
Instructivo Retiro de Losetas Seguro
Aún no hay calificaciones
Instructivo Retiro de Losetas Seguro
6 páginas
Pruevas de Circuitos Abierto y Corto Circuito
Aún no hay calificaciones
Pruevas de Circuitos Abierto y Corto Circuito
16 páginas
2.2. Aportes Al Foro Sobre Enfoque Dominante
Aún no hay calificaciones
2.2. Aportes Al Foro Sobre Enfoque Dominante
2 páginas
S06.s11 - Material
Aún no hay calificaciones
S06.s11 - Material
24 páginas
Proceso de Facturación en Salud
Aún no hay calificaciones
Proceso de Facturación en Salud
10 páginas
La Energía Eólica
Aún no hay calificaciones
La Energía Eólica
12 páginas
Introducción A La Ciencia de Datos y El Big Data
Aún no hay calificaciones
Introducción A La Ciencia de Datos y El Big Data
11 páginas
Serie LH 780
Aún no hay calificaciones
Serie LH 780
18 páginas
Ejercicios de Factorización Algebraica
Aún no hay calificaciones
Ejercicios de Factorización Algebraica
17 páginas
Aldean Sangurima 20180911
Aún no hay calificaciones
Aldean Sangurima 20180911
93 páginas
Guía de Actividades en Android
Aún no hay calificaciones
Guía de Actividades en Android
21 páginas
Gestión de Calidad en Juguetería
Aún no hay calificaciones
Gestión de Calidad en Juguetería
9 páginas
Trabajo Colaborativo Mafe
Aún no hay calificaciones
Trabajo Colaborativo Mafe
14 páginas
Textos Jurídicos Inglés
Aún no hay calificaciones
Textos Jurídicos Inglés
13 páginas
Evaluacion, Ev-In-O-442-0104 - Perforación Diamantina
Aún no hay calificaciones
Evaluacion, Ev-In-O-442-0104 - Perforación Diamantina
2 páginas
100000I17N EstadisticaInferencial 2
Aún no hay calificaciones
100000I17N EstadisticaInferencial 2
9 páginas
8 Análisis de Normalidad Gráficos y Contrastes de Hipótesis
Aún no hay calificaciones
8 Análisis de Normalidad Gráficos y Contrastes de Hipótesis
6 páginas
Anexo II - Modelo de Certificado de Conformidad de Obra
Aún no hay calificaciones
Anexo II - Modelo de Certificado de Conformidad de Obra
21 páginas
Fase 3: Acción y Evaluación Servicio Social
Aún no hay calificaciones
Fase 3: Acción y Evaluación Servicio Social
22 páginas
Ventas Enero Corregido Pasa Nada
Aún no hay calificaciones
Ventas Enero Corregido Pasa Nada
2 páginas
Modelos Sistematicos
100% (3)
Modelos Sistematicos
4 páginas
Contratos de Construccion
Aún no hay calificaciones
Contratos de Construccion
15 páginas
Actividad Evaluativa RIIATEL
Aún no hay calificaciones
Actividad Evaluativa RIIATEL
2 páginas
Manual Básico de ETOYS en Perú
Aún no hay calificaciones
Manual Básico de ETOYS en Perú
14 páginas
Factura Modatelas
Aún no hay calificaciones
Factura Modatelas
1 página
Catálogo MEF: Bienes, Servicios y Obras
Aún no hay calificaciones
Catálogo MEF: Bienes, Servicios y Obras
46 páginas
Infografía de Arquitectura de Computadoras
100% (2)
Infografía de Arquitectura de Computadoras
1 página
Modelo Edvinsson Malone
Aún no hay calificaciones
Modelo Edvinsson Malone
3 páginas