UNIVERSIDAD NACIONAL SAN
ANTONIO ABAD DEL CUSCO
Facultad de Ingenieria Electrica, Electronica,
Informatica y Mecanica
Escuela Profesional de Ingenieria Informatica y de
Sistemas
Asigantura: Modelos Probabilisticos
Tema: Introduccion al R
Docente: Enciso Rodas Lauro
Integrantes:
- Royer Fernandez Mandura - 192665
- Espirilla Machaca Joseph Ode - 145004
Semestre: 2021 -I
Cusco - Peru
2021
1 COMANDOS BASICOS
R utiliza funciones para realizar operaciones. Para ejecutar una funcion llamada funcname,
funcion escribimos funcname(input1, input2), donde las entradas (o argumentos) input1 argumento
y input2 le dicen a R como ejecutar la funcion. Una funcion puede tener cualquier numero
de entradas. Por ejemplo, para crear un vector de numeros, utilizamos la funcion c() (para
concatenar).
Tenga en cuenta que el > no es parte del comando; mas bien, es impreso por R para indicar
que esta listo para que se introduzca otro comando. Tambien podemos guardar cosas usando
= en lugar de <-:
Podemos decirle a R que sume dos conjuntos de numeros. Entonces sumara el primer numero
de x al primer numero de y, y asi sucesivamente. Sin embargo, x e y deben tener la misma
longitud. Podemos comprobar su longitud utilizando la funcion length()
1
la funcion ls() nos permite ver una lista de los objetos, como datos y funciones, que hemos
guardado hasta el momento. la funcion rm() se puede utilizar para eliminar los que no queremos
Tambien es posible eliminar todos los objetos a la vez:
la funcion matrix() toma varias entradas, pero por ahora nos centramos en las tres primeras:
los datos (las entradas de la matriz), el numero de las y el numero de columnas
2
Tenga en cuenta que tambien podriamos omitir escribir data=, nrow= y ncol= en el
comando matrix(): es decir, podriamos escribir simplemente
y esto tendria el mismo efecto. Sin embargo, a veces puede ser u
til especicar los nombres
de los argumentos pasados, ya que de lo contrario R asumira que los argumentos de la funcion
se pasan a la funcion en el mismo orden que se da en el archivo de ayuda de la funcion. Como
ilustra este ejemplo, por R crea por defecto matrices rellenando sucesivamente las columnas.
Como alternativa se puede utilizar la opcion byrow=TRUE para rellenar la matriz en el orden
de las las.
La funcion sqrt() devuelve la raz cuadrada de cada elemento de un vector o matriz. tambien
se puede x a la potencia 2 con el comando que se visualiza en la imagen; cualquier potencia es
posible, incluyendo potencias fraccionarias o negativas.
La funcion rnorm() genera un vector de variables normales aleatorias, con el primer argumento
n el tama no de la muestra. Cada vez que llamemos a esta funci on obtendremos una respuesta
diferente. Aqu creamos dos conjuntos de numeros cor-relacionados, x e y, y utilizamos la funci
on
cor() para calcular la correlaci
on entre x e y
3
Por defecto, rnorm() crea variables aleatorias normales est
andar con una media de 0 y una
desviacion estandar de 1. Sin embargo, la media y la desviacion estandar pueden alterarse
utilizando los argumentos mean y sd, como se ilustra arriba.
A veces queremos que nuestro codigo reproduzca exactamente el mismo conjunto de n umeros
aleatorios; para ello podemos utilizar la funci on set.seed(). La funci
on set.seed() toma un
argumento entero (arbitrario).
Utilizamos set.seed() a lo largo de los laboratorios siempre que realizamos calculos que
implican cantidades aleatorias. En general, esto debera permitir al usuario reproducir nuestros
resultados. Sin embargo, hay que tener en cuenta que a medida que se disponga de nuevas
versiones de R es posible que se produzcan peque nas discrepancias entre el libro y la salida de
R. Las funciones mean() y var() pueden utilizarse para calcular la media y la varianza de un
vector de numeros. Aplicando sqrt() a la salida de var() obtendremos la desviaci on estandar.
O simplemente podemos utilizar la funcion sd().
4
2
GRAFICOS
La funcion plot() es la principal forma de representar los datos en R. Por ejemplo, plot(x,y)
produce un gr aco de dispersion de los numeros en x frente a los n
umeros en y. Hay muchas
opciones adicionales que se pueden pasar a la funci
on plot(). Por ejemplo, si se pasa el argumento
xlab, se obtendr
a una etiqueta en el eje x. Para obtener mas informacion sobre la funcion plot()
escriba ?plot.
5
Para crear un pdf, usamos la funcion pdf(), y para crear un jpeg, usamos la funcion jpeg().
La funci
on dev.o() indica a R que hemos terminado de crear el gr aco. Como alternativa,
podemos simplemente copiar la ventana del gr aco y pegarla en un tipo de archivo apropiado,
como un documento de Word.
La funcion seq() puede utilizarse para crear una secuencia de n
umeros. Por ejemplo, seq(a,b)
crea un vector de n umeros enteros entre a y b. Hay muchas otras opciones: por ejemplo,
seq(0,1,length=10) crea una secuencia de 10 n umeros igualmente espaciados entre 0 y 1. Escribir
3:11 es una forma de abreviar seq(3,11) para argumentos enteros.
Los gracos de contorno se pueden crear en R con la funcion contour()
6
La funci on image() funciona de la misma manera que contour(), excepto que image()
produce un gr aco codicado por colores cuyos colores dependen del valor de z. Esto se conoce
como mapa de calor, y a veces se utiliza para representar la temperatura en las previsiones
meteorologicas. Alternativamente, persp() puede utilizarse para producir un graco tridimensional.
Los argumentos theta y phi controlan los angulos en los que se ve el graco.
7
8
9
10
11
12
13
3
DATOS DE INDEXACION
A menudo deseamos examinar una parte de un conjunto de datos. Supongamos que nuestros
datos estan almacenados en la matriz A.
Entonces, escribiendo
seleccionara el elemento correspondiente a la segunda la y a la tercera columna. El primer
n
umero despues del smbolo de corchete abierto [ se reere siempre a la la, y el segundo
n
umero se reere siempre a la columna. Tambien podemos seleccionar varias las y columnas
a la vez, proporcionando vectores como ndices.
14
Los dos ultimos ejemplos no incluyen ning
un ndice para las columnas o ningun ndice para
las las. Estos indican que R debe incluir todas las columnas o todas las las, respectivamente.
R trata una sola la o columna de una matriz como un vector.
El uso de un signo negativo - en el ndice indica a R que debe mantener todas las las o
columnas excepto las indicadas en el ndice.
15
La funcion dim() proporciona el n
umero de las seguido del n
umero de columnas de una
matriz determinada.
16
4 Carga de datos
Las funciones read.table() y read.csv() se utilizan para importar datos de un archivo a R.
La familia de funciones read.table() y read.csv() ofrece una serie de opciones para controlar
como se importan los datos, como el control sobre las las de encabezado, las las en blanco o
los valores que faltan
17
18
19
Podemos obtener una lista de todas las variables en el conjunto de datos que importamos
con la funci
on names().
20
5 Res
umenes gr
acos y numericos adicionales
Hay dos maneras de hacer referencia a una variable desde un conjunto de datos. El primero
utiliza el smbolo para indicar a R que la variable es del conjunto de datos.
El segundo metodo utiliza la funci
on attach() que indica a R que busque los nombres de las
variables en el conjunto de datos.Auto
21
Podemos convertir variables cuantitativas en cualitativas o categ
oricas con la funcion as.factor().
Las variables catrogicas son trazadas autom
aticamente como box-plots por R.
22
23
24
25
26
Tambien podemos obtener un hsitograma de los datos con la funci
on hist().
27
28
29
Para generar una matriz de gracos de dispersi
on, podemos utilizar la funcion pairs()
30
31
La funcion identify() puede utilizarse para identicar puntos especcos en un gr
aco. En una
sesion interactiva en R-Studio, identify() permite hacer clic en puntos especcos y etiquetarlos
en la pantalla para su comoda identif
32
33
La funcion summary() puede utilizarse para imprimir un resumen del conjunto de datos.
34
35