Estadística Avanzada
06MBID
Estadística Avanzada
Temario del Curso
• TUTORÍA COLECTIVA: Objetivos, Contexto y estructura de la asignatura
• Estadística descriptiva e Introducción a R
• Introducción a Estadística Inferencial
• Modelos y Métodos Estadísticos
• Modelos de Regresión (lineal simple, lineal múltiple y polinómica)
• Clasificación, Regresión logística y Regularización
• Estadística Bayesiana
• Métodos MCMC y algoritmos de muestreo
• Inferencia basada en maximización de la verosimilitud y Criterios AIC, BIC
• Series Temporales
Estadística Avanzada
Clase 2 ESTADÍSTICA DESCRIPTIVA
Estadística Avanzada
Clase 2 ESTADÍSTICA DESCRIPTIVA
Estadística Avanzada
Clase 2 ESTADÍSTICA DESCRIPTIVA
RECORDEMOS
En estadística, las variables se clasifican según su escala de medida en dos grandes grupos:
no métricas (variables cualitativas o categóricas) y métricas (variables cuantitativas).
A su vez, entre las categóricas se distinguen dos subtipos principales (Nominal y Ordinal) en
función de si sus categorías se pueden ordenar o no.
Por su parte, entre las cuantitativas también se distinguen dos subtipos en función de si pueden
tomar un valor entre dos valores cualquiera consecutivos (se habla entonces de variables
cuantitativas continuas) o si sus valores son discretos.
TIPO DE VARIABLE
ESCALA DE MEDIDA EJEMPLOS
Nominal binaria Sexo (hombre/mujer)
Categórica Nominal politómica Nacionalidad (español/UE/No UE)
Ordinal Satisfacción (nada/algo/bastante/mucho)
Discreta Número de accidentes laborales
Cuantitativa
Continua Edad, peso, talla, presión arterial
Resumen de la Clasificación de las variables en función de su escala de medida.
Estadística Avanzada
Clase 2 Distribuciones de frecuencias
Las tablas de frecuencias son una de las t cnicas b sicas para el resumen de
informaci n a partir de una muestra de datos.
Su construcci n es sencilla pero en conjuntos de datos de un tama o moderado o
grande su c lculo puede resultar laborioso,
Hoy en día hay buenos paquetes estad sticos para facilitar los cálculos
Modalidades: cada uno de los valores que puede tomar una variable x (cualitativa o
cuantitativa discreta). Se denotan como como , donde i=1,… . .
El n mero de individuos (o casos) de la muestra en cada modalidad se denota por
Frecuencia absoluta: para cada modalidad , la frecuencia absoluta es:
i = 1,…k .
Frecuencia relativa: para cada modalidad , la frecuencia relativa es:
= / i = 1,…k
𝒊
𝒊
𝒊
𝒊
𝒊
𝒊
𝒊
𝒊
𝒙
𝑘
𝒙
𝒏
𝒙
𝒏
𝒙
𝒑
𝒏
𝒏
ú
ó
á
ó
í
é
á
ñ
Estadística Avanzada
Clase 2 Distribuciones de frecuencias
Así pues para cualquier variable x, se conoce como frecuencia
absoluta de un determinado valor al número de casos que tienen
dicho valor
Y como frecuencia relativa a la proporción que se obtiene al dividir
la frecuencia absoluta por el total número n de casos: = /
Al tratarse de proporciones, los valores de las frecuencias relativas
pueden oscilar entre 0 y 1, siendo su suma total igual a la unidad.
Las frecuencias relativas se acostumbran a transformar en porcentajes
multiplicando por 100 su valor.
𝒊
𝒊
𝒑
𝒏
𝒏
𝑛
𝑝
𝑥
Estadística Avanzada
Clase 2 Distribuciones de frecuencias
A partir de estos tres valores también es útil calcular las frecuencias absolutas acumuladas, las
frecuencias relativas acumuladas y los porcentajes acumulados. Estos resultados
acumulados se obtienen sumando los valores de las frecuencias absolutas, relativas y porcentajes,
respectivamente, para los valores de la variable X inferiores o iguales al valor xi.
Valor de Frecuencia Frecuencia Porcentaje Frec. absoluta Frec. relativa Porcentaje
X absoluta relativa relativo acumulada acumulada acumulado
% %
0 12 0,22 21,82 12 0,22 21,82
1 10 0,18 18,18 22 0,40 40,00
2 22 0,40 40,00 44 0,80 80,00
3 8 0,15 14,55 52 0,95 94,55
4 3 0,05 5,45 55 1,00 100,00
55 1,00 100,00
La Tabla muestra la distribución de frecuencias para una hipottética variable cuantitativa discreta cuyos valores enteros
𝒑
𝒏
𝒑
𝒏
𝒙
Estadística Avanzada
Clase 2 Representaciones Gráficas de Distribuciones de
Frecuencia
Histogramas
Una forma ampliamente utilizada para graficar la
distribución de una variable cuantitativa continua es el
histograma (histogram).
Para su construcción hay que agrupar los valores de la
variable en intervalos de clase de la misma amplitud
(usualmente),
siendo ésta amplitud (o su cantidad) la principal decisión a
tomar a la hora de diseñarlo
Histograma con 10 intervalos de clase de la variable número de horas de trabajo semanal
Estadística Avanzada
Clase 2
Gráfico en forma de Pirámide (doble Histograma que permite visualizar variables
cuantitativas y cualitativas simultáneamente)
Estadística Avanzada
Clase 2 Representaciones Gráficas de Distribuciones de
Frecuencia
Diagramas de Sectores
La Figura presenta el diagrama de sectores de un estudio realizado para la variable grado de satisfacción laboraly sector de actividad
Estadística Avanzada
Representaciones Gráficas de Distribuciones de
Clase 2
Frecuencia
Diagrama de Pareto
Un tipo especial de diagrama de barras que se utiliza
para variables nominales puras (no para ordinales ni
para cuantitativas discretas) es el diagrama de
Pareto.
Se trata de un gráfico con las barras ordenadas de
forma descendente en función de su frecuencia.
Además, sobre las barras se dibuja una línea que
representa las frecuencias acumuladas de las
categorías.
Este diagrama es especialmente útil cuando la
variable nominal tiene muchas categorías y lo que se
desea es destacar de forma visual sus frecuencias
relativas.
Estadística Avanzada
Clase 2 Propiedades de una Distribución de
Frecuencia
Las tres propiedades principales de una distribución de frecuencia son: la
tendencia central, la dispersi n o variabilidad y la forma.
La tendencia central sintetiza los valores de la variable en t rminos de valores
promedio o representativos de la totalidad de los datos.
La dispersi n o variabilidad resume el grado de concentraci n de los datos
alrededor de los valores promedio
La forma eval a dos aspectos adicionales bien diferenciados de una distribuci n
de frecuencias: Asimetría y Curtosis (mide el grado de apuntamiento de la
distribuci n)
ó
ó
ú
ó
é
ó
ó
Estadística Avanzada
Clase 2 Propiedades de una Distribución de
Frecuencia
Estadística IV: Modelos Y Métodos
Índices Descriptivos basados en
Clase 2
Momentos
1er Momento - Índices de tendencia central: Media Aritmética.
2º Momento - Índices de dispersi n o variabilidad: Varianza.
Media aritmética de la muestra: es el La media aritm tica se expresa en la misma unidad
resultado de la suma de todos los valores de la de medida que la variable que describe.
muestra dividida por la cantidad total de valores
() En t rminos f sicos la media aritm tica representa
el centro de gravedad de una distribuci n de
masas
Varianza muestral: medida de variabilidad La variancia mide la dispersi n absoluta de la
resultante de la división por () de la suma de las distribuci n, con unidad de medida igual al
diferencias al cuadrado entre cada valor de la cuadrado de la unidad de medida de la variable
muestra y la media de la muestra. La que describe.
desviación típica muestral de valores está
simbolizada por Para expresar la variancia en t rminos de la
unidad de medida original de la variable se calcula
su ra z cuadrada, (s) que se denomina desviaci n
est ndar (standard deviation)
á
é
í
ó
í
é
ó
é
é
ó
ó
ó
Estadística Avanzada
Clase 2 Interpretación de la Desviación Estándar
En el mbito estad stico tiene una interpretaci n pr ctica relevante cuando se describe una
variable que se distribuye seg n una ley Normal. En este caso, tal y como ilustra la Figura
abajo, si se suma y se resta k veces la desviaci n est ndar a la media aritm tica se
obtienen intervalos que contienen un porcentaje determinado de las observaciones:
á
í
ú
ó
ó
á
á
é
Estadística Avanzada
Clase 2 Índices Descriptivos basados en
Momentos
3er Momento - Índices de forma: Asimetría (Skewness)
.
Estadística Avanzada
Índices Descriptivos basados en
Clase 2 Momentos
4º Momento - Índices de forma/tipo de apuntamiento: Curtosis
Estadística Avanzada
Clase 2 Índices Descriptivos basados en
Correlaciones
La existencia de relaci n entre variables
implica la presencia de una asociaci n entre
los valores que toman dichas variables, es
decir, la covariaci n de sus datos.
Esta asociaci n se manifiesta a trav s de
alg n tipo de patr n de emparejamiento
entre los valores que presentan las
observaciones en una variable y los que
toman en las otras.
Cuando no existe relaci n entre variables
se dice que son variables independientes
ú
ó
ó
ó
ó
ó
é
ó
Estadística Avanzada
Índices Descriptivos basados en
Clase 2
Correlaciones
Índices de Correlación entre dos variables
La Figura presenta el diagrama de dispersi n de
la relaci n entre el n mero de horas de trabajo
semanales y la puntuaci n en la escala de
exigencias psicol gicas
Se desea estudiar es el efecto del n mero de
horas de trabajo semanales (variable de
exposici n) sobre el grado de exigencias
psicol gicas (variable de respuesta)
Como se puede observar, existe una moderada
relaci n lineal entre ambas variables, en el
sentido de que a medida que se incrementa el
n mero de horas de trabajo semanales tambi n
se incrementa la puntuaci n en la escala de
exigencias psicol gicas.
ú
ó
ó
ó
ó
ó
ó
ú
ó
ó
ú
ó
é
Estadística Avanzada
Índices Descriptivos basados en
Clase 2
Correlaciones
Como se puede observar el diagrama de dispersión ofrece una imagen gráfica de la
relación que en ocasiones no es del todo clara, aunque apunte a una tendencia
concreta.
Por ello es necesario cuantificar el grado de la asociación entre las dos variables
mediante un índice estadístico numérico.
Dicha cuantificación se realiza comparando el grado en que la nube de puntos se
ajusta al patrón de referencia que se considere que mejor se ajusta a los datos.
En esta parte nos ceñiremos al caso más habitual, que asume que el modelo de relación
que subyace en la relación es de tipo lineal.
Así, para medir la asociación lineal entre dos variables cuantitativas se pueden calcular
diferentes índices, entre los cuales destacan los siguientes: la covariancia (sxy), el
coeficiente de correlación producto-momento de Pearson (rxy) y el coeficiente de
determinación ( 2xy ) xy2.
𝑅
𝑅
Estadística Avanzada
Clase 2 Índices Descriptivos basados en
Correlaciones
Covarianza y Correlación entre dos variables
Estadística Avanzada
Clase 2 Índices Descriptivos basados en
Correlaciones
COVARIANZA Y CORRELACIÓN
El signo de la covarianza, por lo tanto, muestra la tendencia en la relación lineal entre las
variables.
Estadística Avanzada
Clase 2 Índices Descriptivos basados en
Correlaciones
La magnitud de la covarianza no es fácil de interpretar porque no está normalizada y, por lo
tanto, depende de las magnitudes de las variables.
La versión normalizada de la covarianza, el coeficiente de correlación de Pearson sin
embargo, muestra por su magnitud la fuerza de la relación lineal: Cor(X,Y) = Cov(X,Y)/ Sx Sy
PROPIEDADES del Coeficiente de Correlación de
Pearson
Estadística Avanzada
Clase 2 Índices Descriptivos basados en
Correlaciones
Coeficiente de Correlación de Pearson
Estadística Avanzada
Clase 2 Ejemplos en R- Instalación de Rstudio
1. Descargar R: https://cran.r-project.org/index.html
2. Instalar R-Studio: https://www.rstudio.com/products/rstudio/download/
En ocasiones pueden surgir problemas con algunos paquetes.En este caso, se
recomienda RStudio Cloud
IDE:
RStudio
Estadística Avanzada
Clase 2 Ejemplos en R- Instalación Rstudio Cloud
Para instalar en Linux: sudo apt install r-base-core.
En general se puede descargar gratis: www.r-project.org.
Desde Windows lo pueden bajar e instalar desde la url:
https://cloud.r-project.org/bin/windows/base/.
Y para Mac: url: https://cloud.r-project.org/bin/macosx/.
Una vez instalado, hagamos en el prompt: > 2+2
Estadística Avanzada
Clase 2 Ejemplos en R
Vamos a entender y poner a ejecutar la siguiente línea de comando:
Fact <- function(n) if (n == 1) 1 else n * Fact(n - 1)
Fact(5)
1) Calcular ahora Fact(5).
2) Ejercicio: Ejecutar la instrucción anterior desde
un script.
Estadística Avanzada
Clase 2 Ejemplos en R
Empecemos por el ejemplo de la última página del Anexo de la Clase1
Preguntamos a 16 personas su sabor de helado favorito e introducimos los
resultados en R.
datos <- c("Vainilla", "Fresa", "Vainilla",
"Fresa", "Chocolate", "Avellana",
"Chocolate", "Vainilla", "Cafe",
"Vainilla", "Fresa", "Chocolate",
"Turron", "Menta", "Menta", "Menta")
Estadística Avanzada
Clase 2 Ejemplos en R
Queremos Graficar la Frecuencia Absoluta
datos <- c("Vainilla", "Fresa", "Vainilla","Fresa",
"Chocolate", "Avellana",
"Chocolate", "Vainilla", "Cafe",
"Vainilla", "Fresa", "Chocolate",
"Turron", "Menta", "Menta", "Menta")
table(datos)
N <- length(datos)
n <- table(datos)
sum(n)
f <- n/N
sum(f)
f100 <- round(100*f,2)
sum(f100)
barplot(n, col= 'blue')
Estadística Avanzada
Clase 2 Ejemplos en R
> table(datos)
> N <- length(datos) > barplot(n, col= 'blue')
> n <- table(datos)
> sum(n)
[1] 16
> f <- n/N
> sum(f)
[1] 1
> f100 <- round(100*f,2)
> sum(f100)
[1] 100
> barplot(n, col= 'blue')
Estadística Avanzada
Clase 2 Ejemplos en R
El mismo ejemplo y preguntamos ¿Cuánto te gusta el helado de Menta?
En este caso, aunque son valores Cualitativos, tiene sentido ordenar los valores de la
variable, para cada valor j ∈ {1, . . . , k }: 0. Nada. 1 Regular. 2 Bastante. 3. Mucho
Se puede definir la frecuencia absoluta acumulada, Nj , y la frecuencia relativa
acumulada, Fj
Ejercicio: hacerlo generando un segundo Script
# Tabla
datos <- c("0", "1", "1", "2", "2", "1", "1", "1",
"2", "2", "1", "1", "2", "3", "3", "3")
N <- length(datos)
n <- table(datos)
cumsum(n)
cumsum(n)/N
round(100*cumsum(n)/N,2)
Estadística Avanzada
Clase 2 Graficamos Frecuencia Absoluta
> datos <- c("0", "1", "1", "2", "2", "1", "1", "1", "2", "2",
"1", "1", "2", "3", "3", "3")
> N <- length(datos) > barplot(n)
> n <- table(datos)
> cumsum(n)
0 1 2 3
1 8 13 16
> cumsum(n)/N
0 1 2 3
0.0625 0.5000 0.8125 1.0000
> round(100*cumsum(n)/N,2)
0 1 2 3
6.25 50.00 81.25 100.00
> barplot(n)
Estadística Avanzada
Clase 2 Graficamos Frecuencia Absoluta con títulos (Labels)
> datos <- c("0", "1", "1", "2", "2", "1", "1", "1", "2", "2",
"1", "1", "2", "3", "3", "3")
> N <- length(datos) > barplot (n , main = "Diagrama de barras : Helado de menta"
+ space = 0.5, xlab = "Categorias",
> n <- table(datos) + ylab = "Frecuencia absoluta",
> cumsum(n) + col="pink" , border= "blue" )
0 1 2 3
1 8 13 16
> cumsum(n)/N
0 1 2 3
0.0625 0.5000 0.8125 1.0000
> round(100*cumsum(n)/N,2)
0 1 2 3
6.25 50.00 81.25 100.00
> barplot(n)
> barplot (n , main = "Diagrama de barras : Helado de
menta" ,
+ space = 0.5, xlab = "Categorias",
+ ylab = "Frecuencia absoluta",
+ col="pink" , border= "blue" )
Estadística Avanzada
Clase 2 Ejercicios en R: simples para que practiquen
1) Para el Helado de Menta: hacer el diagrama por sectores: con
título, labels colores y borde
2) Graficar un histograma de los tiempos para el siguiente ejemplo:
En la carrera del pueblo los tiempos de llegada de los participantes
han sido:
( 40 , 45 , 33 , 44 , 56 , 31 , 30 , 33 , 53 , 52 , 59 , 41)
Estadística Avanzada
Clase 2 Ejemplos en R- Leamos algunos datos
con R
Hasta ahora hemos proporcionado las datos para realizar los ejemplos. Ahora
aprenderemos cómo leer data
En este caso de la web: https://advstats.psychstat.org/data/gpa.txt
> gpadata <- read.table(file='https://advstats.psychstat.org/data/gpa.txt', header=TRUE,
na.string="999", comment.char = "#")
> gpadata
Estadística Avanzada
Ejemplos en R- Leamos alguna data con
Clase 2
R
> head(gpadata) #Muestra las primeras
lineas > gpadata
id gender college gpa weight
1 1 f yes 3.6 110
2 2 m yes 3.5 170 id gender college gpa weight
3 3 m no 99.0 165 1 1 f yes 3.6 110
4 4 m no NA 190 2 2 m yes 3.5 170
5 5 f no NA 95 3 3 m no 99.0 165
6 6 m yes 3.7 200 4 4 m no NA 190
5 5 f no NA 95
> tail(gpadata) #Muestra las ultimas 6 6 m yes 3.7 200
lineas 7 7 m yes 3.6 150
id gender college gpa weight 8 8 f yes 3.8 100
5 5 f no NA 95 9 9 f yes 3.0 130
6 6 m yes 3.7 200 10 10 f no NA 120
7 7 m yes 3.6 150
8 8 f yes 3.8 100
9 9 f yes 3.0 130
10 10 f no NA 120
Estadística Avanzada
Clase 2 Ejemplos en R- Leamos alguna data con R
> names(gpadata)
> dim(gpadata)
> gpadata$weight #Muestra los valores de la variable weight
> gpadata[, 2] #Muestra segunda columna
> gpadata[, 'gender'] #Que tambien se puede pedir por nombre de columna
Estadística Avanzada
Clase 2 Ejemplos en R- Leamos alguna data con R
> names(gpadata)
[1] "id" "gender" "college" "gpa" "weight"
> dim(gpadata)
[1]10 5
> gpadata$weight
[1] 110 170 165 190 95 200 150 100 130 120
> gpadata[, 2] #Muestra segunda columna
[1] "f" "m" "m" "m" "f" "m" "m" "f" "f" "f”
> gpadata[, 'gender'] #Que tambien se puede pedir por nombre de columna
[1] "f" "m" "m" "m" "f" "m" "m" "f" "f" "f"
Estadística Avanzada
Clase 2 Ejemplos en R- Representaciones visuales de
distribuciones
> set.seed(1)
> w <- rnorm(100)
> plot(w, type = "p")
La función set.seed da una semilla inicial para obtener la misma
salida en caso de repetir la instrucción.
Estadística Avanzada
Clase 2 Ejemplos en R- Representaciones visuales de
distribuciones
> set.seed(1)
> w <- rnorm(100)
> plot(w, type = "p")
La función set.seed da una semilla inicial para obtener la misma
salida en caso de repetir la instrucción.
Estadística Avanzada
Clase 2 Ejemplos en R- Representaciones visuales de
distribuciones
> set.seed(1)
> w <- rnorm(100)
> plot(w, type = "p")
La función set.seed da una semilla inicial para obtener la misma
salida en caso de repetir la instrucción.
Cómo podemos comprobar que la función es gaussiana o
uniforme?
> hist(w)
Estadística Avanzada
Clase 2 Ejemplos en R- Veamos algunas representaciones
visuales
> hist(w)
Estadística Avanzada
Clase 2 Ejemplos en R- Veamos algunas representaciones
visuales
> set.seed(1)
> w <- rnorm(100)
> plot(w, type = "p")
La función set.seed da una semilla inicial para obtener la misma
salida en caso de repetir la instrucción.
Cómo podemos comprobar que la función es gaussiana o
uniforme?
Si queremos la densidad de probabilidad, en lugar de la frecuencia
> hist(w, prob = TRUE)1
1: prob=True da la densidad de probabilidad en vez de las frecuencias de
Estadística Avanzada
Clase 2 Ejemplos en R- Veamos algunas representaciones
visuales
> hist(w, prob = TRUE)
Estadística Avanzada
Clase 2 Ejemplos en R- Veamos algunas representaciones
visuales
> hist(w) Cuál es la diferencia? > hist(w, prob = TRUE)
Estadística Avanzada
Clase 2 Ejemplos en R- Juguemos con la Varianza
> set.seed(1)
> w <- rnorm(100)
> plot(w, type = "p")
La función set.seed da una semilla inicial para obtener la misma
salida en caso de repetir la instrucción.
Cómo podemos comprobar que la función es gaussiana o
uniforme?
Si queremos la densidad de probabilidad, en lugar de la frecuencia
Y si la queremos en forma de curva en lugar de barras?
> plot(density(w)) el comando density llamará a density.default(w).
Estadística Avanzada
Clase 2 Ejemplos en R- Veamos algunas representaciones
visuales
> plot(density(w))
Estadística Avanzada
Clase 2 Ejemplos en R- Veamos algunas representaciones
visuales
> density (w) > plot(density(w))
Call:
density.default(x = w)
Data: w (100 obs.); Bandwidth 'bw' = 0.3171
x y
Min. :-3.16589 Min. :0.0001555
1st Qu.:-1.53621 1st Qu.:0.0211747
Median : 0.09346 Median :0.0902294
Mean : 0.09346 Mean :0.1532510
3rd Qu.: 1.72313 3rd Qu.:0.2896688
Max. : 3.35281 Max. :0.4277561
el comando density(w) llamará a density.default(x=w).
Estadística Avanzada
Clase 2 Ejemplos en R- Recordemos (medidas de
dispersión)
Estadística Avanzada
Ejemplos en R- Medidas de dispersión.
Clase 2
Boxplots
Los diagramas de caja son realmente útiles en estadística descriptiva y, a menudo,
se subutilizan (a veces porque el público no los entiende bien)
Un diagrama de caja representa gráficamente la distribución de una variable
cuantitativa al mostrar visualmente un resumen de cinco ubicaciones comunes
(mínimo, mediana, 1er/3er cuartil y máximo) y cualquier observación que se clasificó
como valor atípico.
Estadística Avanzada
Clase 2 Ejemplos en R- Boxplots
Vamos a graficar en una misma figura el boxplot para dos
distribuciones normales.
Una centrada en cero con varianza 1 y otra centrada en 1 con
varianza 5.
> x <- rnorm(mean=0,1000)
> set.seed(1)
> data <- data.frame(A = rnorm(mean=0,sd=sqrt(1),1000), B = rnorm(mean=1,sd=sqrt(5),1000))
> boxplot(data)
Estadística Avanzada
Clase 2 Ejemplos en R- Boxplots
Dos distribuciones normales: una centrada en cero con varianza 1 y otra
centrada en 1 con varianza 5.
Estadística Avanzada
Clase 2 Ejemplos en R- Boxplots
Ejercicio:
Queremos comparar los goles por partido en un año de dos equipos: Equipo A y B
> equipoA <- c(0, 1, 2, 1, 4, 0, 2, 2, 2, 3, 5, 0, 0, 1)
> equipoB <- c(0, 0, 1, 1, 1, 0, 1, 2, 0, 2, 1, 1, 1, 6)
Boxplot(equipoB)
Boxplot(equipoA)
Estadística Avanzada
Clase 2 Ejemplos en R- Dist. Normales con diferentes
Varianzas
Graficar las distribuciones para dos series de números aleatorios con
distribución normal, donde una varianza sea más pequeña que la otra.
> w <- rnorm(100)
> w1 <- rnorm(mean=0, n = 100, sd=sqrt(0.5))
> plot(density(w), col = 'blue')
> plot(density(w1), col = 'red')
Estadística Avanzada
Clase 2 Ejemplos en R- Dist. Normales con diferentes
Varianzas
> w <- rnorm(100)
> w1 <- rnorm(mean=0, n = 100, sd=sqrt(0.5)))
> plot(density(w), col = 'blue')
> plot(density(w1), col = 'red')
Agregamos otra: sd=sqrt(1.5)
Estadística Avanzada
Clase 2 Ejemplos en R- Dist. Normales con diferentes
Varianzas
1 0,5 1,5 0,5
Ejercicio: Jugar con las varianzas de distribuciones normales (de igual media). Probar
con al menos 10 varianzas diferentes
GRACIAS!!!