0% encontró este documento útil (0 votos)
13 vistas58 páginas

Clase 1

Cargado por

enriqueprado6c
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
13 vistas58 páginas

Clase 1

Cargado por

enriqueprado6c
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Estadística Avanzada

06MBID
Estadística Avanzada

Temario del Curso


• TUTORÍA COLECTIVA: Objetivos, Contexto y estructura de la asignatura

• Estadística descriptiva e Introducción a R

• Introducción a Estadística Inferencial

• Modelos y Métodos Estadísticos

• Modelos de Regresión (lineal simple, lineal múltiple y polinómica)

• Clasificación, Regresión logística y Regularización

• Estadística Bayesiana

• Métodos MCMC y algoritmos de muestreo


• Inferencia basada en maximización de la verosimilitud y Criterios AIC, BIC

• Series Temporales
Estadística Avanzada

Clase 2 ESTADÍSTICA DESCRIPTIVA


Estadística Avanzada

Clase 2 ESTADÍSTICA DESCRIPTIVA


Estadística Avanzada

Clase 2 ESTADÍSTICA DESCRIPTIVA


RECORDEMOS
En estadística, las variables se clasifican según su escala de medida en dos grandes grupos:
no métricas (variables cualitativas o categóricas) y métricas (variables cuantitativas).

A su vez, entre las categóricas se distinguen dos subtipos principales (Nominal y Ordinal) en
función de si sus categorías se pueden ordenar o no.

Por su parte, entre las cuantitativas también se distinguen dos subtipos en función de si pueden
tomar un valor entre dos valores cualquiera consecutivos (se habla entonces de variables
cuantitativas continuas) o si sus valores son discretos.

TIPO DE VARIABLE
ESCALA DE MEDIDA EJEMPLOS

Nominal binaria Sexo (hombre/mujer)

Categórica Nominal politómica Nacionalidad (español/UE/No UE)

Ordinal Satisfacción (nada/algo/bastante/mucho)

Discreta Número de accidentes laborales

Cuantitativa
Continua Edad, peso, talla, presión arterial

Resumen de la Clasificación de las variables en función de su escala de medida.


Estadística Avanzada

Clase 2 Distribuciones de frecuencias


Las tablas de frecuencias son una de las t cnicas b sicas para el resumen de
informaci n a partir de una muestra de datos.
Su construcci n es sencilla pero en conjuntos de datos de un tama o moderado o
grande su c lculo puede resultar laborioso,
Hoy en día hay buenos paquetes estad sticos para facilitar los cálculos

Modalidades: cada uno de los valores que puede tomar una variable x (cualitativa o
cuantitativa discreta). Se denotan como como , donde i=1,… . .

El n mero de individuos (o casos) de la muestra en cada modalidad se denota por

Frecuencia absoluta: para cada modalidad , la frecuencia absoluta es:


i = 1,…k .
Frecuencia relativa: para cada modalidad , la frecuencia relativa es:
= / i = 1,…k
𝒊
𝒊
𝒊
𝒊
𝒊
𝒊
𝒊
𝒊
𝒙
𝑘
𝒙
𝒏
𝒙
𝒏
𝒙
𝒑
𝒏
𝒏








Estadística Avanzada

Clase 2 Distribuciones de frecuencias


Así pues para cualquier variable x, se conoce como frecuencia
absoluta de un determinado valor al número de casos que tienen
dicho valor

Y como frecuencia relativa a la proporción que se obtiene al dividir


la frecuencia absoluta por el total número n de casos: = /
Al tratarse de proporciones, los valores de las frecuencias relativas
pueden oscilar entre 0 y 1, siendo su suma total igual a la unidad.
Las frecuencias relativas se acostumbran a transformar en porcentajes
multiplicando por 100 su valor.
𝒊
𝒊
𝒑
𝒏
𝒏
𝑛
𝑝
𝑥
Estadística Avanzada

Clase 2 Distribuciones de frecuencias


A partir de estos tres valores también es útil calcular las frecuencias absolutas acumuladas, las
frecuencias relativas acumuladas y los porcentajes acumulados. Estos resultados
acumulados se obtienen sumando los valores de las frecuencias absolutas, relativas y porcentajes,
respectivamente, para los valores de la variable X inferiores o iguales al valor xi.
Valor de Frecuencia Frecuencia Porcentaje Frec. absoluta Frec. relativa Porcentaje
X absoluta relativa relativo acumulada acumulada acumulado
% %

0 12 0,22 21,82 12 0,22 21,82

1 10 0,18 18,18 22 0,40 40,00

2 22 0,40 40,00 44 0,80 80,00

3 8 0,15 14,55 52 0,95 94,55

4 3 0,05 5,45 55 1,00 100,00

55 1,00 100,00

La Tabla muestra la distribución de frecuencias para una hipottética variable cuantitativa discreta cuyos valores enteros
𝒑
𝒏
𝒑
𝒏
𝒙
Estadística Avanzada

Clase 2 Representaciones Gráficas de Distribuciones de


Frecuencia
Histogramas
Una forma ampliamente utilizada para graficar la
distribución de una variable cuantitativa continua es el
histograma (histogram).

Para su construcción hay que agrupar los valores de la


variable en intervalos de clase de la misma amplitud
(usualmente),

siendo ésta amplitud (o su cantidad) la principal decisión a


tomar a la hora de diseñarlo
Histograma con 10 intervalos de clase de la variable número de horas de trabajo semanal
Estadística Avanzada

Clase 2
Gráfico en forma de Pirámide (doble Histograma que permite visualizar variables
cuantitativas y cualitativas simultáneamente)
Estadística Avanzada

Clase 2 Representaciones Gráficas de Distribuciones de


Frecuencia
Diagramas de Sectores

La Figura presenta el diagrama de sectores de un estudio realizado para la variable grado de satisfacción laboraly sector de actividad
Estadística Avanzada

Representaciones Gráficas de Distribuciones de


Clase 2
Frecuencia
Diagrama de Pareto
Un tipo especial de diagrama de barras que se utiliza
para variables nominales puras (no para ordinales ni
para cuantitativas discretas) es el diagrama de
Pareto.

Se trata de un gráfico con las barras ordenadas de


forma descendente en función de su frecuencia.
Además, sobre las barras se dibuja una línea que
representa las frecuencias acumuladas de las
categorías.

Este diagrama es especialmente útil cuando la


variable nominal tiene muchas categorías y lo que se
desea es destacar de forma visual sus frecuencias
relativas.
Estadística Avanzada

Clase 2 Propiedades de una Distribución de


Frecuencia
Las tres propiedades principales de una distribución de frecuencia son: la
tendencia central, la dispersi n o variabilidad y la forma.

La tendencia central sintetiza los valores de la variable en t rminos de valores


promedio o representativos de la totalidad de los datos.

La dispersi n o variabilidad resume el grado de concentraci n de los datos


alrededor de los valores promedio

La forma eval a dos aspectos adicionales bien diferenciados de una distribuci n


de frecuencias: Asimetría y Curtosis (mide el grado de apuntamiento de la
distribuci n)







Estadística Avanzada

Clase 2 Propiedades de una Distribución de


Frecuencia
Estadística IV: Modelos Y Métodos

Índices Descriptivos basados en


Clase 2
Momentos
1er Momento - Índices de tendencia central: Media Aritmética.
2º Momento - Índices de dispersi n o variabilidad: Varianza.
Media aritmética de la muestra: es el La media aritm tica se expresa en la misma unidad
resultado de la suma de todos los valores de la de medida que la variable que describe.
muestra dividida por la cantidad total de valores
() En t rminos f sicos la media aritm tica representa
el centro de gravedad de una distribuci n de
masas

Varianza muestral: medida de variabilidad La variancia mide la dispersi n absoluta de la


resultante de la división por () de la suma de las distribuci n, con unidad de medida igual al
diferencias al cuadrado entre cada valor de la cuadrado de la unidad de medida de la variable
muestra y la media de la muestra. La que describe.
desviación típica muestral de valores está
simbolizada por Para expresar la variancia en t rminos de la
unidad de medida original de la variable se calcula
su ra z cuadrada, (s) que se denomina desviaci n
est ndar (standard deviation)












Estadística Avanzada

Clase 2 Interpretación de la Desviación Estándar


En el mbito estad stico tiene una interpretaci n pr ctica relevante cuando se describe una
variable que se distribuye seg n una ley Normal. En este caso, tal y como ilustra la Figura
abajo, si se suma y se resta k veces la desviaci n est ndar a la media aritm tica se
obtienen intervalos que contienen un porcentaje determinado de las observaciones:








Estadística Avanzada

Clase 2 Índices Descriptivos basados en


Momentos
3er Momento - Índices de forma: Asimetría (Skewness)
.
Estadística Avanzada

Índices Descriptivos basados en


Clase 2 Momentos
4º Momento - Índices de forma/tipo de apuntamiento: Curtosis
Estadística Avanzada

Clase 2 Índices Descriptivos basados en


Correlaciones
La existencia de relaci n entre variables
implica la presencia de una asociaci n entre
los valores que toman dichas variables, es
decir, la covariaci n de sus datos.

Esta asociaci n se manifiesta a trav s de


alg n tipo de patr n de emparejamiento
entre los valores que presentan las
observaciones en una variable y los que
toman en las otras.

Cuando no existe relaci n entre variables


se dice que son variables independientes








Estadística Avanzada

Índices Descriptivos basados en


Clase 2
Correlaciones
Índices de Correlación entre dos variables

La Figura presenta el diagrama de dispersi n de


la relaci n entre el n mero de horas de trabajo
semanales y la puntuaci n en la escala de
exigencias psicol gicas

Se desea estudiar es el efecto del n mero de


horas de trabajo semanales (variable de
exposici n) sobre el grado de exigencias
psicol gicas (variable de respuesta)

Como se puede observar, existe una moderada


relaci n lineal entre ambas variables, en el
sentido de que a medida que se incrementa el
n mero de horas de trabajo semanales tambi n
se incrementa la puntuaci n en la escala de
exigencias psicol gicas.













Estadística Avanzada

Índices Descriptivos basados en


Clase 2
Correlaciones
Como se puede observar el diagrama de dispersión ofrece una imagen gráfica de la
relación que en ocasiones no es del todo clara, aunque apunte a una tendencia
concreta.
Por ello es necesario cuantificar el grado de la asociación entre las dos variables
mediante un índice estadístico numérico.
Dicha cuantificación se realiza comparando el grado en que la nube de puntos se
ajusta al patrón de referencia que se considere que mejor se ajusta a los datos.
En esta parte nos ceñiremos al caso más habitual, que asume que el modelo de relación
que subyace en la relación es de tipo lineal.
Así, para medir la asociación lineal entre dos variables cuantitativas se pueden calcular
diferentes índices, entre los cuales destacan los siguientes: la covariancia (sxy), el
coeficiente de correlación producto-momento de Pearson (rxy) y el coeficiente de
determinación ( 2xy ) xy2.
𝑅
𝑅
Estadística Avanzada

Clase 2 Índices Descriptivos basados en


Correlaciones
Covarianza y Correlación entre dos variables
Estadística Avanzada

Clase 2 Índices Descriptivos basados en


Correlaciones
COVARIANZA Y CORRELACIÓN

El signo de la covarianza, por lo tanto, muestra la tendencia en la relación lineal entre las
variables.
Estadística Avanzada

Clase 2 Índices Descriptivos basados en


Correlaciones
La magnitud de la covarianza no es fácil de interpretar porque no está normalizada y, por lo
tanto, depende de las magnitudes de las variables.

La versión normalizada de la covarianza, el coeficiente de correlación de Pearson sin


embargo, muestra por su magnitud la fuerza de la relación lineal: Cor(X,Y) = Cov(X,Y)/ Sx Sy

PROPIEDADES del Coeficiente de Correlación de


Pearson
Estadística Avanzada

Clase 2 Índices Descriptivos basados en


Correlaciones
Coeficiente de Correlación de Pearson
Estadística Avanzada

Clase 2 Ejemplos en R- Instalación de Rstudio


1. Descargar R: https://cran.r-project.org/index.html
2. Instalar R-Studio: https://www.rstudio.com/products/rstudio/download/
En ocasiones pueden surgir problemas con algunos paquetes.En este caso, se
recomienda RStudio Cloud
IDE:
RStudio
Estadística Avanzada

Clase 2 Ejemplos en R- Instalación Rstudio Cloud

Para instalar en Linux: sudo apt install r-base-core.

En general se puede descargar gratis: www.r-project.org.

Desde Windows lo pueden bajar e instalar desde la url:


https://cloud.r-project.org/bin/windows/base/.

Y para Mac: url: https://cloud.r-project.org/bin/macosx/.

Una vez instalado, hagamos en el prompt: > 2+2


Estadística Avanzada

Clase 2 Ejemplos en R

Vamos a entender y poner a ejecutar la siguiente línea de comando:

Fact <- function(n) if (n == 1) 1 else n * Fact(n - 1)


Fact(5)

1) Calcular ahora Fact(5).

2) Ejercicio: Ejecutar la instrucción anterior desde


un script.
Estadística Avanzada

Clase 2 Ejemplos en R
Empecemos por el ejemplo de la última página del Anexo de la Clase1

Preguntamos a 16 personas su sabor de helado favorito e introducimos los


resultados en R.

datos <- c("Vainilla", "Fresa", "Vainilla",


"Fresa", "Chocolate", "Avellana",
"Chocolate", "Vainilla", "Cafe",
"Vainilla", "Fresa", "Chocolate",
"Turron", "Menta", "Menta", "Menta")
Estadística Avanzada

Clase 2 Ejemplos en R
Queremos Graficar la Frecuencia Absoluta

datos <- c("Vainilla", "Fresa", "Vainilla","Fresa",


"Chocolate", "Avellana",
"Chocolate", "Vainilla", "Cafe",
"Vainilla", "Fresa", "Chocolate",
"Turron", "Menta", "Menta", "Menta")
table(datos)
N <- length(datos)
n <- table(datos)
sum(n)
f <- n/N
sum(f)
f100 <- round(100*f,2)
sum(f100)
barplot(n, col= 'blue')
Estadística Avanzada

Clase 2 Ejemplos en R
> table(datos)

> N <- length(datos) > barplot(n, col= 'blue')


> n <- table(datos)
> sum(n)
[1] 16
> f <- n/N
> sum(f)
[1] 1
> f100 <- round(100*f,2)
> sum(f100)
[1] 100
> barplot(n, col= 'blue')
Estadística Avanzada

Clase 2 Ejemplos en R
El mismo ejemplo y preguntamos ¿Cuánto te gusta el helado de Menta?
En este caso, aunque son valores Cualitativos, tiene sentido ordenar los valores de la
variable, para cada valor j ∈ {1, . . . , k }: 0. Nada. 1 Regular. 2 Bastante. 3. Mucho
Se puede definir la frecuencia absoluta acumulada, Nj , y la frecuencia relativa
acumulada, Fj

Ejercicio: hacerlo generando un segundo Script

# Tabla
datos <- c("0", "1", "1", "2", "2", "1", "1", "1",
"2", "2", "1", "1", "2", "3", "3", "3")
N <- length(datos)
n <- table(datos)
cumsum(n)
cumsum(n)/N
round(100*cumsum(n)/N,2)
Estadística Avanzada

Clase 2 Graficamos Frecuencia Absoluta

> datos <- c("0", "1", "1", "2", "2", "1", "1", "1", "2", "2",
"1", "1", "2", "3", "3", "3")
> N <- length(datos) > barplot(n)
> n <- table(datos)
> cumsum(n)
0 1 2 3
1 8 13 16
> cumsum(n)/N
0 1 2 3
0.0625 0.5000 0.8125 1.0000
> round(100*cumsum(n)/N,2)
0 1 2 3
6.25 50.00 81.25 100.00
> barplot(n)
Estadística Avanzada

Clase 2 Graficamos Frecuencia Absoluta con títulos (Labels)


> datos <- c("0", "1", "1", "2", "2", "1", "1", "1", "2", "2",
"1", "1", "2", "3", "3", "3")
> N <- length(datos) > barplot (n , main = "Diagrama de barras : Helado de menta"
+ space = 0.5, xlab = "Categorias",
> n <- table(datos) + ylab = "Frecuencia absoluta",
> cumsum(n) + col="pink" , border= "blue" )
0 1 2 3
1 8 13 16
> cumsum(n)/N
0 1 2 3
0.0625 0.5000 0.8125 1.0000
> round(100*cumsum(n)/N,2)
0 1 2 3
6.25 50.00 81.25 100.00
> barplot(n)
> barplot (n , main = "Diagrama de barras : Helado de
menta" ,
+ space = 0.5, xlab = "Categorias",
+ ylab = "Frecuencia absoluta",
+ col="pink" , border= "blue" )
Estadística Avanzada

Clase 2 Ejercicios en R: simples para que practiquen

1) Para el Helado de Menta: hacer el diagrama por sectores: con


título, labels colores y borde

2) Graficar un histograma de los tiempos para el siguiente ejemplo:

En la carrera del pueblo los tiempos de llegada de los participantes


han sido:

( 40 , 45 , 33 , 44 , 56 , 31 , 30 , 33 , 53 , 52 , 59 , 41)
Estadística Avanzada

Clase 2 Ejemplos en R- Leamos algunos datos


con R
Hasta ahora hemos proporcionado las datos para realizar los ejemplos. Ahora
aprenderemos cómo leer data
En este caso de la web: https://advstats.psychstat.org/data/gpa.txt

> gpadata <- read.table(file='https://advstats.psychstat.org/data/gpa.txt', header=TRUE,


na.string="999", comment.char = "#")
> gpadata
Estadística Avanzada

Ejemplos en R- Leamos alguna data con


Clase 2
R
> head(gpadata) #Muestra las primeras
lineas > gpadata
id gender college gpa weight
1 1 f yes 3.6 110
2 2 m yes 3.5 170 id gender college gpa weight
3 3 m no 99.0 165 1 1 f yes 3.6 110
4 4 m no NA 190 2 2 m yes 3.5 170
5 5 f no NA 95 3 3 m no 99.0 165
6 6 m yes 3.7 200 4 4 m no NA 190
5 5 f no NA 95
> tail(gpadata) #Muestra las ultimas 6 6 m yes 3.7 200
lineas 7 7 m yes 3.6 150
id gender college gpa weight 8 8 f yes 3.8 100
5 5 f no NA 95 9 9 f yes 3.0 130
6 6 m yes 3.7 200 10 10 f no NA 120
7 7 m yes 3.6 150
8 8 f yes 3.8 100
9 9 f yes 3.0 130
10 10 f no NA 120
Estadística Avanzada

Clase 2 Ejemplos en R- Leamos alguna data con R

> names(gpadata)
> dim(gpadata)
> gpadata$weight #Muestra los valores de la variable weight
> gpadata[, 2] #Muestra segunda columna
> gpadata[, 'gender'] #Que tambien se puede pedir por nombre de columna
Estadística Avanzada

Clase 2 Ejemplos en R- Leamos alguna data con R

> names(gpadata)
[1] "id" "gender" "college" "gpa" "weight"
> dim(gpadata)
[1]10 5
> gpadata$weight
[1] 110 170 165 190 95 200 150 100 130 120
> gpadata[, 2] #Muestra segunda columna
[1] "f" "m" "m" "m" "f" "m" "m" "f" "f" "f”
> gpadata[, 'gender'] #Que tambien se puede pedir por nombre de columna
[1] "f" "m" "m" "m" "f" "m" "m" "f" "f" "f"
Estadística Avanzada

Clase 2 Ejemplos en R- Representaciones visuales de


distribuciones

> set.seed(1)
> w <- rnorm(100)
> plot(w, type = "p")

La función set.seed da una semilla inicial para obtener la misma


salida en caso de repetir la instrucción.
Estadística Avanzada

Clase 2 Ejemplos en R- Representaciones visuales de


distribuciones
> set.seed(1)
> w <- rnorm(100)
> plot(w, type = "p")

La función set.seed da una semilla inicial para obtener la misma


salida en caso de repetir la instrucción.
Estadística Avanzada

Clase 2 Ejemplos en R- Representaciones visuales de


distribuciones
> set.seed(1)
> w <- rnorm(100)
> plot(w, type = "p")

La función set.seed da una semilla inicial para obtener la misma


salida en caso de repetir la instrucción.
Cómo podemos comprobar que la función es gaussiana o
uniforme?

> hist(w)
Estadística Avanzada

Clase 2 Ejemplos en R- Veamos algunas representaciones


visuales
> hist(w)
Estadística Avanzada

Clase 2 Ejemplos en R- Veamos algunas representaciones


visuales
> set.seed(1)
> w <- rnorm(100)
> plot(w, type = "p")

La función set.seed da una semilla inicial para obtener la misma


salida en caso de repetir la instrucción.
Cómo podemos comprobar que la función es gaussiana o
uniforme?
Si queremos la densidad de probabilidad, en lugar de la frecuencia

> hist(w, prob = TRUE)1

1: prob=True da la densidad de probabilidad en vez de las frecuencias de


Estadística Avanzada

Clase 2 Ejemplos en R- Veamos algunas representaciones


visuales
> hist(w, prob = TRUE)
Estadística Avanzada

Clase 2 Ejemplos en R- Veamos algunas representaciones


visuales
> hist(w) Cuál es la diferencia? > hist(w, prob = TRUE)
Estadística Avanzada

Clase 2 Ejemplos en R- Juguemos con la Varianza


> set.seed(1)
> w <- rnorm(100)
> plot(w, type = "p")
La función set.seed da una semilla inicial para obtener la misma
salida en caso de repetir la instrucción.
Cómo podemos comprobar que la función es gaussiana o
uniforme?
Si queremos la densidad de probabilidad, en lugar de la frecuencia

Y si la queremos en forma de curva en lugar de barras?

> plot(density(w)) el comando density llamará a density.default(w).


Estadística Avanzada

Clase 2 Ejemplos en R- Veamos algunas representaciones


visuales
> plot(density(w))
Estadística Avanzada

Clase 2 Ejemplos en R- Veamos algunas representaciones


visuales
> density (w) > plot(density(w))

Call:
density.default(x = w)

Data: w (100 obs.); Bandwidth 'bw' = 0.3171

x y
Min. :-3.16589 Min. :0.0001555
1st Qu.:-1.53621 1st Qu.:0.0211747
Median : 0.09346 Median :0.0902294
Mean : 0.09346 Mean :0.1532510
3rd Qu.: 1.72313 3rd Qu.:0.2896688
Max. : 3.35281 Max. :0.4277561

el comando density(w) llamará a density.default(x=w).


Estadística Avanzada

Clase 2 Ejemplos en R- Recordemos (medidas de


dispersión)
Estadística Avanzada

Ejemplos en R- Medidas de dispersión.


Clase 2
Boxplots
Los diagramas de caja son realmente útiles en estadística descriptiva y, a menudo,
se subutilizan (a veces porque el público no los entiende bien)
Un diagrama de caja representa gráficamente la distribución de una variable
cuantitativa al mostrar visualmente un resumen de cinco ubicaciones comunes
(mínimo, mediana, 1er/3er cuartil y máximo) y cualquier observación que se clasificó
como valor atípico.
Estadística Avanzada

Clase 2 Ejemplos en R- Boxplots

Vamos a graficar en una misma figura el boxplot para dos


distribuciones normales.
Una centrada en cero con varianza 1 y otra centrada en 1 con
varianza 5.

> x <- rnorm(mean=0,1000)


> set.seed(1)
> data <- data.frame(A = rnorm(mean=0,sd=sqrt(1),1000), B = rnorm(mean=1,sd=sqrt(5),1000))
> boxplot(data)
Estadística Avanzada

Clase 2 Ejemplos en R- Boxplots


Dos distribuciones normales: una centrada en cero con varianza 1 y otra
centrada en 1 con varianza 5.
Estadística Avanzada

Clase 2 Ejemplos en R- Boxplots


Ejercicio:
Queremos comparar los goles por partido en un año de dos equipos: Equipo A y B
> equipoA <- c(0, 1, 2, 1, 4, 0, 2, 2, 2, 3, 5, 0, 0, 1)
> equipoB <- c(0, 0, 1, 1, 1, 0, 1, 2, 0, 2, 1, 1, 1, 6)

Boxplot(equipoB)
Boxplot(equipoA)
Estadística Avanzada

Clase 2 Ejemplos en R- Dist. Normales con diferentes


Varianzas
Graficar las distribuciones para dos series de números aleatorios con
distribución normal, donde una varianza sea más pequeña que la otra.

> w <- rnorm(100)


> w1 <- rnorm(mean=0, n = 100, sd=sqrt(0.5))
> plot(density(w), col = 'blue')
> plot(density(w1), col = 'red')
Estadística Avanzada

Clase 2 Ejemplos en R- Dist. Normales con diferentes


Varianzas
> w <- rnorm(100)
> w1 <- rnorm(mean=0, n = 100, sd=sqrt(0.5)))
> plot(density(w), col = 'blue')
> plot(density(w1), col = 'red')

Agregamos otra: sd=sqrt(1.5)


Estadística Avanzada

Clase 2 Ejemplos en R- Dist. Normales con diferentes


Varianzas

1 0,5 1,5 0,5

Ejercicio: Jugar con las varianzas de distribuciones normales (de igual media). Probar
con al menos 10 varianzas diferentes
GRACIAS!!!

También podría gustarte