0% encontró este documento útil (0 votos)
40 vistas117 páginas

Estadística y Muestras Aleatorias

Este documento introduce los conceptos de población y muestra aleatoria en estadística. Explica que una población es el conjunto total de elementos sobre los cuales se quiere obtener información, mientras que una muestra aleatoria es un subconjunto de elementos seleccionados de la población de forma aleatoria e independiente.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
40 vistas117 páginas

Estadística y Muestras Aleatorias

Este documento introduce los conceptos de población y muestra aleatoria en estadística. Explica que una población es el conjunto total de elementos sobre los cuales se quiere obtener información, mientras que una muestra aleatoria es un subconjunto de elementos seleccionados de la población de forma aleatoria e independiente.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Unidad 4: Muestras Aleatorias y

Distribuciones Muestrales
FCE UNCuyo - CP-LA

Estadı́stica I

FCE UNCuyo
Contador Público - Licenciatura en Administración

2023

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 1 / 117


Contenidos
1 Introducción
2 Población y Muestra
Representaciones Gráficas
3 Estadı́sticos
Momentos Muestrales
Media Muestral
Total Muestral
Varianza Muestral
Estadı́sticos de Orden
4 Gráfico Cuantil - Cuantil
5 Distribuciones de Algunos Estadı́sticos
Teorema Central del Lı́mite
6 Distribuciones de Funciones de Muestras en una Población Normal
Distribución de la Media Muestral
Funciones Muestrales con Distribución chi-cuadrado
Funciones Muestrales con Distribución t-Student
Funciones Muestrales con Distribución F de Fisher - Snedecor
7 Distribuciones de Funciones de Muestras en dos Poblaciones Normales Independientes
Funciones de X − Y
Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 2 / 117
Introducción

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 3 / 117


Introducción

En Matemática se usa el razonamiento deductivo.

A partir de ciertas premisas se deduce otra.

El progreso de la ciencia está casi siempre basado en la


experimentación.

A partir de los datos experimentales obtenidos se sacan ciertas


conclusiones.

Estas conclusiones generalizan los resultados de ese experimento


particular.

Esta extensión de lo particular a lo general es llamada Inferencia


inductiva.

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 4 / 117


Introducción

Ejemplo 1 (Inferencia Inductiva)


Se tienen 10 millones de semillas de las cuales se sabe que producen plantas
con flores blancas y rojas.
Se quiere saber cuál es la proporción de estas semillas que producirán unas u
otras flores.
La única manera de tener una respuesta precisa es sembrar todas las semillas
y esperar a que las plantas florezcan. Pero este procedimiento
evidentemente no tiene ningún sentido si se quieren vender las semillas.
Una forma de proceder es tomar algunas de estas semillas, sembrarlas,
observar la proporción de flores blancas y luego inferir este resultado al total
de las semillas.

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 5 / 117


Introducción

La estadı́stica se ocupa de desarrollar métodos para realizar


inferencias sobre una población a partir de observaciones hechas sobre
un subconjunto de miembros de esa población.

Las afirmaciones estadı́sticas son inciertas, la incertidumbre aparece


por la presencia del azar en la selección de la muestra.

La probabilidad “mide” la incertidumbre.

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 6 / 117


Población y Muestra

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 7 / 117


Población y Muestra
Definición

Población
Se llama población al conjunto total de elementos en discusión y sobre los
cuáles se quiere tener alguna información.
Esta información está representada por una (o varias) variable aleatoria.

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 8 / 117


Población y Muestra
Ejemplo

Ejemplo 2
En un estudio sobre los salarios docentes en Argentina.
La población es el conjunto de docentes a los que va dirigido el
estudio (primarios, secundarios, etc.).
La variable aleatoria que representa a esta población en este estudio es
el salario ($) de un docente.

En un estudio sobre la desocupación en la Argentina, la población está


formada por todos los adultos que habitan el paı́s. La variable de interés es
si una persona está ocupada o desocupada.
La población es el conjunto de todos los adultos que habitan el
paı́s.
La variable aleatoria que representa a esta población en este estudio es
si si una persona está ocupada o desocupada.

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 9 / 117


Población y Muestra
Ejemplo

Ejemplo 2 (continuación)
En un estudio para estimar el ı́ndice de precios al consumidor (IPC).
La población es el conjunto de todos los artı́culos seleccionados a
tal efecto.
Las variables aleatorias de interés son el conjunto de precios y
demandas de cada artı́culo.

En un estudio sobre la pobreza en los diferentes paı́ses del mundo.


La población es el conjunto de paı́ses.
La variable aleatoria de interés es un indicador de la pobreza en un
paı́s.

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 10 / 117


Población y Muestra
Definición

Muestra Aleatoria
Una muestra aleatoria de tamaño n de una población representada por la
variable aleatoria X con función densidad de probabilidad fX es un
conjunto de n variables aleatorias independientes, cada una con idéntica
distribución a la de la población.

Simbólicamente se indica,
iid
X1 , X2 , . . . , Xn muestra aleatoria ⇔ X1 , X2 , . . . , Xn ∼ fX (·, θ)

donde el sı́mbolo iid hace referencia a la independencia y a la idéntica


distribución de las variables X1 , X2 , . . . , Xn .

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 11 / 117


Población y Muestra
Definición

Muestra Aleatoria
Si la población consiste en N objetos y de éstos se seleccionan n, el
proceso de muestreo debe asegurar que cada muestra de tamaño n
tenga la misma probabilidad de ser seleccionada.
Si N es finito, se deben elegir los n elementos con reposición.
Si N es infinito, población infinita, es decir suficientemente grande, se
eligen los n elementos sin reemplazo. Hay que garantizar la
independencia en la selección.
Si cada uno de los n valores proviene del resultado de un experimento,
como por ejemplo arrojar una moneda y observar la cara que muestra,
este experimento debe repetirse n veces bajo las mismas condiciones
para asegurar la independencia en los valores obtenidos.

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 12 / 117


Población y Muestra
Densidad Conjunta de la Muestra Aleatoria

Densidad Conjunta de la Muestra Aleatoria


Sea X1 , X2 , . . . , Xn una muestra aleatoria de una población representada
por la variable aleatoria X con función densidad fX (·; θ).
La función densidad conjunta de la muestra o función densidad del
vector aleatorio X = (X1 , X2 , . . . , Xn ) es,
n
Y
fX (x1 , x2 , . . . , xn ; θ) = fX (xi ; θ)
i=1

Demostración
fX1 , X2 ,..., Xn (x1 , x2 , . . . , xn ; θ) = fX1 (x1 ; θ) · fX2 (x2 ; θ) · . . . · fXn (xn ; θ)
indep.
n
Y n
Y
= fXi (xi ; θ) = fX (xi ; θ)
i.d.
i=1 i=1

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 13 / 117


Población y Muestra
Densidad Conjunta de la Muestra Aleatoria

Ejemplo 3
Supongamos que X = (X1 , X2 , . . . , Xn )T es una muestra aleatoria de una
población normal, X1 ∼ N(µ, σ 2 ).
Luego, su función densidad conjunta es:
n n  
2
Y
2
Y 1 1
fX (x1 , x2 , . . . , xn ; µ, σ ) = fX (xi ; µ, σ ) = √ exp − 2 (xi − µ)2
2πσ 2 2σ
i=1 i=1
 n n
!
1 1 X
= √ exp − 2 (xi − µ)2
2πσ 2 2σ
i=1

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 14 / 117


Población y Muestra
Representaciones Gráficas

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 15 / 117


Población y Muestra

Función de densidad empı́rica


Si desconocemos la densidad de la población los datos de una muestra
suficientemente grande nos pueden dar buena información sobre esta
densidad.

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 16 / 117


Población y Muestra
Representaciones Gráficas: Gráfico de Barras

Gráfico de Barras
En un estudio sobre la pobreza se clasifica a las personas de una población en dos
categorı́as:
Definimos la variable aleatoria:
por debajo de la lı́nea de la pobreza (a)
X : S → R,
por encima de la lı́nea de la pobreza (b) {a} 7→ X ({a}) = 0
S = {a, b} {b} 7→ X ({b}) = 1
En una muestra observada (x1 , x2 , . . . , x1000 ) de unos y ceros obtenemos 225 ceros y 775
unos.
Estos resultados los ubicamos en una tabla:

X Frecuencia Frecuencia relativa


Por debajo de la lı́nea de pobreza (0) 225 0.225
Por encima de la lı́nea de pobreza (1) 775 0.775

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 17 / 117


Población y Muestra
Representaciones Gráficas: Gráfico de Barras

Densidad empı́rica
Cuando la variable aleatoria es discreta, entonces la función que resulta de
asignar a cada valor de la variable su frecuencia relativa se llama función
densidad empı́rica
Densidad Empı́rica fe(x) = 0.225I{0} (x) + 0.775I{1} (x)

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 18 / 117


Población y Muestra
Representaciones Gráficas: Gráfico de Barras

datos <- rep(c(0,1), times=c(225,775))

######################################
## Opción 1 - Frecuencia absoluta ##
######################################
barplot(table(datos), col=c("blue","red"),
names=c("Por debajo de la\n lı́nea de pobreza",
"Por encima de la\n lı́nea de pobreza"),
main="Datos sobre pobbreza",
ylim = c(0,1000),
ylab="Frecuencia absoluta"
)

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 19 / 117


Población y Muestra
Representaciones Gráficas: Gráfico de Barras

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 20 / 117


Población y Muestra
Representaciones Gráficas: Gráfico de Barras

datos <- rep(c(0,1), times=c(225,775))


[Link] <- [Link](table(datos)/length(datos))

######################################
## Opción 2 - Frecuencia relativa ##
######################################
barplot([Link], col=c("blue","red"),
names=c("Por debajo de la\n lı́nea de pobreza",
"Por encima de la\n lı́nea de pobreza"),
main="Datos sobre pobbreza",
ylim = c(0,1),
ylab="Frecuencia relativa"
)

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 21 / 117


Población y Muestra
Representaciones Gráficas: Gráfico de Barras

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 22 / 117


Población y Muestra
Representaciones Gráficas: Sectores Circulares

Sectores Circulares
Continuando con el ejemplo de los Datos sobre pobreza.
X Frecuencia Frecuencia relativa
Por debajo de la lı́nea de pobreza (0) 225 0.225
Por encima de la lı́nea de pobreza (1) 775 0.775

Densidad Empı́rica fe(x) = 0.225I{0} (x) + 0.775I{1} (x)

datos <- rep(c(0,1),times=c(225,775))

pie(table(datos), col=c("blue","red"),
main="Datos sobre pobreza",
labels = c("Por debajo de la\n lı́nea de pobreza",
"Por encima de la\n lı́nea de pobreza")
)

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 23 / 117


Población y Muestra
Representaciones Gráficas: Sectores Circulares

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 24 / 117


Población y Muestra
Representaciones Gráficas: Histograma

Histogramas
Cuando el número de valores posibles de una variable discreta es grande o
cuando ésta es continua conviene agrupar los datos en clases.
Para esto se deben seleccionar los lı́mites de clase que definen los intervalos
de manera que la unión de todas las clases contenga a todas las
observaciones de la muestra.
El número de observaciones en cada clase se denomina frecuencia de clase y
la frecuencia relativa de clase se obtiene dividiendo aquella por el total de
datos.
La representación más frecuente para datos agrupados es el [Link]
bases son iguales a la amplitud del intervalo, y las alturas se determinan de
manera que su área sea proporcional a la frecuencia de cada clase. Las
alturas se pueden determinar considerando la frecuencia absoluta o relativa
de cada clase.

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 25 / 117


Población y Muestra
Representaciones Gráficas: Histograma

Histograma

En un estudio sobre el consumo de agua diario (en litros), se obtiene una muestra
de 40 familias.
Los valores se muestran en la tabla siguiente:

Tabla: Consumo de agua (en litros) en 40 familias.

44.9 46.6 44.0 35.1 41.3 40.1 52.1 41.4 43.5 38.0
47.7 43.8 44.5 46.8 43.1 44.3 39.7 44.1 37.9 45.5
37.7 41.5 39.2 44.2 41.0 43.1 43.6 30.3 41.0 51.1
46.5 40.5 32.4 38.3 40.8 40.3 37.3 36.9 43.7 37.7

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 26 / 117


Población y Muestra
Representaciones Gráficas: Histograma

datos <- c(44.9, 46.6, 44.0, 35.1, 41.3, 40.1, 52.1, 41.4, 43.5,
38.0, 47.7, 43.8, 44.5, 46.8, 43.1, 44.3, 39.7, 44.1,
37.9, 45.5, 37.7, 41.5, 39.2, 44.2, 41.0, 43.1, 43.6,
30.3, 41.0, 51.1, 46.5, 40.5, 32.4, 38.3, 40.8, 40.3,
37.3, 36.9, 43.7, 37.7)

######################################
## Opción 1 - Frecuencia Absoluta ##
######################################
hz <- hist(datos, col = "red",
main = title("Histograma del consumo de agua"),
xlab = "Consumo de agua",
ylab = "Frecuencia absoluta")

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 27 / 117


Población y Muestra
Representaciones Gráficas: Histograma

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 28 / 117


Población y Muestra
Representaciones Gráficas: Histograma

datos <- c(44.9, 46.6, 44.0, 35.1, 41.3, 40.1, 52.1, 41.4, 43.5,
38.0, 47.7, 43.8, 44.5, 46.8, 43.1, 44.3, 39.7, 44.1,
37.9, 45.5, 37.7, 41.5, 39.2, 44.2, 41.0, 43.1, 43.6,
30.3, 41.0, 51.1, 46.5, 40.5, 32.4, 38.3, 40.8, 40.3,
37.3, 36.9, 43.7, 37.7)

######################################
## Opción 2 - Densidad empı́rica ##
######################################
hz <- hist(datos, col="red", freq = FALSE,
main = title("Histograma del consumo de agua"),
xlab = "Consumo de agua",
ylab = "Frecuencia absoluta")

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 29 / 117


Población y Muestra
Representaciones Gráficas: Histograma

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 30 / 117


Población y Muestra
Representaciones Gráficas: Histograma

hz$counts ## Frecuencia Absoluta


[1] 2 10 21 5 2

hz$breaks ## Extremos intervalos


[1] 30 35 40 45 50 55

hz$mids ## Punto medio del intervalo


[1] 32.5 37.5 42.5 47.5 52.5

hz$density ## Densidad Empı́rica


[1] 0.010 0.050 0.105 0.025 0.010

Densidad Empı́rica

fe(x) = 0.010 I[30,35) (x) + 0.050 I[35,40) (x) + 0.105 I[40,45) (x) +
0.025 I[45,50) (x) + 0.010 I[50,55) (x)

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 31 / 117


Población y Muestra
Representaciones Gráficas: Histograma

Función de densidad empı́rica


Cuando la suma de las áreas de los rectángulos que constituyen el
histograma es uno, entonces la función definida en cada intervalo por la
altura del rectángulo correspondiente se llama función densidad empı́rica.
En este caso, es:

fe(x) = 0.010 I[30,35) (x) + 0.050 I[35,40) (x) + 0.105 I[40,45) (x) +
0.025 I[45,50) (x) + 0.010 I[50,55) (x)

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 32 / 117


Población y Muestra
Representaciones Gráficas: Histograma

El histograma anterior, muestra que la distribución del consumo de agua


se puede considerar simétrica. Si el histograma de una variable X parece
razonablemente simétrico, para analizar normalidad, podrı́amos estudiar el
número de observaciones que caen en un cierto intervalo teniendo en
cuenta que: Si X ∼ N(µ, σ), asignamos una probabilidad de 0.683 al
intervalo (µ − σ, µ + σ) y una probabilidad 0.954 al intervalo
(µ − 2 · σ, µ + 2 · σ). Como desconocemos los parámetros de la
distribución normal, el problema a resolver es estimar los valores de estos
parámetros, es decir, ¿qué valores calculados con la muestra sirven para
representar adecuadamente a los parámetros µ y σ?

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 33 / 117


Estadı́sticos

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 34 / 117


Estadı́sticos
Definición

Estadı́stico
Problema: Estudiar una población con función densidad fX (., θ),
donde la familia a la que pertenece la densidad es conocida pero
contiene un parámetro θ desconocido.
Solución: Tomar una muestra aleatoria X1 , X2 , ..., Xn de esa densidad
y usar el valor de una función g (x1 , x2 , ..., xn ) como una estimación
del parámetro desconocido θ.
Esta función g (X1 , X2 , ..., Xn ) recibe el nombre de estadı́stico

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 35 / 117


Estadı́sticos
Definición

Estadı́stico
Si X1 , X2 , . . . , Xn es una muestra aleatoria de tamaño n de una población
representada por la variable aleatoria X , se llama estadı́stico a cualquier
función T = l(X1 , X2 , . . . , Xn ) que no depende de parámetros
desconocidos.

T Estadı́stico ⇒ T = l(X1 , X2 , . . . , Xn )

Observaciones
Un estadı́stico es una función de variables aleatorias observables y en
consecuencia él mismo es una variable aleatoria.
Si la función densidad de la población de la cual proviene la muestra
(X1 , X2 , . . . , Xn ) depende del parámetro desconocido θ, entonces, la función
densidad del estadı́stico también depende del mismo parámetro θ.

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 36 / 117


Estadı́sticos
Ejemplo

Ejemplo 4
Sea X = (X1 , X2 , . . . , Xn )T una muestra aleatoria de una población con densidad
f (·, θ), donde θ es un parámetro desconocido y x = (x1 , x2 , . . . , xn ) una muestra
observada. Entonces:
1 T1 = X1 · X5 = l1 (X1 , X2 , . . . , Xn ) es un estadı́stico donde
l1 (x1 , x2 , . . . , xn ) = x1 · x5 es una estimación.
Pn
2 T2 = n1 i=1 Xi = l4 (X1 , X2 , . . . , Xn ) es un estadı́stico donde
l4 (x1 , x2 , . . . , xn ) = x1 + x2 + . . . xn es una estimación.

3 T3 = X1 + X2 + · · · + Xn − θ = l5 (X1 , X2 , . . . , Xn , θ) no es un estadı́stico
ya que l5 depende no sólo de las variables aleatorias observables
X1 , X2 , . . . , Xn sino también del parámetro desconocido θ.

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 37 / 117


Estadı́sticos
Media Muestral

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 38 / 117


Estadı́sticos
Media Muestral: Propiedad

Esperanza y Varianza de la Media Muestral


Sea X1 , X2 , . . . , Xn una muestra de una población representada por la
variable aleatoria X con función densidad fX .
Entonces,
n
!
1X
X = Xi
n
i=1

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 39 / 117


Estadı́sticos
Media Muestral: Propiedad

Esperanza y Varianza de la Media Muestral


Se puede probar que si “promediamos” las medias de todas las muestras posibles (es decir,
calculamos la esperanza) ella coincide con la media poblacional o esperanza de la variable
aleatoria en estudio de la cual proviene la muestra.
Sea X1 , X2 , . . . , Xn una muestra de una población representada por la variable aleatoria X con
función densidad fX .
Entonces,

E(X ) = E(X ) = µX

Demostración
n
! n n
1X 1X 1X 1
E(X ) = E Xi = E (Xi ) = µX = nµX = µX = E(X )
n i=1 n i=1 id n
i=1
n

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 40 / 117


Estadı́sticos
Media Muestral: Propiedad

Esperanza y Varianza de la Media Muestral


Se puede probar que la variabilidad de la Media Muestral está relacionada con la variabilidad de
la población de donde fue extraı́da la muestra, pero también con el tamaño de la muestra
Sea X1 , X2 , . . . , Xn una muestra de una población representada por la variable aleatoria X con
función densidad fX .
Entonces,

var(X ) σ2
var(X ) = = X
n n

Demostración
n
! n n
1X 1 X 1 X 2 1 σ2
var(X ) = var Xi = 2
var (Xi ) = 2
σX = 2 nσX2 = X
n i=1 ind n i=1 id n i=1 n n
var(X )
=
n

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 41 / 117


Estadı́sticos
Media Muestral: Propiedad

Esperanza y Varianza de la Media Muestral


Estas dos propiedades de X nos permitirán tener “confianza” en que un valor de
la media muestral sea un buen “representante” de la media poblacional que
desconocemos, ya que en la práctica trabajamos con un valor observado
(proveniente de una sola muestra) de esta variable aleatoria X . En consecuencia,
si la distribución de X tiene una dispersión muy grande, el valor que obtengamos
desde la muestra podrı́a caer en un intervalo suficientemente alejado de la
esperanza de la población con una probabilidad no despreciable. Sin embargo,
como se ha probado en la diapositiva anterior,esta dispersión no es “muy
grande”, es en realidad “mucho menor” que la de la variable en la población,
tanto menor cuanto mayor sea el tamaño de la muestra de la cual proviene.

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 42 / 117


Estadı́sticos
Total Muestral

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 43 / 117


Estadı́sticos
Total Muestral: Propiedad

Esperanza y Varianza del Total Muestral


Sea X1 , X2 , . . . , Xn una muestra de una población representada por la
variable aleatoria X con función densidad fX .
Entonces,
n
!
X
T = Xi
i=1

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 44 / 117


Estadı́sticos
Total Muestral: Propiedad

Esperanza y Varianza de la Media Muestral


Se puede probar que si “promediamos” los totales de todas las muestras posibles (es decir,
calculamos la esperanza) también está relacionada con la media poblacional o esperanza de la
variable aleatoria en estudio de la cual proviene la muestra.
Sea X1 , X2 , . . . , Xn una muestra de una población representada por la variable aleatoria X con
función densidad fX .
Entonces,

E(T ) = n E(X ) = n µX

Demostración
n
! n n
X X X
E(T ) = E Xi = E (Xi ) = µX = n µX = n E(X )
id
i=1 i=1 i=1

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 45 / 117


Estadı́sticos
Total Muestral: Propiedad

Esperanza y Varianza del Total Muestral


Se puede probar que la variabilidad del Total Muestral está relacionada con la variabilidad de la
población de donde fue extraı́da la muestra, pero también con el tamaño de la muestra.
Sea X1 , X2 , . . . , Xn una muestra de una población representada por la variable aleatoria X con
función densidad fX .
Entonces,

var(T ) = n var(X ) = n σX2

Demostración
n
! n n
X X X
var(T ) = var Xi = var (Xi ) = σX2 = nσX2 = nvar(X )
ind id
i=1 i=1 i=1

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 46 / 117


Estadı́sticos
Varianza Muestral

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 47 / 117


Estadı́sticos
Varianza Muestral: Definición - Propiedad

Varianza Muestral
Hemos visto en unidades anteriores como medida de variabilidad de una
variable aleatoria a la varianza. La varianza la definimos como la
esperanza (“promedio pesado” por las probabilidades) del cuadrado del
desvı́o de la variable aleatoria respecto de la media poblacional, es decir
varianza muestral al estadı́stico
h 2 i
σ2 = E X − X

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 48 / 117


Estadı́sticos
Varianza Muestral: Definición - Propiedad

Varianza Muestral
Serı́a natural pensar que un representante en la muestra de esta medida fuese
considerar un promedio pesado por las frecuencias relativas de los cuadrados de
los desvı́os de cada valor observado de la muestra respecto de la media muestral,
este estadı́stico generalmente se denomina “Cuasi-Varianza” y su expresión es
n
1X 2
S˜2 = Xi − X
n
i=1

Se puede observar que la “Cuasi-Varianza” tiene una estructura “similar” a la


varianza poblacional y podrı́amos inferir que se comporta en la muestra de forma
similar a la varianza en la población. Sin embargo, si consideramos la esperanza
de la variable aleatoria “Cuasi-Varianza” , ella no coincide con la varianza de la
población:

E(S˜2 ) 6= σ2

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 49 / 117


Estadı́sticos
Varianza Muestral: Definición - Propiedad

Varianza Muestral
Sea X1 , X2 , . . . , Xn una muestra aleatoria de una población representada
por la variable aleatoria X con densidad fX y X su media muestral,
entonces llamamos varianza muestral al estadı́stico
n
2 1 X 2
S = Xi − X
n−1
i=1

Esperanza de la Varianza Muestral


Sea X1 , X2 , . . . , Xn una muestra de una población representada por la
variable aleatoria X con función densidad fX . Entonces,
E(S 2 ) = var(X ) = σX2

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 50 / 117


Estadı́sticos
Varianza Muestral: Propiedad

Demostración
n n 
! !
2 1 X 2 1 X 2
E(S ) = E Xi − X = E Xi − X
n − 1 i=1 n−1 i=1
n  n n
! !
1 X
2 2
 1 X
2
X 2
= E Xi − 2Xi X + X = E Xi − 2X Xi + nX
n−1 i=1
n−1 i=1 i=1
n n
! !
1 X 2 1 X 2
= E Xi2 − 2X nX + nX = E Xi2 − nX
n−1 i=1
n−1 i=1
n n
! !
1 X 2 1 X 2
= E(Xi2 ) − nE(X ) = E(X 2 ) − nE(X )
n − 1 i=1 id n − 1
i=1
1  2
 n  
= nE(X 2 ) − nE(X ) = var(X ) + E2 (X ) − var(X ) − E2 (X )
n−1 n−1
   
n 2 var(X ) n 1
= var(X ) + E (X ) − − E2 (X ) = var(X ) 1 −
n−1 n n−1 n
 
n n−1 2
= var(X ) = var(X ) = σX
n−1 n

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 51 / 117


Estadı́sticos
Varianza Muestral: Propiedad

Demostración (alternativa)
n n h i2
2
X X
(Xi − X ) = (Xi − µ) − (X − µ)
i=1 i=1
n h i
2 2
X
= (Xi − µ) − 2(Xi − µ)(X − µ) + (X − µ))
i=1
 
n n n n
2 2
X X X X
= (Xi − µ) − 2(X − µ)  Xi − µ + (X − µ))
i=1 i=1 i=1
n
2 2
X
= (Xi − µ) − 2(X − µ)[nX − nµ] + n(X − µ))
i=1
n
2 2 2
X
= (Xi − µ) − 2n(X − µ) + n(X − µ))
i=1
n
2 2
X
= (Xi − µ) − n(X − µ)
i=1

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 52 / 117


Estadı́sticos
Varianza Muestral: Propiedad

Demostración (alternativa, continuación)


     
n n n
 
2 1 X 2 1 X 2 1 X 2 2
E S = E (Xi − X )  = E (Xi − X )  = E (Xi − µ) − n(X − µ) 
n − 1 i=1 n−1 i=1
n−1 i=1
     
n n
1 X 2

2
 1 X 2 2
= E  (Xi − µ)  − nE (X − µ)  =  E(Xi − µ) − nE(X − µ) 
n−1 i=1
n − 1 i=1
 
n
1 1 1 var(X )
X h i  
=  var(Xi ) − n var(X ) = n var(X ) − n var(X ) = n var(X ) − n
n − 1 i=1 n−1 n−1 n

1 2
= var(X ) (n − 1) = var(X ) = σX
n−1

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 53 / 117


Población y Muestra
Representaciones Gráficas: Histograma

Recordando la variable aleatoria X : consumo de agua, la distribución de la


misma se podı́a considerar simétrica, observando su respectivo histograma.

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 54 / 117


Población y Muestra
Representaciones Gráficas: Histograma

Para analizar normalidad, se podrı́a estudiar el número de observaciones


que caen en un cierto intervalo teniendo en cuenta que:
Si X ∼ N(µ, σ) asignamos una probabilidad de 0.683 al intervalo
(µ − σ, µ + σ) y una probabilidad 0.954 al intervalo (µ − 2 · σ, µ + 2 · σ).
Como desconocemos los parámetros de la distribución normal, el problema
a resolver era estimar los mismos. Ahora que conocemos la media y la
varianza muestral, se puede hacer el análisis, siendo x = 16.45 y s = 1.16.
Entonces,
(x − s, x + s) = (15.29, 17.61) 10 observaciones
P(15.29 < X < 17.61) u 0.68
(x − 2 s, x + 2 s) = (14.14, 18.77) 15 observaciones
P(14.14 < X < 18.77) > 0.95
Entonces podemos concluir que: La población del consumo de agua es
aproximadamente normal

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 55 / 117


Estadı́sticos
Estadı́sticos de Orden

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 56 / 117


Estadı́sticos
Estadı́sticos de Orden: Introducción

Sea (x1 , x2 , . . . , xn ) es una muestra observada de la muestra


(X1 , X2 , . . . , Xn ).
Hemos asociado,
el estadı́stico X a la media de la población de manera tal que su valor
en esta muestra observada, x , nos puede servir para “representar” a la
media, µ, de la población.
el estadı́stico S 2 a la varianza de la población de manera tal que su
valor en esta muestra observada, s 2 , nos puede servir para
“representar” a la varianza, σ 2 .

¿Qué estadı́sticos podemos asociar los valores con los cuantiles


de la población?

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 57 / 117


Estadı́sticos
Estadı́sticos de Orden: Introducción

Sea (X1 , X2 , X3 , X4 , X5 ) una muestra aleatoria y sea además,


(x1 , x2 , x3 , x4 , x5 ) = (6, 4, 2, 10, 8).

Ordenamos la muestra de menor a mayor y a cada valor en el nuevo


orden lo llamamos con un subı́ndice entre paréntesis:
6 4 2 10 8
↓ ↓ ↓ ↓ ↓
x1 x2 x3 x4 x5
ordenando de menor a mayor
2 4 6 8 10
x(1) x(2) x(3) x(4) x(5)

¿cómo “representar” la mediana de la población?

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 58 / 117


Estadı́sticos
Estadı́sticos de Orden: Definición

Estadı́stico de Orden i
Sea X la variable aleatoria definida en el espacio muestral S que representa
a la población, (X1 , X2 , . . . , Xn ) una muestra aleatoria proveniente de esta
población y gi la función de Rn en R definida por gi (a1 , a2 , . . . , an ) = a(i) ,
donde a(i) es el valor que ocupa el lugar i-ésimo cuando se ordenan los
números a1 , a2 , . . . , an de menor a mayor, i = 1, . . . , n.

El estadı́stico de orden i es el estadı́stico

X(i) = gi (X1 , X2 , . . . , Xn ), i = 1, . . . , n

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 59 / 117


Estadı́sticos
Estadı́sticos de Orden: Ejemplo

Ejemplo 5
Dada una muestra observada (x1 , x2 , . . . , xn ) el valor del estadı́stico de orden i en
esta muestra es el número x(i) que resulta ser el valor que ocupa el lugar i-ésimo
cuando se ordena la muestra de menor a mayor.
En el ejemplo, (x1 , x2 , . . . , xn ) = (6, 4, 2, 10, 8):
x(3) = g3 (6, 4, 2, 10, 8) = 6

x(1) = g1 (6, 4, 2, 10, 8) = 2

x(5) = g5 (6, 4, 2, 10, 8) = 10

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 60 / 117


Estadı́sticos
Estadı́sticos de Orden

Mediana Muestral
Sea (X1 , X2 , . . . , Xn ) una muestra aleatoria proveniente de esta población,
llamamos mediana muestral a:

 X( n+1 ) ; n impar

 2

Xe0.5 = Me = Md =
X n + X( n +1)
 (2)

2

; n par
2

Observación
Note que si n es par, la mediana muestral no es un estadı́stico de
orden.

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 61 / 117


Gráfico Cuantil - Cuantil

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 62 / 117


Gráfico Cuantil - Cuantil

La idea central de un gráfico cuantil-cuantil (q-q plot) es comparar


cuantiles muestrales (valores de estadı́sticos de orden) con cuantiles
de una población (distribución) conocida con el objeto de corroborar
(o descartar) que la distribución postulada puede ser considerada la
distribución de la población.
Aunque se pueden utilizar para analizar una distribución cualquiera en
la población, nosotros los usaremos para analizar la normalidad de la
distribución de la población

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 63 / 117


Gráfico Cuantil - Cuantil
Un gráfico de este tipo se representa en el plano, en un sistema de
coordenadas cartesianas, donde sobre el eje vertical se colocan los
estadı́sticos de orden (obtenidos de la muestra) y en el eje horizontal los
cuantiles teóricos de una Normal estándar. El gráfico tiene la forma

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 64 / 117


Gráfico Cuantil - Cuantil

datos <- c(15.3, 15.9, 17.4, 14.6, 15.6, 16.7, 16.1, 14.7,
17.7, 16.2, 18.7, 16.8, 17.8, 16.4, 16.9)

qqnorm(datos, col="blue",
xlab="Cuantiles poblacionales",
ylab="Cuantiles muestrales",
main="Gráfico cuantil-cuantil para datos")

qqline(datos, col="red")

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 65 / 117


Gráfico Cuantil - Cuantil

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 66 / 117


Distribución de un Estadı́stico

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 67 / 117


Distribuciones de un Estadı́stico

Distribución de un estadı́stico
Un estadı́stico es una variable aleatoria y como tal tiene una distribución
de probabilidades. A la distribución de probabilidades de un estadı́stico se
le llama distribución del estadı́stico. Esta distribución es muy importante
para determinar que tan buena es la inferencia que se hace a partir de los
valores del estadı́stico. Si bien no se puede observar empı́ricamente, es
más bien un concepto teórico, podemos determinar la distribución de los
datos observados.

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 68 / 117


Distribuciones de un Estadı́stico

Distribución de un estadı́stico
A modo de ejemplo determinaremos la distribución de X a partir de
muestras de tamaño 2 con reemplazo de una variable aleatoria discreta X
(población) definida como:
X : ”Número de etiquetas de sostenibilidad obtenidas por los hoteles 5
estrellas de Mendoza” X (S) : {0, 1, 2, 3, 5}
cuya función de densidad es
1
fX (x) = I{ 0, 1, 2, 3, 5}(x)
5

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 69 / 117


Distribuciones de un Estadı́stico

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 70 / 117


Distribuciones de un Estadı́stico

Distribución de un estadı́stico
Determinaremos la esperanza y la varianza de esta variable aleatoria X .

1
E(X ) = · (0 + 1 + 2 + 3 + 5) = 2.2
5

Por tanto, se espera que, en promedio, los hoteles 5 estrellas tengan 2,2 etiquetas de
sostenibilidad.

var(X ) = E(X − E(X ))2


1h i
= (0 − 2.2)2 + (1 − 2.2)2 + (2 − 2.2)2 + (3 − 2.2)2 + (5 − 2.2)2
5
= 2.96

Dado que la varianza no es interpretable, se interpretará el desvı́o poblacional, cuyo valor


es de 1.72, por tanto, se espera que el número de etiquetas sostenibles en los hoteles 5
estrellas se alejen de la media en 1.72 etiquetas.

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 71 / 117


Distribución de un Estadı́stico

Distribución de un Estadı́stico
Ahora determinaremos la distribución de X a partir de muestras de
tamaño 2 con reemplazo extraı́das de la variable aleatoria discreta X

Muestras (0,0) (0,1) (0,2) (0,3) (0,5) (1,0) (1,1) (1,2) (1,3) (1,5) (2,0) (2,1)
x 0 0.5 1 1.5 2.5 0.5 1 1.5 2 3 1 1.5
Muestras (2,2) (2,3) (2,5) (3,0) (3,1) (3,2) (3,3) (3,5) (5,0) (5,1) (5,2) (5,3)
x 2 2.5 3.5 1.5 2 2.5 3 4 2.5 3 3.5 4
Muestras (5,5)
x 5

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 72 / 117


Distribución de un Estadı́stico

Distribución de un Estadı́stico
Todas estas muestras tienen la misma probabilidad de ser obtenidas y son
1
25 muestras, entonces la probabilidad de cada una es . Luego, la
25
distribución del estadı́stico X se muestra en la tabla que sigue.

x 0 0.5 1 1.5 2 2.5 3 3.5 4 5


1 2 3 4 3 4 3 2 2 1
fX (x)
25 25 25 25 25 25 25 25 25 25
Es decir:
1 2 3 4
fX (x) = I{0,5} (x) + I{0.5,3.5,4} (x) + I{1,2,3} (x) + I{1.5,2.5} (x)
25 25 25 25

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 73 / 117


Distribución de un Estadı́stico

Distribución de un Estadı́stico
La esperanza de X es:
P 1 2 3 4
E(X ) = X ∈X (S) x · fX (x) = (0 + 5) + (0.5 + 3.5 + 4) + (1 + 2 + 3) + (1.5 + 2.5) = 2.2
25 25 25 25
La varianza de X es:
X
var(X ) = (x − E(X )2 · fX (x)
x∈X (S)
1 2 3 4
= (0 − 2.2)2 + (0.5 − 2.2)2 + (1 − 2.2)2 + (1.5 − 2.2)2 +
25 25 25 25
3 4 3 2
(2 − 2.2)2 + (2.5 − 2.2)2 + (3 − 2.2)2 + (3.5 − 2.2)2 +
25 25 25 25
2 1 2.96 var(X )
(4 − 2.2)2 + (5 − 2.2)2 = 1.48 = =
25 25 2 n

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 74 / 117


Distribución de un Estadı́stico
Distribución de un Estadı́stico

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 75 / 117


Distribución de un Estadı́stico

Distribución de un Estadı́stico
Ahora determinaremos la distribución de X a partir de muestras de
tamaño 3 con reemplazo extraı́das de la variable aleatoria discreta X
Muestras (0,0,0) (0,0,1) (0,0,2) (0,0,3) ... (5,5,1) (5,5,2) (5,5,3) (5,5,5)
x 0 0.33 0.67 1 ... 3.67 4 4.33 5

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 76 / 117


Distribución de un Estadı́stico

Distribución de un Estadı́stico
Todas estas muestras tienen la misma probabilidad de ser obtenidas y son
1
125 muestras, entonces la probabilidad de cada una es . Luego, la
125
distribución del estadı́stico X se muestra en la tabla que sigue.

x 0 0.33 0.67 1 1.33 1.67 2 2.33 2.67 3 3.33 3.67 4 4


1 3 6 10 12 15 16 15 15 10 9 6 3
fX (x)
125 125 125 125 125 125 125 125 125 125 125 125 125 1

1 3 6 9 10
Es decir: fX (x) = I{0,5} (x) + I{0.33,4,4.33} (x) + I{0.67,3.67} (x) + I{3.33} (x) + I{1,3} (x) +
125 125 125 125 125
12 15 16
I{1.33} (x) + I{1.67,2.33,2.67} (x) + I{2} (x)
125 125 125

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 77 / 117


Distribución de un Estadı́stico

Distribución de un Estadı́stico
La esperanza
P de X es:
E(X ) = X ∈X (S) x · fX (x) = 2.2
La varianza de X es:
X
var(X ) = (x − E(X )2 · fX (x)
x∈X (S)

2.96 var(X )
= 0.99 = =
3 n

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 78 / 117


Distribución de un Estadı́stico
Distribución de un Estadı́stico

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 79 / 117


Distribuciones de un Estadı́stico
µ ± σ y µ ± σ/n

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 80 / 117


Distribuciones de Algunos Estadı́sticos

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 81 / 117


Distribuciones de Algunos Estadı́sticos
Teorema Central del Lı́mite

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 82 / 117


Distribuciones de Algunos Estadı́sticos
Teorema Central del Lı́mite

Teorema Central del Lı́mite


¿Por qué es importante la distribución normal?
La razón es que aunque una variable aleatoria no posea distribución
normal, ciertos estadı́sticos / estimadores calculados sobre muestras
elegidas al azar sı́ poseen una distribución normal.

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 83 / 117


Distribuciones de Algunos Estadı́sticos
Teorema Central del Lı́mite

Teorema Central del Lı́mite

σ2
 
2 ∼
X1 , . . . , Xn m.a. /E(X1 ) = µ ∧ var(X1 ) = σ ⇒ X → N µ,
n→∞ n

Corolario del Teorema Central del Lı́mite

X1 , . . . , Xn m.a. / E(X1 ) = µ ∧ var(X1 ) = σ 2


n

X
Xi : U → N nµ, nσ 2

⇒ U=
n→∞
i=1

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 84 / 117


Distribuciones de Algunos Estadı́sticos
Teorema Central del Lı́mite

Bernoulli

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 85 / 117


Distribuciones de Algunos Estadı́sticos
Teorema Central del Lı́mite

Binomial

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 86 / 117


Distribuciones de Algunos Estadı́sticos
Teorema Central del Lı́mite

Poisson

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 87 / 117


Distribuciones de Algunos Estadı́sticos
Teorema Central del Lı́mite

Teorema del Lı́mite Central


Cuando la población es normal la distribución de X es normal
cualquiera sea n.
La varianza decrece a medida que n crece.
Cuando la distribución de la población es simétrica, más rápidamente
tiende a una distribución aproximadamente normal.
Cuando n = 30 la distribución es aproximadamente normal,
cualquiera sea la población de la cual provienen las muestras. Se
considera que, para tamaños muestrales mayores o iguales a 30, la
aproximación a la distribución normal será bastante buena.

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 88 / 117


Distribuciones de Algunos Estadı́sticos
Teorema Central del Lı́mite

Ejemplo 6 (TCL)
De acuerdo con la información que suministra una compañı́a de telefonı́a móvil en
Argentina, el pago mensual promedio de todos los abonados de la Ciudad de
Mendoza es de $1530 con una desviación tı́pica de $410. Se toma una muestra
de tamaño 36 de esa población ¿cuál es la probabilidad de que el pago promedio
sea inferior a 1500?
VAC
P(X < 1500) = P(X ≤ 1500) = FX̄ (1500)
≈ pnorm(1500, 1530, sqrt(410)) = 0.06922413

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 89 / 117


Distribuciones de Algunos Estadı́sticos
Teorema Central del Lı́mite

Ejemplo 7 (Corolario TCL)


Supongamos que se lanza una moneda 900 veces y se quiere determinar,
aproximadamente, la probabilidad de obtener más de 495 caras. Definimos la variable
aleatoria:

1 si se obtiene cara 1 lanzamiento de la moneda
X =
0 si se obtiene ceca en el lanzamiento de una moneda
X ∼ Bernoulli(π = 1/2) ⇒ E(X ) = π = 1/2 ∧ E(X ) = π(1 − π) = 1/4

Sea X1 , X2 , . . . , X900 una m.a. de la población representada por la variable X .


Definimos U: número total de caras,
 

U → N nµ, nσ 2
n→∞

P(U > 495) = 1 − P(U ≤ 495)


≈ 1 − pnorm(495, 900 ∗ 1/2, sqrt(900 ∗ 1/4)) = 0.001349898

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 90 / 117


Distribuciones de Algunos Estadı́sticos

Distribución del Total Muestral


1 Población Bernoulli
n
X
X1 , . . . , Xn m.a. /X1 ∼ Bernoulli(π) ⇒ U = Xi / U ∼ Binom(n, π)
i=1

2 Población Poisson
n
X
X1 , . . . , Xn m.a. /X1 ∼ Pois(λ) ⇒ U = Xi / U ∼ Pois(nλ)
i=1

3 Población Normal
n
X
X1 , . . . , Xn m.a. /X1 ∼ N(µ, σ 2 ) ⇒ U = Xi / U ∼ N(nµ, nσ 2 )
i=1

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 91 / 117


Distribuciones de Algunos Estadı́sticos
Distribución del Total Muestral

Ejemplo 8 (Distribución del total Muestral)


Supongamos que se lanza una moneda 900 veces y se quiere determinar,
aproximadamente, la probabilidad de obtener más de 495 caras. Definimos la variable
aleatoria:

1 si se obtiene cara 1 lanzamiento de la moneda
X =
0 si se obtiene ceca en el lanzamiento de una moneda
X ∼ Bernoulli(π = 1/2) ⇒ E(X ) = π = 1/2 ∧ E(X ) = π(1 − π) = 1/4

Sea X1 , X2 , . . . , X900 una m.a. de la población representada por la variable X .


Definimos U: número total de caras,

U → Binomial (n = 900, π = 1/2)

P(U > 495) = 1 − P(U ≤ 495)


≈ 1 − pbinom(495, 900, 0.5) = 0.0012

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 92 / 117


Distribuciones de Funciones de Muestras en una
Población Normal

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 93 / 117


Distribuciones de Funciones de Muestras en una Población
Normal

Distribución Conjunta de la Muestra Aleatoria


Si X1 , X2 , . . . , Xn es una muestra aleatoria de una población normal con
mediaPµ y varianza σ 2 y a1 , a2 , . . . , an son constantes reales. P
Y = ni=1 (aP i · Xi ) tiene una distribución normal con media (µ
n
i=1 (ai )) y
2 n 2
varianza (σ i=1 (ai ) )

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 94 / 117


Distribuciones de Funciones de Muestras en una
Población Normal
Distribución de la Media Muestral

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 95 / 117


Distribuciones de Funciones de Muestras en una Población
Normal
Distribución de la Media Muestral

Distribución de la Media Muestral

σ2
 
2
X1 , . . . , Xn m.a. /X1 ∼ N(µ, σ ) ⇒ X ∼ N µ,
n

Observaciones

De lo anterior se desprende: X −µ
 Z = √ ∼ N (0, 1)



σ/ n
X1 , . . . , Xn m.a. /X1 ∼ N(µ, σ 2 ) ⇒
  
σ2

 Z = X − µ ∼ N 0,

n

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 96 / 117


Distribuciones de Funciones de Muestras en una Población
Normal
Distribución del Total Muestral

Distribución del Total Muestral

X1 , . . . , Xn m.a. /X1 ∼ N(µ, σ 2 ) ⇒ T ∼ N(n µ, n σ 2 )

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 97 / 117


Distribuciones de Funciones de Muestras en una Población
Normal

Se estudiarán distribuciones que están estrechamente relacionadas con


muestras aleatorias de poblaciones normales. Estas distribuciones son muy
útiles porque son las distribuciones de variables aleatorias que nos permiten
realizar inferencias sobre los parámetros desconocidos de una población.

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 98 / 117


Distribuciones de Funciones de Muestras en una
Población Normal
Funciones Muestrales con Distribución chi-cuadrado

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 99 / 117


Distribuciones de Funciones de Muestras en una Población
Normal
Funciones Muestrales con Distribución chi-cuadrado

S2
X1 , X2 , . . . , Xn m.a. / X1 ∼ N(µ, σ 2 ) ⇒ Q = (n − 1) ∼ χ2(n−1)
σ2
Donde χ2 es la distribución Chi-Cuadrada y (n − 1) es su parámetro
llamado “grados de libertad”.

Propiedad 1
Si bien no se demuestra, para analizar la distribución de una función de la
varianza S 2 de una muestra de una población normal, se deben considerar algunas
propiedades vinculadas a las distribuciones normales, tales como:
Si Z tiene una distribución Normal estándar, entonces Z 2 tiene una distribución
chi-cuadrado con un grado de libertad. En sı́mbolos,

Z ∼ N(0, 1) ⇒ Z 2 ∼ χ2 (1)
Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 100 / 117
Distribuciones de Funciones de Muestras en una
Población Normal
Funciones Muestrales con Distribución t-Student

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 101 / 117
Distribuciones de Funciones de Muestras en una Población
Normal
Funciones Muestrales con Distribución t-Student

X −µ
X1 , X2 , . . . , Xn m.a. / X1 ∼ N(µ, σ 2 ) ⇒ T = √ ∼ t(n−1)
S/ n

Donde t es la distribución t-student y (n − 1) es su parámetro llamado “grados de


libertad”.

Propiedad 2
Si bien, no se demuestra, dada una variable aleatoria normal estándar Z y Q una
variable aleatoria con distribución χ2 (k) y tales que Z y U son variables aleatorias
independientes. Entonces, T = √Z es una variable con distribución t-Student con k
U/k
grados de libertad.

Z
Z ∼ N(0, 1) ∧ Q ∼ χ2(k) ∧ Z , Q independientes ⇒ T = q ∼ t(k)
Q
k

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 102 / 117
Distribuciones de Funciones de Muestras en dos
Poblaciones Normales Independientes
Funciones muestrales con distribución F de Fisher - Snedecor

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 103 / 117
Distribuciones de Funciones de Muestras en dos
Poblaciones Normales Independientes
Funciones muestrales con distribución F de Fisher - Snedecor

X1 , . . . , Xn m.a. / X1 ∼ N(µX , σX2 ) ∧ Y1 , . . . , Ym m.a. / Y1 ∼ N(µY , σY2 )

SX2 /σX2
∧ X , Y ind. ⇒ F = ∼ F(n−1, m−1)
SY2 /σY2
Donde F es es la distribución “F de Snedecor” y n − 1 y m − 1 son sus parámetros
llamados “grados de libertad”

Propiedad 3
Si bien no se demuestra, el cociente de dos variables aleatorias chi-cuadrado
independientes divididas por sus grados de libertad es otra variable aleatoria con
distribución F de Fisher - Snedecor con los grados de libertad de las variables aleatorias
del numerador y denominador respectivamente.

U/n
U ∼ χ2(n) ∧ V ∼ χ2(m) ∧ U, V ind. ⇒ W = ∼ F(n,m)
V /m
Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 104 / 117
Distribuciones de Funciones de Muestras en dos
Poblaciones Normales Independientes

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 105 / 117
Distribuciones de Funciones de Muestras en dos
Poblaciones Normales Independientes
Funciones de X − Y

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 106 / 117
Distribuciones de Funciones de Muestras en dos
Poblaciones Normales
2 2
Independientes
Funciones de X − Y con σX y σY conocidos

Función de X − Y con σX2 y σY2 conocidos

X1 , . . . , Xn m.a. / X1 ∼ N(µX , σX2 ) ∧ Y1 , . . . , Ym m.a. / Y1 ∼ N(µY , σY2 )



X − Y − (µX − µY )
∧ X , Y ind. ⇒ Z = q ∼ N(0, 1)
σX2 σY2
n + m

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 107 / 117
Distribuciones de Funciones de Muestras en dos
Poblaciones Normales
2 2
Independientes
Funciones de X − Y con σX y σY conocidos

Demostración
σ2
   
X1 , . . . , Xn m.a. / X1 ∼ N µX , σX2 ⇒ X ∼ N µX , X
n
σ2
   
Y1 , . . . , Ym m.a. / Y1 ∼ N µY , σY2 ⇒ Y ∼ N µY , Y
m
X , Y independientes ⇒ X = g (X1 , . . . , Xn ), Y = h(Y1 , . . . , Ym ) independientes

σ2 σ2
 
∴ X −Y ∼ N µX − µY , X + Y ⇒
n m

X − Y − (µX − µY )
Z = q
2 2
∼ N(0, 1)
σX σY
n
+ m

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 108 / 117
Distribuciones de Funciones de Muestras en dos
Poblaciones Normales
2 2
Independientes
Funciones de X − Y con σX = σY desconocidos

Función de X − Y con σX2 = σY2 desconocidos

X1 , . . . , Xn m.a. / X1 ∼ N(µX , σ 2 ) ∧ Y1 , . . . , Ym m.a. / Y1 ∼ N(µY , σ 2 )



X − Y − (µX − µY )
∧ X , Y ind. ⇒ T = q ∼ t(n+m−2)
Sp · n1 + m1

(n − 1) SX2 + (m − 1) SY2
donde Sp2 =
n+m−2

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 109 / 117
Distribuciones de Funciones de Muestras en dos
Poblaciones Normales
2 2
Independientes
Funciones de X − Y con σX = σY desconocidos

Demostración

X − Y − (µX − µY )
σX2 = σY2 = σ 2 ⇒ Z = q ∼ N(0, 1)
σ · n1 + m1

SX2 S2
QX = (n − 1) 2
∼ χ2(n−1) ∧ QY = (m − 1) Y2 ∼ χ2(m−1) ∧ QX , QY ind.
σ σ
(n − 1) SX2 + (m − 1) SY2
⇒ Q = QX + QY = ∼ χ2(n+m−2)
σ2
Z, Q ind
Z
∴ T = r ∼ χ2(n+m−2)
Prop 7 Q
n+m−2

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 110 / 117
Distribuciones de Funciones de Muestras en dos
Poblaciones Normales
2 2
Independientes
Funciones de X − Y con σX = σY desconocidos

Demostración (continuación)
 
X − Y − (µX − µY ) X − Y − (µX − µY )
q q
Z σ · n1 + m1 1
n
+ m1
T = r = s = s
Q (n − 1) SX2 + (m − 1) SY2 (n − 1) SX2 + (m − 1) SY2
n+m−2 σ (n + m − 2)
2 (n + m − 2)

X − Y − (µX − µY )
q
1
+ m1

n X − Y − (µX − µY )
= = q ∼ χ2(n+m−2)
Sp S · 1+ 1p n m

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 111 / 117
Distribuciones de Funciones de Muestras en dos
Poblaciones Normales
2 2
Independientes
Funciones de X − Y con σX 6= σY desconocidos

Función de X − Y con σX2 6= σY2 desconocidos

X1 , . . . , Xn m.a. / X1 ∼ N(µX , σX2 ) ∧ Y1 , . . . , Ym m.a. / Y1 ∼ N(µY , σY2 )



X − Y − (µX − µY )
∧ X , Y ind. ⇒ T = q ∼ t(ν)
SX2 SY2
n + m

donde 2
SX2 SY2

n + m
ν= (aproximación de Welch)
(SX2 /n)2 (SY2 /m)2
n−1 + m−1

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 112 / 117
Ejemplo 9
Los datos del Departamento de Agricultura indican que el consumo semestral de
manzanas de una mujer elegida aleatoriamente se distribuye según una normal de
media 19.9 libras y una desviación estándar de 3.4 libras; mientras que el
consumo semestral de manzanas de un hombre se distribuye normalmente con
una media de 20.7 libras y una desviación estándar de 3.2 libras.
Admitamos que se elige aleatoriamente a una mujer. ¿Qué proporción de las
mujeres tendrán un consumo de manzanas entre 19.4 y 20.3 libras? ¿Qué puede
comentar de este resultado?
Definimos las variables aleatorias
X : Consumo semestral de manzanas de la mujer (en libras)
X ∼ N(µX , σX2 ) donde µX = 19.9 y σX = 3.4
Y : Consumo semestral de manzanas del hombre (en libras)
Y ∼ N(µY , σY2 ) donde µY = 20.7 y σY = 3.2
P(19.4 < X < 20.3) = P(X < 20.3) − P(X ≤ 19.4) = P(X ≤ 20.3) − P(X ≤ 19.4)
= FX (20.3) − FX (19.4) = 0.1052835

En R: pnorm(20.3, mean = 19.9, sd = 3.4) − pnorm(19.4, mean = 19.9, sd = 3.4)

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 113 / 117
Ejemplo 9 (continuación)
Los datos del Departamento de Agricultura indican que el consumo semestral de manzanas de
una mujer elegida aleatoriamente se distribuye según una normal de media 19.9 libras y una
desviación estándar de 3.4 libras; mientras que el consumo semestral de manzanas de un hombre
se distribuye normalmente con una media de 20.7 libras y una desviación estándar de 3.2 libras.
Supongamos que se eligen aleatoriamente dos muestras independientes de 30 mujeres y 35
hombres. ¿Cuál es la probabilidad que el consumo medio de manzanas de la mujer sea mayor
que el consumo medio de los hombres? ¿Qué puede comentar de este resultado?
Se seleccionan aleatoriamente las muestras
(X1 , X2 , · · · , Xn ) muestra aleatoria n = 30
(Y1 , Y2 , · · · , Ym ) muestra aleatoria m = 35
Recordando que
(X1 , X2 , · · · , Xn ) /Xi ∼ N(µX , σX2 ) ∧ (Y1 , Y2 , · · · , Ym ) /Yi ∼ N(µY , σY2 ) ∧ X , Y independientes
 
σ2 σ2
⇒ X − Y ∼ N µX − µY , nX + mY
P(X > Y ) = P(X − Y > 0) = 1 − P(X − Y ≤ 0) = 1 − FX −Y (0) = 1 − 0.8343853 = 0.1656147
En R: 1 − pnorm(0, mean = 19.9 − 20.7, sd = sqrt((3.42 )/30 + (3.22 )/35))

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 114 / 117
Ejemplo 9 (continuación)
El Departamento de Agricultura quisiera, para el caso de los hombres, que el consumo medio de
la muestra se desviara a lo más en 1.3 libras del verdadero consumo medio. ¿Con qué
probabilidad ocurre lo que el Departamento de Agricultura desea?
Recordando que  
2
σY
(Y1 , Y2 , · · · , Ym ) m.a. /Yi ∼ N(µY , σY2 ) ⇒ Y ∼ N µY , m

P(| Y − µY |≤ 1.3) = P(−1.3 ≤ Y − µY ≤ 1.3) = P(µY − 1.3 ≤ Y ≤ µY + 1.3)


= P(Y ≤ µY + 1.3) − P(Y < µY − 1.3)
= P(Y ≤ µY + 1.3) − P(Y ≤ µY − 1.3)
= FY (µY + 1.3) − FY (µY − 1.3) = FY (20.7 + 1.3) − FY (20.7 − 1.3)
= FY (22) − FY (19.4) = 0.9837569

En R:
pnorm(22, mean = 20.7, sd = 3.2/sqrt(35)) − pnorm(19.4, mean = 20.7, sd = 3.2/sqrt(35))

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 115 / 117
Ejemplo 9 (continuación)
Para el caso de las mujeres, ¿cuál es la probabilidad de que el desvı́o muestral en muestras de
tamaño 30 supere al desvı́o poblacional?
Recordando que
S2
(X1 , X2 , · · · , Xn ) m.a. /Xi ∼ N(µX , σX2 ) ⇒ Q = (n − 1) X2 ∼ χ2(n−1)
σX
! !
SX2 SX2
P SX2 > σX2 = P

P(SX > σX ) = >1 =P (n − 1) > (n − 1) = P(Q > n − 1)
σX2 σX2
= 1 − P(Q ≤ n − 1) = 1 − P(Q ≤ 29) = 1 − FQ (29) = 0.4650662

En R: 1 − pchisq(29, df = 29)

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 116 / 117
Ejemplo 9(continuación)
El departamento de agricultura desea conocer además cómo se comporta la variabilidad en el
consumo del producto en los dos géneros. Determine qué probabilidad hay de que la variabilidad
en el consumo semestral de manzanas de una mujer sea mayor a la de los hombres teniendo en
cuenta los tamaños de muestras considerados en este estudio. Recordando que
(X1 , X2 , · · · , Xn ) /Xi ∼ N(µX , σX2 ) ∧ (Y1 , Y2 , · · · , Ym ) /Yi ∼ N(µY , σY2 ) ∧ X , Y independientes
S 2 /σ 2
⇒ F = X2 X2 ∼ F(n−1, m−1)
SY /σY
! ! !
SX2 SX2 σY2 σY2 SX2 /σX2 σY2
P(SX2 > SY2 ) = P >1 =P > =P >
SY2 SY2 σX2 σX2 SY2 /σY2 σX2
! !
σY2 σY2 3.22
 
= P F > =1−P F ≤ =1−P F ≤
σX2 σX2 3.42
= 1 − P (F ≤ 0.8858) = 1 − FF (0.8858)
= 1 − 0.37313 = 0.6268696

En R: 1 − pf ((3.2/3.4)2 , df 1 = 29, df 2 = 29)

Estadı́stica I (FCE UNCuyo - CP-LA) U5: Muestras Aleatorias 2023 117 / 117

También podría gustarte