Universidad Católica "San Pablo"
Materia: Probabilidad y Estadística II
Distribuciones de muestreo fundamentales y descripción de datos - Apuntes de clase
Yuri Miranda Gonzáles
2023
Contenido
1 Introducción y conceptos necesarios 1
1.1 Población muestra y parámetro . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Estadígrafo y muestra aleatoria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.3 Como se puede extraer una muestra aleatoria? . . . . . . . . . . . . . . . . . . . . . . . . . . 4
2 Distribución muestral de medias y el teorema central del límite 5
2.1 Teorema Central del Limite (dos versiones) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
2.1.1 Distribución Muestral de la Media, propiedades: . . . . . . . . . . . . . . . . . . . . . 6
2.1.2 Distribución muestral de la diferencia de medias . . . . . . . . . . . . . . . . . . . . . 6
3 Distribución muestral de S2 6
2
3.1 Distribución Chi-cuadrado(X (n)) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
3.2 Distribución de la varianza muestral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
4 Distribución t de Student (X t(n)) 7
4.1 Distribución de la media para muestras pequeñas . . . . . . . . . . . . . . . . . . . . . . . . . 8
4.2 Distribución de la diferencia de medias de dos poblaciones normales independientes con 2
desconocidas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
5 Disribución Fisher Snedecor (F (n; m)) 8
5.1 Distribución muestral de la razón de varianzas muestrales . . . . . . . . . . . . . . . . . . . . 8
6 Distribución muestral para una proporción 9
6.1 Distribución de la diferencia de proporciones muestrales . . . . . . . . . . . . . . . . . . . . . 9
1 Introducción y conceptos necesarios
(Lectura obligatoria: páginas 225 a 230 de "Probabilidad y estadística para ingeniería y ciencias" Walpole
Myers)
1.1 Población muestra y parámetro
Población: Es un conjunto todos de elementos con cierta característica en común, de…nido en tiempo y
espacio
Muestra: Es un subconjunto representativo de la población.
Parámetro: Es una característica de la población. Los parámetros generalmente se denotan por letras
griegas, por ejemplo los más analizados son los siguientes:
: Media poblacional
1
: Desviación estandar poblacional
2
: Varianza poblacional
p : Proporción poblacional
Y : Total
1.2 Estadígrafo y muestra aleatoria
Estadístico, Estadígrafo o Estimador: Es una característica de la muestra. por ejemplo
X : Media muestral
S : Desviación estandar muestral
S 2 : Varianza muestral
p^ : Proporción muestral
y^ : Estimación del total
Muestra aleatoria: Si se tiene una poblacion con cierta característica X con distribución de probabilidad
f (x). Entoces una muestra aleatoria (m:a) es un conjunto fX1 ; X2 ; :::Xn g de n variables aleatorias indepen-
dientes e identicamente distribuidas (v.a.i.i.d). Y como la población tiene las caracteristicas: = E[X] y
2
= V [X]
Por lo una muestra aleatoria cumple:
La misma media para cada Xi : E[Xi ] =
2
La misma varianza para cada Xi : V [Xi ] =
n
Y
La distribución de probabilidades conjunta : f (x1 ; x2 ; :::xn ) = f (xi )
i=1
Estadístico, Estadígrafo o Estimador: Es una función de v:a: y de constantes concodicas, que se
pueden observar en una m:a:
Los estadisticos se utilizan para hacer inferencias (estimaciones) respecto a parámetros de la población.
Por lo tanto un estadistico es una v:a: y su distribución de probabilidad se llama distribución muestral del
estimador.
Ejemplos:
2
3
1.3 Como se puede extraer una muestra aleatoria?
Se pueden extraer muestras aleatorias con reemplazamiento y sin reemplazamiento. El número de muestras
de tamaño n de una población de tamaño N es el siguiente:
Número de muestras aleatorias que se puede extraer si:
El orden SI interesa El orden NO interesa
N 1+n
Con reemplazamiento N n n
N
Sin reemplazamiento N Pn n caso habitual
Se recomienda analizar el siguiente ejemplo teórico:
Ejemplo 1. Se tiene una población de 5 niños con las siguientes iniciales P = fa; b; c; d; eg; con los siguientes pesos
en Kg. respectivamente f3; 4; 5; 6; 7g
(a) Cuantas muestras de tamaño 3 se puede extraer, si el orden "no" interesa:
Sin reemplazamiento: 53 = 10: Que se pueden mostrar:
f(abc)(abd)(abe)(acd)(ace)(ade)(bcd)(bce)(bde)(cde)g
Con reemplazamiento: 5 31+3 = 35: Es decir a parte de las 10 muestras anteriores se tiene por
ejemplo (aab) y 4 más (con c, d, y a) es decir 5 más. Lo mismo para (bba), entoces en total 25
muestras más, que …nalmente con las 10 anteriores serian: 35 muestras.
(b) Cuantas muestras de tamaño 3 se puede extraer si el orden "si" interesa:
5!
Sin reemplazamiento: 5 P3 = 2! = 60 = (5 4 3)
3
Con reemplazamiento: 5 = 125 = (5 5 5)
(c) Hallar el parámetro del peso medio de la población, =?
4
(d) Hallar las 10 medias, de las 10 muestras descritas en el inciso a), luego hallar la media de las 10 y
comentar sus resultados
2 Distribución muestral de medias y el teorema central del límite
2
Se tiene una poblacion con media y varianza . Se extrae de esa poblacion una m.a. X1 ; X2 ; :::Xn :Se
puede demostrar que:
E[X] =
2
V [X] =
n
2
Si la variable X en la población tiene distribución normal con media y varianza : Entonces la distribución
de probabilidades de la media muestral será:
P
n
xi 2
i=1
X= N( ; )
n n
Nota:
Si el muestreo se realiza de una población …nita de tamaño N y sin reemplazamiento, se tiene:
E[X] =
2
N n
V [X] =
n N 1
N n
Donde: N 1 se llama factor de correción por …nitud de la población.
Ejemplo 2 El peso de paquetes de chocolate se distribuye como una normal con media 311 gramos y varianza
31,6 gramos2 . Si se seleciona una m.a. de tamaño 40. Hallar la probabilidad de que la media muestral
se encuentre entre 309 y 313.
Ejemplo 3 Las notas promedio del examen de probabilidad II en la gestión 2018 fue de 62, con una desviación
estándar de 10. Hallar el el tamaño de muestra de postulantes a probabilidad II, para que tengan un
10% de probabilidad de que la nota promedio sea inferior a 60.
2
Solución X N (62; 10n ) ) Z = X 62
10
p
n
P [X 60] = 0; 10
60 62
P [Z 10 ] = 0; 10
p
n
60 62
de tablas : 1:2815 = 10
p
n
n = 41:056 =) n = 42
2.1 Teorema Central del Limite (dos versiones)
(i) Teorema Central del Límite para la media muestral
2
Se tiene la siguiente sucecion de v.a.i. X1 ; X2 ; :::Xn que constituyen una m.a. con media y varianza .
2
Entonces cuando la muestra crece la media muestral tiende a una distribucion normal ( ; n ), es decir:
Xn
lim P [ k] = Z(k)
n!1 p
n 5
Lo que lleva a la siguiente deducción importante:
n
X
2
Xi N (n ; n )
i=1
Es decir:
2
X N( ; )
n
(ii) Teorema Central del Límite para la suma de v.a. no necesariamente distribuidas identica-
mente
Se tiene la siguiente sucecion de v.a.i. X1 ; X2 ; :::Xn pero no necesariamente distribuidas identicamente,
es decir:
E(Xi ) = i
2
V (Xi ) = i
La suma tiene la siguiente distribución:
n
X Xn n
X
2
Xi N( i; i)
i=1 i=1 i=1
2.1.1 Distribución Muestral de la Media, propiedades:
2
1. Si la m.a. extraída de una población con media y varianza .Cuando n es muy grande entonces por
el teorema central del límite:
2
X N( ; )
n
2.1.2 Distribución muestral de la diferencia de medias
La distribución muestral de la diferencia entre dos medias muestrales de dos poblaciones normales indepen-
dientes con ambas varianzas conocidas es:
2 2
1 2
X1 X2 N( 1 2; + )
n1 n2
Nota:
Si las muestras son grandes y debido a una extensión del teorema central del límite:
S12 S2
X1 X2 N( 1 2; + 2)
n1 n2
3 Distribución muestral de S2
2
3.1 Distribución Chi-cuadrado(X (n))
1 n
1 1
fX (x) = x 2 e 2x ;x 0
2n=2 ( n2 )
Teoremas importantes:
1.
E(X) = n V (X) = 2n
6
(a) Si X1 ; X2 ; ; Xn es una m.a de una N ( ; )
n
X 2
Xi 2
(n)
i=1
2
2. Si X1 ; X2 ; ; Xn es una m.a de una N ( ; )
2
(a) X N( ; n )
P
(b) Las estadísticas X y (Xi X)2 son independientes
P 2
(Xi X) 2
(c) 2 (n 1)
3.2 Distribución de la varianza muestral
P P
2 (xi x)2
Si X1 ; X2 ; ; Xn es una m.a de una N ( ; ); y tenemos las estadísticas X y S 2 es decir xi =n y n 1
, Entonces P
(n 1)S 2 (Xi X)2 2
2
= 2
(n 1)
4 Distribución t de Student (X t(n))
n+1 (n+1)=2
2 x2
fX (x) = p 1+ ; x 2 R; n = 1; 2;
n ( n2 ) n
Teoremas importantes:
2
1. Sea Z N (0; 1) y V (n) además son independientes, entonces:
Z
T =q t(n)
V
n
n
2. Sea X t(n), entonces: E(X) = 0 ; V (X) = n 2 8:n>2
3. t depende unicamente del parámetro n
4. La t es muy similar a la normal estandar pero es mas achatada es decir tiene mayor dsipersión por que
su varianza V (X) = nn 2 siempre es mayor que 1, son simétricas respecto a 0
5. Como lim V (X) = lim nn 2 = 1 Entonces la t se aproxima a la N (0; 1) cuando n es muy grande en
n! 1 n! 1
la practica cuando n>30.
2
6. Si X1 ; X2 ; ; Xn es una m.a de una N ( ; )
X (n 1)S 2 2
Z= p
N (0; 1) V = 2 (n 1)
n
Además Z; V son independientes entonces
Z
T =q t(n 1)
V
n
Simpli…cando: p
X n(X )
= t(n 1)
pS S
n
7
4.1 Distribución de la media para muestras pequeñas
Si la población tiene distribución normal, entonces se cumple:
X
t(n 1)
pS
n
4.2 Distribución de la diferencia de medias de dos poblaciones normales inde-
pendientes con 2 desconocidas
S12 S22
1. Muestras grandes: X1 X2 N( 1 2 ; n1 + n2 )
2. Muestras pequeñas:
2
(a) Suponiendo las varianzas poblacionales i desconocidas e iguales:
(X1 X ) ( 2)
T = q2 2 1
t(n1 + n2 2)
Sp Sp2
n1 + n2
(n1 1)S12
+ (n2 1)S22
Sp2 =
n1 + n 2 2
2
(b) Suponiendo las varianzas poblacionales i desconocidas y diferentes:
(X1 X ) ( 2)
T = q2 2 1
t( )
S1 S22
n1 + n2
2
S12 S22
n1 + n2
= 2 2 2 2
S1 S2
n1 n2
n1 1 + n2 1
5 Disribución Fisher Snedecor (F (n; m))
m+n m
m 1
2 m 2 x2
fX (x) = ;x > 0
(m n
2 ) (2) n 1+ m (m+n)=2
nx
Teoremas importantes:
2 2
1. Si U, V son v.a. independientes U (n), V (m) entonces:
U
n
F = V
F (n; m)
m
n 2n2 (m+n 2)
2. E(X) = n 2 V (X) = m(n 2)2 (n 4) : 8n > 4
3. Propiedad para la lectura de tablas:
1
F (n; m) =
F1 (m:n)
5.1 Distribución muestral de la razón de varianzas muestrales
Si las muestras aleatorias fueron extraidas de dos poblaciones normales e independientes, entonces bajo las
anteriores propiedades se tiene:
S12
2
1
F = S22
F (n1 1; n2 1)
2
2
8
6 Distribución muestral para una proporción
A menudo se desea estimar proporciones de ciertas características de la población y es neceario conocer la
distribución de probabilidad de la estadística proporción.
La proporción esta dada por p (poblacional) y la proporción que estamos estimando mediante la muestra
aleatoria es p^; entonces:
p^ = E(^
p) = P
2 p q
p^ = V (^
p) =
n
donde
q=1 p
Si el muestreo se hace con reemplazamiento o en una población in…nita:
pq
p^ N (p; )
n
entonces:
p^ P
Z= q N (0; 1)
PQ
n
Nota:
Si el muestreo se hace sin reemplazamiento en una población …nita: p^ N (p; pp N
n (N
n
1 )) entonces:
6.1 Distribución de la diferencia de proporciones muestrales
La distribución muestral de la diferencia entre dos proporciones muestrales considerando dos poblaciones X
e Y independientes cuando n1 ; n2 son grandes
p1 q 1 p2 q 2
p^1 p^2 N (p1 p2 ; + )
n1 n2