0% encontró este documento útil (0 votos)
147 vistas24 páginas

Estadística Muestral y Distribuciones

Este documento introduce los conceptos fundamentales de muestreo aleatorio y estadísticas muestrales. Explica que una muestra aleatoria consiste en observaciones independientes de una variable aleatoria tomadas de una población, y que las estadísticas son funciones de las observaciones muestrales que proporcionan información sobre la población. Define la media y varianza muestrales como estadísticas comúnmente usadas y proporciona ejemplos para ilustrar estos conceptos. El documento también presenta ejercicios para practicar el cál
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
147 vistas24 páginas

Estadística Muestral y Distribuciones

Este documento introduce los conceptos fundamentales de muestreo aleatorio y estadísticas muestrales. Explica que una muestra aleatoria consiste en observaciones independientes de una variable aleatoria tomadas de una población, y que las estadísticas son funciones de las observaciones muestrales que proporcionan información sobre la población. Define la media y varianza muestrales como estadísticas comúnmente usadas y proporciona ejemplos para ilustrar estos conceptos. El documento también presenta ejercicios para practicar el cál
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

ASIGNATURA FST41: Estadística Muestrales y sus

Distribuciones

Cirilo Alvarez Rojas

Universidad Nacional De Ingeniería


Facultad De Ingeniería Económica,Ingeniería Estadística
Y Ciencias Sociales
ESCUELA PROFESIONAL DE INGENIERÍA ESTADÍSTICA

Cirilo Alvarez Rojas (UNI-FIEECS) ASIGNATURA FST41: Estadística Muestrales y sus Distribuciones 1 / 48
Introdución

A menudo, los datos colectados en un experimento consisten de varias


observaciones sobre una variable de interés. En esta sección, presentamos
un modelo para colección de datos que frecuentemente es utilizado para
describir los datos recolectados, un modelo denominado como muestreo
aleatorio. La siguiente definición explica matemáticamente que se entiende
por el método aleatorio de muestreo de la colección de datos.

Cirilo Alvarez Rojas (UNI-FIEECS) ASIGNATURA FST41: Estadística Muestrales y sus Distribuciones 2 / 48
MUESTREO ALEATORIO

Considere un experimento estadístico que culmina en los resultados x, que


son los valores asumidos por una v.a. X . Sea F la fd (función de
distribución) de X . En la práctica, F no es completamente conocido, es
decir, uno o más parámetros asociados con F son desconocidos. El trabajo
de un estadístico es estimar estos parámetros desconocidos o probar la
validez de ciertas afirmaciones sobre ellos. Se puede obtener n
observaciones independientes sobre X . Esto significa que se observa n
valores x1 , x2 , . . . , xn asumido por la v.a. X . Cada valor xi puede
considerarse como el valor asumido por una v.a. Xi , i = 1, 2, . . . , n, donde
X1 , X2 , . . . , Xn son variables aleatorias independientes con fd común F .

Cirilo Alvarez Rojas (UNI-FIEECS) ASIGNATURA FST41: Estadística Muestrales y sus Distribuciones 3 / 48
Los valores observados (x1 , x2 , . . . , xn ) son valores asumidos por
(X1 , X2 , . . . , Xn ). El conjunto {X1 , X2 , . . . , Xn } entonces es una muestra de
tamaño n tomada de una población con distribución de F . El conjunto de
n valores x1 , x2 , . . . , xn se llama realización de la muestra. Tenga en cuenta
que los valores posibles de las v.a. (X1 , X2 , . . . , Xn ) pueden considerarse
como puntos en Rn , que pueden denominarse espacio muestral. En la
práctica no se observa x1 , x2 , . . . , xn sino alguna función f (x1 , x2 , . . . , xn ).
Entonces f (x1 , x2 , . . . , xn ) son valores asumidos por la v.a.
f (X1 , X2 , . . . , Xn ).

Ahora formalicemos estos conceptos.

Cirilo Alvarez Rojas (UNI-FIEECS) ASIGNATURA FST41: Estadística Muestrales y sus Distribuciones 4 / 48
Definición 1
Sea X una v.a. con función de distribución F , y sean X1 , X2 , . . . , Xn
variables aleatorias iid con fd común F . Entonces la colección
{X1 , X2 , . . . , Xn } se denomina una muestra aleatoria de tamaño n tomada
de la fd F o simplemente como n observaciones independientes sobre X .

Si X1 , X2 , . . . , Xn es una muestra aleatoria de la población F (x), entonces


la fd conjunta de la muestra está dada por
n
Y
F̂n (x1 , x2 , . . . , xn ) = F (xi ) (1)
i=1

Cirilo Alvarez Rojas (UNI-FIEECS) ASIGNATURA FST41: Estadística Muestrales y sus Distribuciones 5 / 48
Definición 2 (Estadística o estadístico)

Sea X1 ,X2 ,. . . ,Xn , n observaciones independientes en una variable aleatoria


X y sea T : Rn → Rm una función medible Borel. Entonces la variable
aleatoria T (X1 , X2 , . . . , Xn ) se llama una estadística (muestra) o un
estadístico supuesto que no es una función de ningún parámetro (θ)
desconocido. En otros términos un estadístico T es una función del espacio
muestral X apara algún espacio de valores T ; esto es T : X → T
generalmente un espacio Euclidiano.

esquemáticamente se tiene el siguiente diagrama.

Cirilo Alvarez Rojas (UNI-FIEECS) ASIGNATURA FST41: Estadística Muestrales y sus Distribuciones 6 / 48
X (w ) T (X )

Ω Rn Rm

w1 X1 (w ) T (X1 )
w2 X2 (w ) T (X2 )
.. .. ..
. . .
wn Xn (w ) T (Xn )

(T ◦ X )(x)

Cirilo Alvarez Rojas (UNI-FIEECS) ASIGNATURA FST41: Estadística Muestrales y sus Distribuciones 7 / 48
Dos de los estadístico comúnmente más utilizados son definidas como sigue.
Definición 3

Sea X1 ,X2 ,. . . ,Xn , una muestra aleatoria de tamaño n de una función de


distribución F . Entonces el estadístico
n
1X
X = Xi
n
i=1

se llama media muestral y el estadístico


n
2 1 X 2
S = Xi − X
n−1
i=1

se llama varianza muestral.

Cirilo Alvarez Rojas (UNI-FIEECS) ASIGNATURA FST41: Estadística Muestrales y sus Distribuciones 8 / 48
Ejemplo 1.
Sea Ber(1, θ) donde θ es desconocido. La función de de df, F está dada por

Fθ (x) = θ(x − 1) + (1 − θ)(x), ∀ x ∈ R

Supongamos que 5 observaciones independientes de X son (0, 1, 1, 1, 0).


Entonces (0, 1, 1, 1, 0) es una realización de la muestra aleatoria
X1 , X2 , . . . , X5 : La media muestral es
5
X
xi
i=1 0+1+1+1+0
x= = = 0,6
5 5

Cirilo Alvarez Rojas (UNI-FIEECS) ASIGNATURA FST41: Estadística Muestrales y sus Distribuciones 9 / 48
La cual es el valor que asume la variable media muestral X . La varianza
muestral es
5
X
(xi − x)2
i=1 2(0,6)2 + 3(0,4)2
s2 = = = 0,3
5−1 4
que es el valor que asume la variable varianza muestral S 2 . La desviación

estándar muestral es también s = 0,3 = 0,547.

Ejemplo 2.
Sea X ∼ N (µ, σ 2 )donde µ es conocido, pero σ 2 es desconocido. Sean
X1 , X2 , . . . , Xn una muestra aleatoria de la N (µ, σ 2 ). De acuerdo con la
definición de un estadístico, ni=1 Xi /σ 2 no es un estadístico
P

Supongamos, que 5 observaciones sobre X son


−0,864, 0,561, 0,2,355, 0,582, −0,774
Cirilo Alvarez Rojas (UNI-FIEECS) ASIGNATURA FST41: Estadística Muestrales y sus Distribuciones 10 / 48
Entonces la media muestral es x = 0,372 y la varianza muestral es
s 2 = 1,648.

Ejercicio 3.
1. Sea X una v.a. de Ber(1, 1/2) y considere todas las muestras aleatorias
posibles de tamaño 3 en X . Calcule X y S 2 para cada una de las ocho
muestras, y también calcule las funciones de frecuencia de X y S 2 .

2. Se lanza un dado equilibrado. Supongamos que X es el valor nominal


que aparece y X1 , X2 son dos observaciones independientes sobre X. Halle
la función frecuencia de X .

Cirilo Alvarez Rojas (UNI-FIEECS) ASIGNATURA FST41: Estadística Muestrales y sus Distribuciones 11 / 48
Ejercicio 4.
3. Sean X1 , X2 , . . . , Xn una muestra aleatoria de alguna población.
Demuestre que
(n − 1)
máx Xi − X < √
1≤i≤n n
a menos que todas las n observaciones sean iguales o exactamente n − 1 de
las Xj0 s sean iguales.
4. Sean x1 , x2 , . . . , xn números reales, y sea x(n) = máx{x1 , x2 , . . . , xn },
x(1) = mı́n{x1 , x2 , . . . , xn }. Demuestre que para cualquier conjunto de
números reales a1 , a2 , . . . , an tal que i = ni=1 ai = 0 se cumple la
P

siguiente desigualdad:
n n
X 1 X
ai xi ≤ (x(n) − x(n) ) ≤ |ai |

2


i=1 i=1

Cirilo Alvarez Rojas (UNI-FIEECS) ASIGNATURA FST41: Estadística Muestrales y sus Distribuciones 12 / 48
Más Ejemplo sobre muestreo

Esta sección intentará motivar aún más el uso de tomar una muestra. La
idea principal es que tenemos una población que deseamos comprender.
Pero debido al tamaño, el costo u otras razones, no podemos ver a todos
en esta población. Algunas poblaciones son claramente demasiado grandes,
por lo que incluso si estamos interesados en la distribución de las alturas de
los europeos, por ejemplo, medir a todos los europeos sería una tarea
importante. Por el contrario, si estamos interesados en el alcoholismo, los
alcohólicos pueden no estar dispuestos a identificarse fácilmente y, por lo
tanto, identificar a esta población sería difícil. En cambio, tomamos una
muestra (porque es más barata, o más rápida, o lo único posible) y usamos
esta muestra para hacer suposiciones razonables sobre la población.

Revisaremos el ejemplo de la sección


Cirilo Alvarez Rojas (UNI-FIEECS)
ASIGNATURA anterior
FST41: para
Estadística ver cómo
Muestrales podría
y sus Distribuciones 13 / 48
Revisaremos el ejemplo de la sección anterior para ver cómo podría
funcionar esto.

Ejemplo 6.
Una alcancía contiene seis monedas: una de 5c, dos de 10c, una de 20c y
dos monedas de 50c (c=centavos). Enumere todas las muestras aleatorias
posibles de tamaño dos de la alcancía, las probabilidades de obtener cada
una de estas muestras aleatorias, y enumere todas las medias y variaciones
posibles de la muestra. Considere cómo estas medias y variaciones
muestrales se relacionan con la media y la varianza de la población.

Cirilo Alvarez Rojas (UNI-FIEECS) ASIGNATURA FST41: Estadística Muestrales y sus Distribuciones 14 / 48
Solución: Sea X la variable aleatoria que representa la población. Podemos
construir la distribución de probabilidad de X :

Tabla 1: Distribución de probabilidad de X .

X 5c 10c 20c 50c


1 2 1 2
P(X = x) 6 6 6 6

y podemos calcular los parámetros media y la varianza poblacional para


esta población. Tenemos, por ejemplo, que

1 2 145
X    
µ = E(X ) = xP(X = x) = 5 × + · · · + 50 × =
x
6 6 6

y
Cirilo Alvarez Rojas (UNI-FIEECS) ASIGNATURA FST41: Estadística Muestrales y sus Distribuciones 15 / 48
X
σ 2 = VarX = E(X 2 ) − (E(X ))2 = x 2 P(X = x)
x
1 2 145 2
     
= 52 × + · · · + 502 × − ≈ 353,47
6 6 6

Por lo general, estos serían parámetros de población que no sabríamos,


pero para este ejemplo de una población conocida podemos calcularlos.
Ahora podemos intentar ver cómo las medias y varianzas muestrales se
relacionan con los parámetros de la población.

Para enumerar todas las muestras aleatorias posibles (junto con sus medias
y variaciones muestrales) y las probabilidades de obtener cada muestra, es
útil producir una tabla como la siguiente:

Cirilo Alvarez Rojas (UNI-FIEECS) ASIGNATURA FST41: Estadística Muestrales y sus Distribuciones 16 / 48
Distribución de la muestra
Muestras valores № P[(X1 , X2 ) = (x1 , x2 )] Media Varian
muestrales de o muestral muestr
posibles (X1 , X2 ) formas P[(X1 = x1 , X2 = x2 )] X S2
(x1 , x1 ) (5c,5c) 1 1
36 5 0
(x1 , x2 ) (5c,10c) 4 4
36 7.5 12.5
(x1 , x4 ) (5c,20c) 2 2
36 12.5 112.5
(x1 , x5 ) (5c,50c) 4 4
36 27.5 1012.
(x2 , x2 ) (10c,10c 4 4
36 10 0
(x2 , x4 ) (10c,20c) 4 4
36 15 50
(x3 , x5 ) (10c,50c) 8 8
36 30 800
(x4 , x4 ) (20c,20c) 1 1
36 20 0
(x4 , x5 ) (20c,50c) 4 4
36 35 450
(x6 , x6 ) (50c,50c) 4 4
36 50 0

Cirilo Alvarez Rojas (UNI-FIEECS) ASIGNATURA FST41: Estadística Muestrales y sus Distribuciones 17 / 48
Se puede ver que la primera columna contiene todos los membretes de la
muestra aleatoria, la segunda columna contiene todos los valores de todas
las muestras aleatorias posibles de tamaño dos. Hay varias formas de
calcular la probabilidad de que ocurra una muestra en particular. Debido a
que nuestra definición de una muestra aleatoria coincide con el muestreo
aleatorio con reemplazo, existen 6 × 6 = 36 configuraciones posibles de
muestras de tamaño dos. Tenemos que elegir una de las 6 monedas para
nuestra primera selección aleatoria, y una de las 6 monedas nuevamente
para nuestra segunda selección de la muestra aleatoria. Solo hay una forma
posible de obtener una muestra de dos monedas de 5c: debemos
seleccionar la moneda de 5c en nuestra primera selección y luego
seleccionarla nuevamente en nuestra segunda selección.

Cirilo Alvarez Rojas (UNI-FIEECS) ASIGNATURA FST41: Estadística Muestrales y sus Distribuciones 18 / 48
Entonces, la probabilidad de que obtengamos la muestra (5c, 5c) es
36 . Un ejemplo más difícil lo da la siguiente fila. Una muestra de
1 1 1
6 × 6 =
(5c, 10c) podría ocurrir de varias maneras. Etiquetemos con los símbolos
x1 , x2 , . . . , x6 , dispongamos en los ejes cartesianos y formemos pares
ordenados y se observa que existen cuatro pares ordenados con el mismo
valor media muestral por lo que la probabilidad de obtener dicha muestra
es 4/36. Las dos columnas finales para la media muestral y la varianza
muestral se calculan usando fórmulas las siguientes fórmulas.

n
!2 
 X 
xi 

 
n n
 n

1 1 1

X 

i=1
X X
2 2
x= xi , s = (xi −x) = xi2 − .
n n−1 n−1 n 
i=1 i=1 

 i=1 



 

Cirilo Alvarez Rojas (UNI-FIEECS) ASIGNATURA FST41: Estadística Muestrales y sus Distribuciones 19 / 48
La tabla anterior enumera todas las medias de muestras posibles y todas
las varianzas de muestra posibles que podríamos obtener, con la finalidad
de realizar fácilmente los cálculos. Por ejemplo, obtener una varianza
muestral de 0 solo es posible si observamos una de las siguientes muestras:
(5c, 5c) o (10c, 10c) o (20c, 20c) o (50c, 50c). La probabilidad de obtener
cualquiera de estas muestras es 1/36, 4/36, 1/36 y 4/36, respectivamente,
por lo que la probabilidad de obtener una varianza muestral de 0 es
1/36 + 4/36 + 1/36 + 4/36 = 10/36. Podemos repetir tales cálculos y
hacer distribuciones de probabilidad para cada estadística de muestra. Una
distribución de probabilidad para una estadística de la muestra se conoce
como distribución de muestreo. La distribución muestral para la media
muestral X es

Cirilo Alvarez Rojas (UNI-FIEECS) ASIGNATURA FST41: Estadística Muestrales y sus Distribuciones 20 / 48
Tabla 2: Distribución muestral de X .

X 5 7.5 10 12.5 15 20 27.5 30 35 50


1 4 4 2 4 1 4 8 4 4
P(X = x) 36 36 36 36 36 36 36 36 36 36

Calcular las siguientes probabilidades

1. P(X < 10) 3. P(10 < X ≤ 27,5)


2. P(X > 20) 4. P(12,5 < X < 35)

Cirilo Alvarez Rojas (UNI-FIEECS) ASIGNATURA FST41: Estadística Muestrales y sus Distribuciones 21 / 48
La distribución muestral para la varianza muestral S 2 es

Tabla 3: Distribución muestral de S 2

S2 0 12.5 50 112.5 450 800 1012.5


10 4 4 2 4 8 4
P(S 2 = s 2 ) 36 36 36 36 36 36 36

Calcular las siguientes probabilidades

1. P(S 2 < 50) 3. P(S 2 = 0)


2. P(S 2 > 112,5) 4. P(12,5 < S 2 < 450)

Cirilo Alvarez Rojas (UNI-FIEECS) ASIGNATURA FST41: Estadística Muestrales y sus Distribuciones 22 / 48
Tenga en cuenta que usamos letras mayúsculas para las variables aleatorias
correspondientes a la media muestral y la varianza muestral: esto es para
reconocer explícitamente que se basan en una muestra aleatoria, y también
lo son las variables aleatorias en sí mismas.

Ahora que tenemos estas distribuciones de muestreo (que no son más que
distribuciones de probabilidad), hacemos los siguientes cálculos:

1 4 4 145
     
E(X ) = 5 × + 7,5 × + · · · + 50 × = = E(X ) = µ
36 36 36 6

1 4 145 2
     
σX2 = E(X ) − [X ] = 5 ×
2 2 2
+ · · · + 50 ×
2

36 36 6
Var (X ) σ 2
= 176,736 = = ,
2 2
Cirilo Alvarez Rojas (UNI-FIEECS) ASIGNATURA FST41: Estadística Muestrales y sus Distribuciones 23 / 48
de los anteriores se concluye que, la media de la media muestral es igual a
la media de la población; la varianza de la media muestral es igual a la
varianza de la población dividido por el tamaño de la muestra.

En forma similar calculamos la esperanza de la varianza muestral, S 2 como


sigue:
X
E(S 2 ) = s 2 P(S 2 = s 2 )
s2
10 4 4
     
= 0× + 12,5 × + · · · + 1012,5 ×
36 36 36
= 353,47 = σ 2 = Var (X ).

Luego se concluye que la esperanza de la varianza muestral es igual a la


varianza de la población.
Cirilo Alvarez Rojas (UNI-FIEECS) ASIGNATURA FST41: Estadística Muestrales y sus Distribuciones 24 / 48

También podría gustarte