UNIVERSIDAD NACIONAL MAYOR DE
SAN MARCOS
UNIVERSIDAD DEL PERÚ, DECANA DE AMÉRICA
FUNDADA EL 12 DE MAYO DE 1551 (651 AÑOS)
ASIGNATURA: PROBABILIDAD Y ESTADÍSTICA
SEMANA 11
I. DISTRIBUCIONES MUESTRALES: DISTRIBUCIÓN
MUESTRAL DE LA MEDIA.
II. DISTRIBUCIÓN MUESTRAL DE LA PROPORCIÓN
III. DISTRIBUCIÓN MUESTRAL DE LA VARIANZA.
IV. ESTIMACIÓN PUNTUAL. PROPIEDADES DE UN
ESTIMADOR PUNTUAL.
Por: Lic. Fernando Camones Gonzales
E.A.P. ESTADÍSTICA
I. DISTRIBUCIONES MUESTRALES
La presente guía trata principalmente cómo reunir la estadística descriptiva
y la probabilidad para estudiar la INFERENCIA ESTADÍSTICA, Esto es
sacar, buscar procedimientos inferenciales para sacar conclusiones
valederas sobre una característica de una población, en base a la
información que está contenida en una muestra, tema de estudio que nos
ocuparemos hasta finalizar el curso.
1. DISTRIBUCION MUESTRAL
Se denomina distribución muestral de una estadística a su
distribución de probabilidad de una estadística obtenida a partir
de todas las posibles muestras de tamaño n, elegidas al azar de
una población determinada.
El objetivo es construir distribuciones de probabilidad de las
estadísticas más importantes y luego aplicar para hallar áreas o
probabilidad cuando son conocidos sus parámetros.
Cuando son desconocidos los parámetros de la estadística,
aplicaremos las distribuciones muestrales para realizar estimación de
los parámetros o para realizar comprobaciones acerca de los valores
que se supone tienen los parámetros (pruebas de hipótesis).
En general, cuando estudiamos una distribución muestral, estamos
interesados en conocer las siguientes características:
I. Su forma funcional (representación gráfica de su función
densidad)
II. Su media
III. Su desviación estándar.
Las muestras aleatorias obtenidas de una población son, por
naturaleza propia, impredecibles. No se esperaría que dos muestras
aleatorias del mismo tamaño y tomadas de la misma población tenga
la misma media muestral o que sean completamente parecidas;
puede esperarse que cualquier estadístico, como la media muestral,
calculado a partir de las medias en una muestra aleatoria, cambie su
valor de una muestra a otra, por ello, se quiere estudiar la
distribución de todos los valores posibles de un estadístico. Tales
distribuciones serán muy importantes en el estudio de la estadística
inferencial, porque las inferencias sobre las poblaciones se harán
usando estadísticas muestrales. Como el análisis de las
distribuciones asociadas con los estadísticos muestrales, podremos
juzgar la confiabilidad de un estadístico muestral como un
instrumento para hacer inferencias sobre un parámetro poblacional
desconocido.
Como los valores de un estadístico, tal como x, varían de una
muestra aleatoria a otra, se le puede considerar como una variable
aleatoria con su correspondiente distribución de frecuencias.
La distribución de frecuencia de un estadístico
muestral se denomina distribución muestral. En
general, la distribución muestral de un estadístico es
la de todos sus valores posibles calculados a partir de
muestras del mismo tamaño.
La distribución de frecuencia de un estadístico muestral se
denomina distribución muestral. En general, la distribución muestral
de un estadístico es la de todos sus valores posibles calculados a
partir de muestras del mismo tamaño.
Suponga que se han seleccionado muestras aleatorias de tamaño 20
en una población grande. Se calcula la madia muestral x para cada
muestra; la colección de todas estas medias muestrales recibe el
nombre de distribución muestral de medias, lo que se puede ilustrar
en la siguiente figura:
Suponga que se eligen muestras aleatorias de tamaño 20, de una
población grande, y se calcula la deviación estándar de cada una. La
colección de todas estas desviaciones estándar muestrales se
llama distribución muestral de la desviación estándar, y lo podemos
ver en la siguiente figura:
II. DISTRIBUCIÓN MUESTRAL DE LA MEDIA X́
Vamos a dar inicio con un ejemplo:
Ejemplo 1.6
Se eligen muestras ordenadas de tamaño 2, con reemplazo ( N n ) y
N
otra sin reemplazamiento ( ), de la población de valores 0, 2, 4 y
n
6. Encuentre:
μ , la media poblacional.
σ, la desviación estándar poblacional.
μx́ , la media de la distribución muestral de medias.
σ x́ , la desviación estándar de la distribución muestral de medias.
Además, grafique las frecuencias para la población y para la
distribución muestral de medias.
Solución:
1ro calcular la media y la varianza poblacional:
a. La media poblacional es:
μ=
∑ Xi =
N
b. La desviación estándar de la población es:
σ2=
∑ (x i−μ)2 =
N
c. Cuando hacemos muestreo con reemplazamiento de una
población de tamaño N, el número de todas las muestras
posibles es: ( N n )= ( 4 2=16 ): A continuación se listan los
elementos de la distribución muestral de la media y la
correspondiente distribución de frecuencias.
Distribución muestral de la media
Valores de x́ 0 1 2 3 4 5 6
PI =P( X́ = X́ I ) 1/1 2/1 3/16 4/16 3/16 2/16 1/16
6 6
Gráfico de la Distribución muestral de la media
d. La media de la distribución muestral de medias es
μx́ =E ( x́ ) =∑ p i x́ i =
e. La desviación estándar de la distribución muestral de medias
es:
2 2
σ x́ =∑ pi ( x́ i−μ) =¿
También, la varianza de las medias muestrales es igual a la varianza
dividido entre el tamaño de la muestra:
σ2
σ 2x́ =Var ( x́ ) = =
n
f. Cuando hacemos muestreo sin reemplazamiento de una
población de tamaño N, el número de todas las muestras
N 4
posibles es: ( )= ( )=6, A continuación se listan los
n 2
elementos de la distribución muestral de la media y la
correspondiente distribución de frecuencias.
Distribución muestral de la media
Valores de x́ 1 2 3 4 5
PI =P( X́ = X́ I ) 1/6 1/6 2/6 1/6 1/6
Gráfico de la Distribución muestral de la media
g. La media de la distribución muestral de medias es
μx́ =E ( x́ ) =∑ p i x́ i =
h. La desviación estándar de la distribución muestral de medias
es:
σ x́ =∑ pi ( x́ i−μ) =¿
2 2
También la varianza de las medias muestrales es:
σ 2 N−n
Var ( x́ ) = ( ) =
n N−1
Se denomina factor de corrección:
Después de haber realizado el ejercicio anterior se puede ver que una
distribución muestral se genera extrayendo todas las posibles muestras
del mismo tamaño de la población y calculándoles a éstas su estadístico.
Si la población de la que se extraen las muestras es normal, la
distribución muestral de medias será normal sin importar el tamaño de la
muestra.
Si recordamos a la distribución normal, esta es una distribución continua,
en forma de campana en donde la media, la mediana y la moda tienen un
mismo valor y es simétrica.
Con esta distribución podíamos calcular la probabilidad de algún evento
relacionado con la variable aleatoria, mediante la siguiente fórmula:
X−μ
Z= N (0,1)
σ
En donde Z es una variable estandarizada con media igual a cero y
varianza igual a uno. Con esta fórmula se pueden a hacer los cálculos de
probabilidad para cualquier ejercicio, utilizando la tabla de la distribución
Z.
Sabemos que cuando se extraen muestras de tamaño mayor a 30 o bien
de cualquier tamaño de una población normal, la distribución muestral de
medias tiene un comportamiento aproximadamente normal, por lo que se
puede utilizar la fórmula de la distribución normal:
Sea X́ la variable que denota las medias de muestras aleatorias de
tamaño n, elegidas de una población N con media μ y varianza conocida
2
σ . Entonces, para n suficientemente grande la v.a.
X́−μ
Z= tiene distribución aprox . N (0,1)
σ
√n
y para poblaciones finitas y muestreo sin reemplazo:
X́ −μ
Z=
√
σ N −n
√ n N −1
Ejercicios 01:
Una Centro tecnológico eléctrico fabrica focos que tienen una duración
que se distribuye aproximadamente en forma normal, con media de 800
horas y desviación estándar de 40 horas. Encuentre la probabilidad de
que una muestra aleatoria de 16 focos tenga una vida promedio de
menos de 775 horas.
sol
Ejercicios 02:
La talla de 1050 alumnos están distribuidas aproximadamente en forma
normal con una media de 174.5 centímetros y una desviación estándar
de 6.9 centímetros. Si se extraen 200 muestras aleatorias de tamaño 25
sin reemplazo de esta población, determine:
a. El número de las medias muestrales que caen entre 172.5 y 175.8
centímetros.
b. El número de medias muestrales que caen por debajo de 172
centímetros.
III. DISTRIBUCIÓN MUESTRAL DE LA PROPORCIÓN
Existen ocasiones en las cuales no estamos interesados en la media de
la muestra, sino que queremos investigar la proporción de artículos
defectuosos o la proporción de alumnos reprobados en la muestra. La
distribución muestral de proporciones es la adecuada para dar respuesta
a estas situaciones. Esta distribución se genera de igual manera que la
distribución muestral de medias, a excepción de que al extraer las
S
muestras de la población se calcula el estadístico proporción ( ^P = n
n
S
en donde “ n ” es el número de éxitos u observaciones de interés y "n"
el tamaño de la muestra) en lugar del estadístico media.
Sea P la proporción de cierta característica de la población. X es
una variable aleatoria, de modo que.
{
X = 1, Siel elemento es portador de la característica
0, Siel elemento no es portador de lacaracterística
Luego la media y la varianza será:
μ=E [ X ] =P y σ 2 =Var [ X ] =P ( 1−P )=PQ
Sea Sn la estadística que denota el número de
características de interés de X en la muestra. Entonces,
la proporción de elementos portadores de la
característica de interés en la muestra es:
Sn
^p=
n
La Distribución Muestral de la estadística ^p se
denomina DISTRIBUCIÓN MUESTRAL DE LA
PROPORCIÓN MUESTRAL con media “P” y
PQ
varianza” n ”
Sea P la proporción de cierta característica de la población y sea
Sn
^p= , proporción muestral de una m.a de tamaño n extraída de
n
la población N:
Si el muestreo se realiza con reemplazamiento o si la
población es infinita, entonces n suficientemente grande la
proporción muestral ^p se distribuye:
PQ ^p−P
(
^p ≅ N P ,
n )
ó Z= ≅ N (0,1)
√PQ
n
Si el muestreo se realiza sin reemplazamiento de una
población finita N, entonces para n suficientemente grande
la proporción muestral ^p se distribuye:
PQ N −n ^p −P
(
^p ≅ N P ,
n N−1 )ó Z= ≅ N (0,1)
√
PQ N−n
n N −1
Aproximación de la Binomial a la Normal:
X−nP
B(n,P) → N ( nP , nPQ) ó Z = √nPQ N ( 0,1 ) ; X =n ^p
EJERCICIO 01
En distribuidor de tornillos determina que a través de pruebas que el 4%
de los tornillos fabricados por una determinada compañía son
defectuosos. El distribuidor vende paquetes de 150 tornillos con garantía
de que el paquete contiene 92% de tornillos no defectuosos. ¿Cuál es la
probabilidad de que un paquete no satisfaga la garantía?
a. Resolverlo mediante la aproximación de la normal a la binomial
b. Resolverlo con la distribución muestral de proporciones
Sol.
EJERCICIO 02
Se sabe que cierto virus informático ha invadido los laboratorios de la
FISI de la UNMSM y ataca al 40% de los USB usados por los
estudiantes. Si se desea que la diferencia entre la proporción muestral y
la proporción real de los USB atacados por los virus, sea a lo más 2%, en
el 955 de las muestras posibles, ¿Cuántos USB deben seleccionarse
para la inspección?
Sol.
EJERCICIO 03
Se ha determinado que 60% de los estudiantes de una universidad
grande fuman cigarrillos. Se toma una muestra aleatoria de 800
estudiantes. Calcule la probabilidad de que la proporción de la muestra
de la gente que fuma cigarrillos sea menor que 0.55.
a. Resolverlo mediante la aproximación de la normal a la binomial
b. Resolverlo con la distribución muestral de proporciones
Sol.
EJERCICIO 04
Un medicamento para malestar estomacal tiene la advertencia de que
algunos usuarios pueden presentar una reacción adversa a él, más aún,
se piensa que alrededor del 3% de los usuarios tienen tal reacción. Si
una muestra aleatoria de 150 personas con malestar estomacal usa el
medicamento, encuentre la probabilidad de que la proporción de la
muestra de los usuarios que realmente presentan una reacción adversa,
exceda el 4%.
a. Resolverlo mediante la aproximación de la normal a la binomial
b. Resolverlo con la distribución muestral de proporciones
Solución
EJERCICIO 05
Se sabe que la verdadera proporción de los componentes defectuosos
fabricados por una firma es de 4%, y encuentre la probabilidad de que
una muestra aleatoria de tamaño 60 tenga:
a. Menos del 3% de los componentes defectuosos.
b. Más del 1% pero menos del 5% de partes defectuosas.
Solución:
IV. DISTRIBUCIÓN MUESTRAL DE LA VARIANZA
Sea X1,X2,…,Xn una muestra extraída de una población N( μ , σ 2 ),
entonces se tiene:
σ2
a) X́ N ( μ , )
n
b) 2
Las estadísticas x́ y S sonindependientes
c) DISTRIBUCIÓN DE LA VARIANZA MUESTRAL
La Variable aleatoria:
n
2 ∑ ( X i − X́ )2
(n−1) S i =1 2
= ℵ(n−1)
σ2 2
σ
EJERCICIO 01
Encuentre la probabilidad de que una m.a. de 25 observaciones, tomada
de una población normal con varianza σ 2 =9 , tenga una varianza
muestral S 2 entre 4,071 y 15,10125.
Sol. (Use la Tabla de la chi cuadrado)
EJERCICIO 02
Encuentre la probabilidad de que una m.a. de 25 observaciones, tomada
de una población normal con varianza σ 2 =9 , tenga una varianza
muestral S 2 entre 4,071 y 15,10125.
Sol. (Use la Tabla de la chi cuadrado)
EJERCICIO 03
Si la altura de un grupo de población sigue una distribución normal
N(176,12), calcular la P(S≤10) para una muestra de tamaño 8.
Sol. (Use la Tabla de la chi cuadrado)
EJERCICIO 04
El Dpto de control de calidad de una Empresa Manufacturera compra
componentes eléctricos a un vendedor extranjero. La empresa específica
que la varianza de las resistencias de los componentes no debe exceder
de 0.40 ohmios al cuadrado. Para evitar la aceptación de remesas que
no cumplan con esta especificación, el dpto. de control de calidad toma
una muestra de 25 componentes de cada remesa y mide la resistencia
de cada uno. Si la varianza de la muestra es demasiado grande, el dpto.
rechaza el pedido. Se considera que una varianza muestral es
demasiado grande si la probabilidad de obtener de este tipo es igual o
menor que 0.02. Se acaba de seleccionar una muestra de una remesa y
se obtiene S 2=0.75 . ¿Debe aceptarse la remesa?
Suponga que las resistencias están normalmente distribuidas.
Sol. (Use la Tabla de la chi cuadrado)
V. ESTIMACIÓN PUNTUAL DE PARÁMETROS
5.1 ESTIMACIÓN PUNTUAL
DEFINICIÓN.
La estimación estadística consiste en utilizar datos muestrales para
determinar los valores de los parámetros desconocidos de una
población.
La estimación de un parámetro puede adoptar la forma de un solo
punto, es decir, la estimación de un valor único de un parámetro de la
población.
Definición:
Sea X una v.a. con función densidad de probabilidad f ( x , θ) , donde
θ denota el parámetro desconocido de la población.
Un estimador puntual del parámetro θ es pués, una variable
aleatoria θ^
Mientras que una estimación puntual es el valor númerico θ^ del
estimador.
Un buen estimador, es aquel que está mas cerca del parámetro que se
estima.
Para que un estimador puntual sea un buen estimador debe cumplir
con ciertas propiedades:
INSESGABIILDAD, CONSISTENCIA, EFICIENCIA, SUFICIENCIA,
INVARIANZA Y ROBUSTEZ.
5.2 PROPIEDADES DE LOS ESTIMADORES PUNTUALES
No se tiene certeza que los estimadores tengan el valor del parámetro, pero
tiene que tener propiedades que nos muestren su bondad.
a) ESTIMADOR INSESGADO
Un estadístico θ^ es un estimador insesgado del parámetro
θ , cuando:
E [ θ^ ]=θ …..(1)
Ejemplo :
E[ x́ ]=μ
E[S 2 ]=σ 2
E [ ^p ] =P
b) ESTIMADOR CONSISTENTE
Cuando n suficientemente grande, podemos estar
prácticamente seguros de que el error entre el estimador y el
parámetro será menor que cualquier constante positiva
(propiedad límite de un estimador)
Formalmente: la estadística θ^ es un estimador consistente
del parámetro θ si y solo si para cada c>0, se cumple que:
……..(2)
c) ESTIMADOR EFICIENTE
Si tenemos que escoger uno entre varios estimadores
insesgados de un parámetro dado, se suele tomar aquel cuya
distribución muestral tenga la varianza más pequeña, por tanto
el estimador seleccionado de varianza más pequeña es eficiente
Ejemplo:
θ^1 y θ^2 son estimadores insegados de θ , tal que:
Var ( θ^1 )<Var ( θ^2) … .(3)
θ^1 es un estimador eficiente por tener menor
varianza.
d) ESTIMADOR SUFICIENTE
Cuando un estimador utiliza toda la información de la m.a. para
la estimación de un parámetro, se dice que tiene la propiedad de
suficiente o suficiencia.
Ejemplo:
La x́ es un estimador suficiente de μ , porque utiliza todos
los datos de la m.a. para estimarla.
e) ESTIMADOR INVARIANTE
Se dice que θ^ se dice que es un estimador invariante de θ ,
si el estimador de la función del parámetro, f( θ ), es igual a la
función del estimador del parámetro, es decir:
|^
f (θ)|=f ( θ ) … .(4 )
Ejemplo. La varianza muestral si es invariante respecto a los
cambios de origen, pues:
1 1
S 2x = ∑ ( x❑ −x́)2= (x +a−x́−a)2=S 2x+ a
n−1 n−1 ∑ i
f) ESTIMADOR ROBUSTO
Un estimador es robusto si su distribución muestral no se ve
seriamente afectada por violaciones de suposiciones,
frecuentemente tales violaciones se deben a puntos o datos
extremos de origen diversos. También pueden relacionarse con
la naturaleza de las poblaciones muestreadas o con sus
parámetros.
Ejemplo:
La Me es un estimador robusto, porque su valor no se afecta por
los valores extremos.
VI. BIBLIOGRAFIA
Montgomery & Runger, Probabilidad y Estadística aplicadas a la Ingeniería.
Limusa Wiley. 2ª Edición. 2012.
Muruzábal Irigoyen José Javier, Cálculo de probabilidades y Teoría de
variable aleatoria. Elementos de Estadística Aplicada. Garceta, grupo
editorial. 4ª. Edición. 2014.
Chue, Barreno, Millones, Vásquez, Castillo, Estadística aplicada. Fondo
Editorial de la Universidad de Lima. 2009.
Jay L. Devore, Probabilidad y Estadística para Ingeniería y Ciencias.
CENGAGE Learning. Séptima Edición, 2008.
Ipiña & Durand, Inferencia estadística y análisis de datos. Pearson,
Prentice-Hall. 2008.
Lind, Marchal, Wathen, Estadística aplicada a los negocios y la economía.
Mc Graw Hill. 2008.
Chue, Barreno, Millones, Vásquez, Castillo, Estadística descriptiva y
probabilidades. Fondo Editorial de la Universidad de Lima. 2007.
Quevedo Urías & Pérez Salvador, Estadística para Ingeniería y Ciencias.
Grupo Editorial Patria. 2008.
DE CONSULTA
Freund & Miller & Miller, Estadística Matemática con Aplicaciones. Pearson
Educación. 6ª Edición. 1996.
Walpole & Myers, Probabilidad y Estadística. McGraw-Hill. 4ª Edición. 1996.
Freund & Walpole, Estadística Matemática con Aplicaciones. Prentice-Hall,
4ª Edición, 1990.
Hines & Montgomery, Probabilidad y Estadística para Ingeniería y
Administración. CECSA, 1986.
Mendenhall, Scheaffer, Wackerly, Estadística Matemática con Aplicaciones.
Grupo Editorial Iberoamérica. 1986.
Mendenhall & Sincich, Probabilidad y Estadística para Ingeniería y
Ciencias. Prentice-Hall 4ª Edición. 1997.
Scheaffer & McClave, Probabilidad y Estadística para Ingeniería. Grupo
Editorial Iberoamérica. 1993.
Véliz Capuñay Carlos, Estadística. Aplicaciones. Editorial San Marcos.
2000.
Walpole & Myers, Probabilidad y Estadística. McGraw-Hill. Cuarta edición.
1996.
ENLACES Y SITIOS WEB
http://ar.answers.yahoo.com/question/index?qid=20080803091252AAyiMLy
http://webpages.ull.es/users/jjsalaza/curriculum/books/GOBCAN02.pdf
http://www.fisterra.com/mbe/investiga/distr_normal/distr_normal2.pdf
http://www.hezkuntza.ejgv.euskadi.net/r43-
573/es/contenidos/informacion/dia6_sigma/es_sigma/adjuntos/sigma_27/4_
distribucion_normal.pdf
http://es.slideshare.net/StephanoRomo9/probabilidad-
yestadisticaproblemasresueltosmurrayrspiegel