ESTADISTICA APLICADA
INTERVALOS DE CONFIANZA
CONTENIDO:
o
o
o
o
o
o
Estimacin
Definiciones bsicas
Principales estimadores
Estimacin de promedios puntual e intervlica
Estimacin de proporciones puntual e intervlica
Estimacin puntual e intervlica de diferencia
promedios.
o Estimacin de diferencia de proporciones..
de
ESTIMACIN INTERVALICA:
El nico mtodo cientfico para validar conclusiones sobre un
grupo de individuos a partir de la informacin que nos
proporciona un subconjunto ms o menos amplio de los
mismos es el Mtodo Estadstico.
En el experimento tpico, el objetivo bsico es estimar algunas
caractersticas que describan la poblacin de inters. Es
decir:
Estimar los parmetros que caracterizan a la funcin de
probabilidad de la variable aleatoria en estudio
ESTIMACIN PUNTUAL:
Una estimacin puntual del valor de un parmetro poblacional
desconocido (como puede ser la media: , o la desviacin
estndar: ), es un nmero que se utiliza para aproximar el
verdadero valor de dicho parmetro poblacional.
Una estimacin puntual es el valor de la estadstica de la
muestra correspondiente.
INTERVALO DE CONFIANZA:
Es un rango de valores con una probabilidad asociada o un
nivel de confianza 1-. La probabilidad cuantifica la
posibilidad de que el intervalo contenga el valor verdadero del
parmetro de la poblacin.
Los lmites del intervalo de confianza son: lmite inferior (LI) y
lmite superior (LS).
FACTORES QUE AFECTAN A LOS INTERVALOS DE
CONFIANZA.
Los factores que determinan el ancho del intervalo de
confianza son:
1.El tamao de la muestra, n.
2.La varianza de la poblacin, usualmente es estimada por s.
3.El nivel deseado de confianza.
INTERPRETACIN DEL INTERVALO DE CONFIANZA:
Tener un 95% de confianza en que el parmetro poblacional
real y desconocida se encuentra entre los valores LI y LS.
NIVEL DE SIGNIFICANCIA = ERROR TIPO 1 =
Es la mxima probabilidad de cometer un error tipo 1.
NIVEL DE CONFIANZA: 1-
1. INTERVALO DE CONFIANZA PARA LA MEDIA
POBLACIONAL, CONOCIDO
Supongamos que disponemos de una poblacin en la que tenemos una
v.a. con distribucin N(,) con conocida (de estudios previos, por
ejemplo).
Obtenemos una muestra de tamao n y deseamos estimar la media de
la poblacin. El estimador puntual de la misma es la media muestral cuya
distribucin muestral es conocida
x z1 2
; x z1 2
n
n
El intervalo de confianza es:
Donde:
x
n
Es el estimador del error estndar de la media
2. INTERVALOS DE CONFIANZA PARA LA MEDIA
CON DESCONOCIDA
Si no se conoce la varianza 2 de la poblacin, una posibilidad es
utilizar la varianza muestral S2 en las ecuaciones obtenidas para
estimar intervalos en el caso de varianza conocida.
El intervalo de confianza del 100(1-)% para la media es:
x t n 1;1 2
s
n
; x t n 1;1 2
s
n
Tiene una distribucin t-student con n-1 grados de libertad
3. INTERVALO DE CONFIANZA PARA UNA
PROPORCIN POBLACIONAL
Si se desea estimar la proporcin poblacional con una
confianza del 100(1-)% para muestras de tamao n > 30,
es decir si n es grande, se puede usar la distribucin Z,
concluyndose que:
p z1
pq
; p z1
n
pq
n
4. I.C. PARA LA DIFERENCIA DE MEDIAS (12 y 22
conocidas)
Se desea estimar la diferencia de dos medias poblacionales con
una confianza del 100(1-)% para muestras de tamao n 1 y n2
(muestras grandes).
Las poblaciones donde provienen las variables pueden presentar
o no una distribucin normal, pero sus varianzas poblacionales
son conocidas. En este caso se emplea la distribucin Z,
concluyndose que:
1 2
( x1 x 2 ) z1 2
12 22
12 22
; ( x1 x 2 ) z1 2
n1
n2
n1
n2
5. I.C. PARA LA DIFERENCIA DE MEDIAS (12 = 22
desconocidas)
1. Muestras Independientes y varianzas poblacionales homogneas:
con una confianza del 100(1-)% . Usando la distribucin t student
con n1 + n2 2 grados de libertad, se concluye que:
1 2
1 1
1 1
( x1 x2 ) t(1 2 ),n1 n2 2 S p2
; ( x1 x2 ) t(1 2 ),n1 n2 2 S p2
n
n
n
2
1
1 n2
2
p
n1 1 S12 n2 1 S 22
n1 n2 2
6. I.C. PARA LA DIFERENCIA DE MEDIAS (12 22
desconocidas)
2.
Muestras Independientes y varianzas poblacionales
heterogneas: con una confianza del 100(1-)% . Usando la
distribucin t student con v grados de libertad, se concluye
que:
1 2
( x1 x2 ) t(1 2 ),v
S12 S 22
n
1 n2
2
2
S12 S 22
n1 n2
n1 1
n2 1
S12 S 22
; ( x1 x2 ) t(1 2 ),v
n1 n2
S12 S 22
n1 n2
7. I.C. PARA LA DIFERENCIA DE PROPORCIONES
Si se desea estimar la diferencia de proporciones poblacionales 1 - 2
con una confianza del 100(1-)% para muestras de tamao n 1 > 30 y
n2 > 30, es decir si las muestras son grandes, se puede usar la
distribucin Z, concluyndose que:
1 2 p1 p 2 z1 2
p1 1 p1 p 2 1 p 2
; p1 p 2 z1 2
n1
n2
p1 1 p1 p 2 1 p 2
n1
n2
NOTA: Si el intervalo contiene al valor cero, se concluye que las
proporciones poblacionales podran ser iguales.
EJEMPLO 1:
Un comerciante mayorista compra latas de conserva de atn de la
marca A. segn la indicacin de la etiqueta el peso aproximado
promedio por lata es onzas. Se supone que la poblacin de los
pesos es Normal con = 2 onzas. Si de un envi reciente el
comerciante escoge al azar 20 latas y encuentra que el peso promedio
es de 18.5 onzas:
A.Determine el intervalo de confianza al 90% para el peso promedio de
todas las latas de conserva ().
B.Si el comerciante no conoce la desviacin estndar poblacional y
encuentra que s = 2.0 onzas, construya un intervalo de confianza de
al 90%
C. Cuanto debi ser el tamao de muestra si al estimar a se quiere
un error no superior a 0.98 con confianza del 95%? Use = 2 onzas.
SOLUCIN:
A. Como la varianza poblacional es conocida, al aplicar la siguiente
formula se tiene:
; x z1 2
n
n
2
2
18.5 1.645
;18.5 1.645
20
20
17.76;19.24
x z1 2
Se puede decir que con un 90% de confianza el peso promedio
() de las latas se encuentra entre 17.76 y 19.24 onzas.
SOLUCIN:
B. Como la varianza poblacional es desconocida, se usa la
distribucin t para construir el intervalo que esta dado por:
x t1 2,n1
s
s
; x t1 2,n1
n
n
2
2
18.5 1.72913
;18.5 1.72913
20
20
17.7267;19.2733
SOLUCIN:
C. El tamao de muestra que se debe de estimar es:
Z 1 / 2
n
Z 0.975
n
0.98
1.96( 2)
0.98
n 16
El tamao de muestra debe ser de 16 latas.
EJEMPLO 2:
De 1000 mujeres seleccionadas al azar, 823 realizaban alguna tarea
remunerada fuera del hogar. Construya un intervalo de confianza del
95% para la tasa de ocupacin femenina.
Solucin:
La tasa de ocupacin es la proporcin de las que trabajan y
perciben una remuneracin con respecto al total de mujeres en la
muestra. Tenemos que p = 0.823, q = 1-0.823 = 0.177. Por otro
lado z0.025=1.96, entonces:
p z1
pq
; p z1
n
0.823 1.96
pq
n
0.823 * 0.177
0.823 * 0.177
;0.823 1.96
1000
1000
0.799;0.847
Interpretacin:
La verdadera proporcin de las mujeres que trabajan y que son
remuneradas se encuentra entre: 0.799 y 0.847 con un nivel de
confianza del 95%.
EJEMPLO 3:
Una cadena de TV quiere saber si la audiencia de uno de sus
programas sigue mantenindose en el 23% de los espectadores.
a. Indicar el estimador puntual para la proporcin de la audiencia
televisiva por los espectadores.
b. Cuntos espectadores se deberan encuestar al azar, como
mnimo, para tener un nivel de confianza del 95% de que el error
en la estimacin de la proporcin actual sea igual o inferior a
0.04?
c. Calcular un intervalo de confianza para la verdadera proporcin
de la audiencia televisiva por los espectadores con un 95% de
confianza, considerando la muestra calculada en la parte a.
Solucin:
X: La audiencia de los espectadores por uno de los programas de
una cadena de TV.
El estimador puntual es: p = 0.23
EJEMPLO 3: continuacin
Solucin:
b. X: La audiencia de los espectadores por uno de los programas de
una cadena de TV.
X es una variable cualitativa.
N: no se conoce
Los datos son:
Al 95% de confianza: z0.925=1.96
P = 0.23
Q = 1-0.23 = 0.77
E = 0.04
Por lo tanto, el tamao de muestra queda:
n
z12 / 2 * P * Q
E2
1.96 2 * 0.23 * 0.77
426
2
0.04
Respuesta:
Los espectadores que se deberan encuestar al azar, como mnimo son
426.
EJEMPLO 3: continuacin
Solucin:
c. X: La audiencia de los espectadores por uno de los programas de
una cadena de TV.
X es una variable cualitativa.
Los datos son:
Al 95% de confianza: z0.025=1.96
p = 0.23, q = 1-0.23 = 0.77
n = 426
Por lo tanto, el intervalo de confianza es:
p z1
pq
; p z1
n
pq
n
0.23 * 0.77
0.23 * 0.77
;0.23 1.96
426
426
0.190037,0.269963
0.23 1.96
Respuesta:
La verdadera proporcin de la audiencia de los espectadores por uno de los
programas de una cadena de TV se encuentra entre 0.19 y 0.27 con un nivel de
confianza del 95%.
EJEMPLO 4:
En una discusin sobre reajuste salarial entre empresarios y el sindicato de los empleados que
tienen una distribucin normal, se llego a un impase. Los empresarios afirman que el salario de la
categora es de 7.6 salarios mnimos (SM), y los empleados dicen que es de 6.5 SM. Para
eliminar dudas, cada uno de los grupos resolvi seleccionar muestras independientes. Los
empresarios con una muestra de 90 empleados, observaron un salario medio de 7.0 SM, con una
desviacin estndar de 2.9 SM. El sindicato, con 60 empleados obtuvo una media de 7.1 SM y
una desviacin estndar de 2.4 SM. En base a un intervalo de confianza del 95% para las
diferencias de los salarios medios sostenido por los empresarios con el salario medio sostenido
por el sindicato, responda a la siguiente pregunta Las muestras obtenidas justifican las
respectivas afirmaciones de los dos grupos?
Solucin:
Se tienen los siguientes datos:
Empresario
Sindicato
n1 = 90
n2 = 60
1 = 2.9 SM
o
o
2 = 2.4 SM
Nivel de confianza al 95%: Z 1- /2 = 1.96
Como las muestras son grandes, se tiene: el intervalo de confianza queda definido por:
1 2
( x1 x 2 ) z1
12 22
12 22
; ( x1 x 2 ) z1 2
n1
n2
n1
n2
CONTINUACIN:
Al reemplazar los valores se obtiene:
2.92 2.42
2.92 2.42
1 2 (7 7.1) 1.96
; (7 7.1) 1.96
90
60
90
60
Luego, el intervalo de confianza es:
1 2
0.953094,0.753094
Interpretacin:
Como el intervalo incluye a cero, se concluye que los datos muestrales indican que el
salario promedio sostenido por ambos grupos es igual, con un nivel de confianza del
95%.
EJEMPLO 5:
Un inversionista desea comparar los riesgos asociados con dos diferentes mercados, A y B. El
riesgo de un mercado dado se mide por la variacin en los cambios diarios de precios. El
inversionista piensa que el riesgo promedio asociado con el mercado B es mayor que el del
mercado A. se obtienen muestras aleatorias de 15 cambios de precios diarios para cada
mercado. Se obtienen los siguientes resultados:
Mercado A
Mercado B
nA = 15
SA = 0.25
nB = 15
SB = 0.45
Estos datos apoyan la creencia del inversionista? Suponga que las varianzas poblacionales se
desconocen y son iguales, con un nivel de confianza del 98%
Solucin:
o Nivel de confianza al 98%, t(1 2 ), n A n B 2 t(1 0.02 / 2 ),1515 2 t0.99, 28 2.4671
o Como las muestras son pequeas y con varianzas poblacionales desconocidas e iguales, se
tiene: el intervalo de confianza queda definido por:
A B
S
2
p
1
1
1
1
( xA xB ) t(1 2), n A n B 2 S p2
; ( xA xB ) t(1 2 ), n A n B 2 S p2
nA nB
nA nB
nA 1 S A2 nB 1 S B2
nA nB
CONTINUACIN:
Al reemplazar los valores se obtiene:
A B
S
2
p
1 1
1 1
(0.3 0.4) (2.4671) * 0.141964
; (0.3 0.4) (2.4671) * 0.141964
15
15
15
15
15 1 0.252 15 1 0.452
15 15
0.141964
Luego, el intervalo de confianza es:
A B
0.23941;0.43941
Interpretacin:
Como el intervalo incluye al cero, entonces los precios promedios para cada mercado son
iguales. En consecuencia, con un nivel de confianza del 98% no es posible afirmar que
los datos apoyan la creencia del inversionista, es decir; que el riesgo promedio asociado
con el mercado B no es mayor que el del mercado A.
EJEMPLO 6:
Un analista est investigando la evolucin de la liquidez en el sistema bancario y no bancario,
contando con la siguiente informacin mensual, (datos en millones de nuevos soles) del ao 2011.
12
X
i 1
12
X
i 1
2
i
12
1540.1
i 1
12
204754.47
i 1
511.7
22319.43
Donde X es la liquidez bancaria e Y la liquidez no bancaria.
El analista piensa que la liquidez bancaria promedio del ao 2011es mayor que la liquidez no
bancaria. Los datos apoyan la postura del analista? Con un nivel de confianza del 95% y supngase
que las varianzas poblacionales son desconocidas y diferentes.
Solucin:
Como las muestras son pequeas y con varianzas poblacionales desconocidas y diferentes, se tiene:
El intervalo de confianza queda definido por:
1 2
S
S
n1 n2
2
2
S12 S 22
n1 n2
n1 1
n2 1
2
1
2
2
( x1 x2 ) t(1
2), v
S12 S 22
;( x x ) t
1
2
(1
n1
n2
2), v
S12 S 22
n1
n2
CONTINUACIN:
Haciendo los clculos se tiene:
12
X1
X
i 1
12
Yi
12
X2
i 1
12
1540.1
128.34167
12
S12
1
204754,47 12(128.34167) 2 644.99899
11
511.7
4264167
12
S 22
1
22319.43 12(42,64167) 2 45.42598
11
Al reemplazar los valores se obtiene:
1 2
644.99899 45.42598
12
12
644.99899
12
12 1
644.99899 45.42598
12
12
(128.34167 42.64167) (2.1604) *
2
45.42598
12
12 1
Nivel de confianza al 98%,
12.54 13
t(1
2), v
t (1 0.02 / 2),13 t0.975,25 2.1604
Luego, el intervalo de confianza es:
69.315946;102.084054
1
2
Interpretacin:
Con un nivel de confianza del 95%, se tiene que la estimacin de estos lmites sugiere que, en
promedio, la liquidez bancaria es mayor que la liquidez no bancaria; en consecuencia, los datos
apoyaran a la postura del analista.
EJEMPLO 7:
Una firma distribuye dos marcas de cerveza. En una reciente encuesta se encontr que
60 de 120 prefieren la marca A y 50 de 80 prefieren la marca B. obtenga un intervalo de
confianza para la diferencia de las proporciones poblacionales, con una confianza del
99%, para determinar si ambas marcas tienen la misma preferencia.
Solucin:
Se tiene los siguientes datos:
nA = 120
nB = 80
pA = 60/120 = 0.5
pB = 50/80 = 0.625
Nivel de confianza al 99%, Z 1- /2 = 2.58
El intervalo de confianza queda definido por:
A B pA pB z1 2
pA 1 pA pB 1 pB
p A 1 p A p B 1 p B
; p A pB z1 2
nA
nB
nA
nB