STATISTICS II
II
STATISTICS
PRUEBA DE HIPTESIS
(para la Media y Proporcin)
Plan de clases: 3ra semana
Los dueos de los centros comerciales
creen que un comprador tpico pasa en
promedio 75 minutos, con una
desviacin estndar de 15 minutos en
el centro comercial. Se introdujeron
restaurantes de especialidades para
mantener a los compradores en el
centro comercial por mayor tiempo.
Una m.a. de 45 compradores revel
que el tiempo medio aument a 80
minutos. Se puede afirmar que el
tiempo medio empleado es mayor a
75 minutos?.
COMPETENCIAS
Conocimientos previos
Uso de la tabla distribucin normal
Uso de la tabla t de Student
Clculo de estimadores como la media muestral y
proporcin.
La estadstica inferencial es el proceso de usar informacin
de una muestra para describir el estado de una poblacin.
Sin embargo, es frecuente que usemos la informacin de
una muestra para probar un reclamo o conjetura sobre
algn parmetro de la poblacin. El reclamo o conjetura se
conoce como hiptesis. El proceso que corrobora si la
informacin de una muestra sostiene o refuta el reclamo se
llama prueba de hiptesis.
Qu es una Hiptesis estadstica?
Es una proposicin o supuesto sobre los parmetros de una o
ms poblaciones. Principalmente sobre la media (), varianza
( 2 ), proporcin (), etc.
Qu es una Prueba de hiptesis?
Es un procedimiento basado en:
Evidencia de la muestra
La teora de la probabilidad
Se emplea para determinar si la hiptesis nula es
Un enunciado razonable y no debe rechazarse
No es razonable y debe ser rechazado
Hiptesis Nula (H0)
Hiptesis Alterna (H1)
Una afirmacin acerca del
valor de un parmetro de
la poblacin.
Una afirmacin que es
aceptada si la muestra provee
la evidencia de que la
hiptesis nula es falsa.
Lleva los signos igual,
mayor igual y menor
igual.
Lleva los signos diferente ,
Mayor o menor ( , > <).
Ejemplos de cmo plantear las
hiptesis
Traducir
PROBLEMA
1. El sueldo promedio de un
ingeniero de sistemas es por los
menos 3,500 soles mensuales?
2. El tiempo de vida promedio de
una determinada pieza usada en el
ensamblaje de una marca de
computadoras es diferente a
20000 horas.
3. Ms del 20% de las amas de
casa utiliza aceite de maz.
al
Establece
Plantear
lenguaje
r el
Hiptesis
estadstic opuesto
o
3,500
20000
<3,500
H0:
3,500
H1:
<3,500
= 20000
H0: =
20000
H1:
20000
H0:
Tipos de Errores
Resumen de las situaciones posibles cuando se
toma una decisin en prueba de hiptesis:
Procedimiento para una prueba de hiptesis
Plantear las hiptesis
Fijar nivel de significancia
Definir la hiptesis nula y alterna,
traducida a lenguaje estadstico
Los valores ms usados son: 0.01,
0.05, 0.10.
Identificar el estadstico de
prueba
Seleccionar el estadstico de
prueba: Z, T, 2 , F etc.
Determinar
decisin
Establecer la regla de decisin bajo
las cuales se rechaza o no H0.
Sacar conclusiones en base a la
evidencia muestral y tomar la
decisin correspondiente
Conclusin
la
regla
de
Prueba de Hiptesis para la media poblacional
PASOS
1. Hiptesis
2. Nivel de
significacin
UNILATERAL A LA
IZQUIERDA
H 0 : 0
H 0 : 0
H 0 : 0
H1 : 0
H1 : 0
H1 : 0
puede ser 0.01, 0.05, 0.10, etc
Si es conocido
3. Estadstico
de Prueba
UNILATERAL A LA
DERECHA
BILATERAL
x
Zc
N (0,1)
/ n
Si es desconocido
x
Tc
t( n 1)
S/ n
4. Decisin
Rechazar H0 si Zc < Z
Rechazar H0 si Tc < T(n-1,)
Rechazar H0 si |Zc| > Z1-
Rechazar H0 si |Tc| > T(n-1,1-)
Rechazar H0 si Zc > Z1-
Rechazar H0 si Tc > T(n-1,1-)
Ejemplo 1
Una mquina est calibrada para embolsar cereales a un peso promedio
de 500 gr. Cada cierto tiempo el jefe de control de calidad realiza una
inspeccin para determinar si debe mandar a calibrar la mquina. Para
tomar una decisin toma una muestra aleatoria de 36 bolsas y encuentra
un promedio de 496.5 gr. A que conclusin llegar el jefe de control
de calidad, si suponemos que el peso se distribuye normalmente con
una desviacin estndar de 9 gr.? Use un 5% de significancia.
1.- Hiptesis nula:
Hiptesis alterna
H 0 : 500
La mquina esta calibrada (las bolsas de
cereal pesan en promedio 500 gr.)
H 1 : 500
La mquina no esta calibrada (las bolsas de cereal
no pesan en promedio 500 gr.)
2.- = 0.05
3.- Estadstico de prueba
Zc
x 496.5 500
2.33
/ n
9 / 36
La variable de estudio es peso (X), y se distribuye como
una normal. Por dato del problema, se sabe que (=9) .
5.- Decisin
4.- Valor crtico
Z0 = Z1-/2 = Z0.975 = 1.96
Como Zc= -2.33< ZT=1.96, se rechaza H0.
Decisin: Con un nivel de significacin del 5%, existe evidencia estadstica para concluir que el peso
promedio de las bolsas de cereal no pesan 500 gramos. Se justifica enviar a calibrar la mquina.
Ejemplo 2
En estudios previos se ha determinado que el nivel de colesterol (mg/dL)
promedio de pacientes con problemas cardacos es 220. Un cardilogo piensa
que en realidad el nivel es ms alto y para probar su afirmacin usa la muestra
217
233
223
235
225
242
245
219
238
221
216
234
217
199
226
236
202
248
218
224
Habr suficiente evidencia estadstica para apoyar la afirmacin del
cardilogo? Justificar su respuesta con un =0.05
Solucin:
Por dato del problema, se sabe que es desconocido, por tanto a partir de los datos
de la muestra debemos calcular la media y desviacin estndar muestral.
n
xi
i 1
225.90
x
i 1
2
i
n* x
n 1
13.09
1.- Hiptesis nula:
Hiptesis alterna
H 0 : 220
El cardilogo no tiene la razn
H 1 : 220
El cardilogo tiene la razn
2.- = 0.05
3.- Estadstico de prueba
Tc
x 225.90 220
2.02
S / n 13.09 / 20
La variable de estudio es colesterol (X), y se supone que
distribuye como una normal. Adems desconocido.
5.- Decisin
4.- Valor crtico
tt t n 1;1 t19;0.95 1.729
tt 1.729
Como Tc= 2.02 < TT=1.729, se rechaza H0.
Decisin: Con un nivel de significacin del 5%, existe evidencia estadstica para concluir que el colesterol
promedio de los pacientes con problemas cardacos es mayor a 220 (mg/dL) (es decir, el cardilogo tiene la
razn).
Prueba de Hiptesis para la proporcin poblacional
PASOS
1. Hiptesis
2. Nivel de
significacin
3. Estadstico
de Prueba
UNILATERAL A LA
IZQUIERDA
BILATERAL
H0 : 0
H0 : 0
H1 : 0
H1 : 0
UNILATERAL A LA
DERECHA
H0 : 0
H1 : 0
puede ser 0.01, 0.05, 0.10, etc
Zc
P 0
0 (1 0 )
n
4. Decisin
Rechazar H0 si Zc < Z
Rechazar H0 si |Zc| > Z
Rechazar H0 si Zc > Z
Ejemplo 3:
Se debe decidir si los lotes que llegan a una fbrica deben ser
aceptados o devueltos al proveedor. Los artculos de este lote vienen
con una garanta de 10% de artculos defectuosos. Si hay evidencia
que es ms de 10% se rechazar el lote. Para tomar una decisin se
elige una muestra aleatoria de 625 artculos y se encuentran que 550
no son defectuosos. Cul ser la decisin? Use alfa = 0.01
1.- Hiptesis nula:
Ho: 0.10
No se rechaza el lote.
2.- = 0.01
Hiptesis alterna
H1: > 0.10
Se rechaza el lote
5.- Decisin
3.- Estadstico de prueba
Zc
(1
n
0.12 0.10
1.667
0.10(1 0.10)
625
4.- Valor crtico
Z0 = Z1- = Z0.99 = 2.33
Como Zc= 1.667 < ZT =2.33, no se rechaza H0.
Conclusin: Con un nivel de significacin del 1%, no existe suficiente evidencia estadstica para concluir
que ms del 10% de los artculos son defectuosos. No hay razn para rechazar el lote.
Cmo calcular el p-valor?
UNILATERAL A LA
IZQUIERDA
p valor F ( Z c )
BILATERAL
p valor 2(1 F ( Z c ) )
Z c siempre
UNILATERAL A LA
DERECHA
p valor 1 F ( Z c )
Cmo interpretar?
Si p-valor < ,
rechazar Ho, es decir, la prueba es significativa
Si p-valor > ,
no rechazar Ho, es decir, la prueba no es significativa
Qu significa?
El p-value llamado el nivel de significacin observado, es el
mnimo valor de al cual se rechazara la hiptesis nula. Un pvalue cercano a 0 indica que es muy poco probable que Ho
ocurra por lo que estaremos inclinados a rechazarla.
PRUEBA DE NORMALIDAD: ANDERSON DARLING
(con Reporte Minitab)
Se utiliza esta prueba para verificar si los datos provienen o no
de una poblacin con distribucin normal.
Hiptesis Nula
Hiptesis Alterna
La variable se distribuye La variable no se
como una distribucin distribuye como una
normal
distribucin normal
puede ser 0.01, 0.05, 0.10, etc
Nivel de significacin:
Decisin:
Si p-valor > se acepta Ho
Si p-valor < se rechaza Ho
Ejemplo 4:
Verificar si los siguientes datos se distribuyen como una normal.
1.- Planteamiento de hiptesis
Ho: La variable aleatoria se
comporta como una distribucin
normal
H1: La variable aleatoria No se
comporta como una distribucin
normal.
2.- Nivel de significacin: =0.05
3.- Decisin
Como p-valor=0.177 > 0.05, se
acepta Ho. Es decir, al nivel de
significacin de 5% los datos se
distribuyen como una normal
Pregunta de auto examen
En una encuesta de Gallup se pregunt
a
1087
adultos
seleccionados
aleatoriamente consume en ocasiones
bebidas alcohlicas como licor, cerveza,
o es completamente abstemio?.
El
62%
de
las
personas
afirmaron
consumir bebidas alcohlicas. Al nivel
de significacin de 5% se puede afirmar
de que la mayora de los adultos
consumen bebida alcohlica?.
Preguntas de autoevaluacin
Para probar una hiptesis para una proporcin, se debe verificar que
tanto n como n(1- ) debe cumplir___________
Si se utiliza una prueba de hiptesis unilateral izquierda para la media
cuando la varianza es desconocida, entonces el valor crtico para un
nivel de significacin de 5% es _____________
Al complemento de la potencia se le llama______________
Al complemento del error tipo I se le denomina _______________
Una hiptesis estadstica es una ___________acerca de uno o varios
parmetros de la poblacin.
Bibliografa:
1. Mendehall, W. (2008) Introduccin a la Probabilidad y
Estadstica. Thomson 12 Edicin. Mxico
2. Alvarado, J., Obagi, J. (2008) Fundamentos de la Inferencia
Estadstica. Ed. Pontificia Universidad Javeriana 1ra. Edicin.
Colombia.
3. Anderson, S. (2008) Estadstica para Administracin y
Economa. Cengage Learning 8va. Edicin. Mxico