Región aceptación H0 Región rechazo H0
Pruebas de hipótesis
ALBERTO BOADA RODRÍGUEZ. PH.D
Fuente: Diferentes autores y presentaciones
1
AGENDA
1. Contexto
2. Definiciones pruebas de hipótesis
3. Pasos en las pruebas de hipótesis
4. Ejemplo
2
1. Contexto
Puntual
Estimación de
Parámetros
Intervalos de Confianza
Inferencia
Paramétricas
Prueba de Hipótesis
No paramétricas
2. Contexto
Introducción
Definir prueba de hipótesis.
Describir el procedimiento para las prueba de hipótesis.
Distinguir entre una prueba de hipótesis de una y dos colas.
Realizar pruebas de hipótesis para una y dos muestras.
Definir los errores de Tipo I y de Tipo II.
Calcular la probabilidad de un error de Tipo I y II.
¿Qué es una hipótesis?
Hipótesis:
Enunciado acerca de una población elaborada con el
propósito de ponerse a prueba.
Verificar la validez de una conjetura que un investigador
realiza sobre una población
Representa un elemento fundamental en el proceso de
investigación. Luego de formular un problema, el investigador
enuncia la hipótesis, que orientará el proceso y permitirá
llegar a conclusiones concretas del proyecto que recién
comienza
¿Qué es una prueba de hipótesis?
La experiencia sobre el comportamiento de algún índice de un proceso, o la
exigencia del cumplimiento de alguna norma nos lleva a realizar proposiciones
sobre el valor de algún parámetro estadístico.
Las proposiciones se deben contrastar con la realidad (mediante el muestreo
de datos) para tomar una decisión entre aceptar o rechazar la proposición
Estas proposiciones se denominan Hipótesis y el procedimiento para
decidir si se aceptan o se rechazan se denomina Prueba de Hipótesis
Una prueba de hipótesis es una herramienta de análisis de datos que
puede en general formar parte de un experimento comparativo más
completo
6
¿Qué es una prueba de hipótesis?
Prueba de hipótesis:
Procedimiento basado en la evidencia muestral y en la
teoría de probabilidad, que se emplea para determinar si la
hipótesis es un enunciado razonable y no debe rechazarse
o si no es razonable y debe ser rechazado.
Una hipótesis Estadística es un proposición sobre los
parámetros de una población o sobre la distribución de
probabilidad de una variable aleatoria
Definiciones
Hipótesis nula H0: afirmación acerca del valor
de un parámetro poblacional.
Hipótesis alterna H1: afirmación que se
aceptará si los datos muestrales proporcionan
evidencia de que la hipótesis nula es falsa.
Nivel de significancia: probabilidad de
rechazar la hipótesis nula cuando es verdadera.
Error Tipo I: rechazar la hipótesis nula cuando
en realidad es verdadera.
9-7
Definiciones
Error Tipo II: aceptar la hipótesis nula
cuando en realidad es falsa.
Estadístico de prueba: valor obtenido a
partir de la información muestral, se
utiliza para determinar si se rechaza o no
la hipótesis.
Valor crítico: el punto que divide la región
de aceptación y la región de rechazo de la
hipótesis nula.
Ejemplos de hipótesis estadísticas
Ejemplos de hipótesis acerca de un parámetro de población
son:
◦ El gasto promedio mensual de una familia colombiana de
cuatro personas es de $1.350.000 (DANE, 6-06-2017)
◦ El 51% de la población mayor de 18 años, no esta de
acuerdo con las decisiones del actual Ministro de
Hacienda.
◦ ¿El género es una variable significativa para el análisis
y la comprensión de los procesos de exclusión social?.
Prueba de hipótesis…. pasos
Paso 1: plantear las hipótesis nula y alterna
Calcular estadísticos
Determinar n, α Paso 2: seleccionar un nivel de significancia
, S,
Zc, tc , X²c, Fc Paso 3: identificar el valor estadístico de prueba
Paso 4: formular una regla de decisión
Identificar región
crítica – valor tabla
Existen evidencias
Tomar una
Paso 5: tomar una muestra, decisión
llegar a una decisión Calculo P-value
con un 1 – α, para:
No rechazar la Rechazar la hipótesis nula
hipótesis nula y aceptar la alterna
Paso 6. Comprobar el resultado Calcular intervalos de confianza
Ejemplo pruebas de hipótesis:
1. Paso Formular la hipótesis
Suponga que se quiere evaluar la contaminación por ruido en Bogotá
Secretaría del medio ambiente Expertos internacional JICA Ecólogos – Independiente
Hipo. Nula Ho : µ = 70 db (≥) Hipo. Nula Ho : µ = 70 db (≤ ) Hipo. Nula Ho: µ = 70 db (=)
Hip. Alterna H1: µ < 70 db Hip. Alterna H1: µ > 70 db Hip. Alterna H1: µ # 70 db
2. Paso: determinar tamaño de muestra n encontrar la media aritmética muestral , la
varianza muestral S² o proporción muestral.
Definir el nivel de significancia α =
de 10% o del 5% o del 1%
α = Error de tipo I, probabilidad de rechazar una Ho verdadera
В = Error de tipo II, probabilidad de aceptar una Ho falsa
1 – α = Nivel de confianza 1 – B = Potencia de laprueba
12
Ejemplo 2. Hay un Acusado que va ser juzgado por un delito. En
el juicio intervienen Acusado, la defensa, Fiscal y un Juez (toma
decisión). Cada parte presenta evidencias
H0: Es Inocente
H1: Culpable
Tabla de decisión
Condición real
Decisión Ho VERDADERA Ho FALSA
ACUSADO
INOCENTE CULPABLE
JUEZ
Declarar INOCENTE CORRECTA ERROR TIPO II
1-α β
Declarar CULPABLE ERROR TIPO I CORRECTA
α 1-β
13
Tabla de decisión
Alfa = p (rechazar H0|H0 cierta)
Beta = p (aceptar H0|H0 falsa)
Potencia =1- beta = p (rechazar H0|H0 falsa)
Detalles a tener en cuenta:
Alfa y Beta están inversamente relacionadas.
Sólo pueden disminuirse las dos, aumentando n.
14
α: Nivel de significancia o Error de tipo I es la
probabilidad de rechazar una hipótesis nula
cuando es verdadera
Β: Error de tipo II o probabilidad de aceptar una
hipótesis nula cuando es falsa
1 – α : Nivel de confianza 90%, 95% , 99%
1 – Β : Potencia de la prueba estadística
15
Paso 1. Definición Prueba de hipótesis
(a una cola - unilateral)
Una prueba de hipótesis es de una cola cuando la hipótesis alterna, H1,
establece una dirección, como:
◦ H0 : El gasto medio mensual de las familias colombianas
compuestas por 4 personas es de $1.350.000 mensuales.
◦ Ho : µ = $1.350.000
◦ H1 : El gasto medio mensual de las familias colombianas
compuestas por 4 personas es mayor a $1.350.000
mensuales.
◦ H1: µ > $1.350.000
Prueba de significancia de dos colas
Una prueba de hipótesis es de dos colas
cuando no se establece una dirección
específica de la hipótesis alterna H1, como:
H0 : El ingreso medio de las mujeres es igual al
ingreso medio de los hombres.
Ho : µm = µ h
H1 : El ingreso medio de las mujeres es diferente
al ingreso medio de los hombres.
H1 : µm # µh
·Otra forma de enunciar la hipótesis nula es:
·H0 : No existen diferencias significativas entre los
ingresos de los hombres y las mujeres
Paso 2. Definición Nivel de significancia (valores tabla
distribución normal muestra los Z/2 más usados).
Dos colas Valores Z a una
Nivel de sola cola
Z/2
Confianza (1 – ά) Z1-α/2
1.28
90% 1.645
95% 1.96 1.64
2.53
99% 2.58
18
19
Paso 3. Definir modelo matemático - formula
Prueba para la media poblacional: muestra grande, desviación
estándar poblacional conocida
Cuando se hace una prueba para la media poblacional de una muestra grande
y se conoce la desviación estándar, el estadístico de prueba está dado por:
X
z
/ n
Paso 4. Definir la región Critica
Paso 4. Definir la región Critica
22
Paso 5. Tomar decisión
Si:
Zcalculado ≥ Ztabla
tcalculado ≥ ttabla
EXISTEN EVIDENCIAS
PARA RECHAZAR LA
X²calculado ≥ X²tabla HIPÓTESIS NULA H0
Si el P-Value ≤ α
23
Paso 6. Calculo Intervalo de confianza
(comprobar decisión)
Intervalo de confianza para la media (varianza conocida o n ≥ 30 datos:
__ __
xz α/2 σ/ n μ x z α/2σ/ n
Intervalo de confianza para la media (varianza des conocida o n < 30 datos:
__ __
xt α/2 S/ n μ x t α/2S/ n
¿Para la proporción, para la varianza, diferencia de
medias, de proporciones, de varianzas?... Investigar
24
EJEMPLO 1
Los fabricantes de Salsa de tomate ........... indican en su
etiqueta que el contenido de la botella es de 16 onzas.
Cada hora se toma una muestra de 36 botellas y se pesa el
contenido.
La muestra de la última hora tiene un peso medio de 16.12
onzas con una desviación estándar de 0.5 onzas.
¿Está el proceso fuera de control para un nivel de significancia
de .05?
Formular la respectiva hipótesis y probarla (no omitir ningún
paso)
EJEMPLO 1 …….continuación
Paso 1: Establezca la hipótesis nula y alterna
H 0 : 16 H1 : #16
Paso 2: n = 36 ; = 16.12 ; σ = 0.5 ; α = 5%
Paso 3: Calcule el valor del estadístico de prueba:
X
z z [16.12 16] /[ 0.5 / 36 ] 1.44
/ n
Paso 4: Establezca la regla de decisión
H0 se rechaza si z <- 1.96 o z > 1.96
Paso 5: Tomar Decisión sobre H0:
No se rechaza H0 porque 1.44 es menor que el valor
crítico 1.96
r a l i t r b u i o n : = 0 , 2 = 1
Distribución de muestreo para el valor estadístico z, prueba de
dos colas, nivel de significancia de 0.05
0 . 4
0 . 3
.95 probabilidad
2 .025 regiones
0 . 2
de rechazo
Región o punto crítico
f ( x
0 . 1
Valor
1 – α 0.95 crítico
No rechace z = 1.96
. 0
α/2 = 0.025 H0 α/2 = 0.025
- 5
-4 -3 -2 -1 0 1 2 3 4
-1.96 1.96
Z calculado = 1.44
Valor p Value – p en la prueba de hipótesis
Valor p: es la probabilidad de observar un valor
muestral tan extremo o más que el valor observado,
dado que la hipótesis nula es verdadera.
Si el valor p o P –Value es menor que el nivel de
significancia α (0.10; 0.05; 0.01), H0 se rechaza.
Si el valor p es mayor que el nivel de significancia α,
H no se rechaza: no hay evidencias para rechazar la
0
prueba de hipótesis nula.
Cálculo del valor p
Prueba de una cola: valor p = P { z ≥ el valor absoluto del estadístico de
prueba calculado}
Prueba de dos colas: valor p = 2P { z ≥ el valor absoluto del estadístico de
prueba calculado}
Para el EJEMPLO 1: z = 1.44, y para una prueba de dos colas,
el valor p = 2P { z ≥ 1.44} = 2 (1-.0.92507) = .1498.
Como .1498 > .05, no se rechaza H0.
Prueba para la media poblacional: muestra, desviación
estándar poblacional desconocida
Aquí es desconocida, así que se estimará
con la desviación estándar de la muestra s.
Siempre que el tamaño de muestra n < 30,
z puede aproximarse con:
X
z
s/ n
EJEMPLO 2
Un banco emite su propia tarjeta de crédito. Zoila Peréz Sosa, la
gerente de crédito, quiere encontrar si la media mensual de
saldos no pagados es mayor que $400 (miles de pesos)
El nivel de significancia es de .05.
Una revisión al azar de 172 saldos reveló que la media muestral es
$407 y la desviación estándar muestral es $38.
¿Debe Zoila concluir que la población media es mayor que $400, o
es razonable suponer que la diferencia de $7 ($407-$400) se
debe al azar?
EJEMPLO 2 continuación
Paso 1: H0 : 400 H1: 400
Paso 2: H0 se rechaza si z > 1.645
z [407 400] / [38 / 172 ] 2.42
Paso 3:
Paso 4: H0 se rechaza. Zoila Peréz Sosa puede
concluir que la media de saldos no pagados es
mayor que $400.
Prueba de hipótesis: dos medias poblacionales
Suponga que los parámetros para dos poblaciones son:
Para muestras grandes el estadístico de prueba es:
1 , 2 , 1 y 2
X1 X 2
z
1 2
2 2
n1 n2
Prueba de hipótesis: dos medias poblacionales
Cuando 1 y 2 no se conocen pero el tamaño de
muestra n1 y n2 es mayor o igual que 30, el
estadístico de prueba es
X1 X 2 25.6 30.4
Z *c 2 2
6.77
s1 s2 2.9² 3.6²
n1 n2 40 45
EJEMPLO 3
Se realizó un estudio para comparar los años promedio
de servicio de quienes se retiraron en 2006 con los que
se retiraron el año anterior en la Universidad. Con un
nivel de significancia de .01 = 1%
¿Podemos concluir que los estudiantes que se retiraron
el año pasado estudiaron más años según la siguiente
muestra?
Característica 2006 Año anterior
Media de la muestra 25.6 30.4
Desviación estándar 2.9 3.6
de la muestra
Tamaño de la muestra 40 45
EJEMPLO 3 continuación
Paso 1: H 0 : 2 1 H1 : 2 1
Paso 2: Rechace H0 si z > 2.33
30.4 25.6
Paso 3: z 2 2
6.80
3.6 2.9
45 40
Paso 4: Como z = 6.80 > 2.33, H0 se rechaza. Los que se retiraron el año anterior
tenían más años de estudio.
Pruebas respecto a relaciones proporcionales
Relación proporcional: parte fraccional o porcentaje que
indica la parte de la población o muestra que tiene un
atributo particular de interés.
La relación proporcional muestral se representa por p
donde:
número de éxitos en la muestra
p=
número muestreado
Estadístico de prueba para ensayos con una sola
relación proporcional de población
pP
z
P (1 P )
n
P: relación proporcional poblacional = X/N
P: relación proporcional muestral = x/n
EJEMPLO 4
En el pasado, 15% de la propaganda por correo para donativos dio como
resultado contribuciones. Se mandó una nueva carta a una muestra de 200
personas y 45 enviaron un donativo. Para .05 de significancia, ¿se puede
concluir que la nueva carta fue más efectiva?
1. Ho: P = 0.15 VS H1: P > 0.15
2. n= α = 0.05 = 5% p = x/n = 45/200 = 0.225
3.
p P 0.225 0.15
z 2.97
P (1 P ) 0.15 * 0.85
n 200
4. Valor tabla 1.64
5. Dado que Z calculado es mayor al Ztabla entonces con una confianza del 95%
existen evidencias para rechazar la p.h. Ho
EJEMPLO 4 continuación
Paso 1: H0 : p .15 H1: p .15
Paso 2: H0 se rechaza si z > 1.645
45
.15
z 200 2.97
Paso 3: (.15)(.85)
200
Paso 4: como z = 2.97 >1.645, H0 se rechaza. La nueva carta
es más efectiva.
Prueba donde interviene la diferencia entre dos relaciones
proporcionales de población
El estadístico de prueba en este caso es:
p1 p2
z
pc (1 pc ) pc (1 pc )
n1 n2
Prueba donde interviene la diferencia entre dos relaciones
proporcionales de población continuación
pc es la media ponderada de las dos relaciones proporcionales, calculadas por:
número total de éxitos X1 + X 2
pc = =
número total de muestras n1 + n2
EJEMPLO 5
¿Es más probable que los trabajadores solteros
falten más que los trabajadores casados? Una
muestra de 250 trabajadores casados indicó que
22 faltaron más de 5 días el año pasado,
mientras que una muestra de 300 trabajadores
solteros indicó que 35 faltaron más de 5 días.
Utilice .05 de nivel de significancia. Nota: sea
población #1 = trabajadores solteros.
p2 = 22/250 = 0.088 ;p1 = 0.12
p1 p2
z
EJEMPLO 5 continuación pc (1 pc ) pc (1 pc )
n1 n2
Paso 1: H0 : p2 p1 H1: p2 p1
Paso 2: H0 se rechaza si z > 1.645
22 35
p3:
Paso .1036
250 300
.1167 .0880
z 1.099
.1036(1 .1036) .1036(1 .1036)
300 250
p2 = 22/250 = 0.088 ;p1 = 0.12
EJEMPLO 5 continuación
Paso 4:
H0 no se rechaza. No existe diferencia entre la proporción de trabajadores
casados y solteros que faltan más de 5 días al trabajo.
El valor p = P{ z > 1.1} = .1357
¿Como probar hipótesis de igualdad de varianzas de dos poblaciones?
Muchas veces existe interés en conocer si la varianza de dos poblaciones difieren. En
estos casos, se debe hacer una prueba estadística de igualdad de varianzas.
La hipótesis a plantear es:
H0 : σ²1 = σ²2
Asumiendo que la hipótesis nula es cierta la estadística de prueba
F = S²1 / S²2
Sigue una distribución F con n1 − 1 grados de libertad en el numerador
y n2 − 1 grados de libertad en el denominador.
Además S²1 es la varianza muestral mayor.
46
Características de una variable aleatoria F
1. Hay infinidad de variables F, cada una identificada por dos parámetros m y n
llamados grados de libertad. Estos parámetros son siempre enteros positivos. La
notación F m,n representa una variable aleatoria F con m y n grados de libertad.
2. La variable F no toma valores negativos.
3. La curva de densidad es asimétrica positiva, pero a medida que m y n crecen se
vuelve menos asimétrica
47
Ejemplos:
Sea F 15,20 la variable aleatoria F con 15 y 20 grados de libertad.
a). Hallar P F 15,20 ≤ 2.20
Se busca una tabla F en donde la intersección de la columna con grados
de libertad 15 y la fila con grados de libertad 20 sea 2.20 y el valor de la
probabilidad buscada será el que aparece como título de la tabla F.
Así: P F 15,20 ≤ 2.20 = 0.95
b). Hallar P F 15,20 ≥ 2.46
Ahora se busca la probabilidad que dá la tabla F donde la intersección de
la columna con 15 grados de libertad en el numerador y la fila con 20
grados de libertad en el denominador sea 2.46, la cual corresponde a la
tabla con probabilidad 0.975, es decir:
P F 15,20 < 2.46 = 0.975 luego la probabilidad buscada es 0.025.
48
¿Preguntas?
Gracias por su atención
Alberto. [email protected]
49