UNIDAD N° 5: PRUEBA DE HIPOTESIS
1. INTRODUCCIÓN
Hipótesis: Suposición (conjetura, teoría, presunción, creencia…) hecha a partir de
unos datos, que sirve de base para iniciar una investigación o una argumentación.
Una hipótesis científica es una proposición aceptable que ha sido formulada a
través de la recolección de información y datos, aunque no esté confirmada, sirve
para responder de forma alternativa a un problema con base científica.
En casi todas las disciplinas, los investigadores formulan hipótesis referidas al
comportamiento de los problemas que están estudiando y luego, a través de
experimentos, tratan de comprobar si sus hipótesis son correctas o incorrectas. Sobre
esta idea se apoyan las Pruebas de Hipótesis Estadísticas.
Cuando se requiere hacer una prueba para validar una Hipótesis Estadística sobre un
parámetro poblacional, se debe trabajar con muestras aleatorias. La información
suministrada por la muestra puede rechazar la hipótesis formulada o no rechazarla. La
decisión en relación a si los datos apoyan o no la hipótesis formulada, se toma con bases
a resultados probabilísticos.
Consideremos algunos ejemplos para clarificar el concepto de hipótesis estadística:
• Una empresa presume que el promedio de tiempo que demora un producto en
la línea de montaje, es de 15 minutos. En este caso, la hipótesis que se desea
probar es que “el tiempo promedio de producción de un producto es 15
minutos”.
• Una fundación de salud que estudia las causas del cáncer pulmonar, considera
que, en una población de personas afectadas con cáncer pulmonar, la proporción
de fumadores es de del 50%. La hipótesis sería “de las personas enfermas con
cáncer de pulmón, la proporción de fumadores es del 50%”.
• Una fábrica supone que la cantidad de artículos defectuosos en un día de
producción es como máximo de 50, ó si la proporción de artículos defectuosos
es inferior al 10%. Las hipótesis serían “la cantidad promedio de artículos
defectuosos es inferior o igual a 50” ó “la proporción de artículos defectuosos es
menor o igual a 0,10”.
A través del contraste de hipótesis, la
estadística proporciona procedimientos
para decidir la aceptación o el rechazo de
afirmaciones o hipótesis acerca de la
población en estudio.
Las hipótesis se contrastan comparando
sus predicciones con los datos
experimentales. Si coinciden dentro de un
margen de error, la hipótesis se mantiene.
En caso contrario se rechaza y hay que
buscar hipótesis o modelos alternativos
que expliquen la realidad.
2. PRUEBA DE HIPÓTESIS
La hipótesis que se formula y que se cree verdadera a priori (de inicio) es la que se
desea testear o probar. Esta hipótesis se denomina Hipótesis Nula y se denota por
“H0”. Las hipótesis nulas de los ejemplos mencionados en el inciso anterior, son:
• Encargado de producción: H0: μ = 15min H1: μ≠ 15 min
• Fundación que estudia el cáncer pulmonar: H0: p = 0,5; H1: p≠ 0,5
• Responsable de Control de Calidad: H0: μ≤50; 𝑝 ≤ 0,10; H1: μ˃50
Para cada hipótesis Nula Ho, se debe plantear la hipótesis contraria o negación de
la hipótesis nula, a esta hipótesis contraria se denominada como “Hipótesis
Alternativa H1”
Para rechazar o no la hipótesis nula, se deberán utilizar estimaciones de la
característica a testear, que han sido obtenidas de una muestra.
Aquí el interés no es directamente la estimación del parámetro (la media o la
proporción en los ejemplos mencionados), sino que, habiendo realizado una prueba
de hipótesis sobre el valor del parámetro, se desea comprobar la validez del mismo.
La decisión respecto del rechazo o no de la Hipótesis Nula “Ho” se realiza sobre la
base del valor de la estimación del parámetro de interés que ha sido obtenido con
la muestra aleatoria. El estimador de la media poblacional (μ), es “ẍ” y el estimador
de la proporción poblacional (Ṕ), es la proporción muestral “ṕ”.
La forma más directa de comprobar tales hipótesis, serias estudiando todos y cada
uno de los elementos de la población. Sin embargo, frecuentemente esto no es
posible (la población podría ser incluso infinita), por lo que el contraste de la
hipótesis ha de basarse en una muestra, que supondremos aleatoria, de la población
en estudio. Al no estudiarse la población entera, nunca podremos estar
completamente seguros de sí la hipótesis realizada es verdadera falsa. Es decir,
siempre existe la probabilidad de llegar a una conclusión equivocada.
Los métodos de ensayos de hipótesis que se tratan en este tema permitirán estudiar
si, en términos de probabilidad, la hipótesis de partida (hipótesis nula H 0) puede ser
aceptada o debe ser rechazada. Una hipótesis se aceptará cuando la muestra, no
proporcione evidencias suficientes (contundentes) para refutarla, lo cual no quiere
decir que la hipótesis sea verdadera (Analogía: en el ámbito legal, una persona es
inocente hasta que no se pruebe lo contrario)
Cuando se realiza una prueba de hipótesis, es necesario definir también, la
“Hipótesis Alternativa H1”, que corresponde a la negación de la hipótesis H0, que
es la hipótesis que se acepta, cuando ha sido rechazada la hipótesis nula.
Para nuestros ejemplos indicados anteriormente:
Hipótesis Nula H0 Hipótesis Alternativa H1
H0: μ = 15min H1: μ ≠ 15min
H0: p = 0,5 H1: p ≠ 0,5
H0: μ≤50; 𝑝 ≤ 0,10 H1: μ˃50; 𝑝 ˃ 0,10
3. ERRORES EN LA PRUEBA DE HIPÓTESIS
Cuando se realiza una prueba de hipótesis sobre un parámetro poblacional a partir
de información muestral, como la muestra es aleatoria, es posible que se cometan
errores en el testeo de una hipótesis:
• Se podría aceptar la Hipótesis Nula H0 como verdadera, cuando en realidad
es falsa.
• Se podría rechazar la Hipótesis Nula H0, cuando en realidad es verdadera.
El cuadro siguiente ilustra la situación de estos errores:
El nivel de significación “α” de un contraste de hipótesis, se define como, la probabilidad
de cometer un error de tipo I. Es decir, si se repitiera un gran número de veces un
contraste de hipótesis y H0 fuese verdadera, en el 100(1−α)% de los casos llegaríamos a
la conclusión correcta de aceptar Ho y el 100'% de las veces cometeríamos el error de
rechazar Ho.
Normalmente, el nivel de significación se fija antes de realizar el contraste de hipótesis,
donde se suelen tomar niveles de significación fijos, de 0.05 o 0.01, aunque cualquier
valor es en principio posible.
La probabilidad de cometer un error de tipo II, denotada por β, es típicamente imposible
de calcular a no ser que se tenga una hipótesis alternativa especifica.
Los errores de tipo I y tipo II se relacionan entre sí, desafortunadamente, para una
muestra dada, una disminución en la probabilidad de uno se convierte en un aumento
en la probabilidad del otro. De forma que normalmente no es posible reducir ambos
errores simultáneamente. La única forma en que esto es posible es aumentando el
tamaño de la muestra. Para cada caso particular, habrá que estudiar cuál de los dos tipos
de errores es más importante controlar, y fijar las regiones de aceptación y critica de
forma que se acote el error menos deseable de los dos.
4. PRUEBA DE HIPÓTESIS DE LA MEDIA POBLACIONAL (μ)
4.1. Caso 1: Muestras grandes (n ˃ 30)
Para el caso de la prueba de hipótesis sobre la media poblacional, cuando la muestra es
grande, se conoce que la distribución muestral de media tiende al modelo Normal
(teorema del límite central); en este contexto, podrían ocurrir las siguientes situaciones
de pruebas de hipótesis:
Cuando se aplica el modelo normal:
• El nivel de significación “α”, corresponde a la zona de rechazo de la hipótesis
nula Ho (nivel de error tipo 1 que se está dispuesto a aceptar)
• En cambio: 1 – α, corresponde a la zona de aceptación de la hipótesis nula Ho
(Nivel de confianza)
Para los gráficos de la tabla anterior, la(s) zona(s) de rechazo son las regiones de color
rojo, en cambio la(s) zona(s) de aceptación son las regiones de color verde.
En el proceso de prueba de hipótesis, es muy importante definir el valor de “Z” que es
la frontera entre la zona de rechazo y la zona de aceptación la hipótesis nula Ho, a este
valor de Z de denomina Valor Crítico o Punto Crítico (Zc); Valor Crítico cuando las
pruebas son unilaterales (una sola cola), o Valores Críticos cuando el contraste de
hipótesis es bilateral (de dos colas).
El procedimiento para realizar una prueba de hipótesis para la media aritmética
poblacional es el siguiente:
Datos necesarios:
Media aritmética poblacional μ
Desviación estándar poblacional σ, desviación estándar muestral “s”
Tamaño de la muestra n (n˃ 30)
1° Definir la hipótesis Nula Ho, y la hipótesis alternativa H 1
2° Definir si la prueba de hipótesis es bilateral o unilateral, cuando es unilateral, se debe
definir si la cola es a la izquierda o a la derecha. Esta definición se realiza en función de
la hipótesis alternativa H1:
3° Adoptar el nivel de significación “α” con el que se va a trabajar (tamaño del error tipo
I que se está dispuesto a aceptar). 1% y el 5%
4° Determinar el o los valores críticos Zc que delimitan las zonas de rechazo y de
aceptación de Ho. Para ello se tiene las siguientes referencias:
• Para: 1 – α = 90% α = 0,1 α/2=0,05; Para α/2 de la izquierda: Z1 = -1,64
Para α/2 de la derecha: Z2= 1,64
• Para: 1 – α = 95% α = 0,05 α/2=0,025; Para α/2 de la izquierda: Z1 = -1,96
Para α/2 de la derecha: Z2= 1,96
• Para: 1 – α = 99% α = 0,01 α/2=0,005 Para α/2 de la izquierda: Z1 = -2,58
Para α/2 de la derecha: Z2= 2,58
Para un nivel de significación del α = 5%:
α= 0,05; a este valor le corresponde un valor crítico: Zc = ± 1,645
α/2= 0,025; a este valor le corresponde un valor crítico: Zc =±1,96
Para un nivel de significación del 1%:
α = 0,01; a este valor le corresponde un valor crítico: Zc = ± 2,33
α/2=0,005; a este valor le corresponde un valor crítico: Zc = ±2,57
Con el valor crítico definido, establecer la zona de aceptación y la zona(s) de
rechazo bajo la curva normal.
5° Calcular el valor de Z para los datos del problema:
ẋ−𝜇
𝑍= 𝜎
√𝑛
Ubicar este valor ya sea en la zona de aceptación o la zona de rechazo, según
corresponda.
6° Interpretar el resultado: si la hipótesis nula está en la zona de aceptación o la zona
de rechazo.
7° Tomar la decisión: se acepta o se rechaza la hipótesis nula Ho.
A continuación, aplicamos el procedimiento descrito en los siguientes ejercicios.
Ejemplo de aplicación:
Con mucha frecuencia se acepta que la aceleración de la gravedad g = 9,8 m/s2, sin
embargo, para probar esta hipótesis el laboratorio de Física de la Universidad de Bueno
Aires a realizado varias mediciones de esta aceleración, de las cuales ha tomado una
muestra aleatoria de tamaño n = 50, para las cuales se ha calculado su media aritmética
muestral, que ha resultado ser: ẍ = 9,9 m/s2.
Por experiencias anteriores, se conoce que la desviación estándar poblacional es de σ =
0,4 m/s2
Se requiere probar esta hipótesis para un nivel de significancia del α = 5%
1° Definir hipótesis:
2° Tipo de prueba de hipótesis:
3° Determinar Valores Críticos (fronteras):
4° Calcular el valor del estadígrafo Zcal:
ẋ−𝜇
𝑍= 𝜎
√𝑛
5° Interpretar el resultado:
6° Tomar la decisión:
Pe.
Una empresa que produce dulce de leche, asegura que el contenido de sus
envases es de 500 gr o más; se conoce que la distribución de los pesos sigue una
tendencia normal con una distribución estándar de σ = 20 gr
Si el contenido fuera inferior a 500 gr se estaría estafando a los consumidores y
se tendría que clausurar a la empresa, por lo tanto, los agentes de control de
pesos están interesados en testear la hipótesis de la empresa. Para realizar esta
prueba se toma una muestra aleatoria de 40 envases, de los cuales se obtiene un
peso promedio de 492,64 gr. Por lo delicado del asunto se debe asumir un nivel
de significación α = 1%
Desarrollo:
Datos:
µ = 500 gr
σ = 20 gr
n = 40
ẍ = 492,64 gr
1° Definir hipótesis
Hipótesis nula: Ho: μ ≥500 gr
Hipótesis alternativa: H1: μ < 500 gr
2° Tipo de prueba de hipótesis:
Por la característica de H1, el tipo de prueba en este caso es
El análisis a realizar es un análisis unilateral izquierdo
Zc =-2,32
3° Valor Crítico:
Como el tamaño de la muestra es grande (n = 40), entonces se adopta el
modelo Normal.
Para α = 0,01; le corresponde un Zc = -2.32
4° Calcular el valor del estadígrafo Zp:
ẋ−𝜇 492,64 − 500
𝑍= 𝜎 = = −2,33
20
√𝑛 √40
5° Interpretar el resultado:
Como el valor del Z es menor que Zc, entonces Zp se ubica en la zona de
rechazo.
6° Tomar la decisión:
Rechazar la hipótesis Ho con un nivel de significación del 1°, es decir se rechaza
la hipótesis de que el contenido de los envases es mayor o igual que 500 gr,
con un nivel de significación de 1%.
Recomendación:
Para el caso de muestras grandes, pero se desconoce la desviación estándar
poblacional, entonces esta se puede reemplazar por la desviación estándar
muestral “s”.
4.2. Caso 2: Muestra pequeña (n ˂ 30) y desviación estándar poblacional
desconocida
Para este caso no es pertinente aplicar la distribución Normal, dado que la
población es pequeña, en esta situación el contraste de hipótesis debe realizarse
aplicando la distribución t Student que es un modelo diseñado para muestras
pequeñas, definiendo el estadístico “t”, como:
ẋ−𝝁
𝒕= 𝒔 (1) s: desv. Estándar muestral
√𝒏
Con n – 1 grados de libertad
Luego el proceso de contraste de hipótesis es similar al procedimiento que se
aplicó para las muestras grandes, tanto para los contrastes bilaterales, como
para los unilaterales.
Contraste Bilateral:
Al ser la distribución t una distribución simétrica se puede expresar que, si Ho se
cumple (es decir, si ẋ = μ), entonces, el valor de “t” calculado con la fórmula (1)
debe ubicarse entre los valores críticos (zona de aceptación): -tα/2 ≤ t ≤ tα/2
Donde los valores críticos de tα/2, deben elegirse de la tabla t Student, ingresando
con α/2 y el grado de libertad n – 1.
Si el “t” calculado con la fórmula (1) se ubica fuera de la zona aceptación, enton-
ces se rechaza Ho.
Contraste unilateral:
De manera similar al caso de las muestras grandes, se debe definir primero si el
contraste de hipótesis es unilateral superior o inferior a partir de la hipótesis al-
ternativa H1.
Luego, se debe determinar el valor critico de tα para delimitar la zona de acepta-
ción y de rechazo de Ho; posteriormente se calcula el valor del estadígrafo “t”
que es el que define si Ho se encuentra en la zona de aceptación o de rechazo.
Pe. Tc=-2,764
Dónde: tα/2 = I1,895 l
Como el valor calculado para t = 2,60, se ubica en la zona de rechazo, por tanto, se re-
chaza la hipótesis nula.
Pe.
El propietario de un automóvil sospecha que su vehículo tiene un consumo promedio
de combustible en carretera, es igual o superior a los 5,6 lt por cada 100 km de reco-
rrido, cuando el fabricante indica que el consumo es menor a 5,6 litros/ 100 km.
Para corroborar su sospecha, el dueño del auto observa el consumo medio en 11 viaje
elegidos al azar, obteniendo los siguientes resultados:
6,1 6,5 5,1 6 5,9 5,2 5,8 5,3 6,2 5,9 6,3
Se requiere probar las sospechas del dueño, realizando una prueba de hipótesis para
un nivel de significación del 1%.
Desarrollo:
n = 11
Datos:
Media poblacional: μ = 5,6 lt por cada 100 km
Datos muestrales:
1° Definir las hipótesis:
Ho: μ ≥ 5,6 lt/100 km
H1: μ ˂ 5,6 lt/100 km
2° Tipo de prueba:
Por las características de H1, se trata de una prueba de unilateral inferior.
3° Valor crítico tc:
Por ser una muestra pequeña y se desconoce la desviación estándar poblacional, se
aplica la distribución “t Student”
Para un nivel de significación α = 1% = 0,01, y un grado de libertad n – 1= 10; le corres-
ponde un tc =-2,764
tc = -2.764
4° Valor calculado t:
Como se trata de una muestra pequeña, se calcula el valor de “t” del modelo t Student.
ẋ−𝝁 5,845 − 5,6
𝒕= 𝒔 = = 1,762
0,461
√𝒏 √11
5° Interpretar los resultados
El valor calculado se ubica en la zona de No rechazo de Ho
6° Tomar la decisión
Se acepta la hipótesis nula Ho, con un nivel de significación del 1%.
Pe.
DATOS:
Hipótesis a probar:
µ
σ
Datos de la muestra:
ẍ=
s=
Nivel de confianza: 1-α
Nivel de significación: α
1° Plantear la hipótesis Nula “Ho” y la Hipótesis Alternativa “H1”
2° Definir el tipo de análisis a realizar y el tipo de distribución de probabilidad a utilizar
(graficar la curva de probabilidades, y ubicar la(s) zona(s) de rechazo α o α/2
3° Con el nivel de significación “α” y el grado de grado de libertad (n -1), determinar el
Punto Crítico (Zc o tc), que marca la frontera entre la zona de aceptación y la zona de
rechazo de la hipótesis nula Ho:
4° Calcular el valor de la variable: “Z” si se aplica la distribución Normal o “t” si se
aplica la Distribución “T Student”.
5° Identificar si el valor calculado se ubica en la zona de aceptación o de rechazo:
6° Tomar la decisión: se acepta o se rechaza la Hipótesis Nula Ho, haciendo referencia
al nivel de significación: