U5. Notas de Curso
U5. Notas de Curso
PRUEBAS DE HIPÓTESIS
COMPETENCIA: Interpreta problemas prácticos del área de enseñanza y de otras áreas del
conocimiento, con base en los resultados obtenidos en una prueba de hipótesis para uno o dos
parámetros.
Hipótesis estadística:
Cualquier aseveración acerca de la población es una hipótesis estadística.
En una prueba de hipótesis, ¿para qué queremos saber si una cierta conjetura acerca de la
población está o no sustentada por los datos? Para mantenerla o descartarla.
Esta decisión la tomamos usando las observaciones de la muestra y el esquema general del proceso
es el siguiente: nos situamos en una de las hipótesis (ejemplo 𝐻0 ) y desarrollamos un proceso que
nos conduzca a decidir si la rechazamos o no.
Si rechazamos 𝐻0 , concluimos que 𝐻1 está fuertemente sustentada por los datos.
Si no rechazamos H0, concluimos que 𝐻1 no está fuertemente sustentada por los datos.
El proceso mediante el cual se decide entre una de estas acciones es lo que se llama “prueba de
hipótesis estadística”.
Una prueba de hipótesis no es ni remotamente una prueba matemática. Cuando se prueba una
proposición matemática (su verdad o falsedad) la conclusión se establece más allá de cualquier
duda razonable. En contraste, en una prueba de hipótesis siempre habrá un elemento de
incertidumbre en la conclusión alcanzada a través del análisis de los datos.
Ejemplo:
Hipótesis estadística: La proporción de consumidores que entre dos cereales 𝐴 y 𝐵, prefieren
el 𝐴 es de 40%.
Resultado de la En una muestra de 15 consumidores se halló que 12 prefirieron 𝐴 a 𝐵.
investigación:
Conclusión típica: Es poco probable que la hipótesis estadística sea verdadera: Si 𝑝 = 0.4
y 𝑛 = 15, 𝑋 = número de consumidores que prefirió 𝐴, entonces
𝑃(𝑋 ≥ 12) = 0.002 (muy pequeño).
Sin embargo, como físicamente es posible tener esta observación cuando 𝑝 = 0.4, no podemos
estar absolutamente seguros de que la hipótesis es falsa.
Empezaremos ahora a hacer un desarrollo formal del proceso para conducir e ir ilustrando.
Ubiquémonos en un problema específico:
La experiencia ha demostrado que la tasa de curación de una cierta enfermedad usando un
medicamento estándar es de 60%. La tasa de curación de una nueva droga se anticipa que es mejor
En una prueba de hipótesis de 𝐻0 vs 𝐻1 , rechazar falsamente 𝐻0 es visto como un error más serio
que el de fallar en rechazar 𝐻0 cuando 𝐻1 es verdadero.
Apliquémoslo al ejemplo de las drogas para avanzar un poco más en el análisis:
𝐻0 : 𝑝 ≤ 0.6 (La nueva droga no es mejor)
𝐻1 : 𝑝 > 0.6 (La nueva droga es mejor)
Errores
Al aplicar una prueba de hipótesis, necesariamente se da una de las siguientes situaciones:
Decisión
Hipótesis verdadera No rechazar 𝐻0 Rechazar 𝐻0
𝐻0 Decisión correcta Error tipo I
𝐻1 Error tipo II Decisión correcta
Ya hemos comentado que el error tipo I es más serio que el error tipo II. Entonces en una prueba
de hipótesis tenemos que intentar minimizar la probabilidad de cometer el error tipo I. En un juicio,
el error tipo I no se puede cuantificar, en una prueba estadística se cuantifica con un concepto
llamado nivel de significancia y lo denotamos por
= 𝑃(𝑐𝑜𝑚𝑒𝑡𝑒𝑟 𝑒𝑙 𝑒𝑟𝑟𝑜𝑟 𝑡𝑖𝑝𝑜 𝐼)
= 𝑃(𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝐻0 𝑐𝑢𝑎𝑛𝑑𝑜 𝐻0 𝑒𝑠 𝑣𝑒𝑟𝑑𝑎𝑑𝑒𝑟𝑎)
Pero, lo ideal sería hacer ambos tipos de error arbitrariamente pequeños, digamos = 0.00001 y
= 0.0000000001. Observemos que si uno disminuye, el otro crece, veamos un ejemplo usando
el contexto legal:
Juez No. 1: rechaza inocencia si y solo si existe un videotape que muestra al acusado cometiendo el
crimen. Entonces para este juez P(rechazar inocencia cuando en efecto el individuo es inocente)
resulta ser muy pequeño. Difícilmente siendo inocente existirá un videotape que nos muestre al
acusado cometiendo el crimen. Pero P(no rechazar inocencia cuando 𝐻1 es verdadero) = P(no
rechazar inocencia cuando el individuo no es inocente) es muy grande porque hay muchos crímenes
que no son capturados en un videotape.
Juez No. 2: Rechaza inocencia si y solo si no existe coartada (testigo que diga que el acusado no
estuvo presente en la escena del crimen). Para este juez, P(rechazar inocencia cuando el individuo
es inocente) es grande porque muchos inocentes no podrán tener una coartada (error tipo I,
MORALEJA. No es posible hacer arbitrariamente pequeños ambos tipos de error. Por lo tanto se
adopta la siguiente filosofía de operación:
a) Fijar a priori
b) Minimizar
El usuario estipula entonces , la probabilidad del peor de ambos tipos de error, y una vez
controlado éste, procede a buscar una prueba que minimice .
Nota (otra razón para descartar simetría en una prueba de hipótesis). De acuerdo con lo antes
expuesto, el intercambio de roles de 𝐻0 y 𝐻1 no da lugar a una situación simétrica: cuando tenemos
𝐻0 vs 𝐻1 , fijamos = 𝑃(𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝐻0 𝑑𝑎𝑑𝑜 𝑞𝑢𝑒 𝐻0 𝑒𝑠 𝑣𝑒𝑟𝑑𝑎𝑑𝑒𝑟𝑎) = 𝑃(𝑒𝑟𝑟𝑜𝑟 𝑡𝑖𝑝𝑜 𝐼). Si
invertimos los papeles, 𝐻1 vs 𝐻0 , fijamos
𝑃(𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝐻1 𝑑𝑎𝑑𝑜 𝑞𝑢𝑒 𝐻1 𝑒𝑠 𝑣𝑒𝑟𝑑𝑎𝑑𝑒𝑟𝑎) =
𝑃(𝑛𝑜 𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝐻0 𝑑𝑎𝑑𝑜 𝑞𝑢𝑒 𝐻1 𝑒𝑠 𝑣𝑒𝑟𝑑𝑎𝑑𝑒𝑟𝑎) = 𝑃(𝑒𝑟𝑟𝑜𝑟 𝑡𝑖𝑝𝑜 𝐼𝐼).
Definición. Al más pequeño valor de que permite el rechazo de 𝐻0 sobre la base del valor
observado para el estadístico , se le llama 𝑝 − 𝑣𝑎𝑙𝑜𝑟 o probabilidad de significancia.
Ejemplo:
Una compañía que vende comida para gatos desea determinar si dos sabores 𝐴 y 𝐵 tienen un
atractivo para los gatos. Para ello a cada gato de una muestra de 15 se le da comida en recipientes
idénticos que contienen cada uno de los dos sabores. Sea 𝑋 el número de gatos que comieron del
recipiente que contenía comida del sabor 𝐴. Los datos serán usados para inferir acerca de la posible
presencia de fuerte preferencia por parte de los gatos, a favor de alguno de los dos sabores. Sea 𝑝
la proporción de la población que prefiere comida con el sabor 𝐴.
La hipótesis acerca de la población es que 𝑝 ≠ 0.5. Entonces la estructura de la prueba de hipótesis
es
𝐻0 : 𝑝 = 0.5 vs 𝐻1 : 𝑝 0.5 alternativa de dos colas
La región de rechazo es de la forma 𝑋 ≤ 𝑐1 o 𝑋 ≥ 𝑐2 .
Nótese que bajo 𝐻0 el estadístico de prueba 𝑋 tiene distribución binomial con parámetros 𝑛 = 15,
𝑝 = 0.5. La distribución es simétrica y por lo tanto seleccionar regiones de rechazo simétrico resulta
razonable y teóricamente, son los mejores. Así podríamos proponer una región del tipo
a) Rechazar 𝐻0 si 𝑋 ≤ 4 o 𝑋 ≥ 11 o
b) Rechazar 𝐻0 si 𝑋 ≤ 3 o 𝑋 ≥ 12
Supongamos que se desea un error tipo I inferior a 0.05. Veamos si alguna de estas regiones es
apropiada:
a) b)
= 𝑃(𝑋 ≤ 4 𝑜 𝑋 ≥ 11) = 𝑃(𝑋 ≤ 3) + 𝑃(𝑋 ≥ 12)
= 𝑃(𝑋 ≤ 4) + 𝑃(𝑋 ≥ 11) = 0.018 + 0.018
= 0.059 + 0.059 = 0.036 < 0.05
= 0.118 > 0.05
Sea 𝑋1 , … , 𝑋𝑛 una muestra aleatoria de una densidad 𝑓(𝑥; 𝜃), donde 𝜃 ∈ 𝜃. Queremos hallar una
prueba de 𝐻0 : 𝜃 ∈ 𝜃0 vs 𝐻1 : 𝜃 ∈ 𝜃1 ( 𝜃1 ∩ 𝜃0 = ∅, en general, 𝜃0 , 𝜃1 ⊂ 𝜃 ).
Sup 𝐿(𝜃; 𝑥1 , … , 𝑥𝑛 )
𝜃∈𝜃0
𝜆 = 𝜆𝑛 =
Sup 𝐿(𝜃; 𝑥1 , … , 𝑥𝑛 )
𝜃∈𝜃
Nota:
1) es una función de 𝑥1 , … , 𝑥𝑛
2) Cuando se reemplazan las observaciones 𝑥1 , … , 𝑥𝑛 por sus correspondientes v.a. 𝑋1 , … , 𝑋𝑛 ,
escribiremos Λ por ; esto es Λ = 𝜆(𝑋1 , … , 𝑋𝑛 ). Nótese que Λ es un estadístico.
3) 𝜆 ≥ 0 porque se tiene una razón de cantidades no negativas. 𝜆 ≤ 1 pues como 𝜃0 ⊂ 𝜃 ⇒
Sup ≤ Sup. Por tanto, 0 ≤ 𝜆 ≤ 1.
𝜃∈𝜃0 𝜃∈𝜃
4) El parámetro puede ser un vector.
5) El denominador de es la función de verosimilitud evaluada en EMV.
Ejemplo:
Sea 𝑋1 , … , 𝑋𝑛 una muestra aleatoria de la densidad 𝑓(𝑥; 𝜃) = 𝜃𝑒 −𝜃𝑥 𝐼(0,∞) (𝑥), donde 𝜃 =
{𝜃|𝜃 > 0}. Probar 𝐻0 : 𝜃 ≤ 𝜃0 vs 𝐻0 : 𝜃 > 𝜃0 .
Solución
𝑛
𝐿(𝜃; 𝑥1 , … , 𝑥𝑛 ) = ∏𝑛𝑖=1 𝜃𝑒 −𝜃𝑥𝑖 = 𝜃 𝑛 𝑒 −𝜃 ∑𝑖=1 𝑥𝑖
𝑙𝑛𝐿(𝜃; 𝑥1 , … , 𝑥𝑛 ) = 𝑛𝑙𝑛𝜃 − 𝜃 ∑𝑛𝑖=1 𝑥𝑖
𝑛
Sup 𝐿(𝜃; 𝑥1 , … , 𝑥𝑛 ) = Sup (𝜃 𝑛 𝑒 −𝜃 ∑𝑖=1 𝑥𝑖 )
𝜃∈𝜃0 0<𝜃<𝜃0
𝑛 𝑛
𝑛 𝑆𝑖 ≤ 𝜃0
(∑𝑛 𝑥
) 𝑒 −𝑛 ∑𝑛
𝑖=1 𝑥𝑖
𝑖=1 𝑖
=
𝑛
𝑛 𝑆𝑖 > 𝜃0
{𝜃0𝑛 𝑒𝑥𝑝(−𝜃0 ∑𝑖=1 𝑥𝑖 ) ∑𝑛
𝑖=1 𝑥𝑖
𝜆= 𝜃0𝑛 𝑒𝑥𝑝(−𝜃0 ∑𝑛
𝑖=1 𝑥𝑖 ) 𝑛
𝑛
𝑛 𝑆𝑖 ∑𝑛
> 𝜃0
( 𝑛 ) 𝑒 −𝑛 𝑖=1 𝑥𝑖
∑𝑖=1 𝑥𝑖
{
𝜃0𝑛 𝑒𝑥𝑝(−𝜃0 ∑𝑛
𝑖=1 𝑥𝑖 ) 𝑛
𝑛 ≤ 0 y ∑𝑛
> 𝜃0
𝑛 𝑖=1 𝑥𝑖
( 𝑛 ) 𝑒 −𝑛
∑𝑖=1 𝑥𝑖
𝑛
𝜃0 ∑𝑛
𝑖=1 𝑥𝑖 ∑𝑛
𝑖=1 𝑥𝑖 1
≡( 𝑛
) 𝑒𝑥𝑝(−𝜃0 ∑𝑛𝑖=1 𝑥𝑖 + 𝑛) ≤ 0 y 𝑛
<𝜃
0
Así que la prueba de razón de verosimilitud se reduce a rechazar 𝐻0 si y solo si 𝜃0 𝑥̅ ≤ 𝑘 donde 0 <
𝑘 < 1.
Si el nivel de significancia deseado es , entonces 𝑘 se obtiene resolviendo la ecuación
𝑛𝑘
= 𝑃 {∑𝑛𝑖=1 𝑥𝑖 ≤ 𝜃0
|𝜃 = 𝜃0 }
𝑛𝑘
𝜃0 1
= ∫0 𝜃 𝑛 𝑠 𝑛−1 𝑒 −𝜃0 𝑠 𝑑𝑠
Γ(𝑛) 0
𝑛𝑘 1
= ∫0 Γ(𝑛)
𝑢𝑛−1 𝑒 −𝑢 𝑑𝑢, 𝑢 = 𝜃0 𝑠
Teorema: Sea 𝑋1 , … , 𝑋𝑛 una muestra aleatoria de la densidad 𝑓(𝑥; 𝜃), 𝜃 ∈ 𝜃, donde 𝜃 es algún
intervalo. Supongamos que 𝑓(𝑥; 𝜃) = 𝑎(𝜃)𝑏(𝑥)𝑒𝑥𝑝[𝑐(𝜃)𝑑(𝑥)] y sea 𝑡(𝑥1 , … , 𝑥𝑛 ) = ∑𝑛𝑖=1 𝑑(𝑥𝑖 )
Ejemplo:
Sea 𝑋1 , … , 𝑋𝑛 una muestra aleatoria de 𝑓(𝑥; 𝜃) = 𝜃𝑒 −𝜃𝑥 𝐼(0,∞) (𝑥) donde 𝜃 = {𝜃|𝜃 > 0}.
Probar 𝐻0 : 𝜃 ≤ 𝜃0 vs 𝐻1 : 𝜃 > 𝜃0 .
Solución
𝑓(𝑥; 𝜃) = 𝜃[𝐼(0,∞) (𝑥)]𝑒 −𝜃𝑥 = 𝑎(𝜃)𝑏(𝑥)𝑒𝑥𝑝[𝑐(𝜃)𝑑(𝑥)]
Por el teorema, ∑𝑛𝑖=1 𝑥𝑖 < 𝑘 ∗ es una región de rechazo que da lugar a una prueba UMP
(uniformemente más potente) de tamaño si y solo si 𝑘 ∗ está dada por la solución de
𝑛 𝑘∗
1 𝑛 𝑛−1 −𝜃 𝑢
𝛼 = 𝑃𝜃0 (∑ 𝑥𝑖 < 𝑘 ∗ ) = ∫ 𝜃 𝑢 𝑒 0 𝑑𝑢
Γ(𝑛) 0
𝑖=1 0
Un método intuitivo
Una útil técnica para obtener pruebas es la siguiente:
Descubrir algún estadístico que tenga comportamiento diferente bajo las dos hipótesis y luego
usar los diferentes comportamientos para diseñar una prueba.
Ejemplo:
Consideremos la muestra 𝑋1 , … , 𝑋𝑛 de la densidad 𝜙𝜃,1 (𝑥). Supongamos que se quiere probar
1
𝐻0 : 𝜃 ≤ 𝜃0 vs 𝐻1 : 𝜃 > 𝜃0 . Observemos que el estadístico 𝑋̅~𝑁 (𝜃, ); entonces 𝑋̅ tenderá a ser
𝑛
más pequeño cuando 𝐻0 es verdadera que cuando 𝐻0 es falsa. Aquí 𝑋̅ tiene comportamientos
diferentes bajo las hipótesis. Una prueba razonable sería entonces, rechazar 𝐻0 cuando 𝑋̅ es
grande, esto es, rechazar 𝐻0 si 𝑋̅ > 𝑘, donde 𝑘 se determina fijando el nivel de significancia.
Algunas sugerencias para “descubrir” el estadístico con “comportamiento” diferente bajo las
dos hipótesis son:
1) Si existen estadísticos suficientes, éstos son candidatos naturales.
2) Un buen estimador, como por ejemplo el EMV, es otra posibilidad.
Nota: En el ejemplo, el estadístico 𝑋̅ cumple con ser el estadístico suficiente y además el EMV de .
𝑃(𝑋̅ ≤ 𝑐1 o 𝑋̅ ≥ 𝑐2 |𝜃 = 1) ≤ 0.08
𝑃(𝑋̅ ≤ 𝑐1 |𝜃 = 1) + 𝑃(𝑋̅ ≥ 𝑐2 |𝜃 = 1) ≤ 0.08
𝑃(∑10 10
𝑖=1 𝑥𝑖 ≤ 10𝑐1 |𝜃 = 1) + 𝑃(∑𝑖=1 𝑥𝑖 ≥ 10𝑐2 |𝜃 = 1) ≤ 0.08
𝑃(∑10 10
𝑖=1 𝑥𝑖 ≤ 10𝑐1 |𝜃 = 1) + 1 − 𝑃(∑𝑖=1 𝑥𝑖 ≤ 10𝑐2 |𝜃 = 1) ≤ 0.08
10 10
𝑃(∑𝑖=1 𝑥𝑖 ≤ 10𝑐2 |𝜃 = 1) − 𝑃(∑𝑖=1 𝑥𝑖 ≤ 10𝑐1 |𝜃 = 1) ≥ 0.92
𝑃(∑10 10 −2
𝑖=1 𝑥𝑖 ≤ 10𝑐2 |𝜃 = 1) − 𝑃(∑𝑖=1 𝑥𝑖 ≤ 10𝑐1 |𝜃 = 1) = 0.95126 − 2.9253(10 ) = 0.92201
Así, una región de rechazo que satisface los requerimientos de que 𝛼 ≤ 0.08 es 𝑋̅ ≤ 0.4 o 𝑋̅ ≥
1.5.
Observación: Una prueba del tipo 𝐻0 : 𝜃 = 𝜃0 vs 𝐻1 : 𝜃 ≠ 𝜃0 es una muy usada en diversos campos
de la ciencia, Pero a veces, aún cuando el problema sugiera este tipo de prueba, una modificación
de ella puede ser más realista. Imaginemos por ejemplo que es la diferencia de las medias de
crecimiento entre dos variedades de maíz y que se quiere determinar si hay suficiente evidencia
para la conjetura: “las medias de crecimiento son diferentes”. Entonces una forma de plantear las
hipótesis nula y alternativa sería 𝐻0 : 𝜃 = 0 vs 𝐻1 : 𝜃 ≠ 𝜃0. Sin embargo, en esta situación y en
muchas otras donde puede variar a lo largo de un intervalo, es inconcebible que sea
exactamente igual a cero (esto es, que las variedades tengan idénticas medias de crecimiento). Un
planteamiento más realista sería seleccionar un intervalo para , y probar 𝐻0 : 𝜃1 ≤ 𝜃 ≤ 𝜃2 vs
𝐻1 : 𝜃 < 𝜃1 o 𝜃 > 𝜃2 . Construir una prueba uniformemente más potente para este tipo de hipótesis
̂ de
suele ser difícil o imposible, pero si 𝑓(𝑥; 𝜃) es una densidad con un solo parámetro, el EMV Θ
, puede ser usado para construirla, en cuyo caso la región de rechazo es Θ̂ ≤ 𝑐1 o Θ
̂ ≥ 𝑐2 .
a) 𝐻0 : 𝜇 ≤ 𝜇0 vs 𝐻1 : 𝜇 > 𝜇0 - 𝜎 2 conocido -
1 𝑥−𝜇 2
1 − ( ) 1 1
𝑓(𝑥; 𝜇) = 𝑒 2 𝜎 = 𝑒𝑥𝑝 [− 2𝜎2 (𝑥 2 − 2𝑥𝜇 + 𝜇2 )] =
√2𝜋𝜎 √2𝜋𝜎
1 𝜇 2 1 𝑥 2 𝜇
1 − ( ) − ( ) ( )𝑥
𝑒 2 𝜎 𝑒 2 𝜎 𝑒 𝜎
√2𝜋𝜎
Esto está en la forma 𝑎(𝜃)𝑏(𝑥)𝑒𝑥𝑝[𝑐(𝜇)𝑑(𝑥)]
Por el teorema, una prueba uniformemente más potente es la que rechaza 𝐻0 si y solo si
∑𝑛𝑖=1 𝑥𝑖 > 𝑘 ∗, donde 𝑘 ∗ es la solución de
Ahora,
∑𝑛
𝑖=1 𝑥𝑖 −𝑛𝜇0 𝑘 ∗ −𝑛𝜇0
𝑃𝜇0 ( > ) =𝛼
√𝑛𝜎 √𝑛𝜎
𝑘 ∗ −𝑛𝜇0
𝑃𝜇0 (𝑍 > ) =𝛼
√𝑛𝜎
𝑘 ∗ −𝑛𝜇0
1 − 𝑃𝜇0 (𝑍 ≤ ) =𝛼
√𝑛𝜎
𝑘 ∗ −𝑛𝜇0
𝑃𝜇0 (𝑍 ≤ ) =1−𝛼
√𝑛𝜎
𝑘 ∗ −𝑛𝜇0
= 𝑍𝛼
√𝑛𝜎
𝑘 ∗ = 𝑛𝜇0 + √𝑛𝜎𝑍𝛼
d) 𝐻0 : 𝜇 = 𝜇0 vs 𝐻1 : 𝜇 ≠ 𝜇0 - 𝜎 2 desconocido -
Usemos el principio de razón de verosimilitud:
1 𝑛⁄2 1
𝐿(𝜃; 𝑥1 , … , 𝑥𝑛 ) = (2𝜋𝜎2 ) 𝑒𝑥𝑝 [− 2𝜎2 ∑𝑛𝑖=1(𝑥𝑖 − 𝜇)2 ]
1 1
Ya sabemos que el EMV de 𝜎 2 es 𝑆12 = 𝑛 ∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2 y el de es 𝑛 ∑𝑛𝑖=1 𝑥𝑖 = 𝑥̅
𝑛⁄2
1 1
Sup 𝐿(𝜃; 𝑥1 , … , 𝑥𝑛 ) = ( 1 ) 𝑒𝑥𝑝 [− 1 ∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2 ]
2𝜋 ∑𝑛 (𝑥 −𝑥̅ )2 2( ) ∑𝑛
𝑖=1(𝑥𝑖 −𝑥̅ )
2
𝜃∈𝜃 𝑛 𝑖=1 𝑖 𝑛
𝑛⁄2
𝑛 𝑛
=( 𝑛 ) 𝑒𝑥𝑝 (− )
2𝜋 ∑𝑖=1(𝑥𝑖 − 𝑥̅ )2 2
Para hallar Sup 𝐿(𝜃; 𝑥1 , … , 𝑥𝑛 ) basta tomar 𝜇 = 𝜇0 y hallar 𝜎 2 que maximice 𝐿(𝜃):
𝜃∈𝜃
𝑛 1
𝑙𝑛𝐿(𝜎 2 ; 𝑥1 , … , 𝑥𝑛 ) = − 2 𝑙𝑛(2𝜋𝜎 2 ) − 2𝜎2 ∑𝑛𝑖=1(𝑥𝑖 − 𝜇0 )2
𝑛 1 1
= − 2 (𝜎2 ) + 2𝜎4 ∑𝑛𝑖=1(𝑥𝑖 − 𝜇0 )2 = 0
𝑛 1
− 2 + 2𝜎2 ∑𝑛𝑖=1(𝑥𝑖 − 𝜇0 )2 = 0
1
𝜎 2 = 𝑛 ∑𝑛𝑖=1(𝑥𝑖 − 𝜇0 )2
𝑛⁄2
1 1
Sup 𝐿(𝜃; 𝑥1 , … , 𝑥𝑛 ) = ( 1 ) 𝑒𝑥𝑝 [− 1 ∑𝑛𝑖=1(𝑥𝑖 − 𝜇0 )2 ]
2𝜋( ) ∑𝑛
𝑖=1(𝑥𝑖 −𝜇0 )
2 2( ) ∑𝑛
𝑖=1(𝑥𝑖 −𝜇0 )
2
𝜃∈𝜃 𝑛 𝑛
𝑛 ⁄2
𝑛 𝑛
= (2𝜋 ∑𝑛 (𝑥 −𝜇 ) 2 ) 𝑒𝑥𝑝 (− 2 )
𝑖=1 𝑖 0
𝑛⁄2
∑𝑛 (𝑥 −𝑥̅ )2
𝜆 = [∑𝑛𝑖=1(𝑥 𝑖−𝜇 2]
𝑖=1 𝑖 0)
𝑛⁄2
∑𝑛𝑖=1(𝑥𝑖 −𝑥̅ )
2
= [∑ 𝑛 (𝑥 −𝑥̅ + 𝑥̅ − 𝜇0 )2
]
𝑖=1 𝑖
𝑛⁄2
∑𝑛𝑖=1(𝑥𝑖 −𝑥̅ )
2
= [∑ 𝑛 2 2 ]
𝑖=1(𝑥𝑖 −𝑥̅ ) +𝑛(𝑥̅ −𝜇0 )
𝑛⁄2
1
=[ ̅−𝜇 )2
𝑛(𝑥 0
]
1+ 𝑛 2
∑𝑖=1(𝑥𝑖 −𝑥̅)
2
2
𝑛(𝑥̅ −𝜇0 )2 √𝑛(𝑥̅ −𝜇0 ) √𝑛(𝑥̅ −𝜇0 )
Sea 𝑡 2 = 2 = =[ ]
∑𝑛 ̅) 𝑆
𝑖=1(𝑥𝑖 −𝑥 𝑛 2
𝑛−1 √∑𝑖=1(𝑥𝑖 −𝑥̅)
[ 𝑛−1 ]
El estadístico de prueba es
𝑃(|𝑇| > 𝑘) = 𝛼
1 − 𝑃(|𝑇| < 𝑘) = 𝛼
𝑃(|𝑇| < 𝑘) = 1 − 𝛼
𝑃(−𝑘 < 𝑇 < 𝑘) = 1 − 𝛼
𝑃(𝑇 < 𝑘) − 𝑃(𝑇 ≥ 𝑘) = 1 − 𝛼
𝑃(𝑇 < 𝑘) − 1 + 𝑃(𝑇 < 𝑘) = 1 − 𝛼
2𝑃(𝑇 < 𝑘) = 2 − 𝛼
𝛼
𝑃(𝑇 < 𝑘) = 1 − 2
𝑥̅ −𝜇0
𝑘 = 𝑡𝛼⁄2,(𝑛−1) Por tanto se rechaza 𝐻0 si y solo si | | > 𝑡𝛼⁄2,(𝑛−1)
𝑆⁄√𝑛
c) 𝐻0 : 𝜇 = 𝜇0 vs 𝐻1 : 𝜇 ≠ 𝜇0 - 𝜎 2 conocido –
1 𝑛⁄2 1
𝐿(𝜇; 𝑥1 , … , 𝑥𝑛 ) = (2𝜋𝜎2 ) 𝑒𝑥𝑝 [− 2𝜎2 ∑𝑛𝑖=1(𝑥𝑖 − 𝜇)2 ]
𝑛 1
𝑙𝑛𝐿(𝜇; 𝑥1 , … , 𝑥𝑛 ) = − 𝑙𝑛(2𝜋𝜎 2 ) − ∑𝑛 (𝑥 − 𝜇)2
2 2𝜎 2 𝑖=1 𝑖
𝜕𝑙𝑛𝐿(𝜇;𝑥1 ,…,𝑥𝑛 ) 2 1
𝜕𝜇
= 2𝜎2 ∑𝑛𝑖=1(𝑥𝑖 − 𝜇) = 0 ∑𝑛𝑖=1 𝑥𝑖 − 𝑛𝜇 = 0 𝜇̂ = ∑𝑛𝑖=1 𝑥𝑖 = 𝑥̅
𝑛
1 𝑛⁄2 1
Sup 𝐿(𝜇; 𝑥1 , … , 𝑥𝑛 ) = (2𝜋𝜎2 ) [− 2𝜎2 ∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2 ]
𝜇∈𝜃
1 𝑛⁄2 1
Sup 𝐿(𝜇; 𝑥1 , … , 𝑥𝑛 ) = ( ) [− 2 ∑𝑛𝑖=1(𝑥𝑖 − 𝜇0 )2 ]
2𝜋𝜎 2 2𝜎
𝜇∈𝜃0
1
𝜆 = 𝑒𝑥𝑝 [− 2𝜎2 {∑𝑛𝑖=1(𝑥𝑖 − 𝜇0 )2 − ∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2 }]
1
𝜆 = 𝑒𝑥𝑝 [− 2𝜎2 𝑛(𝑥̅ − 𝜇0 )2 ]
1
Se rechaza 𝐻0 si 𝑒𝑥𝑝 [− 2𝜎2 𝑛(𝑥̅ − 𝜇0 )2 ] < 𝜆0
1
− 2𝜎2 𝑛(𝑥̅ − 𝜇0 )2 < 𝑙𝑛𝜆0 , 𝜆0 > 0
2𝜎 2 𝑙𝑛𝜆0
−(𝑥̅ − 𝜇0 )2 < 𝑛
2𝜎 2 𝑙𝑛𝜆0
(𝑥̅ − 𝜇0 )2 > −
𝑛
2𝜎 2 𝑙𝑛𝜆0
|𝑥̅ − 𝜇0 | > √−
𝑛
El estadístico es
2𝜎 2 𝑙𝑛𝜆0 𝑥̅ −𝜇 𝑥̅ −𝜇
|𝑥̅ − 𝜇0 | > √
𝑛
|𝜎⁄ 𝑛0 | > √2𝑙𝑛𝜆0 |𝜎⁄ 𝑛0 | > 𝑘
√ √
𝑃(|𝑍| > 𝑘) = 𝛼
𝑃(𝑍 > 𝑘 𝑜 𝑍 < −𝑘) = 𝛼
2𝑃(𝑍 > 𝑘) = 𝛼
2 − 2𝑃(𝑍 < 𝑘) = 𝛼
𝛼
𝑃(𝑍 < 𝑘) = 1 − 𝑘 = 𝑍𝛼⁄2
2
𝑥̅ −𝜇
Por tanto, se rechaza 𝐻0 si |𝜎⁄ 𝑛0 | > 𝑍𝛼⁄2
√
A partir de ahora, veremos las principales fórmulas de pruebas de hipótesis con un enfoque
más práctico. Hacemos la aclaración de que varias de ellas han sido ya abordadas con los
métodos arriba mencionados.
Se comenzará estudiando las pruebas de hipótesis para la media 𝜇 de una sola población sobre la
que se desea hacer inferencia. Los estadísticos a utilizar son: el estadístico 𝑧 y el estadístico 𝑡, ¿cuál
se empleará? Pues dependerá de si se conoce o desconoce 𝜎 y considerando ciertas características
de la muestra y la población.
Las hipótesis que pueden ser de interés al investigador respecto a la media 𝜇 son:
I 𝐻0 : 𝜇 = 𝜇0 𝑣𝑠 𝐻𝑎 : 𝜇 ≠ 𝜇0
II 𝐻0 : 𝜇 = 𝜇0 𝑣𝑠 𝐻𝑎 : 𝜇 > 𝜇0
III 𝐻0 : 𝜇 = 𝜇0 𝑣𝑠 𝐻𝑎 : 𝜇 < 𝜇0
Para las hipótesis establecidas aquí, es importante considerar que la prueba sólo es válida bajo
cualquiera de las siguientes condiciones:
Así, por la teoría de distribuciones muestrales, y considerando el error tipo I se tiene que el
estadístico de prueba adecuado es:
𝑦̅ − 𝜇0
𝑧= 𝜎
√𝑛
donde:
𝑦̅ es la media muestral con el tamaño de muestra 𝑛
𝜇0 es la media poblacional planteada en la hipótesis nula
𝜎 es la desviación estándar poblacional.
a) Para las hipótesis planteadas en I la región de rechazo está dada por los valores que
se obtienen de z y que cumplen |𝑧| > 𝑧𝛼⁄2
b) Para las hipótesis planteadas en II la región de rechazo está dada por los valores que
obtienen de z que cumplan 𝑧 > 𝑧𝛼
c) Para las hipótesis planteadas en III la región de rechazo está dada por los valores que
se obtienen de z que cumplan 𝑧 < −𝑧𝛼
Ejemplo
Un ingeniero establece que en promedio las mediciones del diámetro del tubo de albañil es mayor
que 30. Para comprobar que lo que establece el ingeniero efectivamente es lo correcto se toma
Solución
La hipótesis que se desea probar es:
𝐻0 : 𝜇 = 30 𝑣𝑠 𝐻𝑎 : 𝜇 > 30.
Este ejemplo es el caso ii) planteado en esta sección pues 𝜎 es desconocida pero el tamaño de
muestra 𝑛 = 100 es grande.
Y el valor crítico es z = 𝑧0.05 = 1.64. Ya que 𝑧 calculada cumple que 𝑧 > 𝑧0.05 = 1.64 entonces se
rechaza la hipótesis nula a favor de la hipótesis alternativa, esto es, se acepta la hipótesis que
plantea el ingeniero con un 95% de confianza.
Las hipótesis que pueden ser de interés al investigador respecto a la media 𝜇 son:
I 𝐻0 : 𝜇 = 𝜇0 𝑣𝑠 𝐻𝑎 : 𝜇 ≠ 𝜇0
II 𝐻0 : 𝜇 = 𝜇0 𝑣𝑠 𝐻𝑎 : 𝜇 > 𝜇0
III 𝐻0 : 𝜇 = 𝜇0 𝑣𝑠 𝐻𝑎 : 𝜇 < 𝜇0
Para las hipótesis establecidas es importante que la muestra aleatoria obtenida esté bajo cualquiera
de las siguientes condiciones:
Así, bajo cualquiera de estas condiciones que cumpla la muestra, se tiene por teoría de
distribuciones muestrales y considerando el error tipo I que, el estadístico de prueba adecuado para
cualquiera de las hipótesis planteadas es:
𝑦̅ − 𝜇0
𝑡= 𝑠
⁄ 𝑛
√
a) Para las hipótesis del caso I, la región de rechazo es válida para cada valor 𝑡 que
cumple: |𝑡| > 𝑡𝛼⁄2,𝑛−1
b) Para las hipótesis del caso II, la región de rechazo es válida para cada valor t que
cumple: 𝑡 > 𝑡𝛼,𝑛−1
c) Para las hipótesis del caso III, la región de rechazo es válida para cada valor 𝑡 que
cumple: 𝑡 < −𝑡𝛼,𝑛−1
Notas
1) En el caso i) no importa el tamaño de muestra, siempre será válido utilizar el
estadístico 𝑡.
2) En el caso ii) cuando el tamaño de muestra es grande, la distribución 𝑡 con 𝑛 − 1
grados de libertad se aproxima a la distribución normal estándar, por lo que podemos
utilizar el estadístico de prueba
𝑦̅ − 𝜇0
𝑧= 𝜎
⁄ 𝑛
√
Ejemplo
En una fábrica de materiales se fabrican unas varillas con una resistencia de 4500 kg/cm 2. Un
ingeniero sospecha que cierta maquinaria tiene fallas en la fabricación y asegura que la máquina
está fabricando varillas con resistencia diferente a 4500 kg/cm2, por lo propone un ajuste a dicha
maquinara. Con la finalidad de mostrar que la máquina está fallando, un día al azar se toma una
muestra aleatoria de 10 varillas de la producción, al probarlas a la tensión hasta la ruptura se
obtiene una resistencia media de 4200 kg./cm2, con una desviación estándar de 200 kg. /cm2.
Compruebe con un nivel de significancia de 0.05 si la máquina realmente necesita un ajuste.
Considere que la variable poblacional resistencia tiene distribución normal.
Solución
La muestra proviene de una población con distribución normal, se desconoce la desviación estándar
poblacional 𝜎, y además el tamaño de muestra es pequeño, por lo que se usará la distribución 𝑡 de
student para estimar el promedio poblacional, 𝜇 (si el tamaño de muestra fuese grande podría
usarse s como estimación para 𝜎 y usar el estadístico de prueba 𝑧, como se indica en la sección
anterior).
La región de rechazo está dada por |𝑡| > 𝑡𝛼/2,(𝑛−1). Entonces el valor del estadístico cae en la región
de rechazo, por tanto se rechaza la hipótesis nula y se concluye que los datos favorecen la hipótesis
planteada por el ingeniero, por lo que se sugiere que la maquinaria entre a revisión con un 95% de
confianza.
Las hipótesis que pueden ser de interés respecto a la proporción 𝑝 de una población 𝐵𝑒𝑟𝑛𝑜𝑢𝑙𝑙𝑖(𝑝)
son:
I 𝐻0 : 𝑝 = 𝑝0 𝑣𝑠 𝐻𝑎 : 𝑝 ≠ 𝑝0
II 𝐻0 : 𝑝 = 𝑝0 𝑣𝑠 𝐻𝑎 : 𝑝 > 𝑝0
III 𝐻0 : 𝑝 = 𝑝0 𝑣𝑠 𝐻𝑎 : 𝑝 < 𝑝0
Considerando el error tipo I, el estadístico de prueba adecuado para cualquiera de las hipótesis
respecto a 𝑝, planteadas es:
𝑝̂ − 𝑝0
𝑧=
𝑝 𝑞
√ 0 0
𝑛
la cual tiene aproximadamente una distribución normal estándar, justificada por el teorema del
límite central, debido a que el tamaño de la muestra es 𝑛 ≥ 30.
Considerando la distribución aproximada de 𝑧 es posible definir las regiones de rechazo para cada
hipótesis planteada, las cuales resultan ser:
a) Para las hipótesis del caso I, la región de rechazo es válida para los valores de 𝑧 que
cumplan |𝑧| > 𝑧𝛼⁄2
b) Para las hipótesis del caso II, la región de rechazo es válida para los valores de 𝑧 que
cumplan 𝑧 > 𝑧𝛼
Ejemplo
Un fabricante de insecticidas para moscas, desea comprobar que una nueva marca “Matamos K”
es mucho más efectivo que una determinada marca “X” que se encuentra en el mercado. La marca
X mata en promedio 800 de 1000 moscas. Para comprobar si la nueva marca es más efectiva, se
realiza un experimento en el cual, se colocan 1000 moscas en un cuarto y se usa el insecticida
“Matamos K” y resulta que sucumben 815. ¿De acuerdo a estos datos es estadísticamente más
efectiva esta nueva marca? Justifique con un 99% de confianza.
Solución
La hipótesis de interés a probar es: 𝐻0 : 𝑝 = 0.80 𝑣𝑠 𝐻𝑎 : 𝑝 > 0.80.
Se está en el caso de que la muestra es grande, por lo que el siguiente proceso tiene validez
𝑥 815
𝑝̂ = = = 0.815
𝑛 1000
Además se tiene que el valor crítico es 𝑧𝛼 = 𝑧0.01 = 2.33. Por lo tanto como el estadístico 𝑧 =
1.186 calculado es tal que 𝑧 < 𝑧0.01 = 2.33, es decir, el valor del estadístico 𝑧 no cae en la región
de rechazo, no es posible rechazar 𝐻0 a favor de la hipótesis alternativa.
Se concluye que no hay razón suficiente para decir que el nuevo insecticida es más eficiente que el
de la marca X, es decir, los datos no apoyan a la hipótesis del fabricante.
Para realizar la prueba de hipótesis para la varianza poblacional, 𝜎 2 sólo se abordará el caso más
común en el que la media poblacional 𝜇 es desconocida. Hay muchas situaciones prácticas donde
𝜎 2 es el objetivo principal de una investigación experimental; así, este parámetro puede asumir una
importancia mucho mayor que la de la media poblacional. Por ejemplo, los instrumentos de
medición científica deben producir valores insesgados con un error de medición muy pequeño; el
altímetro de una aeronave que mide en promedio la altitud correcta sería de poco valor si la
desviación estándar del error de medición fuese 2000 metros; los repuestos que se producen en un
proceso industrial deben tener un mínimo de variabilidad con el objeto de reducir el número de
productos cuyo tamaño esté fuera de número de productos defectuosos. Además, en general es
deseable mantener una varianza mínima en las mediciones para conseguir el control de
determinados proceso y por lo tanto minimizar el porcentaje de productos de poca calidad.
Es importante hacer énfasis de que bajo la condición de que la muestra obtenida es de una
distribución normal, se tiene, por la teoría de distribuciones muestrales y considerando el error tipo
I que el estadístico de prueba adecuado para cualquiera de las hipótesis establecidas para 𝜎 2 es:
(𝑛 − 1)𝑠 2
𝜒2 =
𝜎02
La cual tiene una distribución Chi- cuadrada con 𝑛 − 1 grados de libertad y donde
A partir de esta distribución correspondiente al estadístico de prueba, es posible definir las regiones
de rechazo para cada hipótesis planteada:
a) Para las hipótesis del caso I, la región de rechazo está formada por los valores de 𝜒 2
que cumplen que 𝜒 2 > 𝜒𝛼2,𝑛−1 o 𝜒 2 < 𝜒1− 2
𝛼
,𝑛−1
2 2
b) Para las hipótesis del caso II, la región de rechazo está formada por los valores de 𝜒 2
2
que cumplen que: 𝜒 2 > 𝜒𝛼,𝑛−1
c) Para las hipótesis del caso III, la región de rechazo está formada por los valores de
2
𝜒 2 que cumplen que: 𝜒 2 < 𝜒1−𝛼,𝑛−1
Ejemplo
Un experimentador está convencido de que su equipo de medición tiene una variabilidad medida
por una desviación estándar de = 2. Durante un experimento, obtuvo las observaciones 4.1, 5.2,
10.2. ¿Están en desacuerdo estos datos con su posición? Si esta respuesta es afirmativa, es
necesaria la revisión del equipo. Responda con un nivel de significancia de = 0.1. Supóngase que
los datos de medición tienen una distribución normal.
Solución
La hipótesis que se desea probar es:
𝐻0 : 𝜎 = 2 𝑣𝑠 𝐻𝑎 : 𝜎 ≠ 2
que es equivalente a
𝐻0 : 𝜎 2 = 4 𝑣𝑠 𝐻𝑎 : 𝜎 2 ≠ 4
El estadístico de prueba es
Los valores críticos obtenidos de la tabla de la distribución Ji-cuadrada son 𝜒𝛼2,𝑛−1 = 𝜒0.05,2
2
= 5.99
2
2 2
y 𝜒1− 𝛼
,𝑛−1
= 𝜒0.95,2 = 0.103, por lo que el valor del estadístico de prueba no cae en la región de
2
rechazo, no se puede rechazar la hipótesis nula a favor de la hipótesis alternativa. Como
consecuencia no hay razón suficiente para dar una revisión al equipo con 90% de confianza.
Supóngase que se tienen dos muestras aleatorias: 𝑋1 , … , 𝑋𝑛𝑋 y 𝑌1 , … , 𝑌𝑛𝑌 . Las pruebas de hipótesis
aquí planteadas se establecen bajo cualquiera de las siguientes condiciones.
i) Las poblaciones de donde son extraídas las muestras tienen distribución normal
o aproximadamente normal y entre las muestras hay independencia.
ii) Las distribuciones poblacionales de donde son extraídas las muestras son
desconocidas pero los tamaños de las muestras son mayores o iguales a 30 y entre
las muestras hay independencia.
El valor 𝐷0 se refiere a la posible diferencia entre las medias poblacionales. Cuando en el estudio
se desea probar si los promedios poblacionales son diferentes, entonces se considera 𝐷0 = 0 y los
planteamientos de las hipótesis se reducen a cualquiera de las dos formas siguientes que se
presentan a manera de ejemplo:
𝐻0 : 𝜇𝑋 − 𝜇𝑌 = 0 𝑣𝑠 𝐻𝑎 : 𝜇𝑋 − 𝜇𝑌 ≠ 0
ó
𝐻0 : 𝜇𝑋 = 𝜇𝑌 𝑣𝑠 𝐻𝑎 : 𝜇𝑋 ≠ 𝜇𝑌
Ejemplo
Se desea analizar el peso de las varillas fabricadas por dos compañías, por tanto se toman muestras
aleatorias de 100 varillas de acero que se fabrican en cada una de las compañías A y B. De la muestra
de la compañía A se obtiene un peso medio de 6.5 kg., asimismo, la muestra de la compañía B indica
un peso medio de 6.3 kg. Considerando que las desviaciones estándar poblacionales de cada
compañía son respectivamente 𝜎𝐴 = 0.4 kg. y 𝜎𝐵 = 0.3 kg. Se puede concluir que alguna de las
compañías fabrica las varillas con mayor peso? Responda estadísticamente con un 99% de
confianza.
Solución
Se desea probar la hipótesis:
𝐻0 : 𝜇𝐴 = 𝜇𝐵 𝑣𝑠 𝐻𝑎 : 𝜇𝐴 ≠ 𝜇𝐵
El valor crítico es 𝑧𝛼/2 = 𝑧0.005 = 2.58 y como el valor del estadístico de prueba es tal que |𝑧| >
𝑧0.005 = 2.58, se rechaza la hipótesis nula a favor de la alternativa con una confianza del 99%, es
decir, los datos apoyan que efectivamente una de las fábricas produce varillas con mayor peso.
Supóngase que se tienen dos muestras aleatorias X1 , … , X nX y Y1 , … , YnY y se cumple alguna de las
siguientes condiciones:
i) Las poblaciones de las cuales se extraen las muestras tienen distribución normal o
aproximadamente normal y entre las dos muestras hay independencia.
ii) Las distribuciones poblacionales de donde son extraídas las muestras son desconocidas pero los
tamaños de las muestras son mayores o iguales a 30 y entre las dos muestras hay independencia.
Caso 1: 𝜎𝑋 = 𝜎𝑌
En este caso, los posibles planteamientos de las hipótesis con sus correspondientes estadísticas de
prueba y regiones de rechazo utilizando la distribución 𝑡 de student, se presentan en el siguiente
cuadro.
𝑣 = 𝑛 𝑥 + 𝑛𝑦 − 2
𝜇𝑋 − 𝜇𝑌 = 𝐷0 𝜇𝑋 − 𝜇𝑌 < 𝐷0 (𝑛𝑥 −1)𝑆𝑥2 +(𝑛𝑌 −1)𝑆𝑦2 𝑡 < −𝑡𝛼,𝑣
𝑆𝑝2 = 𝑛𝑥 +𝑛𝑦 −2
Ejemplo
Se llevó a cabo un experimento para comparar el deterioro abrasivo de dos materiales laminados
diferentes. Se probaron doce piezas del material 1, exponiendo cada una a una máquina para medir
el deterioro. De la misma manera, se probaron diez piezas del material 2. En cada caso, se observó
Solución
Si 𝜇1 y 𝜇2 representan las medias poblacionales de los deterioros abrasivos para el material 1 y 2
respectivamente, entonces se tienen las hipótesis siguientes:
𝐻0 : 𝜇1 − 𝜇2 = 2
𝐻𝑎 : 𝜇1 − 𝜇2 > 2
𝑥̅1 = 85 𝑆1 = 4 𝑛1 = 12
𝑥̅2 = 81 𝑆2 = 5 𝑛2 = 10
0.45
0 1.04 1.725 t
La medida estadística de prueba 1.04 es menor que el valor crítico 1.725 por lo que cae en la región
de aceptación y se acepta la hipótesis nula.
Decisión: No se está en condiciones de concluir que el deterioro abrasivo del material 1 excede al
del material 2 por más de dos unidades, la muestra no aporta evidencia para esta conclusión.
Ejemplo
Se deben eliminar gases ácidos de otros gases de refinería en una instalación de productos
químicos, esto para reducir al mínimo la corrosión de las plantas. Dos métodos para eliminar estos
gases produjeron el ritmo de corrosión (mm./año), medidas que se representan a continuación:
Solución
Se desea probar la hipótesis:
𝐻0 : 𝜇𝐴 = 𝜇𝐵 𝑣𝑠 𝐻𝑎 : 𝜇𝐴 < 𝜇𝐵
Equivalente a:
𝐻0 : 𝜇𝐴 − 𝜇𝐵 = 0 𝑣𝑠 𝐻𝑎 : 𝜇𝐴 − 𝜇𝐵 < 0
Para poder utilizar el estadístico de prueba descrito previamente es necesario realizar los siguientes
supuestos:
• Las muestras aleatorias provienen de poblaciones con distribución normal y son
independientes.
• Las poblaciones tienen desviaciones estándar iguales, o sea 𝜎𝐴 = 𝜎𝐵 .
Como 𝛼 = 0.10, el valor crítico es −𝑡𝛼,𝑛𝐴 +𝑛𝐵 −2 = −𝑡0.1,13 = −1.35. Como la estadística de prueba
es tal que 𝑇 < −𝑡0.1,13 entonces se rechaza 𝐻0 , es decir, los datos presentan evidencia para concluir
que el método A tiene una media en el ritmo de corrosión más baja que el método B.
Caso 2: 𝝈𝑨 ≠ 𝝈𝑩
En este caso, los posibles planteamientos de las hipótesis con sus correspondientes estadísticas de
prueba y regiones de rechazo utilizando la distribución t de student, se presentan en el siguiente
cuadro.
Ejemplo
Un fabricante de unidades reproductoras de video está probando el diseño de dos microcircuitos
para determinar si producen un flujo de corriente medio equivalente. El departamento de
ingeniería de desarrollo ha obtenido los siguientes datos:
Se desea determinar si hay alguna diferencia en el flujo de corriente medio entre los dos diseños,
donde se supone que las poblaciones tienen distribución normal, pero no se desea suponer que las
varianzas son iguales. Utiliza un nivel de significancia de 0.1 para dar respuesta a esta hipótesis.
Solución
La hipótesis de interés a probar es:
𝐻0 : 𝜇𝑥 = 𝜇𝑦 𝑣𝑠 𝐻𝑎 : 𝜇𝑥 ≠ 𝜇𝑦
Ya que se considera que los datos de las muestras provienen de distribuciones normales, además
las varianzas son desconocidas y diferentes, el estadístico de prueba adecuado a emplear es:
2 2
𝑆 2 𝑆𝑦 10 20 2
(𝑛𝑥 + 𝑛 ) ( + 10)
𝑥 𝑦 7.111
𝑣= 2 = 152 2 = = 14.93
(𝑆𝑥2 ⁄𝑛𝑥 )2 (𝑆𝑦2 ⁄𝑛𝑦 ) 10 20 0.032 + 0.444
( ) ( )
𝑛𝑥 − 1 + 𝑛𝑦 − 1 15 + 10
14 9
El valor crítico es 𝑡𝛼,𝜈 = 𝑡0.05,15 = 1.753 y como el estadístico de prueba es tal que |𝑡| < 𝑡𝛼/2,𝜈 se
2
concluye que no se rechaza 𝐻0 por lo que los datos no proporcionan evidencia suficiente para
concluir que existe diferencia entre las medias.
Una vez presentada la condición i) se abordará a continuación la condición ii) que tiene las
siguientes características:
• Las distribuciones poblacionales son desconocidas
• Las desviaciones estándar 𝜎𝑥 y 𝜎𝑌 son desconocidas
• Los tamaños de las muestras son mayores o iguales a 30 y,
Como las desviaciones estándar son desconocidas se estiman con las desviaciones muestrales
𝑆𝑋 𝑦 𝑆𝑌 por ser estos estimadores consistentes de sus desviaciones estándar poblacionales
respectivas. Por ello pueden ser tratadas como desviaciones estándar poblacionales conocidas, lo
que permite utilizar la estadística de prueba y regiones de rechazo presentadas en la tabla
siguiente:
Esta tabla es exactamente la misma que la empleada en el caso cuando las muestras provienen de
distribuciones normales y sus desviaciones estándares son conocidas.
Cuando se tienen dos poblaciones en las cuales el interés radica en comparar las proporciones, al
igual que como se hizo con la diferencia de medias poblacionales, se realiza considerado un
estimador insesgado para la diferencia de proporciones 𝑝1 − 𝑝2 y este estimador es 𝑝̂1 − 𝑝̂ 2 , con
𝑥 𝑥
𝑝̂1 = 1 y 𝑝̂2 = 2 , donde 𝑥1 es el número de éxitos obtenido del tamaño de muestra 𝑛1 de una
𝑛1 𝑛2
población con distribución 𝐵𝑒𝑟𝑛𝑜𝑢𝑙𝑙𝑖(𝑝1 ) y 𝑥2 es el número de éxitos obtenido del tamaño de
muestra 𝑛2 de una población con distribución 𝐵𝑒𝑟𝑛𝑜𝑢𝑙𝑙𝑖(𝑝2 ).
En el siguiente cuadro se presentan los posibles planteamientos de las hipótesis nula y alterna, la
medida estadística de prueba utilizando la distribución normal estándar, así como, las regiones de
rechazo correspondientes.
Solución
Sean 𝑝1 y 𝑝2 proporciones poblacionales del proceso original y del nuevo respectivamente,
entonces se desea probar la hipótesis:
𝐻0 : 𝑝1 = 𝑝2 𝑣𝑠 𝐻𝑎 : 𝑝1 > 𝑝2
𝑥1 = 12 𝑥2 = 6 𝑛1 = 200 𝑛2 = 150
12 6
𝑝̂1 = = 0.06 y 𝑝̂2 = = 0.04
200 150
y además
𝑥1 + 𝑥2 12 + 6
𝑝̂ = = = 0.05143
𝑛1 + 𝑛2 200 + 150
El valor crítico es 𝑧𝛼 = 𝑧0.05 = 1.64 y como el valor del estadístico es tal que 𝑧 < 𝑧𝛼 = 1.64
entonces la hipótesis nula no puede ser rechazada, es decir, los datos no presentan evidencia para
concluir que los cambios efectuados al proceso ayudan a disminuir el porcentaje de defectuosos
con una confianza del 95%.
Prueba de hipótesis para la igualdad de varianzas 𝝈𝟐𝒙 = 𝝈𝟐𝒚 , poblaciones con distribución normal.
Cuando nuestro objetivo es el de comparar las medias de dos poblaciones con distribución normal,
el parámetro que se estudia es la diferencia de medias, ahora, si el objetivo es el de comparar las
variabilidad de las poblaciones, el parámetro que se estudia es el cociente de varianzas, 𝜎𝑥2 ⁄𝜎𝑦2 , la
𝑠𝑥2 𝜎𝑦2
justificación es que en distribuciones muestrales se comprueba que el estadístico 𝑠𝑦2 𝜎𝑥2
tiene una
distribución 𝐹𝑛𝑥 −1,𝑛𝑦 −1 (𝑛𝑥 tamaño de muestra de 𝑋 y 𝑛𝑦 tamaño de muestra de 𝑌); en particular
En el siguiente cuadro se presentan los posibles planteamientos de las hipótesis con sus
correspondientes estadísticas de prueba y regiones de rechazo utilizando la distribución de Fisher.
La notación 𝑓𝛼 (𝜈1 , 𝜈2 ) indica que se debe considerar el valor crítico de la tabla F-Fisher con 𝜈1
grados de libertad en el numerador, 𝜈2 grados de libertad en el denominador y con un nivel de
significancia 𝛼.
En las siguientes gráficas se presentan los diferentes casos de pruebas de hipótesis de una cola y
de dos colas, así como las fórmulas para calcular los valores críticos; también se muestran las
regiones de rechazo identificadas como la parte sombreada. En el caso de pruebas de hipótesis de
una cola, ya sea a la izquierda o a la derecha, el nivel de significancia es el valor de α mientras que
cuando la prueba de hipótesis es de dos colas el nivel de significancia es 𝛼/2.
f
Ejemplo
Un médico asegura que la variabilidad entre el peso de las niñas (𝑋) y los niños (𝑌) es diferente.
Para comprobar estadísticamente dicha afirmación se realiza el experimento de seleccionar dos
muestras, una de 10 niñas y otra de 8 niños, de los cuales se tuvieron varianzas de 𝑠𝑥2 = 2.1 y 𝑠𝑦2 =
3.21, respectivamente. ¿Presentan las varianzas muestrales suficiente evidencia que indique que
la afirmación del médico es cierta? Compruebe con un nivel de significancia de 0.1
Solución
Se desea probar la hipótesis
Supóngase que las poblaciones tienen distribuciones que son razonablemente monticulares y que
por lo tanto satisfacen la suposición de que las poblaciones son normales, dado esto el siguiente
proceso es válido, estadísticamente.
El estadístico de prueba es
𝑆𝑥2 2.1
𝑓= 2 = = 0.6542
𝑆𝑦 3.21
Se sabe que la región de rechazo es para cualquier valor 𝑓 que cumple cualquiera de los siguientes
−1
casos: 𝑓 > 𝑓𝛼,𝑛 o 𝑓 < (𝑓𝛼,𝑛 −1 ) .
2 𝑥 −1,𝑛𝑦 −1 2 𝑦 −1,𝑛𝑥
Se tiene que:
𝑓𝛼,𝑛 = 𝑓0.05,9,7 = 3.68
2 𝑥 −1,𝑛𝑦 −1
−1
−1
(𝑓𝛼,𝑛 ) = (𝑓0.05,7,9 ) = (3.29)−1 = 0.3039.
2 𝑦 −1,𝑛𝑥 −1
Como el estadístico f no cumple con ninguna de las condiciones entonces no pertenece a la región
de rechazo. Como consecuencia no hay suficiente evidencia para concluir que la variación en pesos
entre los niños difiera con respecto a la variación en el peso entre las niñas con 90% de confianza.
Los datos no apoyan a la hipótesis que plantea el médico.