0% encontró este documento útil (0 votos)
72 vistas30 páginas

U5. Notas de Curso

Este documento presenta los conceptos fundamentales de las pruebas de hipótesis estadísticas. Explica que el objetivo de una prueba de hipótesis es determinar si una conjetura sobre una población está sustentada por los datos de una muestra. Siempre hay dos hipótesis en juego: la hipótesis nula (H0) y la hipótesis alternativa (H1). La H0 se plantea para ser rechazada si los datos la contradicen fuertemente. Un error es rechazar incorrectamente la H0, mientras que el
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
72 vistas30 páginas

U5. Notas de Curso

Este documento presenta los conceptos fundamentales de las pruebas de hipótesis estadísticas. Explica que el objetivo de una prueba de hipótesis es determinar si una conjetura sobre una población está sustentada por los datos de una muestra. Siempre hay dos hipótesis en juego: la hipótesis nula (H0) y la hipótesis alternativa (H1). La H0 se plantea para ser rechazada si los datos la contradicen fuertemente. Un error es rechazar incorrectamente la H0, mientras que el
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

UNIDAD V.

PRUEBAS DE HIPÓTESIS
COMPETENCIA: Interpreta problemas prácticos del área de enseñanza y de otras áreas del
conocimiento, con base en los resultados obtenidos en una prueba de hipótesis para uno o dos
parámetros.

La meta de una prueba de hipótesis:


Determinar si una conjetura acerca de alguna característica de una población está fuertemente
soportada por los datos de la muestra.
Esta conjetura típicamente es una aseveración acerca del valor de un parámetro de la población.

Hipótesis estadística:
Cualquier aseveración acerca de la población es una hipótesis estadística.

En una prueba de hipótesis, ¿para qué queremos saber si una cierta conjetura acerca de la
población está o no sustentada por los datos? Para mantenerla o descartarla.

Toda prueba de hipótesis conduce a decidir entre dos hipótesis posibles:


Hipótesis 𝐻0 : la aseveración es falsa
Hipótesis 𝐻1 : la aseveración es correcta

Esta decisión la tomamos usando las observaciones de la muestra y el esquema general del proceso
es el siguiente: nos situamos en una de las hipótesis (ejemplo 𝐻0 ) y desarrollamos un proceso que
nos conduzca a decidir si la rechazamos o no.
Si rechazamos 𝐻0 , concluimos que 𝐻1 está fuertemente sustentada por los datos.
Si no rechazamos H0, concluimos que 𝐻1 no está fuertemente sustentada por los datos.

El proceso mediante el cual se decide entre una de estas acciones es lo que se llama “prueba de
hipótesis estadística”.
Una prueba de hipótesis no es ni remotamente una prueba matemática. Cuando se prueba una
proposición matemática (su verdad o falsedad) la conclusión se establece más allá de cualquier
duda razonable. En contraste, en una prueba de hipótesis siempre habrá un elemento de
incertidumbre en la conclusión alcanzada a través del análisis de los datos.

Ejemplo:
Hipótesis estadística: La proporción de consumidores que entre dos cereales 𝐴 y 𝐵, prefieren
el 𝐴 es de 40%.
Resultado de la En una muestra de 15 consumidores se halló que 12 prefirieron 𝐴 a 𝐵.
investigación:
Conclusión típica: Es poco probable que la hipótesis estadística sea verdadera: Si 𝑝 = 0.4
y 𝑛 = 15, 𝑋 = número de consumidores que prefirió 𝐴, entonces
𝑃(𝑋 ≥ 12) = 0.002 (muy pequeño).

Sin embargo, como físicamente es posible tener esta observación cuando 𝑝 = 0.4, no podemos
estar absolutamente seguros de que la hipótesis es falsa.

Empezaremos ahora a hacer un desarrollo formal del proceso para conducir e ir ilustrando.
Ubiquémonos en un problema específico:
La experiencia ha demostrado que la tasa de curación de una cierta enfermedad usando un
medicamento estándar es de 60%. La tasa de curación de una nueva droga se anticipa que es mejor

Prof. Felipe R. Tuz Poot 118


que la del medicamento estándar. Supongamos que se prueba la nueva droga en una muestra de
20 pacientes y que se registra el número 𝑋 de pacientes curados. ¿Cómo podemos a partir de los
datos experimentales responder a la pregunta: Hay evidencia de que la nueva droga tiene más alta
tasa de curación que el medicamento estándar?

LAS HIPÓTESIS NULA Y ALTERNATIVA


Analicemos lo siguiente:
• La población son los pacientes con la enfermedad.
• La aseveración acerca de la población es que: la proporción 𝑝 de pacientes que se curan
con la nueva droga es superior al que se cura con el medicamento estándar.
• Bajo muestras de tamaño 20, 𝑋 es una v.a. y si consideramos independencia entre los
pacientes, 𝑋~𝐵𝑖𝑛(20, 𝑝) donde 𝑝 = tasa de curación con la nueva droga, 𝑝 es un
parámetro desconocido de la población.
• Lo establecido para la población en términos del parámetro 𝑝 y escribiéndolo en términos
de las hipótesis entre las que hay que escoger es:
“La nueva droga es mejor que el medicamento estándar: 𝑝 > 0.6”
“La nueva droga no es mejor que el medicamento estándar: 𝑝 ≤ 0.6”
De estos dos enunciados complementarios, uno es denominado hipótesis nula (𝐻0 ) y el otro es
denominado hipótesis alternativa (𝐻1 o 𝐻𝑎 ).
¿Cómo se determina quién es quién?
Los roles que cada uno juega y las implicaciones de estos términos deben ser entendidos
claramente. Por lo general la regla es: “para probar una aseveración con base en un sustancial
soporte por parte de los datos, la negación de la aseveración será tomada la hipótesis nula 𝐻0 y la
aseveración misma como la hipótesis alternativa 𝐻1 ”.
La palabra hipótesis nula proviene de que bajo esa hipótesis se nulifica a la aseveración que sobre
la población se establece.
Así pues, decimos que la hipótesis nula se plantea con el expreso objetivo de ser rechazada.
¿Por qué de este modo se separan las hipótesis?
Porque antes de anunciar que un enunciado es válido tenemos que mostrar suficiente evidencia de
que así es. Consecuentemente el analista debe considerar que el enunciado es falso a menos que
lo contrario sea fuertemente sustentado por los datos. En otras palabras:
“La hipótesis nula será considerada verdadera y solo será rechazada cuando los datos testifiquen
fuertemente en su contra.
Es como un juicio en la corte: al inicio la hipótesis nula del jurado es que el individuo “no es culpable”
y solo se rechaza si hay suficiente evidencia en contra.
Estos comentarios indican que los roles asumidos por 𝐻0 y 𝐻1 no son simétricos.
Ahora, como ya se dijo, en la conclusión de una prueba de hipótesis hay un margen de
incertidumbre, lo cual puede también ser visto como un margen de error:
Podría ser que rechacemos falsamente a 𝐻0 o
Podría ser que no rechacemos falsamente a 𝐻0
¿Qué es peor?
Pensemos de nuevo en un juicio. ¿Qué es peor?
a) Rechazar inocencia cuando se es inocente, o
b) No rechazar inocencia cuando no se es inocente
Obviamente a) es peor.

En una prueba de hipótesis de 𝐻0 vs 𝐻1 , rechazar falsamente 𝐻0 es visto como un error más serio
que el de fallar en rechazar 𝐻0 cuando 𝐻1 es verdadero.
Apliquémoslo al ejemplo de las drogas para avanzar un poco más en el análisis:
𝐻0 : 𝑝 ≤ 0.6 (La nueva droga no es mejor)
𝐻1 : 𝑝 > 0.6 (La nueva droga es mejor)

Prof. Felipe R. Tuz Poot 119


¿Cuándo vamos a rechazar 𝐻0 ?
Tenemos una muestra de tamaño 20, 𝑋 puede tomar cualquier valor entre 0 y 20. En la realidad,
cualquiera de esos valores es posible que ocurra así que ninguno de ellos puede probar de manera
absoluta que 𝐻0 es verdadero o que 𝐻1 es verdadero. Sin embargo, la intuición sugiere que valores
grandes de 𝑋 podrían ser una fuerte indicación de que 𝐻0 puede ser falso, mientras que valores
pequeños de 𝑋 sustentan más bien a 𝐻0 .
¿Pero qué tan grande debe ser 𝑋 para rechazar 𝐻0 ?
Eso podemos especificarlo nosotros de acuerdo a nuestro criterio, y también desarrollaremos
procedimientos para determinar qué tan grande debe ser dependiendo del “nivel de confianza”
que deseemos para la prueba. Por ejemplo, podríamos decidir rechazar 𝐻0 si 𝑋 ≥ 15 retenerlo si
𝑋 < 15. En el contexto de la prueba, a 𝑋 se le llama estadístico de prueba.
Un poco más adelante construiremos estadísticos de prueba. El conjunto de valores de 𝑋 para el
cual 𝐻0 es rechazado es llamado “región de rechazo”. Una prueba queda completamente
especificada por un estadístico de prueba y una región de rechazo.

LOS DOS TIPOS DE ERROR Y LA FUNCIÓN POTENCIA


Veremos aquí con más cuidado el tema de los errores de decisión y de la región de rechazo.

Errores
Al aplicar una prueba de hipótesis, necesariamente se da una de las siguientes situaciones:

Decisión
Hipótesis verdadera No rechazar 𝐻0 Rechazar 𝐻0
𝐻0 Decisión correcta Error tipo I
𝐻1 Error tipo II Decisión correcta

Ya hemos comentado que el error tipo I es más serio que el error tipo II. Entonces en una prueba
de hipótesis tenemos que intentar minimizar la probabilidad de cometer el error tipo I. En un juicio,
el error tipo I no se puede cuantificar, en una prueba estadística se cuantifica con un concepto
llamado nivel de significancia y lo denotamos por
 = 𝑃(𝑐𝑜𝑚𝑒𝑡𝑒𝑟 𝑒𝑙 𝑒𝑟𝑟𝑜𝑟 𝑡𝑖𝑝𝑜 𝐼)
= 𝑃(𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝐻0 𝑐𝑢𝑎𝑛𝑑𝑜 𝐻0 𝑒𝑠 𝑣𝑒𝑟𝑑𝑎𝑑𝑒𝑟𝑎)

La probabilidad de cometer el error tipo II se denota por


 = 𝑃(𝑐𝑜𝑚𝑒𝑡𝑒𝑟 𝑒𝑙 𝑒𝑟𝑟𝑜𝑟 𝑡𝑖𝑝𝑜 𝐼𝐼)
= 𝑃(𝑛𝑜 𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝐻0 𝑐𝑢𝑎𝑛𝑑𝑜 𝐻1 𝑒𝑠 𝑣𝑒𝑟𝑑𝑎𝑑𝑒𝑟𝑎)

Pero, lo ideal sería hacer ambos tipos de error arbitrariamente pequeños, digamos  = 0.00001 y
 = 0.0000000001. Observemos que si uno disminuye, el otro crece, veamos un ejemplo usando
el contexto legal:
Juez No. 1: rechaza inocencia si y solo si existe un videotape que muestra al acusado cometiendo el
crimen. Entonces para este juez P(rechazar inocencia cuando en efecto el individuo es inocente)
resulta ser muy pequeño. Difícilmente siendo inocente existirá un videotape que nos muestre al
acusado cometiendo el crimen. Pero P(no rechazar inocencia cuando 𝐻1 es verdadero) = P(no
rechazar inocencia cuando el individuo no es inocente) es muy grande porque hay muchos crímenes
que no son capturados en un videotape.
Juez No. 2: Rechaza inocencia si y solo si no existe coartada (testigo que diga que el acusado no
estuvo presente en la escena del crimen). Para este juez, P(rechazar inocencia cuando el individuo
es inocente) es grande porque muchos inocentes no podrán tener una coartada (error tipo I,

Prof. Felipe R. Tuz Poot 120


¡ALTO!). P(error tipo II) = P(no rechazar inocencia dado que el individuo es culpable) ya que
difícilmente quien cometió el crimen tenga coartada.

MORALEJA. No es posible hacer arbitrariamente pequeños ambos tipos de error. Por lo tanto se
adopta la siguiente filosofía de operación:
a) Fijar  a priori
b) Minimizar 
El usuario estipula entonces , la probabilidad del peor de ambos tipos de error, y una vez
controlado éste, procede a buscar una prueba que minimice .

Nota (otra razón para descartar simetría en una prueba de hipótesis). De acuerdo con lo antes
expuesto, el intercambio de roles de 𝐻0 y 𝐻1 no da lugar a una situación simétrica: cuando tenemos
𝐻0 vs 𝐻1 , fijamos  = 𝑃(𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝐻0 𝑑𝑎𝑑𝑜 𝑞𝑢𝑒 𝐻0 𝑒𝑠 𝑣𝑒𝑟𝑑𝑎𝑑𝑒𝑟𝑎) = 𝑃(𝑒𝑟𝑟𝑜𝑟 𝑡𝑖𝑝𝑜 𝐼). Si
invertimos los papeles, 𝐻1 vs 𝐻0 , fijamos
𝑃(𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝐻1 𝑑𝑎𝑑𝑜 𝑞𝑢𝑒 𝐻1 𝑒𝑠 𝑣𝑒𝑟𝑑𝑎𝑑𝑒𝑟𝑎) =
𝑃(𝑛𝑜 𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝐻0 𝑑𝑎𝑑𝑜 𝑞𝑢𝑒 𝐻1 𝑒𝑠 𝑣𝑒𝑟𝑑𝑎𝑑𝑒𝑟𝑎) = 𝑃(𝑒𝑟𝑟𝑜𝑟 𝑡𝑖𝑝𝑜 𝐼𝐼).

Las conclusiones de una prueba de hipótesis


Una vez que entre todas las pruebas que satisfacen nuestra restricción acerca del error tipo I,
escogemos la que tiene como región de rechazo 𝑋 ≥ 16,  = 0.05, supongamos que para la
muestra dada, el valor de 𝑋 es 𝑥 = 18 (18 de los 20 fueron curados). Entonces el experimentador
rechaza la hipótesis nula con un nivel de significancia de aproximadamente 5.1% y concluye que
hay evidencia sustancial de que la nueva droga es mejor que la medicina estándar.
Si por otro lado, se observa que 𝑥 = 14, 𝐻0 no se rechaza a un nivel de significancia de 5.1% y el
experimentador concluye que los datos no proporcionan suficiente evidencia de que la nueva droga
es mejor que la medicina estándar.
Nótese que en cualquiera de las situaciones hay un elemento de vaguedad en la conclusión. En
particular, la retención de 𝐻0 debe ser interpretada únicamente como una carencia de evidencia
para rechazarla. No significa que hay suficiente evidencia que la sostenga. Por lo tanto, más que
decir que 𝐻0 es aceptada, una forma más apropiada de decirlo es que “𝐻0 no es rechazada”.

De nuevo considerando región de rechazo 𝑋 ≥ 16 con  = 0.051 notemos que si el valor


observado de la muestra es 𝑥 = 16, esto conduce al rechazo de 𝐻0 al igual que cuando 𝑥 = 19.
Aparentemente sin embargo, 𝑥 = 19 constituye una evidencia más fuerte a favor de 𝐻1 que 𝑥 =
16. Para distinguir estas dos situaciones introduciremos un nuevo concepto. Veamos:
• Si 𝑥 = 19, las pruebas con regiones de rechazo 𝑋 ≥ 19, 𝑋 ≥ 18, 𝑋 ≥ 17,… también
conducen a un rechazo de 𝐻0 . Sus correspondientes valores de significancia son
0.001, 0.004, 0.016, … esto es, si el valor observado es 𝑥 = 19, podemos rechazar 𝐻0 hasta
con un nivel de significancia de  = 0.001 en tanto que,
Si 𝑥 = 18 la mínima  a la que podemos rechazar 𝐻0 es 0.004
Si 𝑥 = 17 la mínima  a la que podemos rechazar 𝐻0 es 0.016

Definición. Al más pequeño valor de  que permite el rechazo de 𝐻0 sobre la base del valor
observado para el estadístico , se le llama 𝑝 − 𝑣𝑎𝑙𝑜𝑟 o probabilidad de significancia.

En general, el subconjunto de las regiones de rechazo correspondiente a 𝛼 ´ s pequeñas es un


subconjunto de las regiones de rechazo correspondientes a 𝛼 ´ s grandes. Así, si un punto 𝒙 de la
muestra está en la región de rechazo para una prueba de tamaño  entonces también estará en la
de 𝛼 ′ con 𝛼 ′ > .
Notemos que mientras más pequeña sea la magnitud del 𝑝 − 𝑣𝑎𝑙𝑜𝑟 más fuerte es la evidencia a
favor de 𝐻1 (o en contra de 𝐻0 ).

Prof. Felipe R. Tuz Poot 121


Así, ahora ya podemos notar la diferencia entre rechazar 𝐻0 con la observación 𝑥 = 16 y rechazarla
con la observación 𝑥 = 19. En el primer caso el 𝑝 − 𝑣𝑎𝑙𝑜𝑟 es 0.051 y en el segundo caso es 0.001.
Por lo tanto, hay mayor evidencia a favor de 𝐻1 cuando 𝑥 = 19 que cuando 𝑥 = 16.
En la práctica es recomendable reportar no sólo el resultado de la prueba de hipótesis sino también
el 𝑝 − 𝑣𝑎𝑙𝑜𝑟 para la muestra dada.

Nota: El 𝑝 − 𝑣𝑎𝑙𝑜𝑟 no es un nivel de significancia, pues depende de los datos. Un nivel de


significancia es independiente del valor observado para el estadístico de prueba.
En resumen, ¿cómo se calcula si el valor observado es 19? Basta calcular la 𝑃(𝑋 ≥ 19|𝐻0 ) pues
como {𝑋 ≥ 19} ⊆ {𝑋 ≥ 18} ⊆ {𝑋 ≥ 17} …  𝑃(𝑋 ≥ 19|𝐻0 ) es la más pequeña .

Pruebas con hipótesis alternativa de dos colas (o dos lados)


En el ejemplo de medicamentos la hipótesis alternativa es 𝐻1 : 𝑝 > 0.6. Una hipótesis de este tipo
se dice que es de una sola cola (o de un solo lado) debido a que los valores del parámetro bajo 𝐻1
caen en un solo lado de los valores especificados por 𝐻0 . En esa ocasión dijimos que valores grandes
de 𝑋 sustentaban más fuertemente a 𝐻1 y por tal razón la región de rechazo tuvo la estructura 𝑋 ≥
𝑐, a esta región se le llama región de rechazo de una sola cola (o de un solo lado).
Supongamos ahora que el planteamiento es que “la tasa de curación del nuevo medicamento es
diferente al del medicamento estándar”. La estructura de la prueba de hipótesis es entonces
𝐻0 : 𝑝 = 0.6 vs 𝐻1 : 𝑝 ≠ 0.6. Esta prueba de hipótesis tiene una hipótesis alternativa de dos colas.
¿Cómo sería su región de rechazo?, valores muy grandes de 𝑋 o muy pequeños sustentarán más
fuertemente a 𝐻1 , así que resulta razonable proponer como región de rechazo una del tipo
Rechazar 𝐻0 si y solo si 𝑋 ≤ 𝑐1 o 𝑋 ≥ 𝑐2
Donde los valores 𝑐1 y 𝑐2 serán determinados de acuerdo a nuestras restricciones para el error tipo
I.

Ejemplo:
Una compañía que vende comida para gatos desea determinar si dos sabores 𝐴 y 𝐵 tienen un
atractivo para los gatos. Para ello a cada gato de una muestra de 15 se le da comida en recipientes
idénticos que contienen cada uno de los dos sabores. Sea 𝑋 el número de gatos que comieron del
recipiente que contenía comida del sabor 𝐴. Los datos serán usados para inferir acerca de la posible
presencia de fuerte preferencia por parte de los gatos, a favor de alguno de los dos sabores. Sea 𝑝
la proporción de la población que prefiere comida con el sabor 𝐴.
La hipótesis acerca de la población es que 𝑝 ≠ 0.5. Entonces la estructura de la prueba de hipótesis
es
𝐻0 : 𝑝 = 0.5 vs 𝐻1 : 𝑝  0.5  alternativa de dos colas
La región de rechazo es de la forma 𝑋 ≤ 𝑐1 o 𝑋 ≥ 𝑐2 .
Nótese que bajo 𝐻0 el estadístico de prueba 𝑋 tiene distribución binomial con parámetros 𝑛 = 15,
𝑝 = 0.5. La distribución es simétrica y por lo tanto seleccionar regiones de rechazo simétrico resulta
razonable y teóricamente, son los mejores. Así podríamos proponer una región del tipo
a) Rechazar 𝐻0 si 𝑋 ≤ 4 o 𝑋 ≥ 11 o
b) Rechazar 𝐻0 si 𝑋 ≤ 3 o 𝑋 ≥ 12
Supongamos que se desea un error tipo I inferior a 0.05. Veamos si alguna de estas regiones es
apropiada:
a) b)
= 𝑃(𝑋 ≤ 4 𝑜 𝑋 ≥ 11) = 𝑃(𝑋 ≤ 3) + 𝑃(𝑋 ≥ 12)
= 𝑃(𝑋 ≤ 4) + 𝑃(𝑋 ≥ 11) = 0.018 + 0.018
= 0.059 + 0.059 = 0.036 < 0.05
= 0.118 > 0.05

Prof. Felipe R. Tuz Poot 122


Por tanto, la prueba b) es la más apropiada.

MÉTODOS PARA HALLAR PRUEBAS


La prueba de razón de verosimilitud. Éste es un método muy general y uno de los más aplicados,
también en muchos casos tiene la característica de ser una prueba óptima.

Sea 𝑋1 , … , 𝑋𝑛 una muestra aleatoria de una densidad 𝑓(𝑥; 𝜃), donde 𝜃 ∈ 𝜃. Queremos hallar una
prueba de 𝐻0 : 𝜃 ∈ 𝜃0 vs 𝐻1 : 𝜃 ∈ 𝜃1 ( 𝜃1 ∩ 𝜃0 = ∅, en general, 𝜃0 , 𝜃1 ⊂ 𝜃 ).

Definición. Sea 𝐿(𝜃; 𝑥1 , … , 𝑥𝑛 ) la función de verosimilitud de una muestra 𝑋1 , … , 𝑋𝑛 , con densidad


conjunta 𝑓𝑋1 ,…,𝑋𝑛 (𝑥1 , … , 𝑥𝑛 ; 𝜃) donde 𝜃 ∈ 𝜃. La razón de verosimilitud, denotada por  o por 𝑛 se
define por:

Sup 𝐿(𝜃; 𝑥1 , … , 𝑥𝑛 )
𝜃∈𝜃0
𝜆 = 𝜆𝑛 =
Sup 𝐿(𝜃; 𝑥1 , … , 𝑥𝑛 )
𝜃∈𝜃
Nota:
1)  es una función de 𝑥1 , … , 𝑥𝑛
2) Cuando se reemplazan las observaciones 𝑥1 , … , 𝑥𝑛 por sus correspondientes v.a. 𝑋1 , … , 𝑋𝑛 ,
escribiremos Λ por ; esto es Λ = 𝜆(𝑋1 , … , 𝑋𝑛 ). Nótese que Λ es un estadístico.
3) 𝜆 ≥ 0 porque se tiene una razón de cantidades no negativas. 𝜆 ≤ 1 pues como 𝜃0 ⊂ 𝜃 ⇒
Sup ≤ Sup. Por tanto, 0 ≤ 𝜆 ≤ 1.
𝜃∈𝜃0 𝜃∈𝜃
4) El parámetro  puede ser un vector.
5) El denominador de  es la función de verosimilitud evaluada en EMV.

El principio de la prueba de razón de verosimilitud


En la prueba de 𝐻0 : 𝜃 ∈ 𝜃0 vs 𝐻1 : 𝜃 ∈ 𝜃1 = 𝜃 − 𝜃0 , se rechaza 𝐻0 si y solo si 𝜆 ≤ 𝜆0 , donde 𝜆0 es
alguna constante fija que satisface 0 ≤ 𝜆0 ≤ 1. La constante 𝜆0 es frecuentemente especificada
fijando el nivel de significancia . Λ es el estadístico de prueba.

Nótese lo razonable del principio. Se presentan argumentos a favor de 𝐻1 cuando 𝜆 es pequeña,


pues esto significa que el denominador es grande con respecto al numerador; entonces los 𝜃 ∈ 𝜃0
están lejos del EMV, de donde, es muy plausible que el verdadero valor de  no esté en 𝜃0 .
En general la prueba de razón de verosimilitud es una buena prueba. Una de sus desventajas es que
algunas veces es difícil hallar 𝑆𝑢𝑝𝐿(𝜃; 𝑥1 , … , 𝑥𝑛 ); otra es que puede ser difícil hallar la distribución
de Λ, la cual es requerida para calcular la potencia de la prueba.

Ejemplo:
Sea 𝑋1 , … , 𝑋𝑛 una muestra aleatoria de la densidad 𝑓(𝑥; 𝜃) = 𝜃𝑒 −𝜃𝑥 𝐼(0,∞) (𝑥), donde 𝜃 =
{𝜃|𝜃 > 0}. Probar 𝐻0 : 𝜃 ≤ 𝜃0 vs 𝐻0 : 𝜃 > 𝜃0 .

Solución
𝑛
𝐿(𝜃; 𝑥1 , … , 𝑥𝑛 ) = ∏𝑛𝑖=1 𝜃𝑒 −𝜃𝑥𝑖 = 𝜃 𝑛 𝑒 −𝜃 ∑𝑖=1 𝑥𝑖
 𝑙𝑛𝐿(𝜃; 𝑥1 , … , 𝑥𝑛 ) = 𝑛𝑙𝑛𝜃 − 𝜃 ∑𝑛𝑖=1 𝑥𝑖

Prof. Felipe R. Tuz Poot 123


𝜕𝑙𝑛𝐿(𝜃;𝑥1 ,…,𝑥𝑛 ) 𝑛 𝑛
 𝜕𝜃
= 𝜃 − ∑𝑛𝑖=1 𝑥𝑖 . Igualando a cero queda que 𝜃̂ = ∑𝑛 𝑥 es el EMV.
𝑖=1 𝑖
𝑛
𝑛
 Sup 𝐿(𝜃; 𝑥1 , … , 𝑥𝑛 ) = (∑𝑛 ) 𝑒 −𝑛
. Por otra parte,
𝜃∈𝜃 𝑖=1 𝑥𝑖

𝑛
Sup 𝐿(𝜃; 𝑥1 , … , 𝑥𝑛 ) = Sup (𝜃 𝑛 𝑒 −𝜃 ∑𝑖=1 𝑥𝑖 )
𝜃∈𝜃0 0<𝜃<𝜃0

𝑛 𝑛
𝑛 𝑆𝑖 ≤ 𝜃0
(∑𝑛 𝑥
) 𝑒 −𝑛 ∑𝑛
𝑖=1 𝑥𝑖
𝑖=1 𝑖
=
𝑛
𝑛 𝑆𝑖 > 𝜃0
{𝜃0𝑛 𝑒𝑥𝑝(−𝜃0 ∑𝑖=1 𝑥𝑖 ) ∑𝑛
𝑖=1 𝑥𝑖

La función 𝑔(𝑥) = 𝜃 𝑛 𝑒𝑥𝑝(−𝜃 ∑𝑛𝑖=1 𝑥𝑖 ) es creciente. Entonces


𝑛
1 𝑆𝑖 ∑𝑛
≤ 𝜃0
𝑖=1 𝑥𝑖

𝜆= 𝜃0𝑛 𝑒𝑥𝑝(−𝜃0 ∑𝑛
𝑖=1 𝑥𝑖 ) 𝑛
𝑛
𝑛 𝑆𝑖 ∑𝑛
> 𝜃0
( 𝑛 ) 𝑒 −𝑛 𝑖=1 𝑥𝑖
∑𝑖=1 𝑥𝑖
{

Se rechaza 𝐻0 si 𝜆 ≤ 𝜆0 donde 0 < 𝜆0 < 1. Es decir, se rechaza 𝐻0 si

𝜃0𝑛 𝑒𝑥𝑝(−𝜃0 ∑𝑛
𝑖=1 𝑥𝑖 ) 𝑛
𝑛 ≤ 0 y ∑𝑛
> 𝜃0
𝑛 𝑖=1 𝑥𝑖
( 𝑛 ) 𝑒 −𝑛
∑𝑖=1 𝑥𝑖

𝑛
𝜃0 ∑𝑛
𝑖=1 𝑥𝑖 ∑𝑛
𝑖=1 𝑥𝑖 1
≡( 𝑛
) 𝑒𝑥𝑝(−𝜃0 ∑𝑛𝑖=1 𝑥𝑖 + 𝑛) ≤ 0 y 𝑛
<𝜃
0

≡ (𝜃0 𝑥̅ )𝑛 𝑒𝑥𝑝[−𝑛(𝜃0 𝑥̅ − 1)] ≤ 0 y 𝜃0 𝑥̅ < 1


≡ (𝜃0 𝑥̅ )𝑒𝑥𝑝[−(𝜃0 𝑥̅ − 1)] ≤ 𝑛√0 y 𝜃0 𝑥̅ < 1
𝑛
≡ 𝜃0 𝑥̅ ≤ √0 𝑒𝑥𝑝(𝜃0 𝑥̅ − 1) < 1
≡ 𝜃0 𝑥̅ ≤ 𝑘 donde 0 < 𝑘 < 1

Así que la prueba de razón de verosimilitud se reduce a rechazar 𝐻0 si y solo si 𝜃0 𝑥̅ ≤ 𝑘 donde 0 <
𝑘 < 1.
Si el nivel de significancia deseado es , entonces 𝑘 se obtiene resolviendo la ecuación

𝛼 = 𝑃{𝜃0 𝑥̅ ≤ 𝑘|𝜃 = 𝜃0}

𝑛𝑘
= 𝑃 {∑𝑛𝑖=1 𝑥𝑖 ≤ 𝜃0
|𝜃 = 𝜃0 }

𝑛𝑘
𝜃0 1
= ∫0 𝜃 𝑛 𝑠 𝑛−1 𝑒 −𝜃0 𝑠 𝑑𝑠
Γ(𝑛) 0

𝑛𝑘 1
= ∫0 Γ(𝑛)
𝑢𝑛−1 𝑒 −𝑢 𝑑𝑢, 𝑢 = 𝜃0 𝑠

Prof. Felipe R. Tuz Poot 124


Definición. Una prueba de 𝐻0 : 𝜃 ∈ 𝜃0 vs 𝐻1 : 𝜃 ∈ 𝜃1 = 𝜃 − 𝜃0 se dice que es uniformemente más
potente de tamaño  si
i) Tiene nivel de significancia 
ii) Minimiza el error tipo II para cualquier 𝜃 ∈ 𝜃 − 𝜃0 , esto es, si 𝐴 es la prueba dada y 𝐵
es cualquier otra prueba, entonces 𝛽𝐴 (𝜃) ≤ 𝛽𝐵 (𝜃), ∀𝜃 ∈ 𝜃 − 𝜃0 .

Teorema: Sea 𝑋1 , … , 𝑋𝑛 una muestra aleatoria de la densidad 𝑓(𝑥; 𝜃), 𝜃 ∈ 𝜃, donde 𝜃 es algún
intervalo. Supongamos que 𝑓(𝑥; 𝜃) = 𝑎(𝜃)𝑏(𝑥)𝑒𝑥𝑝[𝑐(𝜃)𝑑(𝑥)] y sea 𝑡(𝑥1 , … , 𝑥𝑛 ) = ∑𝑛𝑖=1 𝑑(𝑥𝑖 )

i) Si 𝑐(𝜃)es monótona creciente como función de  y si existe 𝑘 ∗ tal que


𝑃𝜃0 [𝑡(𝑥1 , … , 𝑥𝑛 ) > 𝑘 ∗ ] = 𝛼,entonces la prueba con región de rechazo 𝑐 ∗ =
{(𝑥1 , … , 𝑥𝑛 )|𝑡(𝑥1 , … , 𝑥𝑛 ) > 𝑘 ∗}es una prueba uniformemente más potente de tamaño
, de 𝐻0 : 𝜃 ≤ 𝜃0 vs 𝐻1 : 𝜃 > 𝜃0 o de 𝐻0 : 𝜃 = 𝜃0 vs 𝐻1 : 𝜃 > 𝜃0 .
ii) Si 𝑐(𝜃) es monótona decreciente en  y si existe 𝑘 ∗ tal que 𝑃𝜃0 [𝑡(𝑥1 , … , 𝑥𝑛 ) < 𝑘 ∗ ] =
𝛼, entonces la prueba con región de rechazo 𝑐 ∗ = {(𝑥1 , … , 𝑥𝑛 )|𝑡(𝑥1 , … , 𝑥𝑛 ) < 𝑘 ∗} es
uniformemente más potente de tamaño , de 𝐻0 : 𝜃 ≤ 𝜃0 vs 𝐻1 : 𝜃 > 𝜃0 o de 𝐻0 : 𝜃 =
𝜃0 vs 𝐻1 : 𝜃 > 𝜃0 .

Ejemplo:
Sea 𝑋1 , … , 𝑋𝑛 una muestra aleatoria de 𝑓(𝑥; 𝜃) = 𝜃𝑒 −𝜃𝑥 𝐼(0,∞) (𝑥) donde 𝜃 = {𝜃|𝜃 > 0}.
Probar 𝐻0 : 𝜃 ≤ 𝜃0 vs 𝐻1 : 𝜃 > 𝜃0 .
Solución
𝑓(𝑥; 𝜃) = 𝜃[𝐼(0,∞) (𝑥)]𝑒 −𝜃𝑥 = 𝑎(𝜃)𝑏(𝑥)𝑒𝑥𝑝[𝑐(𝜃)𝑑(𝑥)]
Por el teorema, ∑𝑛𝑖=1 𝑥𝑖 < 𝑘 ∗ es una región de rechazo que da lugar a una prueba UMP
(uniformemente más potente) de tamaño  si y solo si 𝑘 ∗ está dada por la solución de

𝑛 𝑘∗
1 𝑛 𝑛−1 −𝜃 𝑢
𝛼 = 𝑃𝜃0 (∑ 𝑥𝑖 < 𝑘 ∗ ) = ∫ 𝜃 𝑢 𝑒 0 𝑑𝑢
Γ(𝑛) 0
𝑖=1 0

Un método intuitivo
Una útil técnica para obtener pruebas es la siguiente:
Descubrir algún estadístico que tenga comportamiento diferente bajo las dos hipótesis y luego
usar los diferentes comportamientos para diseñar una prueba.

Ejemplo:
Consideremos la muestra 𝑋1 , … , 𝑋𝑛 de la densidad 𝜙𝜃,1 (𝑥). Supongamos que se quiere probar
1
𝐻0 : 𝜃 ≤ 𝜃0 vs 𝐻1 : 𝜃 > 𝜃0 . Observemos que el estadístico 𝑋̅~𝑁 (𝜃, ); entonces 𝑋̅ tenderá a ser
𝑛
más pequeño cuando 𝐻0 es verdadera que cuando 𝐻0 es falsa. Aquí 𝑋̅ tiene comportamientos
diferentes bajo las hipótesis. Una prueba razonable sería entonces, rechazar 𝐻0 cuando 𝑋̅ es
grande, esto es, rechazar 𝐻0 si 𝑋̅ > 𝑘, donde 𝑘 se determina fijando el nivel de significancia.

Algunas sugerencias para “descubrir” el estadístico con “comportamiento” diferente bajo las
dos hipótesis son:
1) Si existen estadísticos suficientes, éstos son candidatos naturales.
2) Un buen estimador, como por ejemplo el EMV, es otra posibilidad.

Nota: En el ejemplo, el estadístico 𝑋̅ cumple con ser el estadístico suficiente y además el EMV de .

Prof. Felipe R. Tuz Poot 125


Ejemplo:
Sea 𝑋1 , … , 𝑋𝑛 una muestra aleatoria de una distribución Poisson con media 𝜃. Supongamos que se
desea probar 𝐻0 : 𝜃 = 𝜃0 vs 𝐻1 : 𝜃 ≠ 𝜃0.
Sabemos que 𝑋̅ es el EMV de . Cuando es verdadero 𝑋̅ tiende a distribuirse cerca de 𝜃0 , en tanto
que cuando 𝐻1 es verdadera, tiende a alejarse de 𝜃0 , ya sea hacia la izquierda o hacia la derecha
(esto no es otra cosa más que el razonamiento que hicimos en algunos ejemplos anteriores: valores
muy pequeños o muy grandes sustentarán a la hipótesis 𝐻1 ).
Así que un modo razonable de probar 𝐻0 : 𝜃 = 𝜃0 vs 𝐻1 : 𝜃 ≠ 𝜃0 es: rechazar 𝐻0 si 𝑋̅ ≤ 𝑐1 o 𝑋̅ ≥ 𝑐2 .
Si consideramos 𝑛 = 10 y 𝜃0 = 1 y no admitimos un error tipo I superior a 0.08, entonces 𝑐1 y 𝑐2
deben ser tales que

𝑃(𝑋̅ ≤ 𝑐1 o 𝑋̅ ≥ 𝑐2 |𝜃 = 1) ≤ 0.08
 𝑃(𝑋̅ ≤ 𝑐1 |𝜃 = 1) + 𝑃(𝑋̅ ≥ 𝑐2 |𝜃 = 1) ≤ 0.08
 𝑃(∑10 10
𝑖=1 𝑥𝑖 ≤ 10𝑐1 |𝜃 = 1) + 𝑃(∑𝑖=1 𝑥𝑖 ≥ 10𝑐2 |𝜃 = 1) ≤ 0.08
 𝑃(∑10 10
𝑖=1 𝑥𝑖 ≤ 10𝑐1 |𝜃 = 1) + 1 − 𝑃(∑𝑖=1 𝑥𝑖 ≤ 10𝑐2 |𝜃 = 1) ≤ 0.08
 10 10
𝑃(∑𝑖=1 𝑥𝑖 ≤ 10𝑐2 |𝜃 = 1) − 𝑃(∑𝑖=1 𝑥𝑖 ≤ 10𝑐1 |𝜃 = 1) ≥ 0.92

Sabemos que ∑10


𝑖=1 𝑥𝑖 ~𝑃𝑜𝑖𝑠𝑠𝑜𝑛(10). Buscando en la tabla de la fda de la Poisson se encuentra que
con 10𝑐2 = 15 y 10𝑐1 = 4,

𝑃(∑10 10 −2
𝑖=1 𝑥𝑖 ≤ 10𝑐2 |𝜃 = 1) − 𝑃(∑𝑖=1 𝑥𝑖 ≤ 10𝑐1 |𝜃 = 1) = 0.95126 − 2.9253(10 ) = 0.92201

Así, una región de rechazo que satisface los requerimientos de que 𝛼 ≤ 0.08 es 𝑋̅ ≤ 0.4 o 𝑋̅ ≥
1.5.

Observación: Una prueba del tipo 𝐻0 : 𝜃 = 𝜃0 vs 𝐻1 : 𝜃 ≠ 𝜃0 es una muy usada en diversos campos
de la ciencia, Pero a veces, aún cuando el problema sugiera este tipo de prueba, una modificación
de ella puede ser más realista. Imaginemos por ejemplo que  es la diferencia de las medias de
crecimiento entre dos variedades de maíz y que se quiere determinar si hay suficiente evidencia
para la conjetura: “las medias de crecimiento son diferentes”. Entonces una forma de plantear las
hipótesis nula y alternativa sería 𝐻0 : 𝜃 = 0 vs 𝐻1 : 𝜃 ≠ 𝜃0. Sin embargo, en esta situación y en
muchas otras donde  puede variar a lo largo de un intervalo, es inconcebible que  sea
exactamente igual a cero (esto es, que las variedades tengan idénticas medias de crecimiento). Un
planteamiento más realista sería seleccionar un intervalo para , y probar 𝐻0 : 𝜃1 ≤ 𝜃 ≤ 𝜃2 vs
𝐻1 : 𝜃 < 𝜃1 o 𝜃 > 𝜃2 . Construir una prueba uniformemente más potente para este tipo de hipótesis
̂ de
suele ser difícil o imposible, pero si 𝑓(𝑥; 𝜃) es una densidad con un solo parámetro, el EMV Θ
, puede ser usado para construirla, en cuyo caso la región de rechazo es Θ̂ ≤ 𝑐1 o Θ
̂ ≥ 𝑐2 .

Pruebas de hipótesis para muestras de la distribución normal


Pruebas sobre medias
a) 𝐻0 : 𝜇 ≤ 𝜇0 vs 𝐻1 : 𝜇 > 𝜇0 - 𝜎 2 conocido -
b) 𝐻0 : 𝜇 ≤ 𝜇0 vs 𝐻1 : 𝜇 > 𝜇0 - 𝜎 2 desconocido -
c) 𝐻0 : 𝜇 = 𝜇0 vs 𝐻1 : 𝜇 ≠ 𝜇0 - 𝜎 2 conocido -
d) 𝐻0 : 𝜇 = 𝜇0 vs 𝐻1 : 𝜇 ≠ 𝜇0 - 𝜎 2 desconocido -

Veamos el procedimiento para tres de éstas pruebas:

a) 𝐻0 : 𝜇 ≤ 𝜇0 vs 𝐻1 : 𝜇 > 𝜇0 - 𝜎 2 conocido -

Prof. Felipe R. Tuz Poot 126


Sea 𝑋1 , … , 𝑋𝑛 muestra de una distribución normal 𝑁(𝜇, 𝜎 2 )

1 𝑥−𝜇 2
1 − ( ) 1 1
𝑓(𝑥; 𝜇) = 𝑒 2 𝜎 = 𝑒𝑥𝑝 [− 2𝜎2 (𝑥 2 − 2𝑥𝜇 + 𝜇2 )] =
√2𝜋𝜎 √2𝜋𝜎
1 𝜇 2 1 𝑥 2 𝜇
1 − ( ) − ( ) ( )𝑥
𝑒 2 𝜎 𝑒 2 𝜎 𝑒 𝜎
√2𝜋𝜎
Esto está en la forma 𝑎(𝜃)𝑏(𝑥)𝑒𝑥𝑝[𝑐(𝜇)𝑑(𝑥)]
Por el teorema, una prueba uniformemente más potente es la que rechaza 𝐻0 si y solo si
∑𝑛𝑖=1 𝑥𝑖 > 𝑘 ∗, donde 𝑘 ∗ es la solución de

𝑃(∑𝑛𝑖=1 𝑥𝑖 > 𝑘 ∗|𝜇0 ) = 𝑃𝜇0 (∑𝑛𝑖=1 𝑥𝑖 > 𝑘 ∗ ) = 𝛼

Ahora,
∑𝑛
𝑖=1 𝑥𝑖 −𝑛𝜇0 𝑘 ∗ −𝑛𝜇0
𝑃𝜇0 ( > ) =𝛼
√𝑛𝜎 √𝑛𝜎

𝑘 ∗ −𝑛𝜇0
 𝑃𝜇0 (𝑍 > ) =𝛼
√𝑛𝜎

𝑘 ∗ −𝑛𝜇0
 1 − 𝑃𝜇0 (𝑍 ≤ ) =𝛼
√𝑛𝜎

𝑘 ∗ −𝑛𝜇0
 𝑃𝜇0 (𝑍 ≤ ) =1−𝛼
√𝑛𝜎

𝑘 ∗ −𝑛𝜇0
 = 𝑍𝛼
√𝑛𝜎

 𝑘 ∗ = 𝑛𝜇0 + √𝑛𝜎𝑍𝛼

Por tanto, en la prueba de 𝐻0 : 𝜇 ≤ 𝜇0 vs 𝐻1 : 𝜇 > 𝜇0 con 𝜎 2 conocido, se rechaza 𝐻0 si y


𝜎 𝑥̅ −𝜇
solo si ∑𝑛𝑖=1 𝑥𝑖 > 𝑛𝜇0 + √𝑛𝜎𝑍𝛼  𝑥̅ > 𝜇0 + 𝑍𝛼  𝜎 0 > 𝑍𝛼
√𝑛
√𝑛

d) 𝐻0 : 𝜇 = 𝜇0 vs 𝐻1 : 𝜇 ≠ 𝜇0 - 𝜎 2 desconocido -
Usemos el principio de razón de verosimilitud:

𝜃 = {(𝜇, 𝜎 2 )|𝜇 ∈ ℝ, 𝜎 2 > 0}; 𝜃0 = {(𝜇, 𝜎 2 )|𝜇 = 𝜇0 , 𝜎 2 > 0}

1 𝑛⁄2 1
𝐿(𝜃; 𝑥1 , … , 𝑥𝑛 ) = (2𝜋𝜎2 ) 𝑒𝑥𝑝 [− 2𝜎2 ∑𝑛𝑖=1(𝑥𝑖 − 𝜇)2 ]

1 1
Ya sabemos que el EMV de 𝜎 2 es 𝑆12 = 𝑛 ∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2 y el de  es 𝑛 ∑𝑛𝑖=1 𝑥𝑖 = 𝑥̅
𝑛⁄2
1 1
 Sup 𝐿(𝜃; 𝑥1 , … , 𝑥𝑛 ) = ( 1 ) 𝑒𝑥𝑝 [− 1 ∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2 ]
2𝜋 ∑𝑛 (𝑥 −𝑥̅ )2 2( ) ∑𝑛
𝑖=1(𝑥𝑖 −𝑥̅ )
2
𝜃∈𝜃 𝑛 𝑖=1 𝑖 𝑛

𝑛⁄2
𝑛 𝑛
=( 𝑛 ) 𝑒𝑥𝑝 (− )
2𝜋 ∑𝑖=1(𝑥𝑖 − 𝑥̅ )2 2

Para hallar Sup 𝐿(𝜃; 𝑥1 , … , 𝑥𝑛 ) basta tomar 𝜇 = 𝜇0 y hallar 𝜎 2 que maximice 𝐿(𝜃):
𝜃∈𝜃

Prof. Felipe R. Tuz Poot 127


1 𝑛⁄2 1
𝐿(𝜎 2 ; 𝑥1 , … , 𝑥𝑛 ) = (2𝜋𝜎2 ) 𝑒𝑥𝑝 [− 2𝜎2 ∑𝑛𝑖=1(𝑥𝑖 − 𝜇0 )2 ]

𝑛 1
𝑙𝑛𝐿(𝜎 2 ; 𝑥1 , … , 𝑥𝑛 ) = − 2 𝑙𝑛(2𝜋𝜎 2 ) − 2𝜎2 ∑𝑛𝑖=1(𝑥𝑖 − 𝜇0 )2

𝜕𝑙𝑛𝐿(𝜎 2 ;𝑥1 ,…,𝑥𝑛 ) 𝑛 1 1


𝜕𝜎 2
= − 2 (2𝜋𝜎2 ) (2𝜋) + 2𝜎4 ∑𝑛𝑖=1(𝑥𝑖 − 𝜇0 )2

𝑛 1 1
= − 2 (𝜎2 ) + 2𝜎4 ∑𝑛𝑖=1(𝑥𝑖 − 𝜇0 )2 = 0

𝑛 1
 − 2 + 2𝜎2 ∑𝑛𝑖=1(𝑥𝑖 − 𝜇0 )2 = 0

1
 𝜎 2 = 𝑛 ∑𝑛𝑖=1(𝑥𝑖 − 𝜇0 )2

𝑛⁄2
1 1
 Sup 𝐿(𝜃; 𝑥1 , … , 𝑥𝑛 ) = ( 1 ) 𝑒𝑥𝑝 [− 1 ∑𝑛𝑖=1(𝑥𝑖 − 𝜇0 )2 ]
2𝜋( ) ∑𝑛
𝑖=1(𝑥𝑖 −𝜇0 )
2 2( ) ∑𝑛
𝑖=1(𝑥𝑖 −𝜇0 )
2
𝜃∈𝜃 𝑛 𝑛

𝑛 ⁄2
𝑛 𝑛
= (2𝜋 ∑𝑛 (𝑥 −𝜇 ) 2 ) 𝑒𝑥𝑝 (− 2 )
𝑖=1 𝑖 0

𝑛⁄2
∑𝑛 (𝑥 −𝑥̅ )2
 𝜆 = [∑𝑛𝑖=1(𝑥 𝑖−𝜇 2]
𝑖=1 𝑖 0)

𝑛⁄2
∑𝑛𝑖=1(𝑥𝑖 −𝑥̅ )
2
= [∑ 𝑛 (𝑥 −𝑥̅ + 𝑥̅ − 𝜇0 )2
]
𝑖=1 𝑖

𝑛⁄2
∑𝑛𝑖=1(𝑥𝑖 −𝑥̅ )
2
= [∑ 𝑛 2 2 ]
𝑖=1(𝑥𝑖 −𝑥̅ ) +𝑛(𝑥̅ −𝜇0 )
𝑛⁄2
1
=[ ̅−𝜇 )2
𝑛(𝑥 0
]
1+ 𝑛 2
∑𝑖=1(𝑥𝑖 −𝑥̅)

2
2
𝑛(𝑥̅ −𝜇0 )2 √𝑛(𝑥̅ −𝜇0 ) √𝑛(𝑥̅ −𝜇0 )
Sea 𝑡 2 = 2 = =[ ]
∑𝑛 ̅) 𝑆
𝑖=1(𝑥𝑖 −𝑥 𝑛 2
𝑛−1 √∑𝑖=1(𝑥𝑖 −𝑥̅)
[ 𝑛−1 ]

Sustituyendo, tenemos que se rechaza 𝐻0 si y solo si 𝜆 < 𝜆0


𝑛(𝑥̅ −𝜇0 )2 1
 1 + ∑𝑛 2 ≤ 𝜆0  𝑡2
< 𝜆0
𝑖=1(𝑥𝑖 −𝑥̅ ) 1+(𝑛−1)
1 𝑡2 1 1 1−𝜆0
 < 1 + (𝑛−1)  − < 𝑡2  < 𝑡2  |𝑡| > 𝑘
𝜆0 𝜆0 𝑛−1 𝜆0 (𝑛−1)

El estadístico de prueba es

√𝑛(𝑥̅ −𝜇0 ) √𝑛(𝑥̅ −𝜇0 ) (𝑥̅ −𝜇0 )


𝑇= = =
𝑛 2 𝑆 ⏟⁄√𝑛
𝑆
√∑𝑖=1(𝑥𝑖 −𝑥̅) ~𝑡(𝑛−1)
𝑛−1

Prof. Felipe R. Tuz Poot 128


Si el nivel de significancia es , 𝑘 debe ser tal que

𝑃(|𝑇| > 𝑘) = 𝛼

 1 − 𝑃(|𝑇| < 𝑘) = 𝛼
 𝑃(|𝑇| < 𝑘) = 1 − 𝛼
 𝑃(−𝑘 < 𝑇 < 𝑘) = 1 − 𝛼
 𝑃(𝑇 < 𝑘) − 𝑃(𝑇 ≥ 𝑘) = 1 − 𝛼
 𝑃(𝑇 < 𝑘) − 1 + 𝑃(𝑇 < 𝑘) = 1 − 𝛼
 2𝑃(𝑇 < 𝑘) = 2 − 𝛼
𝛼
 𝑃(𝑇 < 𝑘) = 1 − 2
𝑥̅ −𝜇0
 𝑘 = 𝑡𝛼⁄2,(𝑛−1) Por tanto se rechaza 𝐻0 si y solo si | | > 𝑡𝛼⁄2,(𝑛−1)
𝑆⁄√𝑛

c) 𝐻0 : 𝜇 = 𝜇0 vs 𝐻1 : 𝜇 ≠ 𝜇0 - 𝜎 2 conocido –

1 𝑛⁄2 1
𝐿(𝜇; 𝑥1 , … , 𝑥𝑛 ) = (2𝜋𝜎2 ) 𝑒𝑥𝑝 [− 2𝜎2 ∑𝑛𝑖=1(𝑥𝑖 − 𝜇)2 ]

𝑛 1
𝑙𝑛𝐿(𝜇; 𝑥1 , … , 𝑥𝑛 ) = − 𝑙𝑛(2𝜋𝜎 2 ) − ∑𝑛 (𝑥 − 𝜇)2
2 2𝜎 2 𝑖=1 𝑖

𝜕𝑙𝑛𝐿(𝜇;𝑥1 ,…,𝑥𝑛 ) 2 1
𝜕𝜇
= 2𝜎2 ∑𝑛𝑖=1(𝑥𝑖 − 𝜇) = 0  ∑𝑛𝑖=1 𝑥𝑖 − 𝑛𝜇 = 0  𝜇̂ = ∑𝑛𝑖=1 𝑥𝑖 = 𝑥̅
𝑛

1 𝑛⁄2 1
 Sup 𝐿(𝜇; 𝑥1 , … , 𝑥𝑛 ) = (2𝜋𝜎2 ) [− 2𝜎2 ∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2 ]
𝜇∈𝜃

1 𝑛⁄2 1
Sup 𝐿(𝜇; 𝑥1 , … , 𝑥𝑛 ) = ( ) [− 2 ∑𝑛𝑖=1(𝑥𝑖 − 𝜇0 )2 ]
2𝜋𝜎 2 2𝜎
𝜇∈𝜃0

1
 𝜆 = 𝑒𝑥𝑝 [− 2𝜎2 {∑𝑛𝑖=1(𝑥𝑖 − 𝜇0 )2 − ∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2 }]

Pero ∑𝑛𝑖=1(𝑥𝑖 − 𝜇0 )2 = ∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )2 + 𝑛(𝑥̅ − 𝜇0 )2

1
 𝜆 = 𝑒𝑥𝑝 [− 2𝜎2 𝑛(𝑥̅ − 𝜇0 )2 ]

1
Se rechaza 𝐻0 si 𝑒𝑥𝑝 [− 2𝜎2 𝑛(𝑥̅ − 𝜇0 )2 ] < 𝜆0
1
 − 2𝜎2 𝑛(𝑥̅ − 𝜇0 )2 < 𝑙𝑛𝜆0 , 𝜆0 > 0
2𝜎 2 𝑙𝑛𝜆0
 −(𝑥̅ − 𝜇0 )2 < 𝑛
2𝜎 2 𝑙𝑛𝜆0
 (𝑥̅ − 𝜇0 )2 > −
𝑛
2𝜎 2 𝑙𝑛𝜆0
 |𝑥̅ − 𝜇0 | > √−
𝑛
El estadístico es

2𝜎 2 𝑙𝑛𝜆0 𝑥̅ −𝜇 𝑥̅ −𝜇
|𝑥̅ − 𝜇0 | > √
𝑛
 |𝜎⁄ 𝑛0 | > √2𝑙𝑛𝜆0  |𝜎⁄ 𝑛0 | > 𝑘
√ √

Prof. Felipe R. Tuz Poot 129


𝑥̅ −𝜇0
Bajo 𝐻0 , ~𝑁(0,1)
𝜎 ⁄√𝑛

𝑃(|𝑍| > 𝑘) = 𝛼
𝑃(𝑍 > 𝑘 𝑜 𝑍 < −𝑘) = 𝛼
 2𝑃(𝑍 > 𝑘) = 𝛼
 2 − 2𝑃(𝑍 < 𝑘) = 𝛼
𝛼
 𝑃(𝑍 < 𝑘) = 1 −  𝑘 = 𝑍𝛼⁄2
2

𝑥̅ −𝜇
Por tanto, se rechaza 𝐻0 si |𝜎⁄ 𝑛0 | > 𝑍𝛼⁄2

A partir de ahora, veremos las principales fórmulas de pruebas de hipótesis con un enfoque
más práctico. Hacemos la aclaración de que varias de ellas han sido ya abordadas con los
métodos arriba mencionados.

Prof. Felipe R. Tuz Poot 130


PRUEBA DE HIPÓTESIS A PARTIR DE UNA MUESTRA

Prueba de hipótesis para la media

Se comenzará estudiando las pruebas de hipótesis para la media 𝜇 de una sola población sobre la
que se desea hacer inferencia. Los estadísticos a utilizar son: el estadístico 𝑧 y el estadístico 𝑡, ¿cuál
se empleará? Pues dependerá de si se conoce o desconoce 𝜎 y considerando ciertas características
de la muestra y la población.

Prueba de hipótesis para la media 𝝁 con 𝝈 conocida

Las hipótesis que pueden ser de interés al investigador respecto a la media 𝜇 son:

I 𝐻0 : 𝜇 = 𝜇0 𝑣𝑠 𝐻𝑎 : 𝜇 ≠ 𝜇0
II 𝐻0 : 𝜇 = 𝜇0 𝑣𝑠 𝐻𝑎 : 𝜇 > 𝜇0
III 𝐻0 : 𝜇 = 𝜇0 𝑣𝑠 𝐻𝑎 : 𝜇 < 𝜇0

donde 𝜇0 es una constante.

Para las hipótesis establecidas aquí, es importante considerar que la prueba sólo es válida bajo
cualquiera de las siguientes condiciones:

i) la muestra aleatoria es obtenida de una población con distribución normal o


aproximadamente normal
ii) Se desconoce la distribución poblacional correspondiente a la muestra, pero el
tamaño de la muestra n es grande, mayor o igual a 30.

Así, por la teoría de distribuciones muestrales, y considerando el error tipo I se tiene que el
estadístico de prueba adecuado es:
𝑦̅ − 𝜇0
𝑧= 𝜎
√𝑛
donde:
𝑦̅ es la media muestral con el tamaño de muestra 𝑛
𝜇0 es la media poblacional planteada en la hipótesis nula
𝜎 es la desviación estándar poblacional.

El estadístico 𝑧 tiene una distribución normal estándar o aproximadamente normal, entonces, la


región de rechazo de 𝐻0 con el nivel de significancia 𝛼 es:

a) Para las hipótesis planteadas en I la región de rechazo está dada por los valores que
se obtienen de z y que cumplen |𝑧| > 𝑧𝛼⁄2
b) Para las hipótesis planteadas en II la región de rechazo está dada por los valores que
obtienen de z que cumplan 𝑧 > 𝑧𝛼
c) Para las hipótesis planteadas en III la región de rechazo está dada por los valores que
se obtienen de z que cumplan 𝑧 < −𝑧𝛼

Ejemplo
Un ingeniero establece que en promedio las mediciones del diámetro del tubo de albañil es mayor
que 30. Para comprobar que lo que establece el ingeniero efectivamente es lo correcto se toma

Prof. Felipe R. Tuz Poot 131


una muestra aleatoria de 100 tubos del cual resulta una media de 32 cm y una varianza de 4. ¿Apoya
la muestra la aseveración del ingeniero? Responda con un 95% de confianza.

Solución
La hipótesis que se desea probar es:

𝐻0 : 𝜇 = 30 𝑣𝑠 𝐻𝑎 : 𝜇 > 30.

Este ejemplo es el caso ii) planteado en esta sección pues 𝜎 es desconocida pero el tamaño de
muestra 𝑛 = 100 es grande.

Se estima la varianza poblacional 𝜎 2 a través de la varianza muestral 𝑠 2 = 4. Así, el estadístico de


prueba es
𝑦̅ − 𝜇𝑜 𝑦̅ − 𝜇𝑜 32 − 30
𝑧= 𝜎 ≈ 𝑠 = = 10
2
√𝑛 √𝑛 √100

Y el valor crítico es z = 𝑧0.05 = 1.64. Ya que 𝑧 calculada cumple que 𝑧 > 𝑧0.05 = 1.64 entonces se
rechaza la hipótesis nula a favor de la hipótesis alternativa, esto es, se acepta la hipótesis que
plantea el ingeniero con un 95% de confianza.

Prueba de hipótesis para la media µ, con 𝝈 desconocida.

Las hipótesis que pueden ser de interés al investigador respecto a la media 𝜇 son:

I 𝐻0 : 𝜇 = 𝜇0 𝑣𝑠 𝐻𝑎 : 𝜇 ≠ 𝜇0
II 𝐻0 : 𝜇 = 𝜇0 𝑣𝑠 𝐻𝑎 : 𝜇 > 𝜇0
III 𝐻0 : 𝜇 = 𝜇0 𝑣𝑠 𝐻𝑎 : 𝜇 < 𝜇0

donde 𝜇0 es una constante.

Para las hipótesis establecidas es importante que la muestra aleatoria obtenida esté bajo cualquiera
de las siguientes condiciones:

i) la muestra aleatoria es obtenida de una población con distribución normal o


aproximadamente normal
ii) Se desconoce la distribución poblacional correspondiente a la muestra, pero el
tamaño de la muestra n es grande, mayor o igual a 30.

Así, bajo cualquiera de estas condiciones que cumpla la muestra, se tiene por teoría de
distribuciones muestrales y considerando el error tipo I que, el estadístico de prueba adecuado para
cualquiera de las hipótesis planteadas es:

𝑦̅ − 𝜇0
𝑡= 𝑠
⁄ 𝑛

el cual tiene una distribución 𝑡 con 𝑛 − 1 grados de libertad y donde:

Prof. Felipe R. Tuz Poot 132


𝑦̅ es la media muestral con el tamaño de muestra 𝑛
𝜇0 es la media poblacional planteada en la hipótesis nula
𝑠 es la desviación estándar muestral.

Considerando la distribución 𝑡 (distribución 𝑡 con 𝑛 − 1 grados de libertad), se puede determinar


la región de rechazo y la región de aceptación de 𝐻0 con el nivel de significancia 𝛼.

a) Para las hipótesis del caso I, la región de rechazo es válida para cada valor 𝑡 que
cumple: |𝑡| > 𝑡𝛼⁄2,𝑛−1
b) Para las hipótesis del caso II, la región de rechazo es válida para cada valor t que
cumple: 𝑡 > 𝑡𝛼,𝑛−1
c) Para las hipótesis del caso III, la región de rechazo es válida para cada valor 𝑡 que
cumple: 𝑡 < −𝑡𝛼,𝑛−1

Notas
1) En el caso i) no importa el tamaño de muestra, siempre será válido utilizar el
estadístico 𝑡.
2) En el caso ii) cuando el tamaño de muestra es grande, la distribución 𝑡 con 𝑛 − 1
grados de libertad se aproxima a la distribución normal estándar, por lo que podemos
utilizar el estadístico de prueba
𝑦̅ − 𝜇0
𝑧= 𝜎
⁄ 𝑛

con la desviación estándar poblacional 𝜎 estimada por la desviación estándar


muestral 𝑠.
3) Cuando no se cumple ninguno de los casos i) y ii), es decir, se desconoce la
distribución de la que proviene la muestra y el tamaño de muestra es 𝑛 < 30, no es
posible utilizar los estadísticos 𝑡 y 𝑧 para resolver la prueba de hipótesis respecto a
la media. En esta situación se emplea metodología estadística no paramétrica, que en
este curso no será abordada.

Ejemplo
En una fábrica de materiales se fabrican unas varillas con una resistencia de 4500 kg/cm 2. Un
ingeniero sospecha que cierta maquinaria tiene fallas en la fabricación y asegura que la máquina
está fabricando varillas con resistencia diferente a 4500 kg/cm2, por lo propone un ajuste a dicha
maquinara. Con la finalidad de mostrar que la máquina está fallando, un día al azar se toma una
muestra aleatoria de 10 varillas de la producción, al probarlas a la tensión hasta la ruptura se
obtiene una resistencia media de 4200 kg./cm2, con una desviación estándar de 200 kg. /cm2.
Compruebe con un nivel de significancia de 0.05 si la máquina realmente necesita un ajuste.
Considere que la variable poblacional resistencia tiene distribución normal.

Solución
La muestra proviene de una población con distribución normal, se desconoce la desviación estándar
poblacional 𝜎, y además el tamaño de muestra es pequeño, por lo que se usará la distribución 𝑡 de
student para estimar el promedio poblacional, 𝜇 (si el tamaño de muestra fuese grande podría
usarse s como estimación para 𝜎 y usar el estadístico de prueba 𝑧, como se indica en la sección
anterior).

La hipótesis a probar es:

Prof. Felipe R. Tuz Poot 133


𝐻0 : 𝜇 = 4500 𝑣𝑠 𝐻𝑎 : 𝜇 ≠ 4500.

El estadístico de prueba es:


𝑦̅ − 𝜇0 4200 − 4500 300
𝑡= 𝑠 = = = −4.74
⁄ 𝑛 200⁄ 63.246
√ √10

El valor crítico es 𝑡𝛼,𝑛−1 = 𝑡0.025,9 = 2.262.

La región de rechazo está dada por |𝑡| > 𝑡𝛼/2,(𝑛−1). Entonces el valor del estadístico cae en la región
de rechazo, por tanto se rechaza la hipótesis nula y se concluye que los datos favorecen la hipótesis
planteada por el ingeniero, por lo que se sugiere que la maquinaria entre a revisión con un 95% de
confianza.

Prueba de hipótesis para la proporción

Prueba de hipótesis para la proporción poblacional 𝒑, en muestras grandes (𝒏 ≥ 𝟑𝟎).

Como se ha mencionado en la sección de intervalos de confianza, la proporción observada de éxitos


𝑥
en la muestra, 𝑝̂ = 𝑛, es un estimador de la proporción poblacional 𝑝, que en realidad resulta la
media de una población Bernoulli.

Las hipótesis que pueden ser de interés respecto a la proporción 𝑝 de una población 𝐵𝑒𝑟𝑛𝑜𝑢𝑙𝑙𝑖(𝑝)
son:
I 𝐻0 : 𝑝 = 𝑝0 𝑣𝑠 𝐻𝑎 : 𝑝 ≠ 𝑝0
II 𝐻0 : 𝑝 = 𝑝0 𝑣𝑠 𝐻𝑎 : 𝑝 > 𝑝0
III 𝐻0 : 𝑝 = 𝑝0 𝑣𝑠 𝐻𝑎 : 𝑝 < 𝑝0

Considerando el error tipo I, el estadístico de prueba adecuado para cualquiera de las hipótesis
respecto a 𝑝, planteadas es:
𝑝̂ − 𝑝0
𝑧=
𝑝 𝑞
√ 0 0
𝑛

la cual tiene aproximadamente una distribución normal estándar, justificada por el teorema del
límite central, debido a que el tamaño de la muestra es 𝑛 ≥ 30.

En este estadístico de prueba:

𝑝̂ es la proporción poblacional estimada con el tamaño de muestra 𝑛


𝑝0 es la proporción hipotética planteada en la hipótesis nula y 𝑞0 = 1 − 𝑝0

Considerando la distribución aproximada de 𝑧 es posible definir las regiones de rechazo para cada
hipótesis planteada, las cuales resultan ser:
a) Para las hipótesis del caso I, la región de rechazo es válida para los valores de 𝑧 que
cumplan |𝑧| > 𝑧𝛼⁄2
b) Para las hipótesis del caso II, la región de rechazo es válida para los valores de 𝑧 que
cumplan 𝑧 > 𝑧𝛼

Prof. Felipe R. Tuz Poot 134


c) Para las hipótesis del caso III, la región de rechazo es válida para los valores de 𝑧
que cumplan 𝑧 < −𝑧𝛼

Ejemplo
Un fabricante de insecticidas para moscas, desea comprobar que una nueva marca “Matamos K”
es mucho más efectivo que una determinada marca “X” que se encuentra en el mercado. La marca
X mata en promedio 800 de 1000 moscas. Para comprobar si la nueva marca es más efectiva, se
realiza un experimento en el cual, se colocan 1000 moscas en un cuarto y se usa el insecticida
“Matamos K” y resulta que sucumben 815. ¿De acuerdo a estos datos es estadísticamente más
efectiva esta nueva marca? Justifique con un 99% de confianza.

Solución
La hipótesis de interés a probar es: 𝐻0 : 𝑝 = 0.80 𝑣𝑠 𝐻𝑎 : 𝑝 > 0.80.

Se está en el caso de que la muestra es grande, por lo que el siguiente proceso tiene validez

𝑥 815
𝑝̂ = = = 0.815
𝑛 1000

El estadístico de prueba es:

𝑝̂ − 𝑝0 0.815 − 0.800 0.015


𝑧= = = = 1.186
√𝑝0 𝑞0 ⁄𝑛 √(0.8)(0.2)⁄1000 0.01265

Además se tiene que el valor crítico es 𝑧𝛼 = 𝑧0.01 = 2.33. Por lo tanto como el estadístico 𝑧 =
1.186 calculado es tal que 𝑧 < 𝑧0.01 = 2.33, es decir, el valor del estadístico 𝑧 no cae en la región
de rechazo, no es posible rechazar 𝐻0 a favor de la hipótesis alternativa.

Se concluye que no hay razón suficiente para decir que el nuevo insecticida es más eficiente que el
de la marca X, es decir, los datos no apoyan a la hipótesis del fabricante.

Prueba de hipótesis para la varianza

Prueba de hipótesis para la varianza poblacional, 𝝈𝟐 , cuando la población tiene distribución


normal o aproximadamente normal

Para realizar la prueba de hipótesis para la varianza poblacional, 𝜎 2 sólo se abordará el caso más
común en el que la media poblacional 𝜇 es desconocida. Hay muchas situaciones prácticas donde
𝜎 2 es el objetivo principal de una investigación experimental; así, este parámetro puede asumir una
importancia mucho mayor que la de la media poblacional. Por ejemplo, los instrumentos de
medición científica deben producir valores insesgados con un error de medición muy pequeño; el
altímetro de una aeronave que mide en promedio la altitud correcta sería de poco valor si la
desviación estándar del error de medición fuese 2000 metros; los repuestos que se producen en un
proceso industrial deben tener un mínimo de variabilidad con el objeto de reducir el número de
productos cuyo tamaño esté fuera de número de productos defectuosos. Además, en general es
deseable mantener una varianza mínima en las mediciones para conseguir el control de
determinados proceso y por lo tanto minimizar el porcentaje de productos de poca calidad.

Las hipótesis de interés respecto a la varianza poblacional 𝜎 2 son:

Prof. Felipe R. Tuz Poot 135


I 𝐻0 : 𝜎 2 = 𝜎02 𝑣𝑠 𝐻𝑎 : 𝜎 2 ≠ 𝜎02
II 𝐻0 : 𝜎 2 = 𝜎02 𝑣𝑠 𝐻𝑎 : 𝜎 2 > 𝜎02
III 𝐻0 : 𝜎 2 = 𝜎02 𝑣𝑠 𝐻𝑎 : 𝜎 2 < 𝜎02

donde 𝜎02 es una constante positiva, un valor hipotético.

Es importante hacer énfasis de que bajo la condición de que la muestra obtenida es de una
distribución normal, se tiene, por la teoría de distribuciones muestrales y considerando el error tipo
I que el estadístico de prueba adecuado para cualquiera de las hipótesis establecidas para 𝜎 2 es:

(𝑛 − 1)𝑠 2
𝜒2 =
𝜎02

La cual tiene una distribución Chi- cuadrada con 𝑛 − 1 grados de libertad y donde

𝜎02 es la varianza establecida en la hipótesis nula


𝑠 2 es la varianza muestral con tamaño de muestra 𝑛

A partir de esta distribución correspondiente al estadístico de prueba, es posible definir las regiones
de rechazo para cada hipótesis planteada:
a) Para las hipótesis del caso I, la región de rechazo está formada por los valores de 𝜒 2
que cumplen que 𝜒 2 > 𝜒𝛼2,𝑛−1 o 𝜒 2 < 𝜒1− 2
𝛼
,𝑛−1
2 2
b) Para las hipótesis del caso II, la región de rechazo está formada por los valores de 𝜒 2
2
que cumplen que: 𝜒 2 > 𝜒𝛼,𝑛−1
c) Para las hipótesis del caso III, la región de rechazo está formada por los valores de
2
𝜒 2 que cumplen que: 𝜒 2 < 𝜒1−𝛼,𝑛−1

Ejemplo
Un experimentador está convencido de que su equipo de medición tiene una variabilidad medida
por una desviación estándar de  = 2. Durante un experimento, obtuvo las observaciones 4.1, 5.2,
10.2. ¿Están en desacuerdo estos datos con su posición? Si esta respuesta es afirmativa, es
necesaria la revisión del equipo. Responda con un nivel de significancia de  = 0.1. Supóngase que
los datos de medición tienen una distribución normal.

Solución
La hipótesis que se desea probar es:
𝐻0 : 𝜎 = 2 𝑣𝑠 𝐻𝑎 : 𝜎 ≠ 2

que es equivalente a
𝐻0 : 𝜎 2 = 4 𝑣𝑠 𝐻𝑎 : 𝜎 2 ≠ 4

La varianza muestral de estos datos es


3
1
𝑠 2 = ∑(𝑥𝑖 − 𝑥̅ )2 = 10.57
2
𝑖=1

El estadístico de prueba es

Prof. Felipe R. Tuz Poot 136


(𝑛 − 1)𝑠 2 2(10.57)
𝜒2 = = = 5.285
𝜎02 4

Se sabe que se rechaza 𝐻0 si el valor que se obtiene de 𝜒 2 cumple que:

𝜒2 > 𝜒2𝛼,𝑛−1 o 𝜒2 < 𝜒21−𝛼,𝑛−1


2 2

Los valores críticos obtenidos de la tabla de la distribución Ji-cuadrada son 𝜒𝛼2,𝑛−1 = 𝜒0.05,2
2
= 5.99
2
2 2
y 𝜒1− 𝛼
,𝑛−1
= 𝜒0.95,2 = 0.103, por lo que el valor del estadístico de prueba no cae en la región de
2
rechazo, no se puede rechazar la hipótesis nula a favor de la hipótesis alternativa. Como
consecuencia no hay razón suficiente para dar una revisión al equipo con 90% de confianza.

Prof. Felipe R. Tuz Poot 137


PRUEBA DE HIPÓTESIS A PARTIR DE DOS MUESTRAS

Pruebas de hipótesis para diferencia de medias poblacionales, 𝝁𝑿 − 𝝁𝒀 cuando las


desviaciones estándar poblacionales 𝝈𝑿 y 𝝈𝒀 son conocidas

Supóngase que se tienen dos muestras aleatorias: 𝑋1 , … , 𝑋𝑛𝑋 y 𝑌1 , … , 𝑌𝑛𝑌 . Las pruebas de hipótesis
aquí planteadas se establecen bajo cualquiera de las siguientes condiciones.

i) Las poblaciones de donde son extraídas las muestras tienen distribución normal
o aproximadamente normal y entre las muestras hay independencia.
ii) Las distribuciones poblacionales de donde son extraídas las muestras son
desconocidas pero los tamaños de las muestras son mayores o iguales a 30 y entre
las muestras hay independencia.

En el siguiente cuadro se presentan los posibles planteamientos de hipótesis con sus


correspondientes estadísticas de prueba y regiones de rechazo utilizando la distribución normal
estándar.

Hipótesis nula Hipótesis alternativa Medida Estadística de Región de rechazo


𝑯𝟎 𝐻𝑎 Prueba
𝜇𝑋 − 𝜇𝑌 = 𝐷0 𝜇𝑋 − 𝜇𝑌 ≠ 𝐷0 (𝑥̅ − 𝑦̅) − 𝐷0 |𝑧| > 𝑧𝛼⁄2
𝑧=
2 𝜎2
𝜇𝑋 − 𝜇𝑌 = 𝐷0 𝜇𝑋 − 𝜇𝑌 > 𝐷0 √𝜎𝑥 + 𝑦 𝑧 > 𝑧𝛼
𝑛𝑥 𝑛𝑦
𝜇𝑋 − 𝜇𝑌 = 𝐷0 𝜇𝑋 − 𝜇𝑌 < 𝐷0 𝑧 < −𝑧𝛼

El valor 𝐷0 se refiere a la posible diferencia entre las medias poblacionales. Cuando en el estudio
se desea probar si los promedios poblacionales son diferentes, entonces se considera 𝐷0 = 0 y los
planteamientos de las hipótesis se reducen a cualquiera de las dos formas siguientes que se
presentan a manera de ejemplo:

𝐻0 : 𝜇𝑋 − 𝜇𝑌 = 0 𝑣𝑠 𝐻𝑎 : 𝜇𝑋 − 𝜇𝑌 ≠ 0
ó
𝐻0 : 𝜇𝑋 = 𝜇𝑌 𝑣𝑠 𝐻𝑎 : 𝜇𝑋 ≠ 𝜇𝑌

Ejemplo
Se desea analizar el peso de las varillas fabricadas por dos compañías, por tanto se toman muestras
aleatorias de 100 varillas de acero que se fabrican en cada una de las compañías A y B. De la muestra
de la compañía A se obtiene un peso medio de 6.5 kg., asimismo, la muestra de la compañía B indica
un peso medio de 6.3 kg. Considerando que las desviaciones estándar poblacionales de cada
compañía son respectivamente 𝜎𝐴 = 0.4 kg. y 𝜎𝐵 = 0.3 kg. Se puede concluir que alguna de las
compañías fabrica las varillas con mayor peso? Responda estadísticamente con un 99% de
confianza.

Solución
Se desea probar la hipótesis:

𝐻0 : 𝜇𝐴 = 𝜇𝐵 𝑣𝑠 𝐻𝑎 : 𝜇𝐴 ≠ 𝜇𝐵

Prof. Felipe R. Tuz Poot 138


La información que se tiene es 𝑛𝐴 = 𝑛𝐵 = 100, 𝑥̅𝐴 = 6.5 𝑦 𝑥̅𝐵 = 6.3. Además las desviaciones son
conocidas, a saber, 𝜎𝐴 = 0.4 kg y 𝜎𝐵 = 0.3 kg. De manera natural, las muestras son
independientes, por lo que el estadístico de prueba es:

𝑥̅ − 𝑦̅ 6.5 − 6.3 0.2


𝑧= = = =4
2 2 0.05
𝜎2 𝜎2 √(0.4) + (0.3)
√ 𝐴+ 𝐵 100 100
𝑛𝐴 𝑛𝐵

El valor crítico es 𝑧𝛼/2 = 𝑧0.005 = 2.58 y como el valor del estadístico de prueba es tal que |𝑧| >
𝑧0.005 = 2.58, se rechaza la hipótesis nula a favor de la alternativa con una confianza del 99%, es
decir, los datos apoyan que efectivamente una de las fábricas produce varillas con mayor peso.

Prueba de hipótesis para diferencia de medias poblacionales 𝝁𝑿 − 𝝁𝒀 cuando las


desviaciones estándar poblacionales 𝝈𝑿 y 𝝈𝒀 son desconocidas

Supóngase que se tienen dos muestras aleatorias X1 , … , X nX y Y1 , … , YnY y se cumple alguna de las
siguientes condiciones:

i) Las poblaciones de las cuales se extraen las muestras tienen distribución normal o
aproximadamente normal y entre las dos muestras hay independencia.
ii) Las distribuciones poblacionales de donde son extraídas las muestras son desconocidas pero los
tamaños de las muestras son mayores o iguales a 30 y entre las dos muestras hay independencia.

Entonces, bajo la condición i), la prueba de hipótesis para 𝜇𝑋 − 𝜇𝑌 se determina de acuerdo a


alguno de los dos casos siguientes:

Caso 1: 𝜎𝑋 = 𝜎𝑌

En este caso, los posibles planteamientos de las hipótesis con sus correspondientes estadísticas de
prueba y regiones de rechazo utilizando la distribución 𝑡 de student, se presentan en el siguiente
cuadro.

Hipótesis nula Hipótesis Medida Estadística de Región de rechazo


𝑯𝟎 alternativa 𝐻𝑎 Prueba
(𝑥̅ − 𝑦̅) − 𝐷0
𝜇𝑋 − 𝜇𝑌 = 𝐷0 𝜇𝑋 − 𝜇𝑌 ≠ 𝐷0 𝑡= |𝑡| > 𝑡𝛼⁄2,𝑣
1 1
𝑆𝑝 √𝑛 + 𝑛 𝑡 > 𝑡𝛼,𝑣
𝜇𝑋 − 𝜇𝑌 = 𝐷0 𝜇𝑋 − 𝜇𝑌 > 𝐷0 𝑥 𝑦

𝑣 = 𝑛 𝑥 + 𝑛𝑦 − 2
𝜇𝑋 − 𝜇𝑌 = 𝐷0 𝜇𝑋 − 𝜇𝑌 < 𝐷0 (𝑛𝑥 −1)𝑆𝑥2 +(𝑛𝑌 −1)𝑆𝑦2 𝑡 < −𝑡𝛼,𝑣
𝑆𝑝2 = 𝑛𝑥 +𝑛𝑦 −2

Ejemplo
Se llevó a cabo un experimento para comparar el deterioro abrasivo de dos materiales laminados
diferentes. Se probaron doce piezas del material 1, exponiendo cada una a una máquina para medir
el deterioro. De la misma manera, se probaron diez piezas del material 2. En cada caso, se observó

Prof. Felipe R. Tuz Poot 139


la profundidad del deterioro. Las muestras del material 1 dieron un deterioro promedio (registrado)
de 85 unidades con una desviación estándar muestral de 4, mientras que las muestras del material
2 dieron un promedio de 81 y una desviación estándar muestral de 5. ¿Puede concluirse en el nivel
de significancia de 0.05 que el deterioro abrasivo del material 1 excede al del material 2 por más de
dos unidades? Asuma que las poblaciones son aproximadamente normales con varianzas iguales.

Solución
Si 𝜇1 y 𝜇2 representan las medias poblacionales de los deterioros abrasivos para el material 1 y 2
respectivamente, entonces se tienen las hipótesis siguientes:

𝐻0 : 𝜇1 − 𝜇2 = 2
𝐻𝑎 : 𝜇1 − 𝜇2 > 2

Se trata de una prueba de hipótesis de una cola a la derecha con 𝛼 = 0.05 y 𝑣 = 12 + 10 − 2 =


20 grados de libertad. De la tabla de distribución 𝑡 de student se obtiene el valor crítico de 1.725.

De la información del ejemplo se tiene que:

𝑥̅1 = 85 𝑆1 = 4 𝑛1 = 12
𝑥̅2 = 81 𝑆2 = 5 𝑛2 = 10

La medida estadística de prueba es:


11(16) + 9(25)
𝑆𝑝 = √ = 4.478
12 + 10 − 2

(𝑥̅1 − 𝑥̅2 ) − 𝐷0 (85 − 81) − 2


𝑡= = = 1.04
1 1 1 1
𝑆𝑝 √ + 4.478√12 + 10
𝑛1 𝑛2

0.45

0 1.04 1.725 t

La medida estadística de prueba 1.04 es menor que el valor crítico 1.725 por lo que cae en la región
de aceptación y se acepta la hipótesis nula.

Decisión: No se está en condiciones de concluir que el deterioro abrasivo del material 1 excede al
del material 2 por más de dos unidades, la muestra no aporta evidencia para esta conclusión.

Ejemplo
Se deben eliminar gases ácidos de otros gases de refinería en una instalación de productos
químicos, esto para reducir al mínimo la corrosión de las plantas. Dos métodos para eliminar estos
gases produjeron el ritmo de corrosión (mm./año), medidas que se representan a continuación:

Método A: 0.3, 0.7, 0.5, 0.8, 0.9, 0.7, 0.8


Método B: 0.7, 0.8, 0.7, 0.6, 2.1, 0.6, 1.4, 2.3

Prof. Felipe R. Tuz Poot 140


¿Se puede concluir que el método A tiene una media menor en el ritmo de corrosión que el método
B? Justifique estadísticamente con un nivel de significancia de 0.1. ¿Qué hipótesis se deben hacer
para comprobar la validez de la respuesta?

Solución
Se desea probar la hipótesis:

𝐻0 : 𝜇𝐴 = 𝜇𝐵 𝑣𝑠 𝐻𝑎 : 𝜇𝐴 < 𝜇𝐵

Equivalente a:

𝐻0 : 𝜇𝐴 − 𝜇𝐵 = 0 𝑣𝑠 𝐻𝑎 : 𝜇𝐴 − 𝜇𝐵 < 0

La información que se tiene es:


𝑥̅𝐴 = 0.6714 𝑆𝐴2 = 0.0424 𝑛𝐴 = 7
𝑥̅𝐵 = 1.15 𝑆𝐵2 = 0.4886 𝑛𝐵 = 8

(𝑛𝐴 − 1)𝑆𝐴2 + (𝑛𝐵 − 1)𝑆𝐵2 (7 − 1)(0.0424) + (8 − 1)(0.4886)


𝑆𝑝2 = = = 0.2827
𝑛𝐴 + 𝑛𝐵 − 2 7+8−2

Para poder utilizar el estadístico de prueba descrito previamente es necesario realizar los siguientes
supuestos:
• Las muestras aleatorias provienen de poblaciones con distribución normal y son
independientes.
• Las poblaciones tienen desviaciones estándar iguales, o sea 𝜎𝐴 = 𝜎𝐵 .

Luego, el estadístico de prueba es:

𝑥̅𝐴 − 𝑥̅𝐵 0.6714 − 1.15


𝑇= = = −1.7392
√(1⁄𝑛𝑋 + 1⁄𝑛𝑌 )(𝑆𝑝2 ) √(1⁄7 + 1⁄8)(0.2827)

Como 𝛼 = 0.10, el valor crítico es −𝑡𝛼,𝑛𝐴 +𝑛𝐵 −2 = −𝑡0.1,13 = −1.35. Como la estadística de prueba
es tal que 𝑇 < −𝑡0.1,13 entonces se rechaza 𝐻0 , es decir, los datos presentan evidencia para concluir
que el método A tiene una media en el ritmo de corrosión más baja que el método B.

Caso 2: 𝝈𝑨 ≠ 𝝈𝑩

En este caso, los posibles planteamientos de las hipótesis con sus correspondientes estadísticas de
prueba y regiones de rechazo utilizando la distribución t de student, se presentan en el siguiente
cuadro.

Hipótesis nula Hipótesis alternativa Medida Estadística de Región de rechazo


𝑯𝟎 𝐻𝑎 Prueba
(𝑥̅ − 𝑦̅) − 𝐷𝑜
𝜇𝑋 − 𝜇𝑌 = 𝐷0 𝜇𝑋 − 𝜇𝑌 ≠ 𝐷0 𝑡= |𝑡| > 𝑡𝛼⁄2,𝑣
2 𝑆2
𝜇𝑋 − 𝜇𝑌 = 𝐷0 𝜇𝑋 − 𝜇𝑌 > 𝐷0 √𝑆𝑥 + 𝑦 𝑡 > 𝑡𝛼,𝑣
𝑛𝑥 𝑛𝑦

Prof. Felipe R. Tuz Poot 141


donde
2 2
𝑆 2 𝑆𝑦
(𝑛𝑥 + 𝑛 )
𝜇𝑋 − 𝜇𝑌 = 𝐷0 𝜇𝑋 − 𝜇𝑌 < 𝐷0 𝑥 𝑦 𝑡 < −𝑡𝛼,𝑣
𝑣= 2
(𝑆𝑥2 ⁄𝑛𝑥 )2 (𝑆𝑦2 ⁄𝑛𝑦 )
𝑛𝑥 − 1 + 𝑛𝑦 − 1

Ejemplo
Un fabricante de unidades reproductoras de video está probando el diseño de dos microcircuitos
para determinar si producen un flujo de corriente medio equivalente. El departamento de
ingeniería de desarrollo ha obtenido los siguientes datos:

Para el Diseño 1 𝑛𝑥 = 15 𝑥̅ = 24.2 𝑆𝑥2 = 10


Para el Diseño 2 𝑛𝑦 = 10 𝑦̅ = 23.9 𝑆𝑦2 = 20

Se desea determinar si hay alguna diferencia en el flujo de corriente medio entre los dos diseños,
donde se supone que las poblaciones tienen distribución normal, pero no se desea suponer que las
varianzas son iguales. Utiliza un nivel de significancia de 0.1 para dar respuesta a esta hipótesis.

Solución
La hipótesis de interés a probar es:

𝐻0 : 𝜇𝑥 = 𝜇𝑦 𝑣𝑠 𝐻𝑎 : 𝜇𝑥 ≠ 𝜇𝑦

Ya que se considera que los datos de las muestras provienen de distribuciones normales, además
las varianzas son desconocidas y diferentes, el estadístico de prueba adecuado a emplear es:

(𝑋̅ − 𝑌̅) 24.2 − 23.9 0.3


𝑡= = = = 0.184
1.632993
2 𝑆2 √10 + 20
√𝑆𝑥 + 𝑦 15 10
𝑛𝑥 𝑛𝑦

2 2
𝑆 2 𝑆𝑦 10 20 2
(𝑛𝑥 + 𝑛 ) ( + 10)
𝑥 𝑦 7.111
𝑣= 2 = 152 2 = = 14.93
(𝑆𝑥2 ⁄𝑛𝑥 )2 (𝑆𝑦2 ⁄𝑛𝑦 ) 10 20 0.032 + 0.444
( ) ( )
𝑛𝑥 − 1 + 𝑛𝑦 − 1 15 + 10
14 9

es decir 𝜈 = 15 pues el valor de 𝜈 se redondea al entero más cercano.

El valor crítico es 𝑡𝛼,𝜈 = 𝑡0.05,15 = 1.753 y como el estadístico de prueba es tal que |𝑡| < 𝑡𝛼/2,𝜈 se
2
concluye que no se rechaza 𝐻0 por lo que los datos no proporcionan evidencia suficiente para
concluir que existe diferencia entre las medias.

Una vez presentada la condición i) se abordará a continuación la condición ii) que tiene las
siguientes características:
• Las distribuciones poblacionales son desconocidas
• Las desviaciones estándar 𝜎𝑥 y 𝜎𝑌 son desconocidas
• Los tamaños de las muestras son mayores o iguales a 30 y,

Prof. Felipe R. Tuz Poot 142


• Las muestras son independientes.

Como las desviaciones estándar son desconocidas se estiman con las desviaciones muestrales
𝑆𝑋 𝑦 𝑆𝑌 por ser estos estimadores consistentes de sus desviaciones estándar poblacionales
respectivas. Por ello pueden ser tratadas como desviaciones estándar poblacionales conocidas, lo
que permite utilizar la estadística de prueba y regiones de rechazo presentadas en la tabla
siguiente:

Hipótesis nula Hipótesis alternativa Medida Estadística de Región de rechazo


H0 𝐻𝑎 Prueba
𝜇𝑋 − 𝜇𝑌 = 𝐷0 𝜇𝑋 − 𝜇𝑌 ≠ 𝐷0 (𝑥̅ − 𝑦̅) − 𝐷0 |𝑍| > 𝑍𝛼⁄2
𝑧=
2 𝜎2
𝜇𝑋 − 𝜇𝑌 = 𝐷0 𝜇𝑋 − 𝜇𝑌 > 𝐷0 √𝜎𝑥 + 𝑦 𝑍 > 𝑍𝛼
𝑛𝑥 𝑛𝑦
𝜇𝑋 − 𝜇𝑌 = 𝐷0 𝜇𝑋 − 𝜇𝑌 < 𝐷0 𝑍 < −𝑍𝛼

Esta tabla es exactamente la misma que la empleada en el caso cuando las muestras provienen de
distribuciones normales y sus desviaciones estándares son conocidas.

Prueba de hipótesis para la diferencia de proporciones

Intervalo de confianza para diferencia de proporciones poblacionales 𝒑𝟏 − 𝒑𝟐 , con muestras


mayores o iguales a 30.

Cuando se tienen dos poblaciones en las cuales el interés radica en comparar las proporciones, al
igual que como se hizo con la diferencia de medias poblacionales, se realiza considerado un
estimador insesgado para la diferencia de proporciones 𝑝1 − 𝑝2 y este estimador es 𝑝̂1 − 𝑝̂ 2 , con
𝑥 𝑥
𝑝̂1 = 1 y 𝑝̂2 = 2 , donde 𝑥1 es el número de éxitos obtenido del tamaño de muestra 𝑛1 de una
𝑛1 𝑛2
población con distribución 𝐵𝑒𝑟𝑛𝑜𝑢𝑙𝑙𝑖(𝑝1 ) y 𝑥2 es el número de éxitos obtenido del tamaño de
muestra 𝑛2 de una población con distribución 𝐵𝑒𝑟𝑛𝑜𝑢𝑙𝑙𝑖(𝑝2 ).

En el siguiente cuadro se presentan los posibles planteamientos de las hipótesis nula y alterna, la
medida estadística de prueba utilizando la distribución normal estándar, así como, las regiones de
rechazo correspondientes.

Hipótesis nula Hipótesis alternativa Medida Estadística de Región de rechazo


𝑯𝟎 𝐻𝑎 Prueba
(𝑝̂1 − 𝑝̂2 ) − 𝐷0
𝑝1 − 𝑝2 = 𝐷0 𝑝1 − 𝑝2 ≠ 𝐷0 𝑍= |𝑍| > 𝑍𝛼⁄2
1 1
√𝑝̂ 𝑞̂ ( + )
𝑛 1 𝑛2
𝑝1 − 𝑝2 = 𝐷0 𝑝1 − 𝑝2 > 𝐷0 𝑥1 + 𝑥2 𝑍 > 𝑍𝛼
𝑝̂ =
𝑛1 + 𝑛2
𝑝1 − 𝑝2 = 𝐷0 𝑝1 − 𝑝2 < 𝐷0 𝑍 < −𝑍𝛼
𝑞̂ = 1 − 𝑝̂

Prof. Felipe R. Tuz Poot 143


Ejemplo
Considere un proceso de producción que tiene una fracción defectuosa 𝑝1 desconocida. A este
proceso se le realizan unas mejoras para reducir el porcentaje de defectuosos que está
produciendo, y queremos saber si estos cambios sí reducen sustancialmente la proporción de
artículos defectuosos del proceso. Para ello, se toma una muestra de 200 artículos del proceso
original, y se encuentran 12 defectuosos, por otro lado se examinan 150 artículos del nuevo proceso
y se observan 6 defectuosos. ¿Cree usted que los cambios efectuados al proceso han reducido el
porcentaje de artículos defectuosos? Use un nivel de confianza del 95%.

Solución
Sean 𝑝1 y 𝑝2 proporciones poblacionales del proceso original y del nuevo respectivamente,
entonces se desea probar la hipótesis:

𝐻0 : 𝑝1 = 𝑝2 𝑣𝑠 𝐻𝑎 : 𝑝1 > 𝑝2

Los datos que se tienen son

𝑥1 = 12 𝑥2 = 6 𝑛1 = 200 𝑛2 = 150

por lo que las proporciones muestrales son

12 6
𝑝̂1 = = 0.06 y 𝑝̂2 = = 0.04
200 150

y además
𝑥1 + 𝑥2 12 + 6
𝑝̂ = = = 0.05143
𝑛1 + 𝑛2 200 + 150

Ya que las muestras son grandes el estadístico de prueba adecuado es:

𝑝̂1 − 𝑝̂ 2 0.06 − 0.04 0.02


𝑧= = = = 0.8382
1 1 0.02386
√𝑝̂ 𝑞̂ ( + ) √(0.05143)(0.94857) ( 1 + 1 )
𝑛1 𝑛2 200 150

El valor crítico es 𝑧𝛼 = 𝑧0.05 = 1.64 y como el valor del estadístico es tal que 𝑧 < 𝑧𝛼 = 1.64
entonces la hipótesis nula no puede ser rechazada, es decir, los datos no presentan evidencia para
concluir que los cambios efectuados al proceso ayudan a disminuir el porcentaje de defectuosos
con una confianza del 95%.

Prueba de hipótesis para el cociente de varianzas

Prueba de hipótesis para la igualdad de varianzas 𝝈𝟐𝒙 = 𝝈𝟐𝒚 , poblaciones con distribución normal.

Cuando nuestro objetivo es el de comparar las medias de dos poblaciones con distribución normal,
el parámetro que se estudia es la diferencia de medias, ahora, si el objetivo es el de comparar las
variabilidad de las poblaciones, el parámetro que se estudia es el cociente de varianzas, 𝜎𝑥2 ⁄𝜎𝑦2 , la
𝑠𝑥2 𝜎𝑦2
justificación es que en distribuciones muestrales se comprueba que el estadístico 𝑠𝑦2 𝜎𝑥2
tiene una
distribución 𝐹𝑛𝑥 −1,𝑛𝑦 −1 (𝑛𝑥 tamaño de muestra de 𝑋 y 𝑛𝑦 tamaño de muestra de 𝑌); en particular

Prof. Felipe R. Tuz Poot 144


𝜎𝑦2 𝑠𝑥2
si 𝜎𝑥2 = 𝜎𝑦2 o bien = 1, entonces 𝐹 = tiene la misma distribución de Fisher. En cambio no
𝜎𝑥2 𝑠𝑦2
hay tal justificación si se usa diferencia de varianzas.

En el siguiente cuadro se presentan los posibles planteamientos de las hipótesis con sus
correspondientes estadísticas de prueba y regiones de rechazo utilizando la distribución de Fisher.

Prof. Felipe R. Tuz Poot 145


Hipótesis nula Hipótesis alternativa Medida Estadística de Región de rechazo
𝑯𝟎 𝐻𝑎 Prueba
1
𝑆12 𝑓<𝑓
𝑓= 2 𝛼⁄2,(𝑣2 ,𝑣1 )
𝜎12 = 𝜎22 𝑆2
𝜎12 ≠ 𝜎22 con 𝑣1 = 𝑛1 − 1 ó
grados de libertad en el 𝑓 > 𝑓𝛼⁄2,(𝑣1 ,𝑣2 )

𝜎12 = 𝜎22 𝜎12 > 𝜎22 numerador y 𝑣2 = 𝑓 > 𝑓𝛼,(𝑣1 ,𝑣2 )


𝑛2 − 1 grados de
libertad en el 1
𝑓<
𝜎12 = 𝜎22 𝜎12 < 𝜎22 denominador. 𝑓𝛼,(𝑣2 ,𝑣1 )

La notación 𝑓𝛼 (𝜈1 , 𝜈2 ) indica que se debe considerar el valor crítico de la tabla F-Fisher con 𝜈1
grados de libertad en el numerador, 𝜈2 grados de libertad en el denominador y con un nivel de
significancia 𝛼.

En las siguientes gráficas se presentan los diferentes casos de pruebas de hipótesis de una cola y
de dos colas, así como las fórmulas para calcular los valores críticos; también se muestran las
regiones de rechazo identificadas como la parte sombreada. En el caso de pruebas de hipótesis de
una cola, ya sea a la izquierda o a la derecha, el nivel de significancia es el valor de α mientras que
cuando la prueba de hipótesis es de dos colas el nivel de significancia es 𝛼/2.

Región de rechazo para la prueba de hipótesis cuando 𝐻𝑎 : 𝜎21 < 𝜎22


f

Región de rechazo para la prueba de hipótesis cuando 𝐻𝑎 : 𝜎21 > 𝜎22

Prof. Felipe R. Tuz Poot 146


f

Región de rechazo para la prueba de hipótesis cuando 𝐻𝑎 : 𝜎21 ≠ 𝜎22

Ejemplo
Un médico asegura que la variabilidad entre el peso de las niñas (𝑋) y los niños (𝑌) es diferente.
Para comprobar estadísticamente dicha afirmación se realiza el experimento de seleccionar dos
muestras, una de 10 niñas y otra de 8 niños, de los cuales se tuvieron varianzas de 𝑠𝑥2 = 2.1 y 𝑠𝑦2 =
3.21, respectivamente. ¿Presentan las varianzas muestrales suficiente evidencia que indique que
la afirmación del médico es cierta? Compruebe con un nivel de significancia de 0.1

Solución
Se desea probar la hipótesis

𝐻0 : 𝜎𝑥2 = 𝜎𝑦2 𝑣𝑠 𝐻𝑎 : 𝜎𝑥2 ≠ 𝜎𝑦2

Supóngase que las poblaciones tienen distribuciones que son razonablemente monticulares y que
por lo tanto satisfacen la suposición de que las poblaciones son normales, dado esto el siguiente
proceso es válido, estadísticamente.

El estadístico de prueba es
𝑆𝑥2 2.1
𝑓= 2 = = 0.6542
𝑆𝑦 3.21

Se sabe que la región de rechazo es para cualquier valor 𝑓 que cumple cualquiera de los siguientes
−1
casos: 𝑓 > 𝑓𝛼,𝑛 o 𝑓 < (𝑓𝛼,𝑛 −1 ) .
2 𝑥 −1,𝑛𝑦 −1 2 𝑦 −1,𝑛𝑥

Se tiene que:
𝑓𝛼,𝑛 = 𝑓0.05,9,7 = 3.68
2 𝑥 −1,𝑛𝑦 −1
−1
−1
(𝑓𝛼,𝑛 ) = (𝑓0.05,7,9 ) = (3.29)−1 = 0.3039.
2 𝑦 −1,𝑛𝑥 −1

Como el estadístico f no cumple con ninguna de las condiciones entonces no pertenece a la región
de rechazo. Como consecuencia no hay suficiente evidencia para concluir que la variación en pesos
entre los niños difiera con respecto a la variación en el peso entre las niñas con 90% de confianza.
Los datos no apoyan a la hipótesis que plantea el médico.

Prof. Felipe R. Tuz Poot 147

También podría gustarte