INSTRUMENTOS DE TOMA DE DECISIONES
PARA NEGOCIOS II ADM-136
TEMA III-Pruebas de Hipótesis
3.1 Concepto de prueba de hipótesis.
3.2 Etapas básicas de la prueba de hipótesis.
3.3 Prueba de hipótesis.
3.4 Errores tipo 1 y tipo 2 en pruebas de hipótesis.
3.5 Determinación del tamaño de la muestra requerido
para probar la media.
3.6 Otras pruebas de hipótesis
Pruebas de Hipótesis.
Hipótesis: Una hipótesis es una suposición o inferencia sobre el
valor desconocido de un parámetro. Este capítulo analiza cómo
se pueden probar las hipótesis y, por tanto, sacar algunas
conclusiones sobre la población.
Introducción.
El propósito del análisis estadístico es reducir el nivel de
incertidumbre en el proceso de toma de decisiones. Los gerentes
pueden tomar mejores decisiones sólo si tienen suficiente
información a su disposición. La prueba de hipótesis es una
herramienta analítica muy efectiva para obtener esta valiosa
información, bajo una gran variedad de circunstancias. Existen
muchos ejemplos comunes en los negocios:
Un embotellador de bebidas suaves debe determinar si el
peso promedio del contenido de sus botellas es 16 onzas
(µ = 16 onzas).
Un productor de software de computador desea
certificar que la proporción de sus productos que son
defectuosos es menor del 3% (π < 0.03).
Un fabricante de equipos deportivos desea saber si existe
evidencia de que un proceso de producción ha reducido
los costos promedios de producción por debajo de su nivel
actual de US$5 por unidad (µ < 5).
3.1 Concepto de prueba de hipótesis.
Para realizar una prueba de hipótesis, se hacen algunas
inferencias o supuestos con sentido acerca de la población.
El embotellador de bebidas suaves citado anteriormente
puede asumir, o plantear la hipótesis que el contenido
promedio es de 16 onzas (µ = 16). Esta hipótesis nula (𝐻0 :)
se prueba contra la hipótesis alternativa ( 𝐻𝐴 : ) que
establece lo contrario. En este caso, el contenido promedio
no es de 16 onzas (𝜇 ≠ 16). Por tanto, se tendría que
𝐻0 : 𝜇 = 16 𝐻𝐴 : 𝜇 ≠ 16
El término nula implica nada o nulo. El término surge de
sus primeras aplicaciones por parte de los investigadores
agrícolas quienes probaron la efectividad de un nuevo
fertilizante para determinar su impacto en la producción
de la cosecha. Asumieron que el fertilizante no hacía
ninguna diferencia en el rendimiento hasta que éste
produjo algún efecto.
La hipótesis nula, tradicionalmente contiene alguna
referencia de un signo con igual como " = ", " ≥ ", " ≤ ". Se
analiza esta idea de forma más completa en una discusión
posterior de las pruebas de hipótesis de una cola.
Con base en los datos muestrales, esta hipótesis nula es
rechazada o no rechazada. Nunca se puede "aceptar" la
hipótesis nula como verdadera. El no rechazo de la
hipótesis nula solamente significa que la evidencia
muestral no es lo suficientemente fuerte como para llevar
a su rechazo.
Incluso si 𝑋 = 16, no prueba que µ = 16. Podría ser que µ
sea 15.8 (o cualquier otro número), y debido al error de
muestreo la media muestral acaba de igualar al valor de
16 que se plantea como hipótesis.
Una analogía es que probar una hipótesis es como poner
una persona en juicio. El acusado se halla o culpable o no
culpable. Un veredicto de "inocente" nunca se considera.
Un veredicto no culpable simplemente significa que la
evidencia no es lo suficientemente fuerte como para
encontrar culpable al acusado. No significa que él o ella
sea inocente.
Cuando se realiza una prueba de hipótesis, la hipótesis
nula se supone que es "inocente" (verdadero) hasta que
una preponderancia de la evidencia indique que es
"culpable" (falso).
Se asume que se toma una muestra de n botellas y se halla una
media de 𝑋 = 16.15 𝑜𝑛𝑧𝑎𝑠 . ¿Se puede concluir que la media
poblacional no es 16? Después de todo, 16.15 no es 16
Probablemente no.
Esta pequeña diferencia podría ser estadísticamente
insignificante puesto que podría explicarse fácilmente como
un simple error de muestreo. Es decir, que debido al error de
muestreo es posible tener una población con una media de 16 y
salir con una media muestral de 𝑋 = 16.15. Debido al azar,
algunas botellas de la muestra pueden estar algo más llenas,
produciendo una media muestral que sobrestime levemente la
media poblacional.
La evidencia muestral que 𝑋 = 16.15 no es lo suficientemente
fuerte como para desencadenar un rechazo de la hipótesis nula
de que µ= 16.
Diferencia estadísticamente insignificante. Es la
diferencia entre el valor de la media poblacional bajo la
hipótesis y el valor de la media muestral que es lo
suficientemente pequeña como para atribuirla a un error
de muestreo.
Valores críticos de Z y zonas de rechazo para 95%
Valores críticos de Z y zonas de rechazo
Estos valores de Z de ± 1.96 son valores críticos que
determinan las zonas de rechazo. Para hallarlos, divida
por 2 el 95%. En la tabla Z, el área de 0.95/2 = 0.4750
indica un valor Z de 1.96. El 5% restante está distribuido
entre las dos colas, con 2.5% en cada zona de rechazo. Este
5% es el nivel de significancia, o el valor alfa de la
prueba.
Nivel de significancia. Valor que indica el porcentaje de
valores de la muestra que están fuera de ciertos límites,
suponiendo que la hipótesis nula es correcta; es decir, la
probabilidad de rechazar la hipótesis nula cuando es
cierta.
En la figura anterior vale la pena destacar que si la
hipótesis del embotellador es correcta y µ = 16 onzas, es
poco probable (sólo un 5% de oportunidad) que una
muestra cualquiera produzca un valor Z que caiga en
cualquiera de las zonas de rechazo. Por tanto, si un valor
de Z mayor que 1.96 o menor que -1.96 ocurre, no es
probable que la distribución esté centrada en µ = 16, y la
hipótesis nula sería rechazada.
Estos valores críticos de Z de ± 1.96 permiten establecer
una regla de decisión que diga si se rechaza la hipótesis
nula o no. La regla de decisión es:
Regla de decisión: "No se rechaza la hipótesis nula si los
valores Z están entre ± 1.96. Se rechaza si el valor Z es
menor que -1.96 o mayor que +1.96"
Errores tipo 1 y tipo 2 en pruebas de hipótesis.
Al probar una hipótesis se pueden cometer dos tipos de
errores. Un error tipo 1, es rechazar una hipótesis
nula que es verdadera. En la figura anterior, si la
hipótesis del embotellador es verdadera y µ = 16, todavía
hay un 5% de oportunidad de que una media muestral
pueda caer en cualquier zona de rechazo, haciendo que se
rechace de manera incorrecta la hipótesis nula. De todas las
medias muestrales en la distribución muestral, 2.5%
produce un valor de 1.96 en la zona de rechazo cola a la
derecha y 2.5% produce un valor de Z < -1.96 en la zona de
rechazo cola a la izquierda. Este 5% es el nivel de
significancia, o valor alfa (valor 𝛼 ) y representa la
probabilidad de un error tipo 1.
Error tipo I: Rechazar una hipótesis verdadera. La
probabilidad de cometer un error tipo 1 es igual al nivel de
significancia, o valor 𝛼 en el que se prueba la hipótesis.
Un error tipo II: es no rechazar una hipótesis nula que es
falsa. Si la hipótesis nula 𝐻0 : µ = 16 no es correcta, pero la
prueba falla en detectarlo, se comete un error tipo II.
Mientras que la probabilidad de un error tipo I es igual al
valor 𝛼 seleccionado, la probabilidad de un error tipo II,
representado con la letra 𝛽, no se determina fácilmente. No
se puede asumir que 𝛼 + 𝛽 = 1.
La selección de un valor 𝛼 depende del tipo de error, tipo I o
tipo II, que más se desea evitar. Vale la pena recordar que el
valor 𝛼 de la prueba es la probabilidad de error tipo .
Si se rechaza una hipótesis verdadera (error tipo 1) es más
serio que si no se rechaza una hipótesis falsa (error tipo II),
se desearía seleccionar un valor 𝛼 bajo, como 1% o 5%, para
minimizar la probabilidad de cometer un error tipo I. Por
otra parte, si no rechazar una hipótesis falsa (error tipo II)
es más serio, en este caso es preferible un valor 𝛼 más alto
como 10%.
Consecuencias de las decisiones en pruebas de
hipótesis
3.2 Etapas básicas de la prueba de hipótesis.
Hay cuatro pasos involucrados en una prueba:
Paso 1: Plantear las hipótesis.
Paso 2: Con base en los resultados de la muestra, calcular
el valor del estadístico de prueba Z.
Paso 3: Determinar la regla de decisión con base en los
valores críticos de Z.
Paso 4: Interpretación y conclusiones.
3.3 Prueba de hipótesis.
Al realizar pruebas de hipótesis, se parte de un valor
supuesto (hipotético) de un parámetro poblacional.
Después de recolectar una muestra aleatoria, se compara
la estadística muestral, así como la media (X), con el
parámetro hipotético, se compara con una supuesta media
poblacional (𝜇). Después, se acepta o se rechaza el valor
hipotético, según proceda. Se rechaza el valor hipotético
sólo si el resultado muestral resulta muy poco probable
cuando la hipótesis es cierta.
El valor Z utilizado para probar la hipótesis cuando
𝝈 es conocido
𝑋 − 𝜇𝐻
𝑍= 𝜎
𝑛
en donde
𝑍 es el valor crítico
𝑿 es la media muestral.
𝝁𝑯 es el valor de la media poblacional bajo la hipótesis nula
𝜎
es el error estándar de la distribución muestral.
𝑛
El valor Z utilizado para probar la hipótesis cuando
𝝈 desconocido.
𝑋 − 𝜇𝐻
𝑍= 𝑠
𝑛
en donde 𝑠 es la desviación estándar muestral.
Prueba de hipótesis de dos colas.
Ejemplo 1. El embotellador desea probar la hipótesis de que
la media poblacional es 16 onzas y selecciona un nivel de
significancia del 5%. Debido a que se plantea la hipótesis que
µ= 16,.
La hipótesis nula y la alternativa son
𝐻0 : 𝜇 = 16
𝐻𝐴 : 𝜇 ≠ 16
Si el embotellador selecciona una muestra de 𝑛 = 50 botellas
con una media de 𝑋 = 16.357 onzas y una desviación estándar
de 𝑠 = 0.866 onzas.
Para probar la hipótesis, se calcula el estadístico de prueba Z,
y se compara con los valores críticos de Z.
Z es,
16.357 − 16
𝑍= = 𝟐. 𝟗𝟏
0.866
50
En la figura, el nivel de significancia del 5% se divide en dos
colas. El 95% restante se divide por 2 para hallar el área de
0.4750. En la tabla Z esta área de 0.4750 da los valores
críticos de Z de ± 1.96.
La regla de decisión es: No se rechaza la hipótesis nula si
− 1.96 ≤ 𝑍 ≤ 1.96. Se rechaza si 𝑍 < −1.96 𝑜 𝑍 > 1.96.
Las zonas de rechazo están en ambas colas.
Si 𝑍 > 1.96 𝑜 𝑍 < −1.96, se rechaza la hipótesis nula. Por
este motivo se le denomina prueba de dos colas.
Ejemplo 2.
Como se explicó en la sección "Escenario", a comienzos de
este capítulo, la gerencia de First Bank of America está
planeando basar los cargos para las cuentas corrientes en
el saldo diario promedio. El gerente de cuentas
preferenciales desea probar la hipótesis de que las cuentas
tienen un promedio de US$312. Se selecciona una muestra
de 200 cuentas, dando una media de US$298.10 con s =
US$97.30. Para minimizar la probabilidad de un error tipo
1, se selecciona un valor 𝛼 de 1%. (Tenga en cuenta los
cuatro pasos al realizar la prueba).
Regla de decisión: No rechazar 𝐻0 si −2.58 ≤ 𝑍 ≤ 2.58.
rechazar 𝐻0 si 𝑍 < −2.58 𝑜 𝑍 > 2.58.
Si la hipótesis nula es verdadera, existe sólo un 1% de
probabilidad que una muestra pueda resultar en un valor
Z menor que -2.58 o mayor que 2.58. Por tanto, si Z cae en
cualquiera de las colas, no es probable que µ = 312, y la
hipótesis nula debería rechazarse. El valor 𝑍 = −2.02 está
en la zona de no rechazo.
Interpretación
La diferencia entre el valor de la media poblacional bajo la
hipótesis nula de US$3 l 2 y el valor de la media muestral
de US$298.10 es estadísticamente insignificante.
Podría resultar simplemente del error de muestreo. De
hecho si µ = US$312; el 99% de todas las muestras de
tamaño n = 200 producirían valores Z entre ± 2.58. Por
tanto, no se espera un valor de -2.02.
Prueba de hipótesis de una cola.
Las pruebas realizadas anteriormente eran pruebas de dos
colas debido a que había zonas de rechazo en ambas colas.
La prueba de hipótesis de la embotelladora de que µ=16 se
rechazaría si el valor del estadístico para la muestra es o
demasiado alto o demasiado bajo. De cualquier forma,
parece que µ no es 16 y la hipótesis nula se rechaza.
Sin embargo, hay ocasiones en las que se está interesado
sólo en un extremo u otro. Un restaurante de comida
fresca de mar en Kansas City no se interesa en qué tan
rápido llegan las langostas provenientes de la costa este.
Se preocupa sólo en si el envío se toma mucho tiempo en
llegar. Una tienda minorista se alarmará sólo si los
ingresos caen a niveles demasiado bajos. En particular, las
ventas altas no son problema. En cada uno de estos casos
la preocupación se concentra en un extremo u otro y se
realiza una prueba de una cola.
Comparación de las pruebas de dos colas y de una
cola
En lugar de plantear la hipótesis de que el nivel de contenido
promedio sea exactamente 16 onzas, se supone que el
embotellador considera que el nivel de contenido promedio está
"por lo menos en 16 onzas". La hipótesis nula se convierte
𝐻0 : 𝜇 ≥ 16 ; es decir, 16 o mas. La hipótesis alternativa se
plantea al contrario, y todo el conjunto
𝐻0 : 𝜇 ≥ 16 𝐻𝐴 : 𝜇 < 16
La figura b) muestra que la hipótesis 𝐻0 : 𝜇 ≥ 16 no se rechaza si
el valor del estadístico para la muestra está por encima de 16.
La hipótesis 𝐻0 : 𝜇 ≥ 16 permite valores por encima de 16. Las
medias muestrales tales como 16.3 o 16.5 o incluso 17 y 18
sustentan, no refutan, la afirmación que 𝜇 ≥ 16. Sólo los valores
que están significativamente por debajo de 16 pueden causar un
rechazo de la hipótesis nula. Por tanto, una zona de rechazo
aparece solamente en la cola izquierda y el monto total del valor
𝛼 se coloca en esta zona única de rechazo.
Ejemplo 1:
En una reunión informativa para una oficina corporativa, el
gerente del hotel Embassy Suites en Atlanta, reportó que el
número promedio de habitaciones alquiladas por noche es de
por lo menos 212. Es decir, 𝜇 ≥ 212 . Uno de los funcionarios
corporativos considera que esta cifra puede estar algo
sobrestimada. Una muestra de 150 noches produce una
media de 201.3 habitaciones y una desviación estándar de
45.5 habitaciones. Si estos resultados sugieren que el
gerente ha "inflado" su reporte, será amonestado
severamente. A un nivel de significancia del 1%, ¿cuál es el
destino del gerente?
Solución
La afirmación del gerente que µ ≥ 212 contiene el signo igual
y por tanto sirve como la hipótesis nula:
𝐻0 : 𝜇 ≥ 212 𝐻𝐴 : 𝜇 < 212
Los valores por encima de 212 no provocarán un rechazo de
la hipótesis nula, la cual permite ver claramente los valores
superiores a 212. Sólo los valores que están
significativamente por debajo de 212 conducirán a un
rechazo de µ ≥ 212. Por tanto, esta es una prueba de cola a la
izquierda. Z es
201.3 − 212
𝑍= = −2.88
45.5
150
Como lo muestra la figura, un nivel de significancia del 1%
deja un área de 0.4900 que, de la tabla Z, requiere un valor
crítico Z de −2.33.
La regla de decisión es: "No rechazar 𝐻0 si 𝑍 ≥ −2.33.
Rechazar H si 𝑍 < −2.33".
El valor Z de −2.88 está claramente en la zona de rechazo.
La hipótesis nula 𝐻0 : µ ≥ 212 no se confirma.
Interpretación
Parece que el gerente se ha excedido al estimar su tasa de
ocupación y aparentemente recibirá una reprimenda de la
oficina principal.
Ejemplo 2:
Solución
Ejercicios Propuestos. Prueba de Hipótesis.
1-El gerente de producción de una fábrica de telas necesita
determinar si una máquina recién adquirida está produciendo
cierto tipo específico de tela de acuerdo con las especificaciones de
la empresa, las cuales señalan que debe tener una resistencia a la
ruptura de 70 libras y una desviación estándar de 3.5 libras. Una
muestra de 49 pedazos de tela revela una resistencia muestral
media a la ruptura de 69.1 libras.
a. ¿Existe evidencia de que la máquina no está cumpliendo con las
especificaciones del fabricante en cuanto a la resistencia media a la
ruptura? (Utilice un nivel de significancia de 0.05.) Elabore un
intervalo de confianza estimado del 95%.
b. ¿Cuál sería su respuesta al inciso a), si la media muestral es de
69 libras y la desviación estándar es de 3.5 libras?
2-Como gerente de compras para una gran empresa de
seguros usted debe decidir si actualizar o no los
computadores de la oficina. A usted se le ha dicho que el
costo promedio de los computadores es de US$2, 1OO. Una
muestra de 64 minoristas revela un precio promedio de
US$2,251, con una desviación estándar de US$812. ¿A un
nivel de significancia del 5% parece que su información es
correcta?
3-La empresa Glen Valley Steel Company fabrica barras de
acero. Si el proceso de producción funciona de forma
adecuada, las barras de acero que se fabrican tienen una
longitud media de por lo menos 2.8 pies, con una desviación
estándar de 0.20 (como lo determinan las especificaciones de
ingeniería del equipo de producción). Las barras de acero
más largas se pueden utilizar o modificar, pero las barras
más cortas se tienen que desechar. Usted selecciona una
muestra de 25 barras y la longitud media resulta de 2.73
pies. ¿Es necesario ajustar el equipo de producción?
Si quiere probar la hipótesis nula con un nivel de
significancia de 0.05, ¿qué decisión tomaría utilizando el
método del valor crítico para probar la hipótesis?
4-En Estados Unidos, los niños son responsables por ventas que ascienden
a 36 mil millones de dólares al año. Cuando se considera su influencia
directa en la elección de productos, desde estéreos hasta vacaciones, el
gasto económico total en el que influyen los niños en Estados Unidos es de
290 mil millones de dólares. Se estima que a los 10 años, un niño realiza
un promedio de más de cinco salidas a la tienda por semana, Suponga que
quiere demostrar que los niños de su ciudad promedian más de cinco
salidas a la tienda por semana. Sea µ la media poblacional del número de
veces que los niños de su ciudad salen a la tienda.
a. Determine las hipótesis nula y alternativa.
b. Explique el significado de los errores tipo I y tipo II en el contexto del
escenario anterior.
c. Suponga que realiza un estudio en la ciudad donde vive. Con base en
estudios previos, usted supone que la desviación estándar del número de
salidas a la tienda es de 1.6. Toma una muestra de 100 niños y descubre
que el número medio de salidas a la tienda es de 5.47. Con un nivel de
significancia de 0.01, ¿existen evidencias de que el número medio
poblacional de salidas a la tienda es mayor que cinco por semana?
5- Según The Wall Street Journal (mayo 12 de 1997) muchas
compañías de ropa deportiva están tratando de comercializar
sus productos entre los más jóvenes. El artículo sugirió que la
edad promedio de los consumidores había caído por debajo del
grupo de edad de 34.4 años que caracterizó los comienzos de
la década. Si una muestra de 1,000 clientes reporta una
media de 33.2 años y una desviación estándar de 9.4, ¿qué se
concluye a un nivel de significancia del 4%?