Informe/practica del cap.
#8
Fundamentos de las pruebas de hipótesis
✓ Hipótesis: es una afirmación o declaración sobre una propiedad de una
población.
Ejemplos:
µ < 98.6 °F “La temperatura corporal media de los humanos es menor
que 98.6 °F”.
P > 0.5 “La proporción de consumidores que no se sienten cómodos
con las entregas realizadas por drones es mayor que 0.5
✓ Una prueba de hipótesis (o prueba de significancia) es un procedimiento
para probar una hipótesis sobre una propiedad de una población.
✓ La hipótesis nula (expresada mediante H0) es una afirmación de un valor
del parámetro poblacional.
✓ La hipótesis alternativa (expresada por H1 o Ha o HA) es una afirmación
de que el parámetro tiene un valor que difiere en alguna forma de la
hipótesis nula. Para los métodos de este capítulo, la forma simbólica de
la hipótesis alternativa debe usar uno de los siguientes símbolos: <>≠
≠ Prueba de dos colas
< Prueba de cola izquierda
> Prueba de cola derecha
Procedimiento para las pruebas de hipótesis
✓ Identifique la afirmación
✓ Proporcione la forma simbólica
✓ Identifique las hipótesis nula y alternativa
✓ Seleccione el nivel de significancia
𝛼 = P (rechazar H0 cuando es verdadera)
✓ Identifique el estadístico de prueba
es un valor utilizado al tomar una decisión sobre la hipótesis nula
✓ Encuentre los valores críticos o el valor de P
Valor P es la probabilidad de que un estadístico de prueba sea al
menos tan extremo como el obtenido.
P= proporción poblacional
̂ =proporción muestral
𝑷
Los valores críticos separan la región crítica (donde se rechaza la
hipótesis nula) de los valores del estadístico de prueba que no
conducen al rechazo de la hipótesis nula.
✓ Tome una decisión
✓ Exprese de nuevo la decisión en términos no técnicos
La región crítica (o región de rechazo) es el área correspondiente a todos
los valores del estadístico de prueba que conducen al rechazo de la hipótesis
nula.
Error tipo I: El error de rechazar la hipótesis nula cuando en realidad es
verdadera. El símbolo 𝛼 (alfa) se usa para representar la probabilidad de
un error tipo I.
𝜶 = P (error tipo I) = P (rechazar H0 cuando H0 es verdadera)
Error tipo II: El error de no rechazar la hipótesis nula cuando en realidad
es falsa. El símbolo 𝛽 (beta) se usa para representar la probabilidad de un
error tipo II.
𝜷 = P (error tipo II) =P (no rechazar H0 cuando H0 es falsa)
La potencia de una prueba de hipótesis es la probabilidad 1 - 𝛽 de rechazar
una hipótesis nula falsa.
Prueba de una hipótesis sobre una proporción poblacional (método de
aproximación normal)
n = tamaño de muestra o número de ensayos
p = proporción poblacional (p es el valor usado en el enunciado de la
hipótesis nula)
𝑥
𝒑̂ =𝑛 (proporción muestral)
q= 1 – p
Requisitos
1. Las observaciones muestrales son una muestra aleatoria simple.
2. Se satisfacen las condiciones para una distribución binomial
3. Se satisfacen las condiciones np ≥ 5 y nq ≥ 5
Dato estadístico de prueba
𝑃̂ − 𝑃
𝑧 = 𝑝𝑞
√
𝑛
Valores P: (tabla A-2 o tecnología)
Valores críticos: Utilice la distribución normal estándar tabla A-2.
Prueba de una hipótesis respecto a una media
Prueba de una hipótesis acerca de 𝜇 con 𝜎 desconocida
n = tamaño de muestra
̅= media muestral
𝒙
s = desviación estándar
𝝁𝒙̅ = media poblacional
Requisitos
1. La muestra es una muestra aleatoria simple.
2. Se cumple al menos una de las siguientes condiciones: la población se
distribuye normalmente o n > 30.
Dato estadístico de prueba
𝑥̅ − 𝜇𝑥̅
𝑡= 𝑠
√𝑛
Valores P: use software o la distribución t de Student (tabla A-3, referencia
Triola) con los grados de libertad dados por gl = n - 1.
Valores críticos: use la distribución t de Student (tabla A-3, referencia
Triola) con los grados de libertad dados por gl = n -1.
Prueba de una hipótesis acerca de 𝝁 cuando se conoce 𝝈
𝑥̅ − 𝜇𝑥̅
𝑧= 𝜎
√𝑛
Prueba de una hipótesis respecto a una desviación estándar o varianza.
Requisitos
1. La muestra es una muestra aleatoria simple.
2. La población tiene una distribución normal.
Dato estadístico de prueba
(𝑛−1)𝑠 2
𝝌𝟐 = 𝜎2
Valores P: Utilice la tecnología o la tabla A-4 con los grados de libertad:
gl= n - 1.
Valores críticos: Use la tabla A-4 con los grados de libertad gl = n - 1.
Examen rápido del capítulo
1. Distribuciones. Usando los métodos de este capítulo, identifique la
distribución que se debe usar para probar una hipótesis sobre el
parámetro poblacional dado.
a. Media Distribución t
b. b. Proporción Distribución Normal
c. c. Desviación estándar Distribución Ji Cuadrada
2. Colas. Determine si la afirmación dada implica una prueba de
hipótesis de cola izquierda, de dos colas o de cola derecha.
a. p ≠ 0.5 Dos Colas
b. b. 𝜇 < 98.6 °F Cola Izquierda
c. c. 𝜎 > 15 cm Cola Derecha
3. Encuesta de Instagram. En una encuesta del Pew Research Center
aplicada a usuarios de Internet con edades entre 18 y 29 años, 53%
dijo que usaba Instagram. Queremos utilizar un nivel de significancia
de 0.05 para probar la hipótesis de que la mayoría de los usuarios de
Internet de entre 18 y 29 años de edad usan Instagram.
a. Identifique las hipótesis nula y alternativa.
H0: 𝑝 = 0.5
H1: 𝑃 > 0.5
b. Con un tamaño de muestra de 532, determine el valor del
estadístico de prueba.
𝑝−𝑝0 0.53−0.5 0.03
z= =0.53(1−0.5) = = 1.38
𝑝0 (1−𝑝0) √ 0.0217
√ 532
𝑛
c. Se usa la tecnología para encontrar que el valor P para la prueba
es 0.0827. ¿Qué deberíamos concluir sobre la hipótesis nula?
No se puede rechazar a H0
d. ¿Qué deberíamos concluir sobre la afirmación original?
No hay evidencia suficiente para respaldar dicha afirmación
4. Valor P. Encuentre el valor P para una prueba de hipótesis de que el
ingreso anual medio de un agente de la CIA es superior a $81,623
(según datos de [Link]) dado que el dato estadístico de
prueba es t= 1.304 para una muestra de 40 agentes de la CIA.
Valor P=T. [Link](1.304,40)
Valor P = 0.10
5. Conclusiones. Verdadero o falso: En las pruebas de hipótesis, nunca
es válido llegar a una conclusión de respaldar la hipótesis nula.
Verdadero
6. Conclusiones. Verdadero o falso: La conclusión de “no se rechaza la
hipótesis nula” tiene exactamente el mismo significado que “se
acepta la hipótesis nula”.
Falso
7. Incertidumbre. Verdadero o falso: Si se utilizan los métodos
correctos para probar hipótesis con una gran muestra aleatoria
simple que satisfaga los requisitos de la prueba, la conclusión
siempre será verdadera.
Falso
8. Prueba chi cuadrado. En una prueba de hipótesis de que 𝜎 = 15 para
la población de puntuaciones de IQ de atletas profesionales,
encontramos que el valor crítico más a la derecha es 𝜒𝑅2 = 40.646. ¿El
valor crítico más a la izquierda 𝜒𝐿2 = es igual a - 40.646?
No. Todos los valores críticos de x2 son siempre positivos
9. Robustez. Explique qué significan los siguientes enunciados: “La
prueba t para una afirmación sobre 𝜇 es robusta, pero la
prueba 𝜒 2 para una afirmación sobre 𝜎 2 no lo es”.
La prueba t requiere que la muestra dada sea de una población con
distribución normal, a su vez es sólida ya que funciona bien si la
desviación de la normalidad no es muy extrema. Mientras que la
prueba ji cuadrada no es sólida frente a una desviación de la
normalidad.
10.Métodos equivalentes ¿Cuáles de las siguientes afirmaciones son
verdaderas?
a. Cuando se prueba una hipótesis sobre una media poblacional 𝜇, el
método del valor P, el método del valor crítico y el método del
intervalo de confianza son todos equivalentes en el sentido de que
siempre arrojan las mismas conclusiones.
Cuando se prueba una hipótesis sobre una proporción poblacional p,
el método del valor P, el método del valor crítico y el método del
intervalo de confianza son todos equivalentes en el sentido de que
siempre arrojan las mismas conclusiones.
b. Cuando se prueba una hipótesis sobre cualquier parámetro
poblacional, el método del valor P, el método del valor crítico y el
método del intervalo de confianza son todos equivalentes en el
sentido de que siempre arrojan las mismas conclusiones.
Ejercicios de repaso
1. Verdadero/falso. Caracterice cada una de las siguientes afirmaciones
como verdaderas o falsas.
a. En una prueba de hipótesis, un valor P muy alto indica un fuerte
respaldo a la hipótesis alternativa. Falso
b. La distribución t de Student se puede usar para probar una
hipótesis sobre una media poblacional siempre que los datos
muestrales se seleccionen aleatoriamente de una población
distribuida normalmente. Verdadero
c. Cuando se usa una distribución 𝜒 2 para probar una hipótesis
acerca de una desviación estándar poblacional, existe un requisito
muy poco estricto de que los datos muestrales provengan de una
población que tiene una distribución normal. Falso
d. Al realizar una prueba de hipótesis acerca de la proporción
declarada de adultos que tienen pasaportes actualizados, los
problemas con una muestra de conveniencia pueden superarse
mediante el uso de un tamaño de muestra más grande. Falso
e. Al repetir la misma prueba de hipótesis con diferentes muestras
aleatorias del mismo tamaño, las conclusiones serán todas
iguales. Falso
2. Política. Un empleado del condado de Essex, Nueva Jersey,
seleccionó candidatos para puestos en las boletas electorales. Los
demócratas fueron seleccionados primero en 40 de 41 boletas.
Porque se suponía que debía usar un método de selección aleatorio,
los republicanos afirmaron que, en lugar de utilizar la aleatoriedad,
usó un método que favorecía a los demócratas. Emplee un nivel de
significancia de 0.01 para probar la hipótesis de que el método de
selección de boletas favorece a los demócratas.
x = 40
n = 41
α = 0.01
Reclamación dada: Mayoría o más del 50%
Ho = p = 50% = 0.50
Hα = p > 0.50
𝑥 40
p= = ≈ 0.9756
𝑛 41
𝑝−𝑝0 0.9756−0.50
z= = ≈ 6.09
𝑝0(1−𝑝0) 0.50(1−0.50)
√ √
𝑛 41
El valor de P es la probabilidad obtenida del valor estadístico o de un
valor más extremo, cuando la hipótesis es verdadera, será cuando la
hipótesis será verdadera.
P = P (Z >6.09) = 1 – P (Z <6.09) = 1 – 0.9999 = 0.0001
Si el valor de P es menor que el nivel de significancia, la hipótesis se
rechaza
P < 0.01 → Reject H0
Hay suficiente evidencia para respaldar la hipótesis de que el
método de selección de boletas favorece a los Demócratas
3. Actrices ganadoras de un Oscar. El conjunto de datos 14 “Edades de
ganadores del Oscar” en el apéndice B lista las edades de las actrices
cuando ganaron el Oscar, y los estadísticos de resumen son n = 87,
𝑥̅= 36.2 años, y s =11.5 años. Use un nivel de significancia de 0.01
para evaluar la afirmación de que la edad promedio de las actrices
cuando ganan los Oscar es mayor de 30 años.
𝑥̅ = 36.2
s = 11.5
n = 87
α = 0.01
Reclamación dada: Mayor que 30
H0: 𝜇 = 30
Hα: 𝜇 > 30
Valor estadístico:
𝑥̅ − 𝜇0 36.2−30
t= = ≈ 5.029
𝑠/ √ 𝑛 11.5/√87
El valor de P es la probabilidad obtenida del resultado estadístico o de
un valor más extremo.
df = n – 1 = 87 – 1 = 86 > 80
Si el valor de P es más pequeño que el nivel de significancia, la hipótesis
será rechazada
P < 0.01 → Reject H0
Hay suficientes pruebas para respaldar la hipótesis de que la edad
media de las actrices cuando ganan el Oscar es mayor de 30 años.
4. Conteo de glóbulos rojos. Se obtiene una muestra aleatoria simple
de 40 hombres adultos y se mide el recuento de glóbulos rojos (en
células por microlitro) para cada uno de ellos, con los siguientes
resultados: n 5 40, x – 5 4.932 millones de células por microlitro, s 5
0.504 millones de células por microlitro (según el conjunto de datos
1 “Datos corporales” del apéndice B). Use un nivel de significancia de
0.01 para probar la hipótesis de que la muestra proviene de una
población con una media menor a 5.4 millones de células por
microlitro, que a menudo se usa como el límite superior del rango de
valores normales. ¿El resultado sugiere que cada uno de los 40
hombres tiene un recuento de glóbulos rojos por debajo de 5?4
millones de células por microlitro?
𝑥̅ = 4.932
s = 0.504
n = 40
α = 0.01
Reclamación dada: Menos del 5.4
H0: 𝜇 = 5.4
Hα: 𝜇 < 5 .4
El valor estadístico:
𝑥̅ − 𝜇0 4.932 −5.4
t= = ≈ −5.873
𝑠/ √ 𝑛 0.504/√40
El valor de P es la probabilidad obtenida del resultado estadístico o de
un valor más extremo.
P < 0.005
Si el valor de P es más pequeño que el nivel de significancia, la hipótesis
será rechazada
P < 0.01 → Reject H0
Existe evidencia suficiente para respaldar la hipótesis de que la
muestra proviene de una población media inferior a 5.4 millones de
células por microlitro. La prueba trata de la distribución de las
medias muestrales, no de los valores individuales, por lo que el
resultado no sugiere que cada uno de los 40 hombres tenga un conteo
de glóbulos rojos por debajo de 5.4 millones de células por microlitro.
5. Percepción y realidad. En una elección presidencial, 308 de los 611
votantes encuestados dijeron que votaron por el candidato que ganó
(según datos del ICR Survey Research Group). Use un nivel de
significancia de 0.05 para probar la hipótesis de que, entre todos los
votantes, el porcentaje que cree que votaron por el candidato
ganador es igual a 43%, que es el porcentaje real de votos para el
candidato ganador. ¿Qué sugiere el resultado sobre las percepciones
de los votantes?
x = 308
n = 611
α = 0.05
Reclamación dada: igual a un 43%
H0: p = 43% = 0.43
Hα: p ≠ 0.43
𝑥 308
p= = ≈ 0.5041
𝑛 611
El valor estadístico:
𝑝−𝑝0 0.5041−0.43
z= = ≈ 3.70
𝑝0 (1−𝑝0) 0.43 (1−0.43)
√ √
𝑛 611
El valor de P es la probabilidad obtenida del resultado estadístico o de
un valor más extremo.
P = P (Z < - 3.70 o Z > 3.70) = 2P (Z < -3.70) = 2 (0.0001) = 0.0002
Si el valor de P es más pequeño que el nivel de significancia, la
hipótesis será rechazada.
P < 0.05 →Reject H0
Hay suficiente evidencia para justificar el rechazo de la hipótesis
de que el porcentaje que cree que votaron por el candidato
ganador es igual al 43%. Parece haber una discrepancia
sustancial entre cómo las personas dijeron que votaron y cómo
realmente lo hicieron.
6. IMC de Miss. Estados Unidos Una tendencia reivindicada de
ganadoras más delgadas de Miss Estados Unidos ha generado cargos
de que el concurso fomenta hábitos de dieta poco saludables entre
las mujeres jóvenes. A continuación, se listan los índices de masa
corporal (IMC) para los ganadores recientes de Miss Estados Unidos.
Use un nivel de significancia de 0.01 para probar la hipótesis de que
las ganadoras recientes provienen de una población con un IMC
promedio menor a 20.16, que fue el IMC para las ganadoras en las
décadas de 1920 y 1930. Dado que el IMC es una medida de las
cantidades relativas de grasa corporal y estatura, ¿las ganadoras
recientes parecen ser significativamente más delgadas que las de las
décadas de 1920 y 1930?
19.5 20.3 19.6 20.2 17.8 17.9 19.1 18.8 17.6 16.8
7. IMC de Miss Estados. Unidos Use los mismos índices de IMC dados
en el ejercicio 6. Use un nivel de significancia 0.01 para probar la
hipótesis de que las ganadoras recientes de Miss Estados Unidos
provienen de una población con una desviación estándar igual a 1.34,
que fue la desviación estándar del IMC para las ganadoras en las
décadas de 1920 y 1930. ¿Las ganadoras recientes parecen tener una
variación diferente a la de las décadas de 1920 y 1930?
8. Error tipo I y error tipo II
a. En general, ¿qué es un error tipo I y qué es un error tipo II?
Un error de tipo I es el error de rechazar una hipótesis nula cuando
en realidad es verdadera. Un error de tipo II es el error de no
rechazar una hipótesis nula cuando en realidad es falsa.
b. Para la prueba de hipótesis del ejercicio 6 “IMC de Miss Estados
Unidos”, escriba un enunciado que sería un error tipo I y otro que
sería un error tipo II.
Error tipo I: en realidad, el IMC medio es igual a 20.16, pero
respaldamos la hipótesis de que el IMC medio es menor que
20.16. Error tipo II: en realidad, el IMC medio es inferior a 20.16,
pero no logramos respaldarlo.
Ejercicios de repaso acumulado
1. Muertes por rayo. A continuación, se listan las muertes anuales por
rayo en Estados Unidos, durante una secuencia de 14 años recientes
y consecutivos. Encuentre los valores de los estadísticos indicados.
51 44 51 43 32 38 48 45 27 34 29 26 28 23
a. Media
b. Mediana
c. Desviación estándar
d. Varianza
e. Rango
Row1 (Excel)
Mean 37.07143
Median 36
Standard Deviation 9.840765
Sample Variance 96.84066
Range 28
f. ¿Qué característica importante de los datos no se revela a partir
de un examen de los estadísticos, y qué herramienta sería útil para
revelarla?
El patrón de los datos a través del tiempo no es revelado por los
estadísticos. Una gráfica de series de tiempo sería muy útil para
comprender el patrón a lo largo del tiempo.
2. Muertes por rayo. Consulte los datos muestrales del primer ejercicio
de repaso acumulado.
a. ¿Cuál es el nivel de medición de los datos (nominal, ordinal, de
intervalo, de razón)? Razón
b. ¿Los valores son discretos o continuos? Discreto
c. ¿Los datos son categóricos o cuantitativos? Cuantitativo
d. ¿La muestra es una muestra aleatoria simple? No
3. Intervalo de confianza. para las muertes por rayo Use los valores
muestrales dados en el primer ejercicio de repaso acumulado para
elaborar una estimación del intervalo de confianza del 99% para la
media poblacional. Suponga que la población tiene una distribución
normal. Escriba un enunciado breve que interprete el intervalo de
confianza.
4. Prueba de hipótesis para muertes por rayo. Consulte los datos
muestrales dados en el primer ejercicio de repaso acumulado y
considere que esos datos son una muestra aleatoria de las muertes
anuales por rayo en los últimos años. Use los datos con un nivel de
significancia de 0.01 para evaluar la afirmación de que el número
medio de muertes anuales por rayo es menor que el promedio de
72.6 muertes en la década de 1980. Si la media ahora es menor que
en el pasado, identifique uno de los varios factores que podrían
explicar la disminución.
5. Muertes por rayo. La gráfica de barras adjunta muestra el número de
muertes por rayo, clasificadas según el sexo, durante un período
reciente de nueve años. ¿Qué es incorrecto en la gráfica?
La barra de la gráfica debería de comenzar en 0 en axis horizontal, y este no es el
caso. Esto entonces exagera la diferencia entre hombres y mujeres, porque la barra
de los hombres parece ser más de 10 veces más grande que la barra de las mujeres,
mientras que las 225 muertes de los hombres por rayo son solo unas 5 veces el
número de rayo de mujeres fallecidas
6. Muertes por rayo. La gráfica del ejercicio de repaso acumulado 5 se
creó utilizando datos que constan de 232 muertes de hombres y 55
muertes de mujeres a consecuencia de rayos. Suponga que estos
datos son muertes por rayo seleccionadas al azar y procedemos a
evaluar la afirmación de que la proporción de muertes masculinas es
mayor a 1/2. Use un nivel de significancia de 0.01. ¿Hay alguna
explicación para el resultado?
7. Muertes por rayo. La gráfica del ejercicio de repaso acumulado 5 se
creó utilizando datos que constan de 232 muertes de hombres y 55
muertes de mujeres a consecuencia de rayos. Suponga que estos
datos son muertes por rayo seleccionadas al azar y procedemos a
elaborar una estimación del intervalo de confianza del 95% para la
proporción de hombres entre todas las muertes por rayo. Con base
en el resultado, ¿parece factible que los hombres y las mujeres
tengan las mismas posibilidades de morir a consecuencia de un rayo?
8. Muertes por rayo. Con base en los resultados dados en el ejercicio
de repaso acumulado 6, suponga que para una muerte por rayo
seleccionada al azar, hay una probabilidad de 0.8 de que la víctima
sea un hombre.
a. Encuentre la probabilidad de que tres personas al azar muertas
por rayo sean todos hombres.
b. Encuentre la probabilidad de que tres personas al azar muertas
por rayo sean todas mujeres.
c. Encuentre la probabilidad de que entre tres personas muertas por
rayo, al menos uno sea un hombre.
d. Si cinco personas muertas por rayo se seleccionan al azar,
encuentre la probabilidad de que exactamente tres de ellos sean
hombres.
e. Un estudio implica la selección aleatoria de diferentes grupos de
50 personas muertas por rayo. Para esos grupos, encuentre la
media y la desviación estándar del número de víctimas
masculinas.
f. Para los mismos grupos descritos en el inciso (e), ¿46 sería un
número significativamente alto de hombres en un grupo?
Explique.