Prueba de Hipótesis
Inferencia estadística para una muestra
Adiel Omar FLORES RAMOS
Estadística aplicada
Semana 01
Propósito semanal
• Dada una aseveración, identificar la
hipótesis nula y la hipótesis alternativa, y
expresar ambas de forma simbólica.
• Dados una aseveración y datos muestrales,
calcular el valor del estadístico de prueba.
• Plantear la conclusión de una prueba de
hipótesis en términos sencillos y sin
tecnicismos.
4/01/2023 Adiel Omar FLORES RAMOS 2
Contenido
• Hipótesis nula y la hipótesis
alternativa.
• Calcular el valor del estadístico
de prueba.
• Redactar la conclusión de una
prueba de hipótesis.
4/01/2023 Adiel Omar FLORES RAMOS 3
Prueba de Hipótesis
Fundamentos
4/01/2023 Adiel Omar FLORES RAMOS 4
HIPÓTESIS
Cualquier afirmación o conjetura que
se hace acerca de algo
4/01/2023 Adiel Omar FLORES RAMOS 5
Hipótesis Estadística
Cualquier afirmación o aseveración acerca de
una propiedad de la población.
Ejemplo:
El promedio ponderado de los alumnos de la UC en el
semestre 2022-20 es superior a 14
4/01/2023 Adiel Omar FLORES RAMOS 6
Prueba de hipótesis estadística
• Es un procedimiento estándar para probar una
aseveración acerca de una propiedad de la
población.
• Llamado también prueba de significancia
4/01/2023 Adiel Omar FLORES RAMOS 7
Procedimiento para las pruebas de hipótesis
4/01/2023 Adiel Omar FLORES RAMOS 8
Hipótesis Nula (H0)
Es la afirmación de que el valor de un parámetro
de la población es igual a un valor aseverado.
Es la hipótesis que es aceptada provisionalmente
como verdadera y cuya validez será sometida a
comprobación
4/01/2023 Adiel Omar FLORES RAMOS 9
Hipótesis Alternativa (H1, Ha, HA)
Es una hipótesis contraria a la hipótesis nula, se
acepta en caso que la hipótesis nula sea
rechazada.
4/01/2023 Adiel Omar FLORES RAMOS 10
Planteamiento de hipótesis
1)H0: = 0 y H1 : ≠ 0
2)H0: ≤ 0 y H1 : > 0
3)H0: ≥ 0 y H1 : < 0
0 es el valor del parámetro
desconocido
4/01/2023 Adiel Omar FLORES RAMOS 11
Identificación
de H0 y H1
4/01/2023 Adiel Omar FLORES RAMOS 12
Ejemplo: Identificación de las hipótesis nula
y alternativa
a) La proporción de conductores que admiten pasarse la luz
roja es mayor que 0.5.
b) El peso medio de los pasajeros de avión, con su equipaje de
mano, es a lo sumo de 195 libras (la cifra que la Federal
Aviation Administration difunde actualmente).
c) La desviación estándar de las puntuaciones de CI de actores
es igual a 15.
4/01/2023 Adiel Omar FLORES RAMOS 13
SOLUCIÓN
a) H1: p > 0.5,
H0: p = 0.5.
b) H1: µ > 195
H0: µ = 195.
c) H1: σ ≠ 15
H0: σ = 15.
4/01/2023 Adiel Omar FLORES RAMOS 14
TIPOS DE PRUEBAS DE HIPÓTESIS
Depende de la hipótesis alternativa
Prueba de Hipótesis unilateral o Prueba de
una cola
H0: = 0 y H1 : > 0
H0: = 0 y H1 : < 0
4/01/2023 Adiel Omar FLORES RAMOS 15
TIPOS DE PRUEBAS DE HIPÓTESIS
Prueba de Hipótesis Bilateral o Prueba de dos
cola
H0: = 0 y H1 : ≠ 0
4/01/2023 Adiel Omar FLORES RAMOS 16
ESTADÍSTICO DE PRUEBA
• En un valor que se utiliza para tomar la decisión
sobre la hipótesis nula
• Se calcula convirtiendo al estadístico muestral
en una puntuación de una distribución de
probabilidad
4/01/2023 Adiel Omar FLORES RAMOS 17
ESTADÍSTICO DE PRUEBA
Se utiliza la distribución muestral del estadístico de la
prueba a realizar:
4/01/2023 Adiel Omar FLORES RAMOS 18
Importante
• Para la construcción de intervalos y el cálculo de valores
críticos debemos recordar:
Proporción
Distribución Normal
Media σ conocida
Media σ desconocida
Distribución T-student
Variación Distribución Chi2
Herramientas para evaluar
el estadístico de prueba H1 : Ɵ < Ɵ0
• La región crítica (o región de RC
rechazo) es el conjunto de
todos los valores del estadístico
de prueba que pueden H 1 : Ɵ > Ɵ0
provocar que rechacemos la
hipótesis nula. RC
H1 : Ɵ ≠ Ɵ0
RC RC
4/01/2023 Adiel Omar FLORES RAMOS 20
Herramientas para evaluar H 1 : Ɵ < Ɵ0
el estadístico de prueba
• El nivel de significancia (denotado α
con α) es la probabilidad de que el
estadístico de prueba caiga en la H1 : Ɵ > Ɵ0
región crítica, cuando la hipótesis
nula es verdadera. Si el estadístico
de prueba cae en la región crítica, α
rechazamos la hipótesis nula
H1 : Ɵ ≠ Ɵ0
• Las opciones comunes para α son
0.05, 0.01 y 0.10, aunque la más
común es 0.05.
α/2 α/2
4/01/2023 Adiel Omar FLORES RAMOS 21
Herramientas para evaluar
el estadístico de prueba H 1 : Ɵ < Ɵ0
https://youtu.be/cuus2btvDYc
• El valor crítico, es cualquier valor VC
que separa la región crítica (donde H 1 : Ɵ > Ɵ0
rechazamos la hipótesis nula) de
los valores del estadístico de
prueba que no conducen al
rechazo de la hipótesis nula.
VC
• Los valores críticos dependen de H 1 : Ɵ ≠ Ɵ0
la naturaleza de la hipótesis nula,
de la distribución muestral que se
aplique y del nivel de significancia
α.
VC VC 22
4/01/2023 Adiel Omar FLORES RAMOS
EJEMPLO: Cálculo de valores críticos
• Con un nivel de significancia de α=0.05, calcule los valores z
críticos para cada una de las siguientes hipótesis alternativas
(suponiendo que la distribución normal puede emplearse
como aproximación de la distribución binomial):
a) p < 0.5 (de manera que la región crítica está en la cola izquierda de
la distribución normal)
b) p > 0.5 (de manera que la región crítica está en la cola derecha de
la distribución normal)
c) p ≠ 0.5 (de manera que la región crítica está en ambas colas de la
distribución normal)
4/01/2023 Adiel Omar FLORES RAMOS 23
Solución
• Cuando α=0.05 (cola izquierda)
de la tabla A-2 → z=-1.645
=INV.NORM.ESTAND(0.05)
• Cuando α=0.05 (cola derecha)
1-0.05=0.95
de la tabla A-2 → z=1.645
=INV.NORM.ESTAND(0.95)
• Cuando α=0.05 (cola bilateral)
α/2=0.05/2=0.025
0.025 de la tabla A-2 → z=-1.96
=INV.NORM.ESTAND(0.025)
1-0.025=0.975
de la tabla A-2 → z=1.96
=INV.NORM.ESTAND(0.975)
4/01/2023 Adiel Omar FLORES RAMOS 24
REGLA DE DECISIÓN
Es la división de la distribución muestral del estadístico de la
prueba en dos partes mutuamente excluyentes:
Región Crítica (RC) : región de rechazo de H0
Región de Aceptación (RA) : región de no rechazo de H0
Depende de la hipótesis alternativa H1 del nivel de significación
y la distribución muestral del estadístico
Valor crítico: es cualquier valor que separa la región crítica y la
región de aceptación
4/01/2023 Adiel Omar FLORES RAMOS 25
Método tradicional
• Rechace H0 si el estadístico de prueba cae dentro de la región
crítica.
• No rechace H0 si el estadístico de prueba no cae dentro de la
región crítica.
4/01/2023 Adiel Omar FLORES RAMOS 26
REGLA DE DECISIÓN: Método tradicional
Prueba de Hipótesis Bilateral o Prueba de dos colas
H0: = 0 y H1 : ≠ 0
Prueba de Hipótesis unilateral o Prueba de una cola
a la izquierda
H0: = 0 y H1 : < 0
Prueba de Hipótesis unilateral o Prueba de una cola
a la derecha
H0: = 0 y H1 : > 0
4/01/2023 Adiel Omar FLORES RAMOS 27
Cálculo del
valor de P
4/01/2023 Estadística Aplicada a la Investigación I 28
Ejemplo: Cálculo de valores P
• Primero determine si las condiciones planteadas dan por
resultado una prueba de cola derecha, de cola izquierda o de
dos colas; después utilice la figura anterior para calcular el
valor P, luego saque una conclusión acerca de la hipótesis
nula.
a) Se utiliza un nivel de significancia de α=0.05 para probar la
aseveración de que p > 0.25, y los datos muestrales dan por
resultado un estadístico de prueba de z = 1.18.
b) Se utiliza un nivel de significancia de α=0.05 para probar la
aseveración de que p ≠ 0.25 y los datos muestrales dan por
resultado un estadístico de prueba de z = 2.34.
4/01/2023 Estadística Aplicada a la Investigación I 29
Regla de decisión
• Método del valor P
• Rechace H0 si el valor de P ≤ α (donde α es el nivel de significancia, tal
como 0.05).
• No rechace H0 si el valor P > α.
4/01/2023 Adiel Omar FLORES RAMOS 30
Solución
a. Con la aseveración de que p > 0.25, se trata de una prueba de cola derecha. Al
utilizar la figura para una prueba de cola derecha, vemos que el valor P es el
área a la derecha del estadístico de prueba z = 1.18. Calculando, encontramos
que el área a la derecha de z = 1.18 es 0.1190. El valor P de 0.1190 es mayor
que el nivel de significancia α= 0.05, por lo que no rechazamos la hipótesis
nula. El valor P de 0.1190 es relativamente grande, lo que indica que los
resultados muestrales podrían suceder fácilmente por azar.
b. Con la aseveración de se trata de una prueba de dos colas. Al utilizar la figura
para una prueba de dos colas, observamos que el valor P es dos veces el área
a la derecha de z = 2.34. Calculando, encontramos que el área a la derecha de
z = 2.34 es 0.0096, de manera que el valor P = 2 x 0.0096 = 0.0192. El valor P
de 0.0192 es menor o igual que el nivel de significancia, por lo que
rechazamos la hipótesis nula. El pequeño valor P de 0.0192 indica que los
resultados muestrales no podrían suceder por azar.
4/01/2023 Estadística Aplicada a la Investigación 31
Redacción de la conclusión
4/01/2023 Adiel Omar FLORES RAMOS 32
Ejemplo
• Suponga que un reportero asevera que “más de la mitad”
(más del 50%) de los empleados consiguen trabajo por medio
de redes de contactos.
• Esta aseveración de p > 0.5 se convierte en la hipótesis
alternativa, mientras que p =0.5 se convierte en la hipótesis
nula.
• Además, suponga que la evidencia muestral hace que
rechacemos la hipótesis nula de p = 0.5.
• Enuncie la conclusión en términos sencillos y sin tecnicismos.
4/01/2023 Adiel Omar FLORES RAMOS 33
Solución
• La aseveración original no incluye la condición de igualdad, y
rechazamos la hipótesis nula. Por lo tanto, la redacción de la
conclusión final debe ser la siguiente:
• “Los datos muestrales sustentan la aseveración de que la
mayoría de los empleados consiguen trabajo por medio de
redes de contactos”.
4/01/2023 Adiel Omar FLORES RAMOS 34
Ejercicios
4/01/2023 Adiel Omar FLORES RAMOS 35
Procedimiento para las pruebas de hipótesis
4/01/2023 Adiel Omar FLORES RAMOS 36
Prueba de Hipótesis
para una proporción
Ejemplo: Obtención de empleo por medio de
redes de contactos
• Una encuesta de n = 703 empleados seleccionados al azar,
reveló que el 61% (o 𝑝=0.61)
Ƹ de ellos consiguió trabajo por
medio de una red de contactos. Utilice los datos muestrales,
con un nivel de significancia de 0.05, para probar la
aseveración de que la mayoría de los empleados (más del
50%) consiguen su trabajo por medio de redes de contactos.
Solución
• Aseveración:
• La mayoría de los empleados consigue trabajo por medio de redes de
contactos. Es decir, p > 0.5.
• Datos muestrales
• n=703
• 𝑝=0.61
Ƹ
Solución: Plantear la hipótesis nula y la
alternativa
• La aseveración original en forma simbólica es p > 0.5.
• El opuesto de la aseveración original es p ≤ 0.5.
• De las dos expresiones simbólicas anteriores, la expresión
p>0.5 no contiene igualdad, por lo que se convierte en la
hipótesis alternativa. La hipótesis nula es la afirmación de que
p iguala el valor fijo de 0.5. Por consiguiente, podemos
expresar H0 y H1 de la siguiente manera:
Solución
• Para esta prueba se usa la distribución normal y, en virtud de
que estamos probando una aseveración acerca de una
proporción poblacional p, el estadístico de prueba 𝑝Ƹ es
relevante y la distribución muestral de las proporciones
muestrales se aproxima por medio de una distribución
normal.
Solución: Elegir el nivel de significancia (α)
Cuando α=0.05 (cola derecha)
1-0.05=0.95
de la tabla A-2 → z=1.645
=INV.NORM.ESTAND(0.95)
Solución: Estimar el estadístico de prueba
• n=703
• p=0.5
• 𝑝=0.61
Ƹ
Solución: Estimar el estadístico de prueba
• n=703
• p=0.5
• 𝑝=0.61
Ƹ
Solución: Establecer la regla de decisión
Valor crítico de z = 1.645
Valor estadístico = 5.83 z=5.83
Estadístico de prueba cae dentro
de la región crítica
Solución: Tomar la decisión y redactar la
conclusión
• Como el estadístico de prueba se localiza dentro de la región
crítica, rechazamos la hipótesis nula.
• Concluimos que existe suficiente evidencia muestral para
sustentar la aseveración de que la mayoría de los empleados
consiguen trabajo por medio de redes de contactos.
Prueba de Hipótesis
para una media
poblacional
(σ conocida)
Prueba de aseveraciones acerca de una media
poblacional (σ conocida)
• Requisitos
1. La muestra es aleatoria simple.
2. Se conoce el valor de la desviación estándar poblacional σ.
3. Se satisface una o ambas de las siguientes condiciones:
• la población se distribuye normalmente o
• n > 30.
Ejemplo
• A continuación se muestra un conjunto de datos donde se
incluye los pesos de 13 dulces M&M rojos elegidos al azar de una
bolsa que contiene 465 dulces. La desviación estándar de los
pesos de todos los dulces M&M que están en la bolsa es
σ=0.0565 g.
• A continuación se presentan los pesos muestrales (en gramos),
que tienen una media de 𝑥= ҧ 0.8635. En la bolsa se afirma que el
peso neto del contenido es de 396.9 g, de manera que los dulces
M&M deben tener un peso medio de al menos 396.9/465 =
0.8535 g para dar la cantidad anunciada.
Ejemplo
• Utilice los datos muestrales con un nivel de significancia de 0.05
para probar la aseveración de un gerente de producción de que
los dulces M&M en realidad tienen una media mayor que 0.8535
g, por lo que los consumidores están recibiendo una cantidad
mayor de la indicada en la etiqueta.
0.751 0.841 0.856 0.799 0.966 0.859 0.857
0.942 0.873 0.809 0.89 0.878 0.905
Solución: Planteamiento de la H0 y la H1
Solución
Solución: Elegir el nivel de significancia (α)
Cuando α=0.05 (cola derecha)
1-0.05=0.95
de la tabla A-2 → z=1.645
=INV.NORM.ESTAND(0.95)
Solución: Estimar el estadístico de prueba
• 𝑥ҧ = 0.8635
• µ = 0.8535
• σ = 0.0565
• n = 13
Solución: Estimar el estadístico de prueba
• 𝑥ҧ = 0.8635
• µ = 0.8535
• σ = 0.0565
• n = 13
Solución: Establecer la regla de decisión
z=0.64
Valor crítico de z = 1.645
Valor estadístico = 0.64
Estadístico de prueba cae dentro
de la región de aceptación
Solución: Tomar la decisión y redactar la
conclusión
• Como el estadístico de prueba se localiza dentro de la región
crítica, no rechazamos la hipótesis nula.
• Concluimos que No existe evidencia suficiente para sustentar la
conclusión de que la media poblacional sea mayor que 0.8535,
como afirmó el gerente de producción.
Prueba de Hipótesis
para una media
poblacional
(σ desconocida)
Prueba de aseveraciones acerca de una media
poblacional (σ desconocida)
• Requisitos
1. La muestra es aleatoria simple.
2. Se desconoce el valor de la desviación estándar poblacional σ.
3. Se satisface una o ambas de las siguientes condiciones:
• la población se distribuye normalmente o
• n > 30.
Elección de la distribución apropiada
Ejemplo: Temperaturas corporales
• A un estudiante del propedéutico de la carrera de medicina se le
pide realizar un proyecto en clase. Intrigado por las temperaturas
corporales del conjunto de datos, planea recolectar su propio
conjunto de datos para probar la aseveración de que la
temperatura corporal media es menor que 98.6°F, como suele
pensarse. Por limitación del tiempo impuesto por otros cursos y
al deseo de mantener una vida social que vaya más allá de hablar
en sueños, se da cuenta de que tiene tiempo para reunir datos
únicamente de 12 personas.
Ejemplo: Temperaturas corporales
• Después de planear cuidadosamente un procedimiento para
obtener una muestra aleatoria simple de 12 adultos sanos, mide
sus temperaturas corporales y obtiene los resultados listados a
continuación. Utilice un nivel de significancia de 0.05 para probar
la aseveración de que estas temperaturas corporales provienen
de una población con una media menor que 98.6°F.
98.0 97.5 98.6 98.8 98.0 98.5
98.6 99.4 98.4 98.7 98.6 97.6
Solución
98.0 97.5 98.6 98.8 98.0 98.5
98.6 99.4 98.4 98.7 98.6 97.6
• Estadísticos
• n=12
• 𝑥=98.39
ҧ
• s=0.535
Solución: Planteamos la H0 y la H1
• La aseveración original de que “la temperatura corporal media
es menor que 98.6°F” se expresa de manera simbólica como µ
< 98.6.
• El opuesto de la aseveración original es µ ≥ 98.6.
• De las dos expresiones simbólicas obtenidas hasta ahora, la
expresión µ < 98.6 no contiene igualdad, por lo tanto se
convierte en la hipótesis alternativa H1.
• La hipótesis nula es el supuesto de que µ = 98.6.
Solución
• En esta prueba de una aseveración acerca de la media
poblacional, el estadístico más relevante es la media muestral.
Seleccionamos la distribución t de Student por las siguientes
condiciones: tenemos una muestra aleatoria simple,
desconocemos el valor de σ y los datos muestrales parecen
provenir de una población con una distribución normal.
Solución: Nivel de significancia (α)
• El nivel de significancia es α = 0.05
• Para n=12 los grados de libertad n=12-1 ➔ gl=11
• De la tabla A-3 t=-1.796
=INV.T(0.05;11)
Solución: Estimar el estadístico de prueba
𝑥ҧ − 𝜇
𝑡= 𝑠
𝑛
Estadísticos
n=12
𝑥=98.39
ҧ
s=0.535
Solución: Estimar el estadístico de prueba
𝑥ҧ − 𝜇
𝑡= 𝑠
𝑛
Estadísticos
n=12
𝑥=98.39
ҧ
s=0.535
Solución: Establecer la regla de decisión
t=-1.360
Valor crítico de t = -1.796
Valor estadístico = -1.360
Estadístico de prueba cae dentro
de la región de aceptación
Tomar la decisión y redactar la conclusión
• Puesto que el estadístico de prueba t = - 1.360 no cae en la
región crítica, no rechazamos H0.
• Conclusión: No existe evidencia suficiente para sustentar la
aseveración de que la muestra proviene de una población
con una media menor que 98.6°F.
Prueba de Hipótesis
de una desviación
estándar o de una
varianza
Requisitos
• La muestra es aleatoria simple.
• La población tiene una distribución normal.
Ejemplo
• Control de calidad: El mundo de la industria comparte esta
meta común: mejorar la calidad reduciendo la variación. Los
ingenieros de control de calidad desean asegurarse de que un
producto tenga una media aceptable, pero también quieren
producir artículos con una calidad consistente, eliminando los
defectos. La Newport Bottling Company ha fabricado latas de
bebidas de cola con cantidades que tienen una desviación
estándar de 0.051 onzas. Se prueba una nueva máquina
embotelladora, y una muestra aleatoria simple de 24 latas
produce las cantidades (en onzas) que se listan a continuación.
Ejemplo
• Las 24 cantidades tienen una desviación estándar de s = 0.039
oz. Utilice un nivel de significancia de 0.05 para probar la
aseveración de que las latas de bebidas de cola de la nueva
máquina tienen cantidades con una desviación estándar
menor que 0.051 oz.
Planteamos la H0 y la H1
Nivel de significancia (α)
• El nivel de significancia es α=0.05
• Para n=24 los grados de libertad n=24-1 ➔ gl=23
• De la tabla A-4 X2=13.091
=INV.CHICUAD(0.05;23)
=INV.CHICUAD.CD(0.95;23)
Estimar el estadístico de prueba
• n = 24
• s = 0.039
• σ = 0.051
Estimar el estadístico de prueba
• n = 24
• s = 0.039
• σ = 0.051
Establecer la regla de decisión
Tomar la decisión y redactar la conclusión
• Puesto que el estadístico de prueba no está en la región
crítica, no rechazamos la Hipótesis nula.
• Conclusión: No hay suficiente evidencia para sustentar la
aseveración de que la desviación estándar de las cantidades
con la nueva máquina sea menor que 0.051 onzas.
• Quizás la nueva máquina produce cantidades de bebida de
cola que son más consistentes, con una desviación estándar
menor que 0.051 oz, pero aún no tenemos evidencia
suficiente para sustentar esa aseveración.
Pautas para el PA1
• Proporción • Bondad de ajuste
• Estadística M. Triola. p407 • Estadística M. Triola. p591
• Media: varianza desconocida • https://youtu.be/pXKqhls394Y
• Estadística M. Triola. P426 • Independencia
• https://youtu.be/dHnNBV72WMs • Estadística M. Triola. p606
• https://youtu.be/s389dyxdw2s
1) ¿Qué
aprendí?
4) ¿Qué 2) ¿Cómo
me falta aprendí?
aprender?
3) ¿Para
qué
aprendí?
82
Gracias por su atención
Recursos adicionales
https://1drv.ms/u/s!AnpbNMf4AA0wyT89zMYBfHofr8j7?e=RLi3PD
Dr. Adiel Omar FLORES RAMOS
[email protected] (#)964660405