Programa de
Ingeniería
Industrial
Estadística
Aplicada
Sesión 11
Tema:
Introducción a las pruebas de
hipótesis. Prueba de normalidad
Resultado de aprendizaje Evidencia de aprendizaje
Al término de la sesión, el estudiante selecciona y Práctica Calificada (PC)
aplica el procedimiento de prueba de hipótesis
adecuado para desarrollar cada caso, de acuerdo a la
situación problemática presentada, utilizando el
software estadístico IBM SPSS y el complemento de
Excel MEGASTAT .
Contenido
Introducción a las pruebas de hipótesis. Prueba de
normalidad
• Definición de hipótesis
• Tipos de prueba de hipótesis
• Tipos de errores
• Procedimiento para la prueba de hipótesis con MegaStat
• Prueba de hipótesis para la media
• Prueba de hipótesis para la proporción
• Prueba de Normalidad con SPSS
Revisa el
siguiente
video:
[Link]
Después de haber visualizado el video en la
slide anterior, reflexionamos y respondemos
las siguientes interrogantes:
01 ¿Qué es una hipótesis estadística?
02 ¿Cuáles son los tipos de hipótesis?
03 ¿Qué es la hipótesis nula y la hipótesis alterna?
Tema
Introducción a las
pruebas de
hipótesis. Prueba de
normalidad
Estadística Aplicada – Sesión 11
¿Qué es una hipótesis?
• Un hipótesis es una suposición. Es una idea que puede o no ser
verdadera, basada en información previa.
• Kerlinger “una hipótesis es un enunciado conjetural de la
relación de dos o más variables
• Hernández, Fernández y Baptista, señalan que las hipótesis
indican lo que estamos buscando o tratando de probar son
enunciados formulados como respuestas tentativas a preguntas
de investigación.
¿QUÉ ES UNA HIPÓTESIS?
Estadística Aplicada – Sesión 11
Una hipótesis es una afirmación o declaración a priori a un problema de investigación.
Ejemplo 1:
El 90% de los jóvenes que pasan el mayor
tiempo conectados a una computadora
padecen de problemas musculares.
Ejemplo 2:
El tiempo promedio de vida de una persona que fuma
es de 55 años.
¿Qué es una hipótesis estadística?
Estadística Aplicada – Sesión 11
Es el procedimiento basado en evidencia de la muestra y la teoría de la
probabilidad para determinar si la hipótesis es una afirmación razonable.
Hipótesis Nula y Alternativa
Hipótesis Nula: Denotado por Ho, es una afirmación acerca de un
parámetro de la población y cuya validez será sometida a comprobación
experimental.
Hipótesis Alternativa: Se representa por H1, denominada hipótesis de
investigación es lo contrario de lo que se afirma en la hipótesis nula.
=, ,
H 0 :
Identificación de hipótesis , ,
H1 :
Estadística Aplicada – Sesión 11
EJEMPLOS PARA PLANTEAR HIPÓTESIS
Ejemplo 1:
Una empresa de Marketing Industrial está considerando la introducción de un
nuevo plan de servicio para piezas hidráulicas. El plan será presentado si más del
40% de los clientes lo prefieren:
Ejemplo 2:
En estudios previos, se ha determinado que el nivel de colesterol medio de
pacientes con problemas cardíacos es mayor a 220.
TIPOS DE PRUEBA DE HIPÓTESIS
Estadística Aplicada – Sesión 11
Prueba bilateral o de dos extremos: Prueba unilateral a la derecha:
H0 : 𝜃 = 𝜃𝑜 H0 : 𝜃 ≤ 𝜃𝑜
H1 : 𝜃 ≠ 𝜃𝑜 H1 : 𝜃 > 𝜃𝑜
𝑹𝒆𝒄𝒉𝒂𝒛𝒂 𝑯𝟎 𝛼 𝑹𝒆𝒄𝒉𝒂𝒛𝒂 𝑯𝟎 1−𝛼 𝑹𝒆𝒄𝒉𝒂𝒛𝒂 𝑯𝟎
𝛼/2 𝑵𝒐 𝑹𝒆𝒄𝒉𝒂𝒛𝒂 𝒉𝟎 𝛼/2 𝛼
𝑵𝒐 𝑹𝒆𝒄𝒉𝒂𝒛𝒂 𝒉𝟎
𝑍𝛼 𝑍1−𝛼 𝑍𝛼
2 2 2
Prueba unilateral a la izquierda:
H0 : 𝜃 ≥ 𝜃𝑜
media (µ), La posición de la
H1 : 𝜃 < 𝜃𝑜
𝜽 = varianza (2 ) región Sombreada
depende de la
𝑹𝒆𝒄𝒉𝒂𝒛𝒂 𝑯𝟎
proporción (P) hipótesis alternativa 1−𝛼
𝛼 𝑵𝒐 𝑹𝒆𝒄𝒉𝒂𝒛𝒂 𝒉𝟎
𝑍𝛼
TIPOS DE ERRORES
Estadística Aplicada – Sesión 11
Ninguna prueba de hipótesis es 100% cierta. Puesto que la prueba se basa en
probabilidades, siempre existe la posibilidad de llegar a una conclusión incorrecta. Cuando
usted realiza una prueba de hipótesis, puede cometer dos tipos de error: tipo I y tipo II.
Fuente [Link]
Error Tipo I
Rechazar una Hipótesis Nula cuando es cierta.
𝜶 = 𝑃 𝐸𝑟𝑟𝑜𝑟 𝑡𝑖𝑝𝑜 𝐼 = 𝑃 𝑅𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝐻𝑜/ 𝐻𝑜 𝑒𝑠 𝑣𝑒𝑟𝑑𝑎𝑑𝑒𝑟𝑎
Error Tipo II
Aceptar (no rechazar) una Hipótesis Nula cuando es falsa.
β = 𝑃 𝐸𝑟𝑟𝑜𝑟 𝑡𝑖𝑝𝑜 𝐼𝐼 = 𝑃 𝑁𝑜 𝑅𝑒𝑐ℎ𝑎𝑧𝑎𝑟 𝐻𝑜 /𝐻𝑜 𝑒𝑠 𝑓𝑎𝑙𝑠𝑎
Estadística Aplicada – Sesión 11
TIPOS DE ERRORES
Error de tipo I
Si usted rechaza la hipótesis nula cuando es verdadera, comete un error de tipo I. La
probabilidad de cometer un error de tipo I es α, que es el nivel de significancia que usted
establece para su prueba de hipótesis. un α de 0.05 indica que usted está dispuesto a aceptar
una probabilidad de 5% de estar equivocado al rechazar la hipótesis nula.
Error de tipo II
Cuando la hipótesis nula es falsa y usted no la rechaza, comete un error de tipo II. La
probabilidad de cometer un error de tipo II es β.
Decisión Ho Verdadera Ho Falsa
Aceptar Ho Sin error Error beta o tipo II
Rechazar Ho Error alfa o tipo I Sin error
Estadística Aplicada – Sesión 11
Procedimiento para la Prueba de Hipótesis
Procedimiento de una prueba una hipótesis con MEGASTAT
Paso 1 Paso 2 Paso 3 Paso 4
Se plantea la Se selecciona Se identifica el Comparar p-valor con α (N. Si P-valor < α Se Rechaza Ho, Aceptar H1
hipótesis nula el nivel de estadístico de de significancia) y tomar la
y alternativa. significancia. prueba. decisión. Si P-valor ≥ α Se Acepta Ho
( x − 0 )
H0 : µ = 590 kg z= Paso 5
H1 : µ ≠ 590 kg
α n
( x − 0 )
Decisión e
Se rechaza H0
H0 : P ≥ 0.40
t= interpretación.
H1 : P < 0.40 s n Se acepta H1
H0: = ≤ p − po
z=
p0 (1 − p0 ) n
H1: ≠ < >
PH para la media (U)
Estadística Aplicada – Sesión 11
Prueba de hipótesis para la media µ
Palabras clave: Media o
CASO 1: conocida y n ≥ 30 CASO 2: desconocida y n < 𝟑𝟎 promedio, desvest
X: Variable cuantitativa (U)
Estadístico Para el cálculo se necesita:
Estadístico (𝑥 − 𝜇𝑜 ) de Prueba
(𝑥 − 𝜇𝑜 )
de Prueba 𝑧= 𝑡= n, promedio muestral,
𝜎Τ 𝑛 𝑠Τ 𝑛 desvest, NC
• Usar Z (n >= 30)
• Usar T (n < 30)
Prueba de hipótesis para la proporción P
𝑝ො −𝑝0 𝑋 PH para la proporción (P)
Estadístico Z= Donde: 𝑝ො =
𝑛
Palabras clave: Proporción, porcentaje,
de Prueba 𝑝0(1−𝑝0) preferencia
𝑛 X: Variable cualitativa (P)
Para el cálculo se necesita:
n, x (nro de elementos con característica de
interés) o p, NC
Supuestos: Población normal, muestra al azar
• Usar Z
APLICACIÓN 1
Estadística Aplicada – Sesión 11
Se afirma que un automóvil recorre un promedio anual de más de 20000 kilómetros. Para
probar esta afirmación, se le solicita a una muestra aleatoria de 25 propietarios de
automóvil que lleve un registro de los kilómetros que recorren. ¿Estaría usted de acuerdo
con esta afirmación si en la muestra aleatoria resulta un promedio de 23500 kilómetros y
una desviación de estándar de 3900 kilómetros? Utilice un nivel de significancia del 1%.
SOLUCION
Paso 1. Plantear las hipótesis Paso 3. Estadístico de Prueba
Ho: U ≤ 20000
H1: U > 20000 Considerando que los datos provienen de una distribución
normal, no se conoce la varianza poblacional y la muestra
Paso 2. Nivel de significancia es pequeña (n < 30), entonces utilizamos el estadístico T
α =0.01
Estadística Aplicada – Sesión 11
En la hoja de Excel
Ingresamos los datos en el
siguiente orden:
Recorrido
Promedio 23500
Desvest 3900
Muestra 25
Estadística Aplicada – Sesión 11
Ingresamos los datos como se
muestra:
1ro En input range (Los datos
debidamente ordenados)
2do El valor de la prueba (U)
Seleccionamos la opción
3ro Escoger el signo de la prueba sumary input
en función a lo establecido en H1
4to Seleccionamos el estadístico
de prueba
5to Especificamos el nivel de
confianza
Luego OK
Estadística Aplicada – Sesión 11
Luego aparece la
ventana de output Paso 4. Regla de decisión
Observamos que el p-value es 0.0001 y lo comparamos
con el valor de significancia de la prueba α = 0.01
teniendo: p_value=0.0001 < α = 0.01 por tanto
rechazamos Ho.
Paso 5. Decisión e interpretación
Existe suficiente evidencia estadística para decir que el
promedio es mayor a 20000, con una significancia del
1%, por lo tanto estaría usted de acuerdo con la
afirmación propuesta.
APLICACIÓN 2
Estadística Aplicada – Sesión 11
En la actualidad, la mayoría de quienes viajan por avión compra sus boletos por Internet. Así,
los pasajeros evitan la preocupación de cuidar un boleto de papel, además de que las
aerolíneas ahorran. No obstante, en fechas recientes, las aerolíneas han recibido quejas
relacionadas con los boletos, en particular cuando se requiere hacer un enlace para cambiar de
línea. Para analizar el problema, una agencia de investigación independiente tomó una muestra
aleatoria de 20 aeropuertos y recogió información relacionada con la cantidad de quejas que hubo
sobre los boletos durante marzo. A continuación se presenta la información:
14 14 16 12 12 14 13 16 15 14
12 15 15 14 13 13 12 13 10 13
¿La agencia de investigación puede concluir que la cantidad media de quejas por aeropuerto
es menor que 15 al mes con un nivel de significancia de 5%?
SOLUCION
Estadística Aplicada – Sesión 11
Paso 1. Plantear las hipótesis Ingresamos los datos en una
Ho: U ≥ 15 columna como se muestra
H1: U < 15
Paso 2. Nivel de significancia
α =0.05
Considerando que los datos provienen de una distribución
Paso 3. Estadístico de Prueba
normal, no se conoce la varianza poblacional y la muestra
es pequeña (n < 30), entonces utilizamos el estadístico T
Estadística Aplicada – Sesión 11
Luego clic
Seleccionamos la
opción data input
Estadística Aplicada – Sesión 11
Paso 4. Regla de decisión
Observamos que el p-value es 0.0001 y lo
comparamos con el valor de significancia de la
prueba α = 0.01 teniendo:
p_value=0.0001 < α = 0.05 por tanto rechazamos Ho.
Paso 5. Decisión e interpretación
Existe suficiente evidencia estadística para concluir que el promedio de la cantidad de quejas es
menor a 15, al mes con una significancia del 5%.
APLICACIÓN 3
Estadística Aplicada – Sesión 11
Se llevo a cabo una encuesta de mercado para calcular la proporción de amas de casa que
sí comprarían el limpiador de la marca X. Se escogió una muestra aleatoria de 30 amas de
casa obteniéndose los siguientes resultados:
Sí No Sí Sí No No Sí No Sí No
Sí No No No Sí No No No No No
Sí Sí No No No No No No No No
A un nivel de significancia del 4% se puede afirmar que más del 35% de las amas de casa sí
comprarían el limpiador de la marca X.
SOLUCION
Estadística Aplicada – Sesión 11
Paso 1. Plantear las hipótesis
Paso 2. Nivel de significancia
Ho: P ≤ 0.35
α =0.04
H1: P > 0.35
Paso 3. Estadístico de Prueba
El estadístico a utilizar: Z
Siempre en caso de proporción es así.
Ingresamos los datos
considerando valor 1 para las
respuestas Sí y 0 para las
respuestas No, siendo un total
de 30 datos. (n = 30)
Luego clic
Estadística Aplicada – Sesión 11
Del total 30 datos tenemos 9
respuestas que corresponden
a SI comprarían el limpiador
de la marca X siendo x=9.
(Número de elementos que
cumplen la característica de
interés) Además p= x/ n
Nota: En la opción Observed
podemos utilizar cualquier opción:
1) Valor de p= 9/30= 0.30
2) Valor de x= 9
Estadística Aplicada – Sesión 11
Paso 4. Regla de decisión
Observamos que el p-value es 0.7171 y lo
comparamos con el valor de significancia
de la prueba α = 0.04 teniendo:
p_value=0.7171 > α = 0.04 por tanto
Aceptamos Ho.
Paso 5. Decisión e interpretación
Existe suficiente evidencia estadística para concluir que no se puede afirmar que más del 35% de las
amas de casa sí comprarían el limpiador de la marca X, con una significancia del 4%.
PRUEBAS DE NORMALIDAD
Estadística Aplicada – Sesión 11
Hipótesis a contrastar:
Ho: Los datos analizados siguen una distribución Normal.
H1: Los datos analizados no siguen una distribución Normal .
KOLMOGOROV- SMIRNOV SHAPIRO - WILK
Cuando la muestra es
Para muestras grandes (n ≥ 30) pequeña (n < 30)
Nota: Algunos autores consideran Nota: Algunos autores
consideran
n ≥ 50
n < 50
Regla de decisión:
Si P-value < α Rechazar Ho y aceptar H1
Si P-value ≥ α Aceptar Ho
APLICACIÓN 4
Estadística Aplicada – Sesión 11
Se quiere evaluar la normalidad de los datos referente a los pesos de los
paquetes de semillas de una máquina empaquetadora.
3.09 2.74 2.49 2.99 3.22 2.51 2.28 3.54 2.52 3.2
3.09 2.56 3.43 3.25 2.69 2.49 3.3 2.69 2.89 3.57
Estadística Aplicada – Sesión 11
PROCEDIMIENTO DE PRUEBA DE NORMALIDAD EN SPSS
Estadística Aplicada – Sesión 11
PROCEDIMIENTO DE PRUEBA DE NORMALIDAD EN SPSS
Estadística Aplicada – Sesión 11
La prueba de normalidad para muestras pequeñas Shapiro-Wilk (n<30),
muestra un p-valor mayor que 0.05 (p=0.271>0.05), aceptando la
hipótesis de normalidad para la variable peso de los paquetes de
semillas.
Autoevaluación
Sesión 11
Un analista del comportamiento del consumidor en los Centros
comerciales que tienen restaurantes de comida rápida afirma que
un comprador típico permanece en promedio más de 75 minutos
en el Centro Comercial. Para corroborar esta afirmación, se
seleccionó una muestra aleatoria de 45 compradores y se obtuvo
Pregunta 1
un tiempo promedio de permanencia en el Centro Comercial, de 80
minutos. Además, se sabe que el tiempo que permanece un
comprador típico sigue una distribución normal con una
desviación estándar de 15 minutos. Para este caso, las hipótesis
adecuadas son:
¿Cuáles son las hipótesis que se plantean para este gráfico,
asumiendo que la proporción poblacional es 45%?
Pregunta 2
Autoevaluación
¡Vamos por más logros!
¡Felicitaciones!
Ha concluido la autoevaluación
Una hipótesis es una afirmación a priori frente a un hecho o
fenómeno.
Existen tres tipos de prueba de hipótesis: Prueba Bilateral, Prueba
Unilateral Izquierda y Derecha
Conclusiones
Los pasos para realizar una prueba de hipótesis son:
a) Proponer las hipótesis Ho y H1
b) Establecer el nivel de significancia de la prueba
c) Identificar el estadístico de prueba a utilizar
d) Comparar el valor-p obtenido de los datos de la
muestra con el nivel de significancia.
e) Tomar una decisión.
Los estadísticos de prueba en una prueba de hipótesis para el
promedio (U) son Z y T
El estadístico de prueba en una prueba de hipótesis para la
proporción (P) es Z
Aplicando lo
aprendido:
Desarrolla la práctica calificada y lo indicado en la transferencia educativa.
Devore, L. Probabilidad y Estadística para Ingeniería y
ciencias. (7a ed). (1996). México Cengage Learning
Referencias
LatinAmericana, 2008.
García, A. Estadística Aplicada ConceptosBásicos
(2a ed) UNED, 2011.
Martínez, B. Estadística Básica Aplicada(3a ed)
Colombia. Ecoe Ediciones, 2008