Programa de
Ingeniería
Industrial
Estadística
Aplicada
Sesión 12
Tema:
Prueba de hipótesis para la
comparación de dos medias
independientes paramétricas y no
paramétricas de acuerdo a la
normalidad de los datos.
Resultado de aprendizaje Evidencia de aprendizaje
Al término de la sesión, el estudiante desarrolla Práctica Calificada (PC)
aplicaciones de las pruebas de hipótesis
paramétricas y no paramétricas para muestras
independientes de acuerdo a la normalidad de los
datos, utilizando el software estadístico IBM SPSS y
el complemento de Excel MEGASTAT.
Contenido
Prueba de hipótesis para la comparación de dos medias
independientes paramétricas y no paramétricas de acuerdo
a la normalidad de los datos.
• Pruebas Estadísticas para Analizar dos grupos
• Prueba de Hipótesis para 2 muestras independientes
• Prueba de Hipótesis Paramétricas para 2 muestras
independientes
• Prueba de Hipótesis No Paramétricas para 2 muestras
independientes
• Ejercicios de aplicación
Revisa el
siguiente
video:
https://youtu.be/Cc3uQMrKzPU?si=reSIS6waf7JKmEyN
Después de haber visualizado el video en la
slide anterior, reflexionamos y respondemos
las siguientes interrogantes:
¿Cuándo se dicen que son muestras
01
independientes?
02 ¿Cuándo usamos la Prueba U de Mann Whitney?
Tema
Prueba de hipótesis para la
comparación de dos
medias independientes
paramétricas y no
paramétricas de acuerdo a
la normalidad de los datos
Estadística Aplicada – Sesión 12
PRUEBAS ESTADÍSTICAS PARA ANALIZAR 2 GRUPOS
Al contrastar una hipótesis para 2
grupos debemos tener en cuenta:
• La naturaleza de la variable. (cualitativa o
cuantitativa)
• Analizar si las muestras están
relacionadas (tiene pre-test y pos-test) o
si no están relacionadas (son 2 grupos
independientes)
• Analizar si tienen un comportamiento
Normal (pruebas paramétricas) o si no
tienen una distribución normal (pruebas
no paramétricas)
https://www.youtube.com/watch?v=KdEEwYjhNak
Estadística Aplicada – Sesión 12
PRUEBA DE HIPÓTESIS PARA DOS MUESTRAS INDEPENDIENTES
PARAMÉTRICA NO PARAMÉTRICA
T- STUDENT PARA MUESTRAS
INDEPENDIENTES (Si n1 + n2 < 60)
U DE MANN WHITNEY
Z PARA MUESTRAS INDEPENDIENTES
(Si n1 + n2 ≥ 60)
Estadística Aplicada – Sesión 12
PRUEBA DE HIPÓTESIS PARA DOS MUESTRAS INDEPENDIENTES
Supongamos que disponemos de una muestra aleatoria de tamaño n1 y una muestra aleatoria de
tamaño n2 independiente de la anterior. Podemos construir contrastes de amplia aplicación, como se
resume a continuación:
Prueba de hipótesis:
Ho: μ1 = μ2
H1: μ1 ≠μ2 (caso bilateral)
Ho: μ1 ≤ μ2
H1: μ1 >μ2 (caso unilateral derecha)
Ho: μ1 ≥ μ2
H1: μ1 <μ2 (caso unilateral izquierda)
RECORDANDO LAS PRUEBAS DE NORMALIDAD
Estadística Aplicada – Sesión 12
Paso 1. Planteamiento de las hipótesis
Ho: Los datos analizados siguen una distribución Normal.
H1: Los datos analizados no siguen una distribución Normal .
Paso 2. Nivel de significancia
Alfa
Paso 3. Estadístico de prueba
KOLMOGOROV- SMIRNOV SHAPIRO - WILK
Para muestras grandes (n ≥ 30) Cuando la muestra es pequeña (n < 30)
Nota: Algunos autores consideran n ≥ 50 Nota: Algunos autores consideran n < 50
Paso 4. Regla de decisión
Si P-value < α Rechazar Ho y aceptar H1
Si P-value ≥ α Aceptar Ho
Paso 5. Decisión y conclusión
APLICACIÓN
Estadística Aplicada – Sesión 11
Se quiere evaluar la normalidad de los datos referente a los pesos de los
paquetes de semillas de una máquina empaquetadora.
3.09 2.74 2.49 2.99 3.22 2.51 2.28 3.54 2.52 3.2
3.09 2.56 3.43 3.25 2.69 2.49 3.3 2.69 2.89 3.57
Estadística Aplicada – Sesión 11
PROCEDIMIENTO DE PRUEBA DE NORMALIDAD EN SPSS
Estadística Aplicada – Sesión 11
PROCEDIMIENTO DE PRUEBA DE NORMALIDAD EN SPSS
Estadística Aplicada – Sesión 11
La prueba de normalidad para muestras pequeñas Shapiro-Wilk (n<30),
muestra un p-valor mayor que 0.05 (p=0.271>0.05), aceptando la
hipótesis de normalidad para la variable peso de los paquetes de
semillas.
Estadística Aplicada – Sesión 12
PRUEBA DE HIPÓTESIS PARAMÉTRICA PARA DOS MUESTRAS INDEPENDIENTES
Prueba recomendada: Cuando las muestras siguen una distribución normal
ESTADÍSTICOS DE PRUEBA
CASO 1. Cuando n1, n2 son muestras grandes (ni ≥ 30)
Estadístico de prueba: Z
( x1 − x 2 ) −(1 − 2 )
Zc =
12 22
+
n1 n2
Obs. Si n1, n2 ≥ 60
Estadística Aplicada – Sesión 12
PRUEBA DE HIPÓTESIS PARAMÉTRICA PARA DOS MUESTRAS INDEPENDIENTES
CASO 2. Cuando n1, n2 son muestras pequeñas (ni < 30)
Prueba de Levene (Prueba de homogeneidad de varianzas)
Ho: Var1 = Var2 (Varianzas homogéneas)
H1: Var1 ≠ Var2 (Varianzas no son homogéneas)
Si las varianzas son homogéneas:
Estadístico de prueba: t de Student
Donde varianza mancomunada:
( x1 − x 2 ) −(1 − 2 )
Tc = ( n −1) S 2
+ ( n −1) S 2
1 1 S c2 = 1 1 2 2
Sc + n1 + n2 − 2
n1 n2
Y los grados de libertad son:
Obs. Si n1, n2 < 60
Estadística Aplicada – Sesión 12
PRUEBA DE HIPÓTESIS PARAMÉTRICA PARA DOS MUESTRAS INDEPENDIENTES
Si las varianzas NO son homogéneas:
Donde, los grados de libertad son:
Estadístico de prueba: t de Student
2
s s
2 2
n + n
1 2
𝑥1 −𝑥2 − 𝜇1 −𝜇2
𝑇𝑐 =
2 r = 12 2 2
𝑆2
1 + 𝑆2 s12 s22
𝑛1 𝑛2 n n
1 + 2
n1 − 1 n2 − 1
Obs. Si n1, n2 ≥ 60
Estadística Aplicada – Sesión 12
PRUEBA DE HIPÓTESIS NO PARAMÉTRICA PARA DOS MUESTRAS INDEPENDIENTES
Prueba recomendada: Cuando las muestras no siguen una distribución normal
U- Man Whitney
Esta prueba es el equivalente no paramétrico de la prueba t para la diferencia de dos medias cuando las muestras
son independientes, pero no puede suponerse la normalidad de las poblaciones de origen.
ESTADÍSTICO A USAR
El estadístico de prueba U de Mann-Whitney se
construye a partir de la suma de rangos de una de
las muestras, Ri, elegida arbitrariamente:
El estadístico de
prueba es el valor Z:
Estadística Aplicada – Sesión 12
Recordemos los pasos para realizar las pruebas de hipótesis
1 2 3 4 5
Nivel de
Plantear las Estadístico de Región Decisión y
significancia Prueba crítica ó
hipótesis: Ho y H1 conclusión
Regla de
decisión
EJEMPLO 1: Comercialización de arroz
Estadística Aplicada – Sesión 12
Una firma comercializadora está interesada en vender arroz embolsado por kilos que tenga la menor
cantidad de granos quebrados. Recibe el informe de dos molineras A y B que afirman tener el mejor
arroz embolsado con la más baja cantidad de granos quebrados por kilo. Para tomar la decisión
estadística se seleccionó una muestra aleatoria de 11 y otra de 10 bolsas de arroz de un kilo de las
molineras A y B, respectivamente resultando las siguientes cantidades de granos quebrados en gramos:
A 1.1 1.0 1.2 1.3 2.4 1.8 1.6 1.5 1.4 1.9 1.8
B 1.9 1.8 1.7 1.6 1.8 2.1 2.0 1.5 1.9 1.4
Con un nivel de significancia del 5% ¿Se puede concluir que son iguales las cantidades
medias de granos quebrados por kilo de las molineras A y B?.
SOLUCION:
PASOS:
Estadística Aplicada – Sesión 12
Ingresamos los Paso 1. Plantear las hipótesis
datos en Excel: Ho: U1 = U2
H1: U1 ≠ U2
Paso 2. Nivel de significancia
Alfa = 0.05
Paso 3. Estadístico de Prueba
1ro. Evaluar la normalidad de los datos
2do. Dado que n1 + n2 < 60 y los datos son normales
evaluar si las varianzas son homogéneas
Como p-value A: 0.728 > alfa: 0.05 y p-value B: 0.915 > alfa: 0.05 se acepta Ho. Los datos siguen una
distribución normal, aplicamos una Prueba Paramétrica
SOLUCION:
Estadística Aplicada – Sesión 12
Después de verificar que los datos provienen de una distribución normal, aplicamos la Prueba T de
muestras independientes en SPSS
2do. Como las muestras son menores a 30, aplicamos
SOLUCION:
la prueba de Levene de igualdad de varianzas
Estadística Aplicada – Sesión 12
Como p-value: 0.092 > alfa: 0.05 se acepta Ho. Las varianzas son
homogéneas
T = -1.536
Paso 4. Regla de decisión
p-value: 0.141 > alfa: 0.05
Aceptamos Ho.
Paso 5. Decisión y conclusión
Existe suficiente evidencia estadística para concluir que son iguales las cantidades medias de granos
quebrados por kilo de las molineras A y B con una significancia del 5%.
EJEMPLO 2:
Estadística Aplicada – Sesión 12
Usted produce agua embotellada de una marca determinada
y desea determinar si el consumo de agua promedio diaria en
la costa es superior al consumo en el sur.
Para ello, considera las siguientes muestras aleatorias: 150
individuos de la costa, con un promedio muestral de 280
mililitros de agua diario, y 120 individuos del sur, con un
promedio muestral de 250 mililitros de agua diarios.
Suponga desviaciones poblacionales de 30 mililitros para la costa y 35 mililitros el sur. ¿Existe
evidencia de mayor consumo en la costa? Pruebe a un nivel de significancia de 0.025
En MegaStat:
Estadística Aplicada – Sesión 12
SOLUCION:
Ingresamos los datos en Excel:
PASOS:
Estadística Aplicada – Sesión 12
SOLUCION:
Paso 5. Decidir
Con un nivel de significancia del 2.5%
se rechaza Ho, es decir el consumo
medio de agua diaria en la costa es
mayor al consumo medio de agua
diaria en el sur.
Estadística Aplicada – Sesión 12
EJEMPLO 3:
La siguiente tabla muestra el número de horas semanales que los estudiantes afirman que dedican a
estudiar las asignaturas de Matemática financiera y Contabilidad. Los datos proceden de muestras
aleatorias de 7 estudiantes de Matemática financiera y 7 de Contabilidad. ¿Las horas difieren
significativamente a un nivel de significancia del 5%?
Matemática
8 8 10 7 12 20 28
financiera
Contabilidad 28 16 14 15 9 15 50
PRUEBA DE NORMALIDAD EN SPSS
Estadística Aplicada – Sesión 12
Ingresamos los datos y marcamos la prueba de normalidad:
Primero hacemos la prueba de normalidad ingresando los datos y haciendo
lo siguiente:
Estadística Aplicada – Sesión 12
PRUEBA DE NORMALIDAD EN SPSS
(p<0.05) Los datos no son normales
Como los datos son menores que 30 es preferible usar la Prueba de Shapiro Wilk y podemos concluir que los datos
del grupo 1 (matemática financiera) se distribuyen como una normal, y los datos del grupo 2 (contabilidad) no
siguen una distribución normal, por tal motivo para el análisis de los datos se recomienda usar una prueba no
paramétrica.
Estadística Aplicada – Sesión 12
PRUEBA U- MAN WHITNEY EN SPSS
PRUEBA U- MAN WHITNEY EN SPSS
Estadística Aplicada – Sesión 12
P>0.05 El número de horas
semanales que los estudiantes
dedican a estudiar las asignaturas
de Matemática financiera y
Contabilidad son iguales
Autoevaluación
Sesión 12
Un analista compara dos métodos de enseñanza de Matemáticas básica; el
método tradicional (T) y el método moderno de enseñanza basado en problemas
(M). Una muestra aleatoria de 9 calificaciones finales con el método T y otra
muestra aleatoria de 10 calificaciones finales con el método M dieron los
siguientes resultados:
Pregunta 1
T 6 14 8 11 10 18 15 20 13
M 12 11 12 10 14 15 10 13 14 12
Con un nivel de significancia de 0.01, ¿es la calificación promedio del método
tradicional menor a la calificación promedio del método moderno?
Autoevaluación
¡Vamos por más logros!
¡Felicitaciones!
Ha concluido la autoevaluación
La prueba de hipótesis para la diferencia de medias se utiliza para
contrastar una afirmación respecto al comportamiento de dos
grupos cuando la variable de estudio es cuantitativa.
Conclusiones
Es crucial verificar la normalidad de los datos antes de decidir qué
prueba utilizar. Herramientas estadísticas como el test de
Shapiro-Wilk o Kolmogorov-Smirnov pueden ayudar a determinar
la normalidad de los datos.
La elección entre una prueba paramétrica y una no paramétrica
puede influir en los resultados de la comparación de medias. En
condiciones ideales (datos normales), ambas pruebas pueden
llevar a conclusiones similares. Sin embargo, en presencia de
datos no normales o con outliers, las pruebas no paramétricas
pueden ofrecer una conclusión más fiable.
Aplicando lo
aprendido:
Desarrolla la práctica calificada y lo indicado en la transferencia educativa.
Devore, L. Probabilidad y Estadística para Ingeniería y
ciencias. (7a ed). (1996). México Cengage Learning
Referencias
LatinAmericana, 2008.
García, A. Estadística Aplicada ConceptosBásicos
(2a ed) UNED, 2011.
Martínez, B. Estadística Básica Aplicada(3a ed)
Colombia. Ecoe Ediciones, 2008