Dos muestras
Hasta Ahora…
Hemos visto las pruebas de hipótesis. Siguiendo el
procedimiento de 5-pasos planteamos pruebas donde se
comparó los resultados de una sola muestra con un valor
poblacional.
Es decir, seleccionamos una sola muestra (muestreo) de una
población y se realizó una prueba para ver si era razonable el
valor hipotético de la población.
¿Cuando debemos plantear pruebas de
hipótesis de dos muestras?
DEFINITIVAMENTE, cuando el interés en una
investigación es hacia dos poblaciones.
1. Cuando en una investigación se quiere probar si es razonable concluir
que dos medias poblaciones son diferentes, o
2. Cuando se quiere conocer la magnitud de la diferencia entre ellas.
Prueba de Hipótesis de dos muestras
Hoy se amplía la prueba de hipótesis para dos muestras.
POR EJEMPLO: Se utilizan dos muestras aleatorias de dos poblaciones distintas para
determinar si son iguales las medias o las proporciones de la población. Algunas
interrogantes por probar son:
Prueba de Hipótesis de dos muestras
• ¿Hay alguna diferencia entre el valor medio de A y B?
• ¿Hay alguna diferencia entre la proporción de A y B?
Modelo Conceptual para dos muestras:
muestras independientes
Al tomar varios pares de muestras y calcular la media de cada una, la
diferencia entre las medias muestrales y estudiar la distribución de las
diferencias entre las medias muestrales:
i. Así como en las pruebas de hipótesis para una muestra, tratar con
muestras grandes (n≥30) o muestras pequeñas(n<30) implica diferencias
en los procedimientos.
1. Si las poblaciones de donde proceden las muestra son normales,
se sabe que la distribución de las medias de muestras sigue una
distribución normal.
2. La distribución de las diferencias entre medias muestrales de dos
distribuciones normales también es normal
Modelo Conceptual para dos muestras:
muestras independientes
Al tomar varios pares de muestras y calcular la media de cada una, la diferencia entre las
medias muestrales y estudiar la distribución de las diferencias entre las medias
muestrales:
3. Si la media de las diferencias entre medias es cero, implica que no
hay diferencia entre las dos poblaciones. Así, si la media de las
diferencias es cualquier valor diferente de cero, positivo o negativo,
se puede concluir que las dos poblaciones no tienen la misma
media.
4. Cuando las poblaciones son independientes, la distribución de las
diferencias tiene una varianza igual a la suma de dos varianzas
individuales.
Modelo Conceptual para dos muestras:
muestras independientes
Si se trata de muestras grandes e independientes y si se conocen las
verdaderas varianzas de las poblaciones, el estadístico de prueba es la ya
conocida z estandarizada de la distribución normal que para 2 poblaciones se
calcula como:
𝑋ത1 − 𝑋ത2 − (𝜇1 − 𝜇2 )
𝑧=
𝜎𝑋ത1−𝑋ത2
Pero como la hipótesis nula plantea que:
𝐻0 : 𝜇1 − 𝜇2 = 0
La expresión anterior se Donde el error estándar de la
convierte en: diferencia entre 2 medias es
𝑋ത1 − 𝑋ത2 𝜎12 𝜎22
𝑧= 𝜎𝑋ത1−𝑋ത2 = +
𝜎𝑋ത1−𝑋ത2 𝑛1 𝑛2
Dos muestras: muestras independientes
𝑋ത1 − 𝑋ത2
Prueba de dos medias de 𝑧=
muestras grandes con 𝜎
conocidas
𝜎12 𝜎22
+
𝑛1 𝑛2
Para poder practicar una prueba de hipótesis utilizando el estadístico de arriba
es necesario:
• Que las dos poblaciones siguen distribuciones normales.
• Las dos muestras no deben estar relacionadas, es decir, deben ser
independientes.
• Debe conocerse la desviación estándar de las dos poblaciones.
Dos muestras: muestras independientes
𝑋ത1 − 𝑋ത2
Prueba de dos medias 𝑧=
des muestras grandes
𝑠12 𝑠22
con 𝜎 desconocida +
𝑛1 𝑛2
Para poder practicar una prueba de hipótesis utilizando este
estadístico es necesario:
• Que las dos poblaciones siguen distribuciones normales.
• Las dos muestras no deben estar relacionadas, es decir, deben
ser independientes.
• No se conocen la desviación estándar de las dos poblaciones y
no se asume que sean iguales
EJEMPLO
Se quiere determinar si existe diferencia entre los resultados de dos secciones del
curso de estadística. Para ello, se toma una muestra aleatoria de 30 estudiantes de
cada sección y se encuentra que en promedio la sección “A” sacó 68 puntos de notas,
con una desviación estándar de 16, en tanto que en la otra sección “B” sacaron 65.5
puntos en promedio con desviación estándar de 17. ¿Existe diferencia entre las
secciones, a un nivel de significancia de 0.01?
PASO 1: Plantear las hipótesis: PASO 2: Determinar la significancia:
𝐻0 : 𝜇1 = 𝜇2 Como 𝛼 = 0.01 (dado)
𝐻1 : 𝜇1 ≠ 𝜇2
Como 𝐻1 tiene el símbolo ≠ que también
puede escribirse <> se trata de una prueba
de 2 colas usando la curva normal (𝑛 ≥ 30)
EJEMPLO
PASO 3: Identificar PASO 4: Formular regla de decisión
Estadístico de prueba
𝑋ത1 − 𝑋ത2 − 2.575 ≤ 𝑧 ≤ 2.575
𝑧=
𝑠12 𝑠22 PASO 5: Tomar decisión
+
𝑛1 𝑛2
Este valor observado del estadístico de
prueba esta dentro del rango critico (zona
de no rechazo), así que no se tienen
68 − 65.5
𝑧= = 0.5865 elementos para rechazar la hipótesis nula,
162 172 por lo que se concluye que las dos
30 + 30 secciones tienen resultados iguales en
promedio.
EJEMPLO
Los clientes de un famosos supermercado tienen dos opciones para pagar y se quiere
determinar si es mayor el tiempo en el método tradicional.
Método Tradicional: Se usa la Método Nuevo: Un procedimiento,
caja Registradora operada por un donde el cliente es el que registra
cajero, donde un empleado cada artículo, él mismo lo pone en
registra cada artículo y otro una bolsa y paga con su tarjeta el
empleado lo toma y lo pone en una total (LINEA RAPIDA)
bolsa y luego paga se paga el total
de la compra.
EJEMPLO
Método Tradicional: Método Nuevo:
𝑋ത = 5.8090 𝑚𝑖𝑛𝑢𝑡𝑜𝑠 𝑋ത = 5.5550 𝑚𝑖𝑛𝑢𝑡𝑜𝑠
𝜎 = 0.8360 𝑚𝑖𝑛𝑢𝑡𝑜𝑠 𝜎 = 0.5520 𝑚𝑖𝑛𝑢𝑡𝑜𝑠
𝑛 = 50 𝑛 = 100
EJEMPLO
Paso 1: Formular las hipótesis Conforme a lo solicitado el
tiempo medio Tradicional es mayor que el tiempo de Línea Rápida.
¿La diferencia de 0.254 minutos entre el método tradicional y el pago
con Línea Rápida es pura casualidad? Es error de muestreo?
𝐻0 : 𝜇 𝑇 ≤ 𝜇𝐿𝑅 La Hipótesis Alternativa es que el
tiempo de quienes utilizan el
𝐻1 : 𝜇 𝑇 > 𝜇𝐿𝑅 método tradicional es mayor (una
prueba de una cola derecha o
superior)
Paso 2: Seleccione el nivel de significancia.
Es la probabilidad de que se rechace la hipótesis nula cuando en
realidad es verdadera. En este caso se seleccionó el nivel de
significancia 0.01 (confianza 99%)
EJEMPLO 2
Paso 3: Determine el estadístico de prueba
En este caso se usa la distribución z como
𝑋ത1 − 𝑋ത2
𝑧=
el estadístico de prueba debido a que las
desviaciones estándares de las dos 𝜎12 𝜎22
poblaciones se conocen y 𝑛 ≥ 30 𝑛1 + 𝑛2
Paso 4: Formular la regla de decisión
𝑧 ≤ 2.32634787404084
Para determinar el valor crítico, se coloca el 0.01 del área total en la cola superior.
Esto significa buscar 1 - 0.01 = 0.99 y estos corresponde a una puntuación
Z = 2.326347… = 2.33
Paso 5: Tomar decisión respecto de H0.
𝑋ത1 − 𝑋ത2 ¿Cuál es el valor p?
𝑧=
𝜎12 𝜎22
+
𝑛1 𝑛2
𝑋ത1 − 𝑋ത2 5.8090 − 5.5550
𝑧= = = 1.95
𝜎12 𝜎22 0.83602 0.55202
+𝑛 +
𝑛1 2 50 100
El valor calculado de 1.95, es menor que el valor crítico de 2.33. Por lo tanto no se rechaza la
hipótesis nula. Entonces, la diferencia de tiempos es pequeña para deberse al cambio de
método. En otras palabras, la conclusión es que el método “Línea Rápida” no es más rápido que
el método tradicional.
EJEMPLO
Para calcular el valor p es necesario encontrar la probabilidad
de un valor z mayor que 1.95. La conclusión es que es muy
alta las probabilidad de que la hipótesis nula sea verdadera.
𝑆𝑖 𝑃 < 𝛼, se rechaza 𝐻0
𝑆𝑖 𝑃 > 𝛼, no se rechaza 𝐻0
𝑃 = 0.06 > 0.01
Prueba de proporciones de dos muestras
Para realizar la prueba, suponga que la muestra es lo bastante grande para que
la distribución normal sirva como una buena aproximación a la distribución
binomial.
El estadístico de prueba sigue la distribución normal estándar. El valor de z se
calcula a partir de la fórmula siguiente:
𝑝1 − 𝑝2
𝑧=
𝑝𝑐 (1 − 𝑝𝑐 ) 𝑝𝑐 (1 − 𝑝𝑐 )
𝑛1 + 𝑛2
𝑛1 = es el número de observaciones en la primera muestra
𝑛2 = es el número de observaciones en la segunda muestra
𝑝1 = es la proporción en la primera muestra 𝑋1 + 𝑋2
𝑝2 = es la proporción en la segunda muestra 𝑝𝑐 =
𝑝𝑐 = es la proporción conjunta de las muestras combinadas 𝑛1 + 𝑛2
Prueba de proporciones de dos muestras
𝑋1 + 𝑋2
Proporción 𝑝𝑐 =
conjunta 𝑛1 + 𝑛2
Donde:
𝑋1 es el número de elementos que posee la primera muestra.
𝑋2 es el número de elementos que posee la segunda muestra.
¿Qué posee qué?
La característica que está bajo estudio!
Ejemplo
FETICHE tiene una nueva fragancia que venderá con el nombre FURY.
Quiere saber si hay diferencia de aceptación de las mujeres jóvenes y las mujeres
mayores. Se les pedirá a todas que sientan el perfume e indiquen si les gusta lo
suficiente para comprar un frasco.
Una primera encuesta sobre 100 mujeres jóvenes reveló que a 19 les gusto la
fragancia FURY como para comprarla. También se preguntó a 200 mujeres
mayores y reveló que a 62 les gusto la fragancia y desean comprarla.
Practicando el habitual procedimiento de prueba de hipótesis,
con una significancia de 0.05.
Ejemplo
NOTA: Hay dos poblaciones independientes, una de mujeres jóvenes y la
otra de mujeres mayores.
Paso 1: Formular las hipótesis
𝐻0 : 𝜋1 = 𝜋2
𝐻1 : 𝜋1 ≠ 𝜋2
Paso 2: Seleccione el nivel de significancia.
Nivel de significancia dado, de 0.05 ( dos colas de 0.025)
Paso 3: Determine el estadístico de prueba.
El estadístico de prueba sigue la distribución normal estándar. El valor del
estadístico de prueba se calcula a partir de:
𝑝1 − 𝑝2 𝑋1 + 𝑋2
𝑧=
𝑝𝑐 (1 − 𝑝𝑐 ) 𝑝𝑐 (1 − 𝑝𝑐 ) 𝑝𝑐 =
𝑛1 + 𝑛2
𝑛1 + 𝑛2
Ejemplo
Paso 4: Formular la regla de decisión.
Paso 5: Tomar una decisión y sacar conclusión.
𝑋1 19 𝑚𝑢𝑗𝑒𝑟𝑒𝑠
𝑝1 = = = 19% = 0.19
𝑛1 100 𝑚𝑢𝑗𝑒𝑟𝑒𝑠
𝑋2 62 𝑚𝑢𝑗𝑒𝑟𝑒𝑠
𝑝2 = = = 31% = 0.31
𝑛2 200 𝑚𝑢𝑗𝑒𝑟𝑒𝑠
𝑋1 + 𝑋2 19 + 62 81
𝑝𝑐 = = = = 0.270
𝑛1 + 𝑛2 100 + 200 300
𝑝1 − 𝑝2 0.19 − 0.31
𝑧= = = −2.206949
𝑝𝑐 (1 − 𝑝𝑐 ) 𝑝𝑐 (1 − 𝑝𝑐 ) 0.27(1 − 0.27) 0.27(1 − 0.27)
+ +
𝑛1 𝑛2 100 200
Ejemplo
Paso 5: Tomar una decisión.
El valor calculado de 2.21 se encuentra en el área de rechazo; a la izquierda de 1.96. Por lo
tanto, se rechaza la hipótesis nula con un nivel de significancia 0.05.
Conclusión: Se rechaza la hipótesis nula de que la proporción de mujeres jóvenes que
comprarían la fragancia es igual a la proporción de mujeres mayores que también la
comprarían.