Una proporción
Ejemplo dos colas
Se desea probar si ha habido una variación en la proporción de 0.4 de mujeres en
las carreras de ingeniería. Se selecciona una muestra de 200 ingresantes y se
obtiene una proporción de mujeres de 0.45. Utilice un nivel de significancia del
0.01 𝑝 = 0.45, n = 200, y α= 0.01
Paso 1 Formulación de la hipótesis
H0: p = 0.4 La proporción de mujeres en las carreras de ingeniería es de 0.4
H1: p ≠ 0.4 La proporción de mujeres en las carreras de ingeniería no es de 0.4
Asuma que 𝑝 = 0.45, n = 200, y α = 0.01.
Paso 2 Usando α= .01, como es de dos colas
α/2= 0.005 Entonces
Z= -2.575
Usando α= .01, Z= -2.575 y como es de colas el otro Z= 2.575
Entonces el diagrama de la región de rechazo es: .005.005 -2.575 2.575
Paso 3 Calculando el valor z para la proporción muestral
𝑝 = 0.45, po=0.4
Paso 4 Dibujando z = 1.45 en el diagrama de la región de rechazo.005.005 -2.575
2.575 1.45
Paso 5 Como el valor z está fuera de la región de rechazo (sombreada), Por lo
tanto, no se rechaza Ho.
Conclusión: La proporción de mujeres en las carreras de ingeniería no es diferente
de 0.4.
Ejemplo Cola Izquierda
Se afirma que, de todas las trabajadoras que se contratan en una empresa por lo
menos el 30 % proviene del cono sur. • Si una muestra de 600 contrataciones
tomada al azar de los registros de la oficina de Recursos Humanos revela que de
las personas contratadas 153 fueron del cono sur. • Se desea verificar tal
afirmación con un nivel de significancia del 1
SOLUCIÓN: Para calcular la proporción p lo primero que se ha de hacer es
determinar la proporción muestral
Se probará la hipótesis nula p = 0.30 contra la hipótesis alternativa p < 30 con un
α=0.01 153
Para calcular el error estándar de la proporción
Ho: El porcentaje de trabajadores que proviene del cono sur es del 30%
H1: El porcentaje de trabajadores que proviene del cono sur es menor del 30%
Cálculo del valor critico con un nivel de significancia del 1 % para una prueba de
una cola se tiene α=0.01
Regla de decisión o Región crítica: Se rechaza la Hipótesis nula si:
Cálculo del estadístico de prueba Aplicando formula se tiene:
Conclusión: Como Zc es menor que Zα, se rechaza Ho
Esto se observa en la gráfica donde Zc cae fuera del área de no rechazo.
Se puede afirmar con un nivel de significancia del
1% que El porcentaje de trabajadores que proviene
del cono sur es menor del 30% Por lo tanto, la
afirmación de que, de todas las trabajadoras que
se contratan en una empresa por lo menos el 30 %
proviene del cono sur, es falsa. Zc AREA DE NO
RECHAZO
Cola derecha
Ejemplo: En un estudio se afirma que 3 de 10 estudiantes universitarios trabajan.
Pruebe esta aseveración, a un nivel de significación de 0,025, respecto a la
alternativa de que la proporción real de los estudiantes universitarios trabajan es
mayor de lo que se afirma, si una muestra aleatoria de 600 estudiantes universitarios
revela que 200 de ellos trabajan. La muestra fue tomada de 10000 estudiantes.
Los datos son:
3
𝑝0 = = 0.333
10
α = 0.025
n = 600
X= 200
N= 10 000
H0: 𝒑 = 𝒑𝟎
H1: 𝒑 > 𝒑𝟎.
𝒁𝒕𝒂𝒃𝒍𝒂 = 𝟏. 𝟗𝟔 (𝒄𝒐𝒍𝒂 𝒅𝒆𝒓𝒆𝒄𝒉𝒂)
Como en los datos aparece el tamaño de la población, se debe verificar si el
tamaño de la nuestra es mayor que el 5%. Se remplaza valores en la siguiente
fórmula:
Dos proporciones
Ejemplo cola derecha
Se considera cierto cambio en un proceso de fabricación de partes de
componentes. Se toman muestras del procedimiento existente y del nuevo, para
determinar si éste tiene como resultado una mejoría. Si se encuentra que 75 de
1500 artículos del procedimiento actual son defectuosos y 80 de 2000 artículos del
procedimiento nuevo también lo son. Encuentre un intervalo de confianza de 95%
para la diferencia real en la fracción de defectuosos entre el proceso actual y el
nuevo.
Solución: Sean P1 y P2 las proporciones reales de defectuosos para los procesos
actual y nuevo, respectivamente.
𝑝1 =75/1500 = 0.05
𝑝2 = 80/2000 = 0.04 Ing
Formulación de la hipótesis:
Ho: La proporción de defectuosos del proceso existentes es igual al nuevo
proceso Ho: Pa – Pn = 0
H1: La proporción de defectuosos del proceso existentes es mayor al nuevo
proceso. H1: Pa – Pn >0
Obtención del valor crítico:
Con el uso de la tabla encontramos que z para un nivel de confianza del 95%
(alfa=0.05)
Cálculo de los valores del intervalo
Conclusión: Como el intervalo contiene el valor de cero, no se rechaza la hipótesis
nula Es decir La proporción de defectuosos del proceso existentes no es mayor al
nuevo proceso con un nivel de significancia del 5% Por lo tanto no hay razón para
creer que el nuevo procedimiento producirá una disminución significativa en la
proporción de artículos defectuosos comparado con el método existente.
Ejemplo cola izquierda
Ejemplo: A los votantes de dos ciudades se les pregunta si están a favor o en contra de una ley que
está actualmente en estudio en la legislatura del estado, para proporcionar ropa a animales de
granja. Para determinar si los votantes de las dos ciudades difieren en términos del porcentaje que
está a favor, se toma una muestra de 100 votantes de cada ciudad. Treinta de los muestreados de
una ciudad están a favor, en tanto que, en la otra, lo están veinte. En primer lugar, se deben
establecer las hipótesis nula y alternativa:
α = 0.01
H0: 𝑝1 = 𝑝2
H1: 𝑝1 ≤ 𝑝2
𝑥1 + 𝑥2 30 + 20 0.25
𝑝0 = =
𝑛1 + 𝑛2 100 + 100
𝑥1 𝑥2 0.30 − 0.20
−
𝑛1 𝑛2
𝑧= = = 1.63
𝑝 1 − 𝑝 [( 1 ) + (1 ) 0.25 ∗ 0.75 0.25 ∗ 0.75
√ ( ) √ +
𝑛1 𝑛2 100 100
Como el valor estadístico de prueba z es positivo ∴ H0 es aceptada.
Dos colas
Ejemplo: Los hombres y mujeres adultos radicados en una ciudad grande del norte
difieren en sus opiniones sobre la promulgación de la pena de muerte para personas
culpables de asesinato. Se preguntó a dos muestras aleatorias de 100 hombres y
100 mujeres su opinión sobre la promulgación de la pena de muerte, y el 12% de
los hombres adultos están a favor de la pena de muerte, mientras que sólo 10% de
las mujeres adultas lo están. Con un nivel de significancia de 0.05 ¿Se puede
afirmar que hay evidencia estadística de que las opiniones difieren entre hombres y
mujeres?
H0: 𝑝1 = 𝑝2
H1: 𝑝1 ≠ 𝑝2
𝑥1 + 𝑥2 12 + 10
𝑝0 = = 0.11
𝑛1 + 𝑛2 100 + 100
0.12 − 0.10
𝑧= = 0.45
√0.11 ∗ 0.89
0.89 +
0.11 ∗
100 100
Como -1.96 < 0.45 < 1.96, es decir que 0.45 cae en la zona de no rechazo de
H0 (zona blanca debajo de la curva en la figura), se puede afirmar que no hay
evidencia estadística de que las opiniones difieran (NO se rechaza la Hipótesis
nula).
Desviación conocida, Menor
¿Ejemplo, Hay diferencia en las cantidades que gastan los hombres y las mujeres
el día de San Valentín? El gasto promedio de una muestra de 40 hombres fue de
$135.67 y el gasto o promedio de una muestra de 30 mujeres fue de $127.64. Por
estudios anteriores se sabe que la desviación estándar poblacional en el gasto de
los hombres es de $35 y en el gasto de las mujeres es de $20. ¿Con un nivel de
significancia del 5% se puede asegurar que los hombres gastan mis que las
mujeres?
Objetivo: Comprobar que d gasto promedio de los hombres el día de San Valentín
es mayor que el gasto promedio de las Mujeres.
UH> UM despejando para expresarlo come diferencia de medias: UH-UM>0
Hipótesis: Sabemos que una de las dos hipótesis debe incluir el objetivo pues sólo
así podremos dar respuesta a éste, también se sabe que la hipótesis mula (Ha)
SIEMPRE debe contener la igualdad y la hipótesis alternativa (1) NUNCA contendrá
la igualdad. Por lo tanto:
H0: UH-UM≤0
H1: UH-HM>0
Valor critico: Para determinar el valor critico bemos definir el tipo de distribución que
se maneja y si es de una o dos colas.
En el caso de la prueba de hipótesis para la diferencia de medias de dos poblaciones
con sigma conocida la distribución que se maneja es la distribución normal estándar
(x) y el juego de hipótesis que se plantea nos da una prueba de una cola por lo tanto
con un nivel de significancia de α=0.05
Zc= 1.64
4. Valor estadístico: El valor estadístico se calcula a partir de los datos de la muestra
basado en la fórmula:
donde:
Z, es el valor estadístico
XH es la media muestral de la población H
XM es la media muestral de la población M
(UH- UM) es la diferencia hipotética de las medias poblacionales, en este caso es 0
σ es el error estándar de la diferencia de medias de las muestras que se tomaron
de los hombres y mujeres:
Primero se calcula el error estándar:
Se calcula el valor de Z:
5. Toma de decisión: se comparan los valores de Z, contra Z; tomando la decisión
según el juego de hipótesis. En este caso tenemos el tercer juego de hipótesis
donde se rechazará la H0; si el valor de Z es mayor al valor de Z. Siendo por lo tanto
según la regla no se rechaza la H;
Siendo:
Por lo tanto, no se rechaza la H0
Conclusión: Con un nivel de significancia del 59% no hay evidencia suficiente para
comprobar que el gasto promedio de los hombres en el día de San Valentín sea
mayor al gasto promedio de las mujeres
Mayor
Ejemplo: Una muestra aleatoria de 100 muertes registradas en Estados Unidos el
año pasado revelo una vida promedio de 71.8 años. Si se supone una desviación
estándar de la población de 8.9 años, esto parece indicar que la vida media actual
es mayor que 70 años? Utilice un nivel de significancia de 0.05.
Solución:
1. H0: μ = 70 años.
2. H1: μ > 70 años.
3. α = 0.05.
𝑥−𝜇0
4. Región critica: z > 1.645, donde 𝑧 =
𝜎/√𝑛
71.8−70
5. Cálculos: 𝑥 = 71.8 años, σ = 8.9 años, en consecuencia, 𝑧 = = 2.02
8.9/√100
6. Decisión: rechazar H0 y concluir que la vida media actual es mayor que 70 años.
El valor P que corresponde a z = 2.02 es dado por el área de la región sombreada
en la figura 10.10.
Si usamos la tabla A.3, tenemos
P = P(Z > 2.02) = 0.0217.
Como resultado, la evidencia a favor de H1 es incluso más firme que la sugerida
por un
nivel de significancia de 0.05.
Igual
Ejemplo: Un fabricante de equipo deportivo desarrollo un nuevo sedal para pesca
sintético que, según afirma, tiene una resistencia media a la rotura de 8 kilogramos
con una desviación estándar de 0.5 kilogramos. Pruebe la hipótesis de que μ = 8
kilogramos contra la alternativa de que μ ≠ 8 kilogramos si se prueba una muestra
aleatoria de 30 sedales y se encuentra que tienen una resistencia media a la rotura
de 7.8 kilogramos. Utilice un nivel de significancia de 0.01.
Solución:
1. H0: μ = 8 kilogramos.
2. H1: μ ≠ 8 kilogramos.
3. α = 0.01.
𝑥−𝜇0
4. Región critica: z < –2.575 y z > 2.575, donde 𝑧 =
𝜎/√𝑛
7.8−8
5. Cálculos: : 𝑥 = 7.8 kilogramos, n = 30, en consecuencia, 𝑧 = = −2.19
0.5/√30
6. Decisión: rechazar H0 y concluir que la resistencia promedio a la rotura no es
igual a 8 sino que, de hecho, es menor que 8 kilogramos.
Como la prueba en este ejemplo es de dos colas, el valor de P que se desea es el
doble del área de la región sombreada en la figura 10.11 a la izquierda de z = –
2.19. Por lo tanto, si usamos la tabla A.3, tenemos
P = P(|Z| > 2.19) = 2P(Z < −2.19) = 0.0045,
que nos permite rechazar la hipótesis nula de que μ = 8 kilogramos a un nivel de
significancia menor que 0.01.
Desviación desconocida. Menor
Ejemplo, El gerente de producción de una fábrica de sillas de ruedas quiere
comparar el número de sillas de ruedas defectuosas producidas en el turno matutino
con el turno vespertino. Una muestra de la producción de ambos turnos reveló la
siguiente información:
Matutino 5 8 7 6 9 7
Vespertino 8 10 7 11 9 8 12 9
¿Con un nivel de significancia del 5% se puede concluir que el promedio de sillas
defectuosas producidas es el mismo en ambos turnos?
Solución por método del valor critico;
1. Objetivo: Comprobar que el promedio de sillas de ruedas defectuosas producidas
es el mismo para los turnos matutino y vespertino.
UH = UM despejando para expresarlo como diferencia de medias: UH- UM =0
2. Hipótesis: Sabemos que una de las dos hipótesis debe incluir el objetivo pues
sólo así podremos dar respuesta a éste; también se sabe que la hipótesis nula (H:)
SIEMPRE debe contener la igualdad y la hipótesis alternativa (H.) NUNCA
contendrá la igualdad. Por lo tanto:
H0: UH-UM=0
H1: UH-UM=0
3. Valor crítico: Para determinar el valor crítico primero hemos de definir el tipo de
distribución que se maneja y si es de una o dos colas.
En el caso de la prueba de hipótesis para la diferencia de medas de dos poblaciones
con sigma desconocida la distribución que se maneja es la distribución t-Student (t)
y el juego de hipótesis que se plantea nos da una prueba de dos colas, con α=0.05 y
α/2=0.025.
Una vez definida la distribución se debe comprobar si las varianzas de ambas
poblaciones son iguales a través de la prueba Fisher:
n 𝒔𝟐 gl 𝑭𝒆 𝑭𝒄
Vespertino 8 2.786 7 1.392 6.85
Matutino 6 2 5
Rechazo H; si F, es mayor que F., siendo F.-1.392 y F.=6.85 no se rechaza H; y no
hay evidencia para comprobar que exista diferencia entre las varianzas de las sillas
defectuosas producidas en lo turnos matutino y vespertino.
Por lo tanto, los gados de libertad se calcularán:
de la tabla t-Student con α/2=0.025 y 12 grados de libertad 𝑡𝑐 = 2.179
4. Valor estadístico: El valor estadístico se calcula a partir de los datos de la muestra
bajo la siguiente fórmula:
Para el cálculo error estándar:
5. Toma de decisión: se comparan los valores de 𝑡𝑒 contra 𝑡𝑐 tomando la decisión
según el juego de hipótesis. En este caso tenemos el primer juego de hipótesis
donde se rechazará la H0 si el valor absoluto de 𝑡𝑒 es mayor al valor absoluto de 𝑡𝑐.
Siendo:
por lo tanto, según la regla se rechaza la H0.
Conclusión: Con un nivel de significancia de 0.05 se comprueba que el promedio de
sillas de ruedas defectuosas producidas en el turno matutino difiere del promedio
de sillas de ruedas defectuosas producidas en el turno vespertino.
Iguales
Ejercicio: dos profesores en una escuela desean comparar el rendimiento de los
alumnos de octavo año que han sido móviles (población 1) con los puntajes de los
alumnos que no lo han sido (población 2). ¿Se puede concluir con los datos de las
muestras si el puntaje de rendimiento promedio es diferente en los dos grupos?
Grupo1 n= 15 Promedio= 85 𝑠2=30
Grupo 2 n= 22 Promedio= 87 𝑠2=25
Móviles= estudiantes que asistieron a dos o más escuelas
No móviles= estudiantes que permanecen en la misma escuela
1. Planteamiento de las hipótesis
Ho: µ1 = µ2 Ho: µ1 - µ2 = 0
H1: µ1 ≠ µ2 H1: µ1 - µ2 ≠ 0
2. Nivel se significación: α = 0,05
3. Descripción de la población y supuestos: ambas poblaciones se distribuyen
normalmente
Las 𝜎2 son desconocidas. Las muestras son independientes. M.a.s.i
Para saber si las 𝜎2 poblacionales son iguales, es preciso realizar el IC para la razón
de varianzas
Como el intervalo contiene al 1, las varianzas son iguales.
4. El estadístico pertinente: Diferencia de medias muestrales.
5. El estadístico de prueba: t de student con n1+n2-2 gl.
6. RR y RA: la hipótesis es bilateral.
Para 35 gl y alfa= 0,05 el t crítico es 2,0301
7. Recolección de datos y cálculos:
8. Decisión estadística:
Como -2.03 < -1.14 < 2.03 no es posible rechazar Ho.
Por lo tanto, se acepta.
9. Conclusión:
No hay diferencia entre las medias poblacionales
Mayor
Ejemplo : El Edison Electric Institute publica cifras del numero de kilowatts-hora
que gastan anualmente varios aparatos electrodomesticos. Se afirma que una
aspiradora gasta un promedio de 46 kilowatts-hora al año. Si una muestra aleatoria
de 12 hogares, que se
incluye en un estudio planeado, indica que las aspiradoras gastan un promedio de
42
kilowatts-hora al año con una desviación estándar de 11.9 kilowatts-hora, ¿esto
sugiere
que las aspiradoras gastan, en promedio, menos de 46 kilowatts-hora al año a un
nivel de
significancia de 0.05? Suponga que la población de kilowatts-hora es normal.
Solución:
1. H0: μ = 46 kilowatts-hora.
2. H1: μ < 46 kilowatts-hora.
3. α = 0.05.
𝑥−𝜇0
4. Region critica: t < -1.796, donde 𝑡 = con 11 grados de libertad.
𝑠/√𝑛
5. Calculos: 𝑥 = 42 kilowatts-hora, s = 11.9 kilowatts-hora y n = 12.
En consecuencia,
42−46
𝑡= = −1.16 || P=
11.9/√12
−1.16) ≈ 0.135.
6. Decision: no rechazar H0 y concluir que el número promedio de kilowatts-horaque
gastan al año las aspiradoras domésticas no es significativamente menor que 46.