CLASE 7
PRUEBAS DE HIPÓTESIS PARA MUESTRAS DEPENDIENTES, POR PARES O
PAREADAS
Uno de los diseños experimentales más comunes es el análisis de
“Antes y Después”, consistentes en tomar dos medias sobre el mismo
elemento: una antes y otra después de la adopción de un tratamiento
cualquiera
La hipótesis nula debe de sostener que no hay diferencia significativa
entre ambas muestras, indicando que el tratamiento no tiene efecto, por
lo que la diferencia promedio entre las medias o promedios debe ser
igual a cero, en caso contrario debe de rechazarse la hipótesis nula y
aceptarse la alterna
Por el otro lado, si el tratamiento tiene efecto, la diferencia de los
promedios antes y después del tratamiento, será diferente de cero, por lo
que se rechazará la hipótesis nula.
El procedimiento del test “t” pareado se usa para testar la hipótesis de
que no hay diferencia entre dos variables
Los datos pueden ser considerados como dos medidas tomadas del
mismo sujeto.
También podemos interpretarlo como una medida de igualdad entre dos
sujetos.
Adicionalmente, el procedimiento ofrece estadísticas descriptivas para
cada variable.
La correlación de Pearson entre cada par de variables y su nivel de
significación.
Se pueden realizar planteamientos como:
H 0 :μ 1=μ2
H 1 : μ 1 ≠ ,<,> μ2
También se pueden plantear las hipótesis como:
H 0 :μ d́=0
H 1 : μ d́ ≠ ,<,> μ d́ 2
El estadístico de prueba es:
d́
t c=
sd
√n
Siendo: sd =
√ ∑d − 2
n−1
(∑ d )
n
Ejemplo: Una empresa farmacéutica está interesada en la investigación
preliminar de un nuevo medicamento que al parecer tiene propiedades
reductoras del colesterol en la sangre.
Para comprobar esta sospecha se toma una muestra al azar de 6
personas con características similares, y se determina el contenido en
colesterol antes y después del tratamiento. Los resultados han sido los
siguientes:
Antes 217 252 229 200 209 213
Después 209 241 230 208 206 211
Formule adecuadamente las hipótesis nula y alternativa
A un nivel de significación del 1%, ¿se puede confirmar estadísticamente
la bondad del tratamiento?
Solución
Si X representa el contenido de colesterol antes del tratamiento e Y
representa el contenido de colesterol después del tratamiento, entonces
D = X – Y representará el efecto del tratamiento. Para afirmar que sí tiene
efecto, debe ocurrir que D < 0, en consecuencia se podría afirmar como
hipótesis nula
Antes Después Diferencias
(x) (y) (x-y)= d d2
217 209 8 64
252 241 11 121
229 230 -1 1
200 208 -8 64
209 206 3 9
213 211 2 4
2
Total Σd=15 Σd = 263
15
d́= =2,5
6
Σd 2=263
( Σd)2=( 152 ) =225
225
sd =
√ 263−
6−1
6
=6,71565
1. Se plantean las hipótesis
Ho: μ = 0 No logra reducir el nivel de colesterol en la sangre.
H1: μ < 0 Sí logra reducir el nivel de colesterol en la sangre.
Error de tipo I: Afirmar erróneamente que el tratamiento reducirá el nivel
de colesterol en la sangre.
Error de tipo II: Afirmar erróneamente que el tratamiento no reducirá el
nivel de colesterol en la sangre.
2. Se plantea el nivel de significancia
α =1 %=0,01 α =0,01
Gl=n−1=6−1=5 grados de libertad
Se resuelve el problema usando la distribución t de Student con 5 grados
de libertad.
3. Se Calcula el estadístico de prueba
4. Se establece el valor crítico
Como el problema es de cola a la izquierda, el valor crítico es: tα =
-3,36493
TABLA DE t DE STUDENT PARA UNA Y 2 COLAS
5. Se llega a una conclusión
Y como tc no es menor que tα, entonces no se rechaza Ho; en
consecuencia no se puede afirmar que el medicamento tenga
propiedades reductoras de los niveles de colesterol en la sangre.
Ejemplo: Se realizó un estudio para definir si los ejercicios aeróbicos
reducen el ritmo cardiaco de una persona durante el descanso, y al
examinar a diez voluntarios antes y después de seguir un programa de
ese tipo durante seis meses, sus pulsaciones, en latidos por minuto,
dieron los siguientes registros:
Voluntario 1 2 3 4 5 6 7 8 9 10
Antes 73 77 68 62 72 80 76 64 70 72
Después 68 72 64 60 71 77 74 60 64 68
Utilice un nivel de significancia del 5% para calcular si los ejercicios
aeróbicos reducen el ritmo cardiaco durante el reposo.
1. Se plantean las hipótesis
H 0 :μ 1−μ2=0
H 1 : μ 1−μ2 >0
2. Se plantea el nivel de significancia
NS=5 %
∝=0,05
Gl=n−1=10−1=9
3. Se Calcula el estadístico de prueba
Antes Después d d2
73 68 5 25
77 72 5 25
68 64 4 16
62 60 2 4
72 71 1 1
80 77 3 9
76 74 2 4
64 60 4 16
70 64 6 36
72 68 4 16
Total 36 152
36
d́= =3,6
10
Σd 2=152
( Σd)2=1296
1296
sd =
√ 152−
10
10−1
=1,5776
3,6 3,6
t c= = =7,22
1,5776 0,4988
√ 10
4. Se establece el valor crítico
El valor crítico es 1,833
5. Se toma una decisión
Regla de decisión:
Si tc 1,833 No se rechaza Ho
Si tc > 1,833 se rechaza Ho
Como 7,20 es mayor que 1,833, se rechaza Ho, y se concluye con
un nivel de significancia de 0,05 que los datos indican que los
ejercicios aeróbicos disminuyen significativamente el ritmo cardiaco
durante el reposo.
Calculo del P-Value (cálculo del valor P)
Para calcular el valor de P se busca el 7,20 en el renglón de 9
grados de libertad en la tabla t, y se observa que el valor mayor
que aparece en dicha tabla es 4,781 al cual le corresponde un área
a la derecha de 0,0005, entonces se puede concluir que el valor
de P es prácticamente cero.
Prueba de Hipótesis para Diferencias entre Dos Proporciones
(Muestras Independientes).
Algunas veces estamos interesados en analizar la diferencia entre las
proporciones de poblaciones de grupos con distintas características. Por ejemplo,
pensemos que la administración de las tiendas Oxxo cree, sobre la base de una
investigación, que el porcentaje de hombres que visitan sus tiendas 9 o más veces
al mes (clientes frecuentes) es mayor que el porcentaje de mujeres que hacen lo
mismo. Las especificaciones requeridas y el procedimiento para probar esta
hipótesis es la siguiente:
1. Las hipótesis nula y alternativa son las siguientes:
H o =P H −PM ≤0, la proporción de hombres que reportan 9 o más visitas
por mes es la misma o menor que la proporción de mujeres que hacen lo
mismo.
H a =P H −PM >0, la proporción de hombres que reportan 9 o más visitas
por mes es mayor a la proporción de mujeres que hacen lo mismo.
La información proporcionada es:
n H =45 n M =71
PH =.58 PM =.42
PH −P M =.58−. 42=. 16
2. Especifica el nivel de significación de α=.05 . El valor crítico para la
prueba de una sola cola es de 1.64.
3. Estima el error estándar de la diferencia de las dos proporciones:
1 1
donde:
h−m
√
s p = P (1−P)
( +
nH nM )
n H P H +nM P M
P=
nH +n M
PH = proporción muestra de hombres (H)
PM = proporción muestra de mujeres (M)
NH = tamaño de muestra hombres
NM = tamaño de muestra mujeres
Por lo tanto:
45(.58 )+71(. 42)
P= =0 . 48
45+71
y
1 1
√
s p h−m = . 48(1−. 48 ) ( + =0 .10
45 71 )
4. Calculo de prueba estadística:
( diferenciaentre )−( diferenciaentre )
Z= proporciones observadas proporciones¿
sp
h− m
(. 58−. 42)−(0 )
Z= =1 . 60
.10
La hipótesis nula es aceptada porque el valor de la Z calculada es menor que el valor
crítico Z. La administración no puede concluir con un 95 por ciento de confianza que la
proporción de hombres que visita 9 o más veces los Oxxo es mayor que la proporción de
mujeres.
SPSS no cuenta con procedimientos para hacer pruebas de hipótesis de proporciones.
Probemos si el porcentaje de hombres dueños de microempresas es estadísticamente
diferente del porcentaje de mujeres.
1634 (83 .9 )+314(16 . 1)
P= =72. 97
1634+314
y
1 1
√
s p h−m = . . 73(1−. .73 ) ( +
1634 314 )
=0. 0274
(. 839−.161 )−( 0)
Z= =24 . 74
.0274
La hipótesis nula es rechazada porque el valor de la Z calculada es mayor que el valor
crítico Z. Podemos concluir que el porcentaje de hombres dueños de microempresas es
estadísticamente superior al porcentaje de mujeres propietarias de microempresas.