BIOESTADÍSTICA
PRUEBA CHI-
CUADRADO
RONALD AYLMER
FISHER
OBJETIVOS
• Analizará la relación entre dos variables categóricas
con dos o más categorías.
• Aplicará la prueba de Chi cuadrada.
• Conocerá la Chi cuadrada para tendencias y cuando
aplicarla.
PRUEBA CHI-CUADRADO BIVARIADA
4
2
• Chi-Cuadrado (
) es el nombre de una prueba de hipótesis que determina si dos variables
están relacionadas o no.
• Pasos:
1) Realizar una conjetura, Tabla de contingencia.
2) Escribir la hipótesis nula y la alternativa.
2
3) Calcular el valor de . calc
4) Determinar el valor del parámetro (p) y el grado de libertad (v).
5) Obtener el valor crítico.
6) Realizar una comparación entre el chi-cuadrado calculado y el valor crítico.
7) Interpretar la comparación.
¿Qué vamos hacer ahora?
Hay variables { - Muy relacionadas
- Muy poco relacionadas
Veamos un estadístico para ver si dos variables están o no
asociadas
El estadístico Chi-cuadrado
6 CHI – CUADRADO CALCULADO
• Para obtener el valor de Chi-Cuadrado Calculado u observado se tiene la fórmula
2
2
calc
f0 fe
fe
f0 : Frecuencia del valor observado.
fe : Frecuencia del valor esperado.
7 FORMULACIÓN DE HIPÓTESIS
• NULA (H0): Es aquella en la que se asegura que los dos parámetros analizados son independientes
uno del otro. Las variables en filas y columnas no están asociadas
• ALTERNATIVA (H1): Es aquella en la que se asegura que los dos parámetros analizados sí son
dependientes. Las variables en filas y columnas están asociadas
Necesitamos calcular “frecuencias esperadas”
Total Columna Para dicha celda Total Fila Para dicha celda
SumaTotal
f i. f. j
ei , j
n
EJEMPLO (supervivencia en el Titanic)
Sobrevive No sobrevive Total
Primera clase 194 128 322
Segunda clase 119 161 280
Tercera clase 138 573 711
Total 451 862 1313
Frecuencias esperadas
f1. f.1 322 x 451
e11 110 ,6
n 1313
f 2. f.1 280 x 451
e21 96,2
n 1313
Frecuencias esperadas
Sobrevive No sobrevive Total
Primera clase 110,6 211,4 322
Segunda clase 96,2 183,8 280
Tercera clase 244,2 466,8 711
Total 451 862 1313
Calculemos Chi-cuadrado
( f ij eij ) 2
2
exp
i j eij
Ya vuelven los matemáticos a complicar las cosas
Traducción
Tenemos dos tablas (sin totales):
Frecuencias absolutas Frecuencias esperadas
Sobrevive No sobrevive Sobrevive No sobrevive
Primera clase 194 128 Primera clase 110,6 211,4
Segunda clase 119 161 Segunda clase 96,2 183,8
Tercera clase 138 573 Tercera clase 244,2 466,8
1) Hagamos otra tabla, donde restamos a la primera la
segunda
Sobrevive No sobrevive
Primera clase (194-110,6) (128-211,4)
Segunda clase (119-96,2) (161-183,8)
Tercera clase (138-244,2) (573-466,8)
2) Este valor elevado al cuadrado
Sobrevive No sobrevive
Primera clase (194-110,6)^2 (128-211,4)^2
Segunda clase (119-96,2)^2 (161-183,8)^2
Tercera clase (138-244,2)^2 (573-466,8)^2
3) Dividido por el valor que tengamos en la segunda tabla
Sobrevive No sobrevive
Primera clase (194-110,6)^2/110,6 (128-211,4)^2/211,4
Segunda clase (119-96,2)^2/96,2 (161-183,8)^2/183,8
Tercera clase (138-244,2)^2/244,2 (573-466,8)^2/466,8
Obtenemos la siguiente tabla en nuestro ejemplo
Sobrevive No sobrevive
Primera clase (194 110,6) 2 (128 211,4) 2
62,9 32,9
110,6 211,4
Segunda clase
(119 96,2) 2
5,4
(181 183,8) 2
2,8
96,2 183,8
(138 244,2) 2 (573 466,8) 2
46,2 24,2
Tercera clase 244,2 466 ,8
( f ij eij ) 2
exp
2
62,9 32,9 5,4 2,8 46,2 24,2 174,4
i j eij
Tenemos: exp
2
174,4
Ahora calculemos el valor de la tabla Chi-cuadrado
1) grados de libertad, son:
K = (número de fila-1)x(número de columnas-1)
= (3-1)x(2-1) = 2
2) El valor alfa (0,05 si no se dice).
3) El valor que buscamos
2
g .l .; 2
2; 0 , 05 5,99
SIGNIFICADO: La probabilidad de obtener
un valor mayor que 5,99 es 0,05
Probabilidad de un valor superior
- Alfa (α)
Grados libertad 0,1 0,05 0,025 0,01 0,005
1 2,71 3,84 5,02 6,63 7,88
2 4,61 5,99 7,38 9,21 10,60
3 6,25 7,81 9,35 11,34 12,84
4 7,78 9,49 11,14 13,28 14,86
5 9,24 11,07 12,83 15,09 16,75
6 10,64 12,59 14,45 16,81 18,55
Tenemos: exp
2
174,4
g .l .; 2;0,05 5,99
2 2
Por tanto:
2
exp 2
2; 0 , 05
SIGNIFICADO: Las variables no son
independientes
SIGNIFICADO en el ejemplo: El salvamento de los viajeros
en el Titanic no fue independiente de su clase social.
Hemos hecho un contraste de hipótesis
Los pasos en un contraste son:
1) Fijar las hipótesis que se quieren contrastar: H0 H1
2) Fijar el nivel de significación:
3) Elegir un estadístico de contraste:
( f ij eij ) 2
exp
2
k2( filas1) x ( columnas1);
i j eij
4) Se toma la decisión de rechazar o no la hipótesis:
exp k ; Aceptar H 0 Independientes
2 2
exp
2
k2; Rechazar H 0 Dependientes
Contraste de homogeneidad
1) Fijar las hipótesis que se quieren contrastar:
H0 Las subpoblaciones tienen idéntica
distribución para la variable Y.
H1 la distribución de la variable Y en alguna
de estas subpoblaciones es diferente
2) Fijar el nivel de significación:
3) Elegir un estadístico de contraste:
( f ij eij ) 2
exp
2
k2( filas1) x ( columnas1);
i j eij
4) Se toma la decisión de rechazar o no la hipótesis:
2
exp 2
k ; Aceptar H0
exp
2
k2; Rechazar H0
19
Ejercicio: Melissa conjetura que el uso de cinturón de seguridad, en los conductores, está
relacionado con el género.
Datos: Tabla de contingencia
USO DE CINTURÓN DE
SEGURIDAD
GÉNERO SÍ NO
FEMENINO 50 25
MASCULINO 40 45
Hipotesis:
• H0: El uso del cinturón de seguridad es independiente del género.
• H1: El uso del cinturón de seguridad no es independiente del género.
20 EJEMPLO
• Melissa conjetura que el uso de cinturón de seguridad, en los conductores, está
relacionado con el género.
• H0: El uso del cinturón de seguridad es independiente del género.
• H1: El uso del cinturón de seguridad no es independiente del género.
21
REALIZAR UNA TABLA CON LOS VALORES DE LA TABLA DE CONTINGENCIA Y
AÑADIR UNA FILA EN LA PARTE INFERIOR Y UNA COLUMNA EN LA PARTE
DERECHA.
50 25
40 45
22
REALIZAR LAS SUMAS POR FILAS, POR COLUMNAS Y LA SUMA TOTAL
50 25 75
40 45 85
SUMA DE FILAS
FRECUENCIAS DE
VALORES
OBSERVADOS
90 70 160
SUMA DE COLUMNAS SUMA TOTAL
23
Usar la fórmula para obtener las frecuencias esperadas.
90 75 70 75
42.1875 32.8125
160 160
90 85 70 85
47.8125 37.1875
160 160
FRECUENCIAS DE VALORES ESPERADOS
24 CHI – CUADRADO CALCULADO
• Para obtener el valor de Chi-Cuadrado Calculado se tiene la fórmula
2
2
calc
f0 fe
fe
f0 : Frecuencia del valor observado.
fe : Frecuencia del valor esperado.
EJEMPLO
TABLA DE VALORES OBSERVADOS TABLA DE VALORES ESPERADOS
25
50 25 42.1875 32.8125
40 45 47.8125 37.1875
2
calc
2 f0 fe
fe
2 2 2 2
2
calc
50 42.1875
25 32.8125
40 47.8125
45 37.1875
42.1875 32.8125 47.8125 37.1875
2
calc 1.4468 1.8601 1.2766 1.6413 6.2248
26 GRADO DE LIBERTAD V
• Para calcular el grado de libertad (v) se realiza:
v Cantidad de filas 1Cantidad de columnas 1
EJEMPLO
27
TABLA DE VALORES OBSERVADOS
50 25
40 45
v 2 1 2 1
v 11 1
28 NIVEL DE SIGNIFICANCIA
• Es el error que se puede cometer al rechazar la hipótesis nula siendo
verdadera.
• Por lo general se trabaja con un nivel de significancia de 0.05, que indica
que hay una probabilidad del 0.95 de que la hipótesis nula sea verdadera.
EJEMPLO
29
• Melissa conjetura que el uso de cinturón de seguridad, en los conductores,
está relacionado con el género. Los datos se muestran en la tabla inferior.
Melissa realiza la prueba de su conjetura usando chi-cuadrado con un nivel
de significancia del 1%.
USO DE CINTURÓN DE
SEGURIDAD
GÉNERO SÍ NO
FEMENINO 50 25
MASCULINO 40 45
• Entonces se tiene un nivel de significancia del 0.01.
30 VALOR DEL PARÁMETRO P
• Para calcular el valor de p se realiza:
p 1 Nivel de significancia
• Ejemplo:
p 1 0.01 0.99
Chi cuadrado (independencia)
Con p<0.05 se rechaza H0
Con p>0.05 no se rechaza H0
H0: El genero es independiente del uso del cinturón de seguridad
H1: El genero esta asociado al uso del cinturón de seguridad
Conclusión: El genero de la persona esta asociado al Uso del Cinturón de
seguridad, las mujeres Usan mas el Cinturón de Seguridad.
TABLA PARA VALORES DE CHI-
32 CUADRADO CRÍTICO
EJEMPLO
33
COMPARACIÓN ENTRE LOS VALORES
DEL CHI-CUADRADO CALCULADO Y EL
34 CRÍTICO
• Si el valor del chi-cuadrado calculado es menor o igual que el chi-cuadrado
crítico, entonces se acepta la hipótesis nula, caso contrario no se la acepta.
• Ejemplo:
2
calc Valor crítico
6.2248 6.635
Entonces se rechaza la hipótesis nula, la cual es “El uso del cinturón de
seguridad es independiente del género”.
¿Cuando podemos aplicar el
estadístico Chi-cuadrado?
1) Siempre hacemos un contraste unilateral.
2) No debe usarse si hay frecuencias esperadas
inferiores a 1.
3) Como máximo el 20% de las frecuencias esperadas
pueden ser menores que el valor 5.
RESUMEN
- El estadístico Chi-cuadrado
- Fijar hipótesis
- Fijar nivel de significación
- Grados de libertad
- Valores del estadístico
- Contraste de independencia
- Contraste de homogeneidad
- Condiciones de aplicar el Chi-cuadrado
Se desea saber si la distribución de los grupos sanguíneos es similar en los individuos de dos poblaciones. Para
ello se elige una muestra aleatoria de cada una de ellas, obteniéndose los siguientes datos ¿Qué decisión se
debe tomar?
A B AB 0 Total
Muestra 1 90 80 110 20 300
Muestra 2 200 180 240 30 650
Total 290 260 350 50 950