0% encontró este documento útil (0 votos)
55 vistas39 páginas

Prueba Chi-Cuadrado

Cargado por

alana
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PPTX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
55 vistas39 páginas

Prueba Chi-Cuadrado

Cargado por

alana
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PPTX, PDF, TXT o lee en línea desde Scribd

BIOESTADÍSTICA

PRUEBA CHI-
CUADRADO

RONALD AYLMER
FISHER
OBJETIVOS

• Analizará la relación entre dos variables categóricas


con dos o más categorías.

• Aplicará la prueba de Chi cuadrada.

• Conocerá la Chi cuadrada para tendencias y cuando


aplicarla.
PRUEBA CHI-CUADRADO BIVARIADA
4
2
• Chi-Cuadrado ( 
) es el nombre de una prueba de hipótesis que determina si dos variables
están relacionadas o no.
• Pasos:
1) Realizar una conjetura, Tabla de contingencia.
2) Escribir la hipótesis nula y la alternativa.
2
3) Calcular el valor de . calc
4) Determinar el valor del parámetro (p) y el grado de libertad (v).
5) Obtener el valor crítico.
6) Realizar una comparación entre el chi-cuadrado calculado y el valor crítico.
7) Interpretar la comparación.
¿Qué vamos hacer ahora?

Hay variables { - Muy relacionadas


- Muy poco relacionadas

Veamos un estadístico para ver si dos variables están o no


asociadas


El estadístico Chi-cuadrado
6 CHI – CUADRADO CALCULADO

• Para obtener el valor de Chi-Cuadrado Calculado u observado se tiene la fórmula

2
2
 calc 
 f0  fe 
fe
f0 : Frecuencia del valor observado.
fe : Frecuencia del valor esperado.
7 FORMULACIÓN DE HIPÓTESIS
• NULA (H0): Es aquella en la que se asegura que los dos parámetros analizados son independientes
uno del otro. Las variables en filas y columnas no están asociadas
• ALTERNATIVA (H1): Es aquella en la que se asegura que los dos parámetros analizados sí son
dependientes. Las variables en filas y columnas están asociadas

Necesitamos calcular “frecuencias esperadas”

Total Columna  Para dicha celda   Total Fila  Para dicha celda 

SumaTotal
f i.  f. j
ei , j 
n
EJEMPLO (supervivencia en el Titanic)

Sobrevive No sobrevive Total


Primera clase 194 128 322
Segunda clase 119 161 280
Tercera clase 138 573 711
Total 451 862 1313

Frecuencias esperadas
f1.  f.1 322 x 451
e11    110 ,6
n 1313
f 2.  f.1 280 x 451
e21    96,2
n 1313
Frecuencias esperadas

Sobrevive No sobrevive Total


Primera clase 110,6 211,4 322
Segunda clase 96,2 183,8 280
Tercera clase 244,2 466,8 711
Total 451 862 1313

Calculemos Chi-cuadrado

( f ij  eij ) 2

 2
exp  
i j eij


Ya vuelven los matemáticos a complicar las cosas
Traducción

Tenemos dos tablas (sin totales):


Frecuencias absolutas Frecuencias esperadas
Sobrevive No sobrevive Sobrevive No sobrevive
Primera clase 194 128 Primera clase 110,6 211,4
Segunda clase 119 161 Segunda clase 96,2 183,8
Tercera clase 138 573 Tercera clase 244,2 466,8

1) Hagamos otra tabla, donde restamos a la primera la


segunda
Sobrevive No sobrevive
Primera clase (194-110,6) (128-211,4)
Segunda clase (119-96,2) (161-183,8)
Tercera clase (138-244,2) (573-466,8)
2) Este valor elevado al cuadrado

Sobrevive No sobrevive
Primera clase (194-110,6)^2 (128-211,4)^2
Segunda clase (119-96,2)^2 (161-183,8)^2
Tercera clase (138-244,2)^2 (573-466,8)^2

3) Dividido por el valor que tengamos en la segunda tabla


Sobrevive No sobrevive
Primera clase (194-110,6)^2/110,6 (128-211,4)^2/211,4
Segunda clase (119-96,2)^2/96,2 (161-183,8)^2/183,8
Tercera clase (138-244,2)^2/244,2 (573-466,8)^2/466,8
Obtenemos la siguiente tabla en nuestro ejemplo
Sobrevive No sobrevive

Primera clase (194  110,6) 2 (128  211,4) 2


 62,9  32,9
110,6 211,4

Segunda clase
(119  96,2) 2
 5,4
(181  183,8) 2
 2,8
96,2 183,8
(138  244,2) 2 (573  466,8) 2
 46,2  24,2
Tercera clase 244,2 466 ,8

( f ij  eij ) 2
 exp
2
   62,9  32,9  5,4  2,8  46,2  24,2  174,4
i j eij
Tenemos:  exp
2
 174,4

Ahora calculemos el valor de la tabla Chi-cuadrado

1) grados de libertad, son:


K = (número de fila-1)x(número de columnas-1)
= (3-1)x(2-1) = 2
2) El valor alfa (0,05 si no se dice).
3) El valor que buscamos
 2
g .l .;  2
2; 0 , 05  5,99
SIGNIFICADO: La probabilidad de obtener
un valor mayor que 5,99 es 0,05
Probabilidad de un valor superior
- Alfa (α)
Grados libertad 0,1 0,05 0,025 0,01 0,005
1 2,71 3,84 5,02 6,63 7,88
2 4,61 5,99 7,38 9,21 10,60
3 6,25 7,81 9,35 11,34 12,84
4 7,78 9,49 11,14 13,28 14,86
5 9,24 11,07 12,83 15,09 16,75
6 10,64 12,59 14,45 16,81 18,55
Tenemos:  exp
2
 174,4
 g .l .;   2;0,05  5,99
2 2

Por tanto:
 2
exp  2
2; 0 , 05


SIGNIFICADO: Las variables no son
independientes


SIGNIFICADO en el ejemplo: El salvamento de los viajeros
en el Titanic no fue independiente de su clase social.
Hemos hecho un contraste de hipótesis

Los pasos en un contraste son:

1) Fijar las hipótesis que se quieren contrastar: H0 H1


2) Fijar el nivel de significación: 
3) Elegir un estadístico de contraste:
( f ij  eij ) 2
 exp
2
    k2( filas1) x ( columnas1);
i j eij
4) Se toma la decisión de rechazar o no la hipótesis:
 exp   k ;  Aceptar H 0  Independientes
2 2

 exp
2
  k2;  Rechazar H 0  Dependientes
Contraste de homogeneidad

1) Fijar las hipótesis que se quieren contrastar:

H0  Las subpoblaciones tienen idéntica


distribución para la variable Y.

H1  la distribución de la variable Y en alguna


de estas subpoblaciones es diferente

2) Fijar el nivel de significación: 


3) Elegir un estadístico de contraste:
( f ij  eij ) 2
 exp
2
    k2( filas1) x ( columnas1);
i j eij

4) Se toma la decisión de rechazar o no la hipótesis:

 2
exp  2
k ;  Aceptar H0

 exp
2
  k2;  Rechazar H0
19
Ejercicio: Melissa conjetura que el uso de cinturón de seguridad, en los conductores, está
relacionado con el género.
Datos: Tabla de contingencia

USO DE CINTURÓN DE
SEGURIDAD
GÉNERO SÍ NO
FEMENINO 50 25
MASCULINO 40 45
Hipotesis:
• H0: El uso del cinturón de seguridad es independiente del género.

• H1: El uso del cinturón de seguridad no es independiente del género.


20 EJEMPLO

• Melissa conjetura que el uso de cinturón de seguridad, en los conductores, está


relacionado con el género.

• H0: El uso del cinturón de seguridad es independiente del género.

• H1: El uso del cinturón de seguridad no es independiente del género.


21
REALIZAR UNA TABLA CON LOS VALORES DE LA TABLA DE CONTINGENCIA Y
AÑADIR UNA FILA EN LA PARTE INFERIOR Y UNA COLUMNA EN LA PARTE
DERECHA.

50 25

40 45
22
REALIZAR LAS SUMAS POR FILAS, POR COLUMNAS Y LA SUMA TOTAL

50 25 75

40 45 85
SUMA DE FILAS
FRECUENCIAS DE
VALORES
OBSERVADOS
90 70 160

SUMA DE COLUMNAS SUMA TOTAL


23
Usar la fórmula para obtener las frecuencias esperadas.

90  75  70  75 
42.1875 32.8125
160 160

90 85  70 85 
47.8125 37.1875
160 160

FRECUENCIAS DE VALORES ESPERADOS


24 CHI – CUADRADO CALCULADO

• Para obtener el valor de Chi-Cuadrado Calculado se tiene la fórmula

2
2
 calc 
 f0  fe 
fe
f0 : Frecuencia del valor observado.
fe : Frecuencia del valor esperado.
EJEMPLO
TABLA DE VALORES OBSERVADOS TABLA DE VALORES ESPERADOS
25
50 25 42.1875 32.8125

40 45 47.8125 37.1875

2
 calc  
2  f0  fe 
fe
2 2 2 2
2
 calc 
 50  42.1875 

 25  32.8125 

 40  47.8125 

 45  37.1875 
42.1875 32.8125 47.8125 37.1875
2
 calc  1.4468  1.8601  1.2766  1.6413  6.2248
26 GRADO DE LIBERTAD V

• Para calcular el grado de libertad (v) se realiza:

v  Cantidad de filas  1Cantidad de columnas  1


EJEMPLO
27

TABLA DE VALORES OBSERVADOS

50 25

40 45

v   2  1 2  1
v  11  1
28 NIVEL DE SIGNIFICANCIA

• Es el error que se puede cometer al rechazar la hipótesis nula siendo


verdadera.

• Por lo general se trabaja con un nivel de significancia de 0.05, que indica


que hay una probabilidad del 0.95 de que la hipótesis nula sea verdadera.
EJEMPLO
29
• Melissa conjetura que el uso de cinturón de seguridad, en los conductores,
está relacionado con el género. Los datos se muestran en la tabla inferior.
Melissa realiza la prueba de su conjetura usando chi-cuadrado con un nivel
de significancia del 1%.

USO DE CINTURÓN DE
SEGURIDAD
GÉNERO SÍ NO
FEMENINO 50 25
MASCULINO 40 45

• Entonces se tiene un nivel de significancia del 0.01.


30 VALOR DEL PARÁMETRO P

• Para calcular el valor de p se realiza:

p  1  Nivel de significancia

• Ejemplo:
p  1  0.01  0.99
Chi cuadrado (independencia)

Con p<0.05 se rechaza H0


Con p>0.05 no se rechaza H0

H0: El genero es independiente del uso del cinturón de seguridad


H1: El genero esta asociado al uso del cinturón de seguridad
Conclusión: El genero de la persona esta asociado al Uso del Cinturón de
seguridad, las mujeres Usan mas el Cinturón de Seguridad.
TABLA PARA VALORES DE CHI-
32 CUADRADO CRÍTICO
EJEMPLO
33
COMPARACIÓN ENTRE LOS VALORES
DEL CHI-CUADRADO CALCULADO Y EL
34 CRÍTICO

• Si el valor del chi-cuadrado calculado es menor o igual que el chi-cuadrado


crítico, entonces se acepta la hipótesis nula, caso contrario no se la acepta.

• Ejemplo:

2
 calc  Valor crítico
6.2248  6.635
Entonces se rechaza la hipótesis nula, la cual es “El uso del cinturón de
seguridad es independiente del género”.
¿Cuando podemos aplicar el
estadístico Chi-cuadrado?

1) Siempre hacemos un contraste unilateral.

2) No debe usarse si hay frecuencias esperadas


inferiores a 1.

3) Como máximo el 20% de las frecuencias esperadas


pueden ser menores que el valor 5.
RESUMEN

- El estadístico Chi-cuadrado
- Fijar hipótesis
- Fijar nivel de significación
- Grados de libertad
- Valores del estadístico
- Contraste de independencia
- Contraste de homogeneidad
- Condiciones de aplicar el Chi-cuadrado
Se desea saber si la distribución de los grupos sanguíneos es similar en los individuos de dos poblaciones. Para
ello se elige una muestra aleatoria de cada una de ellas, obteniéndose los siguientes datos ¿Qué decisión se
debe tomar?
A B AB 0 Total
Muestra 1 90 80 110 20 300
Muestra 2 200 180 240 30 650
Total 290 260 350 50 950

También podría gustarte