PRUEBA DE CHI CUADRADA (2)
Una de las pruebas no paramtricas ms conocidas es la prueba de
Chi cuadrada. Esta prueba ayuda a adoptar la decisin ms
adecuada con respecto a la hiptesis. Sus frmulas tienen algunas
variaciones segn los datos que se desee estudiar, pero en todos los
casos se requiere que los datos se presenten en forma de
frecuencias
La frmula de Chi cuadrada que se emplear en este caso es la
siguiente:
En donde: = Sumatoria.
fo = frecuencia obtenida.
fe = frecuencia esperada
MIDE EL GRADO EN QUE LOS PARES DE FRECUENCIAS
OBSERVADAS Y ESPERADAS CONCUERDAN CON UNA
SITUACIN DADA
FRECUENCIA ESPERADA
EL CLCULO DE LAS FRECUENCIAS ESPERADAS, POR LA
PROPIEDAD DE LAS PROBABILIDADES ES EL SIGUIENTE
TOTAL DE LA FILA X TOTAL DE LA COLUMNA
E=
TOTAL DE DATOS
Para realizar el clculo del Chi-cuadrado es preciso construir una
tabla de contingencia. La tabla de Contingencia es una estructura de
filas y columnas que sirven para mostrar el resultado (cifra, nmero) de
clasificar el total de casos (datos). Se pueden construir tablas de
contingencia de 2x2, 2x3, 3x3, etc. No est limitado por el nmero de
categoras. El Chi-cuadrado si est limitado fuertemente el que exista
una o mas celdas con una frecuencia menor de 5 casos (datos), ya que
la distorsin de los resultados es muy grande generando una falsa
interpretacin
Para encontrar X2 crtico se requiere comprender dos conceptos:
Grados de libertad y Nivel de significacin
Grados de libertad (GL): Se define como (Nmero de columnas -1)
(Nmero de filas -1). Para el ejemplo sera: Tabla de 2x2, entonces, GL =
(2-1) (2-1) = 1
Nivel de significacin (P): Denominado nivel de confianza, se refiere a la
probabilidad de que los resultados observados se deban al azar. Este
valor es fijado por el investigador, usualmente es el 5% o 10%. Lo que
indica que si se toma P=0.05, se est significando que solo en un 5% de
las veces en que se realice la medicin, el resultado obtenido podra
deberse al azar. De lo contrario sera decir que existe un nivel de
confianza del 95% que el resultado es real y no debido a la casualidad
APLICACIONES DE LA DISTRIBUCIN CHI CUADRADO
-CUANDO LOS DATOS ESTN EN FORMA DE FRECUENCIA SE
TIENE BSICAMENTE TRES PROCEDIMIENTOS DE PRUEBA DE
HIPTESIS:
A) PRUEBA DE BONDAD DE AJUSTE
B) PRUEBA DE INDEPENDENCIA
C) PRUEBA DE HOMOGENEIDAD
- EN TODOS LOS CASOS SE TRATA DE COMPARAR LAS
FRECUENCIAS OBSERVADAS CON LAS FRECUENCIAS
ESPERADAS, SI LO DATOS SE OBTUVIERON BAJO ALGUNA
HIPTESIS O TEORA PARTICULAR.
PRUEBA DE HOMOGENEIDAD
-EVALUA SI MUESTRAS INDEPENDIENTES EXTRADAS
DE
VARIAS
POBLACIONE
PROVIENEN
DE
POBLACIONES HOMOGENIAS CON RESPECTO A ALGN
CRITERIO DE CLASIFICACIN
-ESTA PRUEBA COMPRENDE UN PROCEDIMIENTO DE
MUESTREO DISTINTO
AL DE LA PRUEBA DE
INDEPENDENCIA
PRUEBA DE INDEPENDENCIA
-FRECUENTEMENTE SE QUIERE PROBAR LA
HIPOTESIS NULA QUE INDICA QUE DOS CRITERIOS
DE CLASIFICACIN (VARIABLES CATEGRICAS) SON
INDEPENDIENTES CUANDO SE APLICA AL MISMO
CONJUNTO DE INDIVIDUOS
-SE DICE QUE DOS CRITERIOS SON INDEPENDIENTES
SI LA DISTRIBUCIN DE UNO DE ELLOS ES LA MISMA
SIN IMPORTAR CUAL SEA LA DISTRIBUCIN DEL OTRO
Ejemplo de prueba de chi cuadrado para una prueba de independencia
En la carrera profesional de Psicologa de una Universidad se desea
determinar si existe alguna relacin entre el nivel acadmico (estudiante
del I ciclo, de II, III y IV) y el nivel de nerviosismo medido por una prueba
estndar de nerviosismo y ansiedad que indica segn las categoras
siguientes; no nerviosismo (NN) ligeramente nervios (LN), moderadamente
nervioso (MN), extremadamente nervioso (EN). Se elige aleatoriamente a
400 estudiantes de Psicologa de esta Universidad y se obtiene la siguiente
tabla
Nivel
acadmico
Nerviosismo y ansiedad
NN
LN
MN
EN
Totales
I Ciclo
20
20
40
80
160
II Ciclo
10
30
30
30
100
III Ciclo
40
20
10
10
80
IV Ciclo
40
20
60
Totales
110
90
80
120
400
Con estos datos emplear una prueba con nivel = 0,05, para
determinar si son independientes entre si las variables nivel
acadmico y nivel de nerviosismo
1. Planteamiento de las hiptesis
Ho: las variables nivel acadmico y nivel de nerviosismo son
independientes entre s
H1: las variables nivel acadmico y nivel de nerviosismo son
dependientes entre s
2. La prueba es unilateral y de cola derecha
3. asumimos un nivel de significacin de 0,05
4. Utilizaremos la distribucin de Chi cuadrado porque las variables
son cualitativas
5. Esquema de la prueba
gl = (C-1)(F-1) = (4-1)(4-1)= 9
= 0,05
2(9) = 16,919
Zona de aceptacin
zona de rechazo
16,969
X2
6. Calculo del estadstico de la prueba . Utilizaremos la frmula.
2 = (O E)2 / E
O= Frecuencia Observada
E = Frecuencia Esperada
Hallando las frecuencias esperadas a partir de las frecuencias
observadas
20
44
20
36
40
32
80
48
160
10
27,5
30
22,5
30
20
30
30
100
40
22
20
18
10
16
10
24
80
40
16,5
20
13,5
12
18
60
110
90
80
120
400
Calculo auxiliar para hallar la chi cuadrada
O
20
44
10
27,5
40
22
40
16,5
20
36
30
22,5
20
18
(O - E)
(O E)2
(O - E)2/E
2 = 154,14 (verificar)
7. Decisin
Como 154,14 > 16,919, el valor 154,14 cae en la regin de rechazo, por
tanto rechazamos Ho y aceptamos la H1, que establece una asociacin
entre las variables nivel acadmico y nerviosismo
Un grupo de investigadores, al estudiar la relacin entre el tipo sanguneo y la
severidad de una afeccin en la poblacin, reuni los datos de 1500 personas,
los cuales se presentan en la tabla de contingencia. Los investigadores desean
saber si estos datos son compatibles con la hiptesis de que el grado de la
afeccin y el tipo sanguneo son independientes
Tabla No 1 mil quinientos individuos clasificados segn la
severidad de su condicin y tipo de sangre
Tipo de sangre
A
Severidad
de
la
condicin
AB
TOTAL
AUSENTE
543
211
90
476
1320
MODERADA
44
22
31
105
SEVERA
28
31
75
TOTAL
615
242
105
538
1500