Estadístico Chi-Cuadrado
El estadístico Chi-cuadrado (χ²) es una prueba estadística la cual se aplica hasta con datos
mediables en una escala de tipo nominal, esta prueba menciona una distribución de
probabilidad específica como el modelo matemático de la población que ha generado la
muestra
Para aplicar esta herramienta estadística se usan los datos previamente planteados en una
tabla de valores, en donde para cada valor o intervalo de valores se indica la frecuencia
absoluta observada o empírica denominada (Oi), posteriormente se procede a calcular para
cada valor o intervalo de valores la frecuencia absoluta que cabría esperar o frecuencia
esperada (Ei=n·pi , donde n es el tamaño de la muestra y pi la probabilidad del i-ésimo
valor o intervalo de valores según la hipótesis nula).
Donde:
Oi es la frecuencia observada en cada categoría,
Ei es la frecuencia esperada en cada categoría.
Este estadístico tiene una distribución Chi-cuadrado con k-1 grados de libertad si n es
suficientemente grande, es decir, si todas las frecuencias esperadas son mayores que 5. En la
práctica se tolera un máximo del 20% de frecuencias inferiores a 5.
Si existe concordancia perfecta entre las frecuencias observadas y las esperadas el estadístico
tomará un valor igual a 0; por el contrario, si existe una gran discrepancias entre estas frecuencias
el estadístico tomará un valor grande y, en consecuencia, se rechazará la hipótesis nula. Así pues,
la región crítica estará situada en el extremo superior de la distribución Chi-cuadrado con k-1
grados de libertad.
En Valores esperados se debe especificar la distribución teórica activando una de las dos
alternativas. Por defecto está activada Todas la categorías iguales que recoge la hipótesis
de que la distribución de la población es uniforme discreta. La opción Valores requiere
especificar uno a uno los valores esperados de las frecuencias relativas o absolutas
correspondientes a cada categoría, introduciéndolos en el mismo orden en el que se han
definido las categorías.
El recuadro Rango esperado presenta dos opciones: por defecto está activada Obtener de
los datos que realiza el análisis para todas las categorías o valores de la variable; la otra
alternativa, Usar rango especificado, realiza el análisis sólo para un deteminado rango de
valores cuyos límites Inferior y Superior se deben especificar en los recuadros de texto
correspondientes.
El cuadro de diálogo al que se accede con el botón Opciones ofrece la posibilidad de
calcular los Estadísticos Descriptivos y/o los Cuartiles, así como seleccionar la forma en
que se desea tratar los valores perdidos.