0% encontró este documento útil (0 votos)
300 vistas20 páginas

Prueba Chi Cuadrado: Análisis y Usos

El documento describe la prueba de chi cuadrado, una prueba estadística no paramétrica que mide la discrepancia entre distribuciones de frecuencias observadas y esperadas. Se utiliza para probar la bondad de ajuste de una variable, la independencia de dos variables y la homogeneidad de dos variables. El estadístico de chi cuadrado se calcula a través de una fórmula que compara las frecuencias observadas y esperadas.

Cargado por

Sinia
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
300 vistas20 páginas

Prueba Chi Cuadrado: Análisis y Usos

El documento describe la prueba de chi cuadrado, una prueba estadística no paramétrica que mide la discrepancia entre distribuciones de frecuencias observadas y esperadas. Se utiliza para probar la bondad de ajuste de una variable, la independencia de dos variables y la homogeneidad de dos variables. El estadístico de chi cuadrado se calcula a través de una fórmula que compara las frecuencias observadas y esperadas.

Cargado por

Sinia
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd

Introducción

La X2 es una prueba de libre distribución (no paramétrica) que mide la


discrepancia entre una distribución de frecuencias observadas y esperadas.
Dentro de sus características generales, la prueba X2 toma valores entre cero e
infinito y no tiene valores negativos porque es la suma de valores elevados al
cuadrado (1).

Existen tres usos relevantes de la prueba X2.

 Prueba de bondad de ajuste (una variable)


 Prueba de independencia (dos variables)
 Prueba de homogeneidad (dos variables)

ANÁLISIS DE LAS PRUEBAS DE CHI CUADRADO

Distribución Chi Cuadrado

La distribución denominada también ji-cuadrado de Pearson, es una distribución


de probabilidad continua con un parámetro “k”, que representa los grados de
libertad de la variable aleatoria.

Es considerada como una prueba no paramétrica, que mide la discrepancia entre


una distribución observada y otra teórica (bondad de ajuste), indicando la medida
de las diferencias existentes entre ambas, y de haberlas, se deben al azar en el
contraste de hipótesis, también se utiliza para probar la independencia de dos
variables entre sí, mediante la presentación de los datos en tablas de
contingencia.

Las Pruebas de Chi Cuadrado, nos permiten verificar si más de dos proporciones
de poblaciones pueden considerarse iguales. En realidad, éstas nos permiten
hacer muchas cosas y no simplemente probar la igualdad de varias proporciones.
Por ejemplo: si clasificamos una población de diversas categorías respectos a dos
atributos, como la edad y rendimiento en el trabajo,

El Estadístico Chi Cuadrado


El estadístico de Chi Cuadrado, se calcula a través de una fórmula y los 56
cálculos son fáciles de hacer. Si el valor de Chi Cuadrado da cero, indica que las
frecuencias observadas son exactamente iguales a las frecuencias esperadas. Si
el valor es diferente de cero, entonces este valor obtenido refleja, que hay
diferencia entre los valores observados y los valores esperados, es importante
mencionar que este valor es comparado con otro estadístico de Chi Cuadrado,
que se determina cuando se calculan los grados de libertad y se tiene el nivel de
significancia escogido; este valor es buscado en la tabla de Distribución Chi
Cuadrado, correspondiente al extremo derecho y así se determina si se rechaza
la hipótesis nula o se acepta.

La fórmula que da el estadístico es la siguiente:

(fo−fe)2
X 2 =∑
fe

Donde:

X 2 =Chi cuadrado

∑ ¿ La suma
fo=Frecuencia observado

fe=Frecuencia esperada

El Chi Cuadrado es un estadístico muestra, que se calcula a través de una serie


de pasos, los mismos se pueden observar a través de la fórmula, estos son:

Restamos fe a fo.

• Elevamos al cuadrado cada una de las diferencias.

• Dividimos entre fe cada diferencia elevada al cuadrado.

• Sumamos las respuestas.

Cuanto mayor sea el valor o el resultado de X2, es menor la posibilidad de que la


hipótesis sea correcta. De la misma forma, cuanto más se aproxima a cero el
valor de Chi-Cuadrado, más ajustadas están ambas distribuciones.
Determinación De Los Grados De Libertad

El grado de libertad, es un estimador del número de categorías independientes en


un test particular o experimento estadístico. Para utilizar la prueba de Chi
Cuadrado, debemos calcular el número de grados de libertad (gl), mediante la
aplicación de la siguiente ecuación:

gl = (número de renglones – 1) (número de columnas - 1)

gl = (r-1) (k-1). Donde “r” es el número de filas y “k” el número de columnas.

Existe un criterio de decisión para seleccionar la hipótesis, que es el siguiente:

Se acepta la hipótesis nula (H0), cuando X² < Xt² (r-1) (k-1), en tal caso que sea
contrario se rechaza la hipótesis nula (H0) y se acepta la hipótesis alternativa.

Donde “t” representa el valor proporcionado por las tablas, según el nivel de
significancia estadístico elegido.

Características De La Distribución De Chi Cuadrado

Es una curva asimétrica a la derecha, es decir, con sesgo positivo y las


frecuencias más altas se encuentran en el lado izquierdo de la media; mientras
que en el derecho hay frecuencias más pequeñas.

A continuación, se presenta una gráfica que muestra la distribución asimétrica


positiva, en donde se puede apreciar que, hacia el lado izquierdo de la media, van
a estar las frecuencias más altas y hacia el lado derecho de la media se
encuentran las frecuencias más pequeñas.

Figura N° 4. Distribución Asimétrica Positiva


Med

Limitaciones De Las Pruebas De Chi Cuadrado

Se debe tener mucho cuidado, al aplicar una prueba de Chi Cuadrado (X²) en
algunos problemas. Si se da el caso en que existe una frecuencia esperada
pequeña en una celda, el Chi Cuadrado (si se aplica) puede llevar a una
conclusión errónea. Esto se debe a que la frecuencia esperada (fe), aparece en el
denominador en la fórmula del estadístico Chi Cuadrado, y la división entre un
número muy pequeño produce un coeficiente demasiado grande.

A continuación, se mencionan dos reglas de aceptación general, respecto a


pequeñas frecuencias de celda, las cuales son:

Si solo hay dos celdas, la frecuencia esperada en cada celda debe ser igual a 5 o
mayor (fe ≥ 5), es decir, para utilizar la prueba de hipótesis de Chi Cuadrado, se
debe tener un tamaño de muestra lo suficientemente grande, para garantizar la
similitud entre la distribución teórica correcta y nuestra distribución de muestreo
de X², porque lo más probable es que se rechace la hipótesis nula, cuando la
misma es verdadera al tener muestras menores a 5 o muestras muy pequeñas.

Prueba De Independencia

Es una prueba estadística de proporciones de frecuencias; que se utiliza para


determinar si la pertenencia de una variable a categorías, es diferente como
función de la pertenencia a la categoría de una segunda variable.

En el análisis de una prueba de independencia, se considera que la muestra una


vez escogida, se clasifica según los criterios de interés; por ello se supone que las
muestras provienen de una población.
En las aplicaciones estadísticas, es frecuente interesarse en calcular si dos
variables de clasificación, ya sea cuantitativa o cualitativa, son independientes o si
están relacionadas.

La Prueba de Independencia, lo que busca es resolver aquellas situaciones en las


que se está interesado en determinar; si dos variables están relacionadas.

Tablas De Contigencias
Tablas de contingencia consiste en: Si dos características, como educación e
ingreso, se registran en clasificación cruzada en una tabla, el resultado se
denomina Tabla de Contingencia.

Al probar una hipótesis se involucra una tabla de contingencia, primero se calcula


las correspondientes frecuencias esperadas o teóricas de acuerdo con la
hipótesis. La suma de todas las frecuencias esperadas, debe ser igual a las
sumas de todas las frecuencias observadas.

Para realizar una Prueba de Independencia, se deben llevar a cabo una serie de
procedimientos que consisten en lo siguiente:

 Plantear la hipótesis nula y la hipótesis alternativa.


 Calcular las frecuencias esperadas, correspondientes a cada frecuencia
observada.
 Calcular el valor de Chi Cuadrado.
 Calcular el valor crítico de Chi Cuadrado.
 Comparar el valor esperado con el valor crítico.
 Conclusiones.

A continuación, se presenta un ejemplo práctico, de la Prueba de Independencia a


través de Tablas de Contingencia.
Tabla N° 7. Cálculos del estadístico Chi Cuadrado (X²).

Pas Pas Pas


o1 o2 o3
(fo-fe)²
fo fe fo - (fo-
fe fe)² fe

68 66, 1,57 2,46 ,


43 037
0
75 79, - 22,2 ,
72 4,72 8 279
5
57 59, - 7,78 ,
79 2,79 130
1
79 73, 5,93 35,1 ,
07 6 481
2
32 33, - 2,46 ,
57 1,57 073
3
Pas Pas Pas
o1 o2 o3
(fo-fe)²
fo fe fo - (fo-
fe fe)² fe

45 40, 4,72 22,2 ,


28 8 553
1
33 30, 2,79 7,78 ,
21 257
5
31 36, - 35,1 ,
93 5,93 6 952
1
(fo-fe)²

Paso 4 X² = ∑ =2,764 2,76


38
X² fe

 Determinar el valor crítico de Chi Cuadrado.


Para determinar el valor crítico de Chi Cuadrado, se debe calcular primero los
grados de libertad, estos se determinan una vez que se conoce cuántos renglones
y cuántas columnas hay en la tabla de contingencia, y con estos datos se
determina el valor crítico y la regla de decisión.

La fórmula para determinar los grados de libertad es la siguiente:

N° de gl = (número de renglones - 1) (número de columnas - 1) gl = (r-1) (k-1) =


(2-1) (4-1)

gl = (1)(3)

gl = 3 grados de libertad

Después que es calculado el grado de libertad, se establece el nivel se


significancia, en este caso, es de 10% ó 0,10. El procedimiento que sigue es
buscar el valor crítico de Chi Cuadrado, en la tabla del área correspondiente al
extremo derecho de una distribución Chi Cuadrado (X²).

Entonces con 3 grados de libertad y un nivel de significancia de 0,10; se tiene:

X² = 6,251

La región de aceptación de la hipótesis nula se encuentra en el extremo izquierdo


de la curva al valor de Chi Cuadrado de 6,251.

Comparación del valor esperado de Chi Cuadrado con el valor crítico


determinado.

El valor de Chi Cuadrado de la muestra que se obtuvo es de 2,764; éste se


encuentra dentro de la región de aceptación, por lo tanto, se acepta la hipótesis
nula de que no existe diferencia entre las actitudes con respecto a la evaluación
de trabajo en las cuatro regiones geográfica.

Figura N° 6. Prueba de hipótesis de Chi Cuadrado al nivel de significancia de


0,10; que muestra la región de aceptación, de rechazo y los valores de X².

Región de aceptación de Ho 0.10 del área


2.764 6.251

Región de rechazo de Ho X² de la muestra valor crítico


Pruebas De Bondad De Ajuste

Es una de las Pruebas No Paramétricas más utilizadas, ideada por Karl Pearson a
principios de 1900, ésta puede usarse para cualquier nivel de datos. Estas
pruebas miden el grado en que los datos muéstrales que son observados,
cumplen una distribución hipotética determinada y si el grado de cumplimiento es
razonable, se puede deducir que la distribución hipotética existe.

Hoy en día, en las decisiones gerenciales, se amerita que las mismas se prueben
a través de algunas hipótesis, sobre distribuciones poblacionales desconocidas,
es por ello, que nos vemos obligados a contrastar cualquier hipótesis que pueda
formular en relación con la distribución establecida. Por ejemplo, se podría
suponer que la distribución poblacional es uniforme y que todos los valores tienen
la misma probabilidad de aparecer. Las hipótesis se establecen de la manera
siguiente:

Ho: La distribución poblacional es uniforme

H1: La distribución poblacional no es uniforme

Luego para estas hipótesis se aplica la Prueba de Bondad de Ajuste, para


determinar si la distribución de valores de la población se acomoda a una forma
hipotética particular en este caso, una distribución uniforme, es importante
mencionar que para estas pruebas estadísticas se toman datos muéstrales de la
población.

En esta prueba de Bondad de Ajuste, cuando hay una diferencia grande entre lo
que se observa de la muestra real y lo que espera observarse si la hipótesis nula
fuera correcta, es menos probable que ésta sea cierta, es decir, la hipótesis nula
es rechazada, lo que busca en esta prueba es analizar las diferencias entre
nuestras expectativas basadas en la distribución hipotética y los datos reales que
aparecen en la muestra.

La fórmula que da el estadístico para la Prueba de Bondad de Ajuste es la


siguiente:

k (fo – fe) ²
X² = ∑
I=1 fe
Donde:

X²= Chi Cuadrado

∑= “La suma de”

fo= Frecuencia observada

fe= Frecuencia esperada

k= Es el N° de categorías o de clases

La prueba lleva consigo (K-m-1) grados de libertad, donde “m” es el número de


parámetros a estimar.

Prueba De Homogeneidad
Otra de las aplicaciones interesantes de la prueba Chi-Cuadrado consiste, en la
comprobación de la homogeneidad de distintas muestras de una variable.

En el análisis de independencia, se considera que la muestra, una vez escogida,


se clasifica según los criterios de interés, para ello se supone que la muestra
proviene de una población, en cambio en el análisis de situaciones que se dan
frecuentemente, las poblaciones son conocidas como diferentes y el interés radica
en tomar una decisión; que consiste en verificar si el comportamiento de éstas es
homogéneo respecto alguna característica.

Primordialmente, lo que busca esta prueba es, que cuando se presente varias
muestras cualitativas, lo que se busca es comprobar si las mismas provienen de
una misma población. En estos casos, las variables medibles, es necesario que
estén representadas mediante categorías, ya que para aplicar esta prueba se
expresan los datos mediante tablas de contingencias.

Para realizar una prueba de homogeneidad se procede de la manera siguiente:

 Escogemos una muestra de cada una de las poblaciones de interés.


 Cada muestra la clasificamos de acuerdo con los criterios que hayamos
escogido el estudio.

Realizamos una prueba Chi Cuadrado, similar al caso de independencia.


En lo que respecta a la hipótesis nula para el caso de homogeneidad, debemos
formularla de manera distinta al caso de independencia; por lo tanto, las
conclusiones tienen carácter diferente. Por ejemplo, la interrogante que se plantea
en una prueba de independencia para la hipótesis nula sería H0: ¿son
independientes los dos criterios de clasificación?, en cambio en una prueba de
homogeneidad, se responde a la interrogante planteada para la hipótesis nula de
la forma siguiente; H0: ¿las muestras extraídas son de poblaciones homogéneas,
respecto a algún criterio de clasificación?

A continuación, se presenta un caso práctico de la prueba de homogeneidad:

En un estudio sobre un cambio de leyes de protección a la niñez, se seleccionó


una muestra de 125 hombres y 125 mujeres y se les preguntó si estaban a favor,
en contra o son indiferentes acerca de la nueva ley. La tabla que sigue señala los
resultados de la encuesta, que formula la siguiente pregunta: ¿son compatibles
estos datos con la hipótesis, que consiste en que los hombres y las mujeres son
homogéneos, respecto a sus opiniones acerca de la nueva ley de protección a la
niñez?

A continuación, se presenta la tabla N° 17, que contiene los datos obtenidos de


las muestras seleccionadas de 125 hombres y 125 mujeres, con sus respectivas
clasificaciones de acuerdo a los criterios que se escogieron los cuales son: a
favor, en contra ó indiferentes ante la nueva ley de protección a la niñez.

Tabla N° 17. Resultados de la encuesta si están a favor, en contra ó son


indiferentes ante la nueva ley.

Hombr Mujeres Total


es
A favor 90 85 (87,5) 175
(87,5)
En contra 30 25 (27,5) 55
(27,5)
Sin decisión 5 (10,0) 15 (10,0) 20

Tot 125 125 250


al

Cálculo del estadístico de Chi Cuadrado:


El procedimiento siguiente es aplicar el estadístico de Chi cuadrado, a partir de
las distribuciones que se encuentran en la tabla
N° 17, y su fórmula es la siguiente:

(fo – fe) ²

X² = ∑
fe

(90 – 87,5) ² (85 – 87,5) ² (15 – 10)²

X²= + +….. + = 5.6


87,5 87,5 10

 Cálculo del valor crítico de Chi Cuadrado:

El Valor Crítico de Chi Cuadrado, es el número que determina la separación de la


región de aceptación de (Ho) y la región de rechazo de la misma, para buscarlo
se debe calcular los grados de libertad de la siguiente manera: (K-1), donde “K”
representa el número de categorías, en este ejemplo se tienen tres categorías por
lo tanto K=3.

El valor crítico determinado por la distribución Chi Cuadrado con gl = K – 1 = 3 –


1 = 2 gl; que separa el 10 % superior del nivel de significancia es de 4,60517; se
puede decir que la prueba resulta significativa al nivel de significancia de 10%, sin
embargo la prueba no resulta significativa al nivel de significancia de 5%, ya que
el valor crítico obtenido a través de la tabla de probabilidades de Chi Cuadrado,
que separa el 5% superior es 5,99146; en este caso no puede decidirse sobre la
diferencia entre las proporciones de hombres en cuanto la respuesta de la nueva
ley. [ CITATION Cas09 \l 10250 ]
EJERCICIOS

EJERCICIO 1

1.- Un jugador quiere probar que es legal el dado con el que juega. Tiro el dado
120 veces y obtuvo la siguiente distribución de frecuencias de las caras
resultantes.[ CITATION Daq15 \l 10250 ]

RESULTADO 1 2 3 4 5 6

FRECUENCIA 15 25 33 17 16 14

a) Enuncie las hipótesis de la prueba y determine las frecuencias esperadas.


b) Describa la estadística de la prueba
c) Determine la región crítica de la prueba al nivel de significación del 5%.
d) ¿A qué conclusión llega usando el nivel de significación 0,05?
e) Determine la probabilidad P.

1.-
Ho: El dado es legal.
Ha: El dado no es legal.
2.- Es de dos colas.
3.- Nivel de confianza
∝=95 % a=0,05 z =11,07
4.- n=120

gl= k-1 gl=6-1 gl=5


5.-
Zona
aceptación

11,07
6.-
Ei 20 20 20 20 20 20

Oi 15 25 33 17 16 14

x 2=¿

x 2 ( 5 ) =¿ ¿

x 2 ( 5 ) =1.25+1.25+8.45+0.45+ 0.8+1.8

x 2 ( 5 ) =14
7.- Se acepta la hipótesis alternativa y se rechaza la hipótesis nula, es decir el
dado del jugador no es legal ya que se encuentra dentro de la zona de rechazo.

EJERCICIO 9
9. Un investigador escogió una muestra aleatoria de 192 familias con 4 hijos y
encontró la siguiente distribución de frecuencias del número de hijos varones:
Número de 0 1 2 3 4
varones
Número de 18 42 64 40 28
familias

Él quiere probar la hipótesis de que los nacimientos de varones y mujeres son


igualmente probables. Esto es, quiere probar que la distribución de estos datos se
aproxima a una distribución binomial.[ CITATION Daq15 \l 10250 ]
Enuncie la hipótesis de la prueba y obtenga las frecuencias esperadas.
Describa la estadística de la prueba
Determine la región critica de la prueba al nivel de significación del 5%
A que conclusión llega usando el nivel de significación 0.05
Determine el nivel de significación de la prueba (calcule probabilidad)
1) H0: la distribución de nacimiento de varones y mujeres son igualmente
probables.
H1: la distribución de nacimientos de varones y mujeres no son igualmente
probables.
2) La prueba es unilateral y de cola derecha
3) Nivel de significación 0.05
4) Emplearemos la distribución maestral del CHI-CUADRADO
5) Gl= k-1

9.48

Gl=5-1=4
6)
Ei 38.4 38.4 38.4 38.4 38.4
Oi 18 42 64 40 28

Cálculo de las frecuencias esperadas

192
Ei= =38.4
5
(Oi−EI )2 ( 18−38.4 )2 ( 42−38.4 )2 ( 64−38.4 )2 ( 40−38.4 )2 (28−38.4 )2
x 2 ( 4 ) =∑
Ei
= [ 38.4
+
38.4
+
38.4
+
38.4
+
38.4 ] =10.83+

Decisiones
Aceptamos la Ha y rechazamos la Ho.
Esto significa que los nacimientos de varones y mujeres no son igualmente
probables.

Conclusiones
La Prueba de Independencia, lo que busca es resolver aquellas situaciones en las
que se está interesado en determinar; si dos variables están relacionadas, en las
aplicaciones estadísticas, es frecuente interesarse en calcular si dos variables de
clasificación, ya sea cuantitativa o cualitativa.

La Prueba de Bondad de Ajuste, estas pruebas miden el grado en que los datos
muéstrales que son observados, cumplen una distribución hipotética determinada
y si el grado de cumplimiento es razonable, se puede deducir que la distribución
hipotética existe.

La Prueba de Homogeneidad lo que busca es, que cuando se presenten varias


muestras cualitativas, se comprueba si las mismas provienen de una misma
población, donde las variables medibles se presentan a través de categorías.
Bibliografía

Castellar, Rosángel & Zapata,Févida. (2009). APLICACIONES DE LA


DISTRIBUCIÓN DE PROBABILIDADES DE CHI CUADRADO EN LA
TOMA DE DECISIONES. Cumaná.
Daquilema, J. (2015). Chi Cuadrado Ejercicios. Obtenido de
[Link]

También podría gustarte