0% encontró este documento útil (0 votos)
126 vistas30 páginas

Pruebas Chi-Cuadrado en Estadística

Este documento describe tres pruebas estadísticas de chi-cuadrado: prueba de bondad de ajuste, prueba de independencia, y prueba de homogeneidad de proporciones. Explica cómo calcular el estadístico de prueba chi-cuadrado y el criterio de decisión para cada prueba, y provee ejemplos ilustrativos de cada una.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
126 vistas30 páginas

Pruebas Chi-Cuadrado en Estadística

Este documento describe tres pruebas estadísticas de chi-cuadrado: prueba de bondad de ajuste, prueba de independencia, y prueba de homogeneidad de proporciones. Explica cómo calcular el estadístico de prueba chi-cuadrado y el criterio de decisión para cada prueba, y provee ejemplos ilustrativos de cada una.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

PROF. GRABIELA MONTES Q.

 Este tipo de pruebas frecuentemente se usan


cuando el análisis se basa en conteos o
frecuencias. Se definen categorías
mutuamente excluyentes y se registran las
frecuencias observadas en cada categoría.
Luego se comparan estas frecuencias
observadas con las frecuencias que se
esperarían si H0 fuera verdadera. Si la
diferencia es grande, entonces rechazamos
H0.

Las pruebas chi-cuadrado que veremos son:


 Pruebas de Bondad de ajuste
 Prueba de independencia de criterios
 Prueba de homogeneidad de proporciones
Esta prueba se utiliza para probar si una
población tiene una distribución teórica
específica.
Supongamos que la población admite las
categorías X1, X2,…, Xk, mutuamente
excluyentes, sea pXi la probabilidad teórica
de la ocurrencia de la categoría Xi.
 Se formulan las hipótesis:
H0: pXi = pi
H1: pXi ≠ pi
 Se toma una muestra de tamaño n de la
población y definimos Oi la frecuencia
observada de Xi.
 Si H0 es verdadera, el número esperado de
observaciones en Xi, i = 1, … , k, es:
E i = n pi
Se cumple que la suma de las frecuencias
esperadas es n.
Aplicar el siguiente procedimiento sólo si los
Ei son todos mayores o iguales a 5.
 Estadístico de prueba:

χ 
2
k
Oi  E i  2

c
i 1 Ei
 Criterio de decisión:
Rechazar H0 si
χ χ
2
c
2
 k  r 1;1α 
Donde k es el número de categorías y r es
el número de parámetros estimados para
calcular Ei.
1. EJEMPLO
La empresa de investigación de mercado D&J S.A. hizo un estudio
para determinar la opinión de los televidentes sobre un nuevo
programa humorístico. Se tomó una muestra aleatoria de 400
personas, obteniéndose los siguientes resultados:

Opinión muy bueno bueno regular malo muy malo total


Frecuencia 25 60 175 120 20 400

Probar si la opinión de los televidentes respecto al nuevo programa


humorístico no se distribuye en la proporción: 2:4:6:5:3. Use  = 0.05
 Tabla de cálculos para hallar el estadístico de
prueba:
Opinión Oi pi Ei Chi
Muy bueno 25 0.1 40 5.6250
Bueno 60 0.2 80 5.0000
Regular 175 0.3 120 25.2083
Malo 120 0.25 100 4.0000
Muy malo 20 0.15 60 26.6667
66.5000
 Se puede observar que todos los valores
esperados son mayores o iguales a 5.
1. Hipótesis:
H0: px1=0.10, px2=0.20, px3=0.30, px4=0.25, px5=0.15
H1: Al menos una pxi diferente a lo mostrado.
2. α=0.05

3. Estadístico de prueba:

χ c2 
k
Oi  Ei 2
i1 Ei
 66.5

 c2   2k r 1;1 
4. Criterio de decisión: Se rechaza H0, si
 2k r 1;1    2501;0.95  9.48773
5. Conclusión: Se rechaza H0, la opinión no se distribuye
en las proporciones mostradas.
 Con Minitab ingresamos los datos de la
frecuencias observadas, Oi, y las
probabilidades correspondientes, pi.
 Luego seguimos la siguiente secuencia:
 Ingresamos los datos como se muestra a
continuación, en “test” seleccionar “Specific
proportions”. Si las probabilidades fueran iguales
seleccionar “Equal proportions”, y dar OK.
 Obteniéndose los siguientes resultados:

Según el P-value = 0, se rechaza H0.


Se tienen dos criterios de clasificación, o dos
variables aleatorias, se quiere averiguar si los
dos criterios son o no independientes.
Se toma una muestra de tamaño n y se
clasifican los datos para ambos criterios.
 Los resultados se resumen en una tabla de
doble entrada llamada tabla de
contingencia.

Y
X Y1 Y2 … Yc
X1 O11 O12 … O1c
X2 O21 O22 … O2c
… … … … ,,,
Xr Or1 Or2 … Orc
 Se plantean las hipótesis:
H0: Las variables son independientes
H1: Las variables no son independientes
 Se calculan los valores esperados.
O i. . O.j
E ij 
n
Donde Oi. es el total de la fila i, y O.j es el
total de la columna j.
 Estadístico de prueba:

χ  
2
r c O ij  E ij 
2

c
i 1 j1 E ij
 Criterio de decisión:
Rechazar H0 si

χ  χ r 1c 1;1α 


2
c
2

Aplicar el criterio sólo si todos los valores


esperados son mayores o iguales a 5. Si no se
cumpliera este criterio se deben agrupar categoría
hasta cumplir con la condición.
EJEMPLO
Una de las preguntas del estudio de suscriptores de 2010 de
Bussiness Week fue: “Durante los últimos 12 meses, en viajes de
negocios, ¿qué tipo de boleto de avión compró con más frecuencia?”
Las respuestas obtenidas se muestran en la siguiente tabla:
Tipo de vuelo

Nacional Internacional

Tipo de Primera clase 29 22


boleto
Clase de negocios o ejecutiva 95 121
Clase económica 518 135

Usando nivel de significación 0.05, pruebe si no existe independencia


entre el tipo de vuelo y tipo de boleto.
1. Hipótesis:
H0: El tipo de boleto y el tipo de vuelo son independientes
H1: El tipo de boleto y el tipo de vuelo no son independientes
2. α=0.05

3. Estadístico de prueba:

 c2  
r c Oij  Eij 2  100.434
i 1 j 1 Eij

4. Criterio de decisión: Se rechaza H0, si χ c2  χ 2r 1c 1;1α 


χ 2r 1c 1;1α    22;0.95  5.99146

5. Conclusión: Se rechaza H0, por lo tanto el tipo de boleto y el tipo de vuelo no


son independientes.
 Probar la homogeneidad de proporciones
equivale a probar si varias muestras pueden
ser consideradas como seleccionadas de una
misma población.
Se toman muestras aleatorias de tamaños n1,
n2,…, nr, de r diferentes poblaciones y cada
observación de cada muestra es clasificada en
c diferentes grupos, luego los datos así
obtenidos se pueden presentar en una tabla
de contingencia rxc.
Grupo
Población Total
1 2 … c

1 O11 O12 … O1c n1

2 O21 O22 … O2c n2

… … … … … …

r Or1 Or2 … Orc nr


 Se plantean las hipótesis:

H0: Todas las muestras proceden de la


misma población.

H1: Todas las muestras no proceden de la


misma población.
Lo que equivale a:

H0: p1j = p2j =…= prj, , j =1,…,c


H1: No todas las proporciones son iguales.

Donde pik es la probabilidad que la


observación tomada al azar de la i-ésima
población sea del grupo k.
 Se calculan los valores esperados.

n i . O.j
E ij 
n

Donde ni es el total de la fila i, Oj es el


total de la columna j, y n es la suma de los
ni.
 Estadístico de prueba:

χ  
2
r c O ij  E ij 
2

c
i 1 j1 E ij
 Criterio de decisión:
Rechazar H0 si

χ  χ r 1c 1;1α 


2
c
2

Aplicar el criterio sólo si todos los valores


esperados son mayores o iguales a 5.
EJEMPLO:
En el estudio de un taller, se obtuvo un conjunto de datos para determinar
si la proporción de artículos defectuosos producidos por los trabajadores
era la misma durante el día, la tarde o la noche. Se encontraron los
siguientes resultados luego de obtener muestras de trabajadores de
diferentes turnos:

TURNO
Condición Día Tarde Noche
Defectuosos 45 55 70
No defectuosos 905 890 870

Utilice un nivel de significación del 5% para determinar si la proporción


de artículos defectuosos no es la misma para los tres turnos.
1. Hipótesis:
H0: pDj = pTj = pNj, , (j =1:Defectuosos, 2:No defectuosos)
H1: No todas las proporciones son iguales

2. α=0.05

3. Estadístico de prueba:

 c2  
r c Oij  Eij 2  6.234
i 1 j 1 Eij
4. Criterio de decisión: Se rechaza H0, si χ c2  χ 2r 1c 1;1α 
χ 2r 1c 1;1α    22;0.95  5.99146

5. Conclusión: Se rechaza H0, por lo tanto la proporción de artículos


defectuosos no es la misma en los 3 turnos.

También podría gustarte