Jesús Reynaga Obregón
Prueba de bondad de ajuste
Descripción
La prueba de bondad de ajuste se aplica en diseños de investigación en los que se estudia a un único
grupo.
La prueba compara la distribución de frecuencias observada (Fa) de una variable usualmente cualitativa,
pero que también puede ser cuantitativa, con la distribución de frecuencias de la misma variable medida
en un grupo de referencia.
El procedimiento de la prueba implica el cálculo de una distribución esperada (Fe) en el grupo estudiado,
usando como punto de partida a la distribución de la variable en el grupo de referencia.
El propósito de la prueba es averiguar si existen diferencias estadísticamente significativas entre la
distribución observada (Fa) y la distribución esperada (Fe).
En la prueba se plantean las siguientes hipótesis estadísticas:
Hipótesis estadística nula: Ho: Fa = Fe
Hipótesis estadística alterna: Ha: Fa #: Fe
El procedimiento de la prueba incluye el cálculo de la medida de resumen llamada Chi cuadrada. El
rechazo de la Ha ocurre cuando el valor calculado con los datos resulta mayor que el valor crítico de
dicha medida contenido en una tabla llamada Valores Críticos de Ch i cuadrada.
En el caso de que el valor de Ch i cuadrada calculada sea igualo menor al de Chi cuadrada crítica se dice
que no se rechaza a la Ho y, por tanto, se concluye que la Fa es semejante a la Fe. En otras palabras, se
dice que ambas distribuciones se ajustan bien; de ahí el nombre de la prueba: bondad de ajuste.
Ejemplo desarrollado
Un cirujano desarrolló una nueva técnica quirúrgica para el reemplazo de la cabeza del fémur que
consideraba superior a la tradicional en cuanto a complicaciones postoperatorias inmediatas. Luego de
intervenir a 106 adultos con edades comprendidas entre los 55 y los 65 años observó la siguiente
distribución de frecuencias de las complicaciones:
Técnica nueva: distribución de frecuencias de complicaciones observada
Daño
Hemorragia Desplazamiento Ninguna Total
nervioso
28 16 4 58 106
La distribución de frecuencias de complicaciones que utilizó como referencia para su comparación fue la
siguiente:
125
Jesús Reynaga Obregón
Técnica anterior: distribución de frecuencias de complicaciones (referencia)
Daño
nervioso
Hemorragia Desplazamiento Ninguna Total
l
485 285 52 148 970
50.0% 29.4% 5.36% 15.26% 100%
(0.500) (0294) (0.054) (0.153) (1.00)
Las cifras entre pa réntesis son las proporciones equivalentes a los porcentajes
El cirujano razonó así: Si no hubiera diferencia entre ambas distribuciones; es decir: si ambas
distribuciones se ajustaran bien entre sí, mis pacientes hubieran presentado las complicaciones de la
siguiente forma:
~
Daño
Hemorragia Desplazamiento Ninguno Total
nelvioso
50 % de 29.4% de 5.36% de 106 15.26% de
106 serían: 106 serían: serían: 106 serían 106
53 31 6 16
Para facilitar la comparación , el cirujano construyó la siguiente tabla:
Distribución
Daño
de Hemorragia Desplazamiento Ninguno Total
nervioso
frecuencias
Observada
(técnica 28 16 4 58 106
nueva)
Esperada
(técnica 53 31 6 16 106
anterior)
Diferencias - 25 -15 -2 42
Al en contrar que su técnica produjo 25 pacientes menos de los que cabría esperar con daño nervi oso, 15
pacientes menos con hemorragia, 2 pacientes menos co n desplazamiento y 42 pacientes de más sin .
complicacio nes, concluyó que, al no ajustarse bien ambas distribuciones de frecuencias, había diferencia
entre tales distribuciones; es decir, había una diferencia evidentemente favorable para los resultados con
la técnica nu eva.
Con el propósito de calcular una medida de resumen qu e pudiera sintetizar en una sola cifra las
diferencias encontradas, el cirujano decidió calcular el valor de la medida llamada Ch i cuadrada o
2
también ji cuadrada, que se simboliza de la siguiente manera X , y cuya fórmula es la siguiente:
126
Jesús Reynaga Obregón
2
Fragmento de la tabla de valores críticos de X
Valores críticos al nivel
Grados de libertad
de sígníficancía de 0.05
1 3.84
2 5.99
3 7.81
4 9A9
5 11.07
100 124.34
En el mismo libro, encontró que el renglón de la columna llamada Grados de libertad en donde debía
buscar el va lor crítico por rebasar correspondía al número de modalidades o clases de la variable que
había estudiado menos uno. La variable que midió se llamaba tipo de complicación y su escala estaba
constituida por cuatro modalidades: daño nervioso, hem orragia, desplazamiento, ninguno; por tanto los
grados de libertad correspondientes serían ·· 4 - 1 == 3.
Al encontrar que el valor calculado de Chi cuadrada (129.97) rebasaba al valor crítico de Chi cuadrada
(que era de 7.81) supo que no había un buen ajuste de la distribución de frecuencias observadas con la
distribución de frecuencias esperadas; es decir; que la idea de que Fa era igual a Fe (Fa == Fe) podría
rechazarse para quedarse co n el planteamiento de que Fa era diferente a Fe (Fa Fe) *
Leyendo un poco más, encontró que en toda prueba de análisis estadístico la suposición de igualdad se
llama hipótesis estadística nula, que en su caso se simbolizaba de la sigu iente forma: Ha: Fa = Fe, y que
la suposición de diferencia se llama hipótesis estadística alterna, que en su estudio se simbolizaba asi:
Ha Fa Fe.*
En resumen, el cirujano concluyó que, en virtud de que el valor calculado de Ch i cuadrada rebasaba al
valor crítico de Chi cuadrada, podía rechazar a la hipótesis estadística nula (o de igualdad entre la
distribución de frecuencias observadas Fa y la distribución de frecuencias esperadas Fe).
El cirujano escribió sintéticamente: Se rechazó a la Ha (p < 0.05). Por lo anterior concluyó que ambas
distribuciones de frecuencias (Fa y Fe) no se ajustaban bien o que, en otras pa labras, los resultados de la
técnica quirúrgica nueva no eran iguales a los de la técnica quirúrgica anterior. Hablando en términos
estadístico, el cirujano pudo rechazar la hipótesis estadística nula Ha Fa = Fe con un riesgo de error
menor a 0.05.
Procedimiento
1. Confirmar que el propósito del estudio consiste en comparar la distribución observada en la
escala de una variable medida en un grupo en estudio (distribución observada) con la distribución
esperada de dicha variable considerando el antecedente de algún grupo de referencia para
verificar si ambas distribuciones se ajustan bien o no.
2. Disponer de las frecuencias absolutas de la distribución observada en la escala de la variable
medida en el grupo en estudio (distribución observada).
127
Jesús Reynaga Obregón
Donde:
¿ : Letra griega sigma que indica sumar todas las expresiones del siguiente tipo
o : Cada frecuencia observada e : cada frecuencia esperada
Para realizar los cálculos de la medida de resumen, el cirujano elaboró la siguiente tabla auxiliar:
I
Daño
Hemorragia Desplazamiento Ninguno Total
nervioso I
O 28 16 4 58 106
e 53 31 6 16 106
(o-e) - 25 -15 -2 42
(O - e)2 625 225 4 1,764
(O _e)2 625/53= ~31= 4/6 = 1,764/16 Suma=
11.79 7.26 0.67 = 110.25 129.97
e
Por tanto, la medida que resumía las diferencias, en este caso llamada Chi cuadrada calculada , va li ó:
(O- e)2
X2 =¿ ' =129.97
e
El cirujano completó su razonamiento concluyendo que si cada una de las frecuencias observadas
hubiera sido idéntica a su correspondiente frecuencia esperada entonces cada diferencia hubiera valido O
(cero ). Si ello hubiera ocurrido, cada diferencia elevada al cuadrado también hubiera valido cero, por
tanto cada expresión también hubiera valido cero y, finalmente, el valor de su suma, es
e
decir, el valor de Chi cuadrada hubiera sido cero.
El valor que el cirujano calculó no fue cero , sino 129.97; por lo tanto decidió que debía encontrar un valor
crítico que, al ser rebasado , le indicaría que no había un buen ajuste entre la serie completa de
frecuencias observadas (serie a la que denominó Fa) y la serie completa de frecuencias esperadas (serie
a la que identificó como Fe). Para el lo recurrió a un libro en donde encontró una tabla de la que se
muestra un fragmento en seguida:
128
Jesús Reynaga Obregón
3. Disponer de las frecuencias absolutas o de las relativas (porcentajes o proporciones) de la
distribución en la escala de la variable medida en el grupo de referencia.
4. Calcular las frecuencias esperadas aplicando al total del grupo en estudio las proporciones o
porcentajes de la distribución de referencia, modalidad por modalidad o clase por clase, para
obtener las correspondientes frecuencias esperadas.
5. Usando una tabla auxiliar como la siguiente, determinar el valor de Chi cuadrada calculada
Modalidad Modalidad Modalidad Modalidad
o inteNalo o inteNalo o intervalo o inteNalo
Total
dela dela dela dela
variable
o
e
(o-e)
Suma=
e
(*) Ajustar el número de columnas al número de modalidades o clases que tenga la
variable. La suma del renglón O debe ser coincidente con la suma del renglón e
6. Comparar el valor de Chi cuadrada calculada con el valor de Chi cuadrada crítica, usando una
tabla de valores críticos. Identificar el renglón de los grados de libertad (G.L.) correspondientes al
número de modalidades o clases de la variable en estudio mediante la fórmula G.L. = k - 1
(donde: k número de modalidades o clases).
7. En caso de que el valor de Chi cuadrada calculada rebase al valor crítico de la tabla, rechazar a
la hipótesis estadística nula Ho señalando que el nivel de significancia fue de 0.05; usualmente
se acostumbra redactar lo anterior de la siguiente forma: se rechazó Ho con una p < 0.05; en
caso de que el valor calculado haya sido igualo no hubiera rebasado al valor crítico se señala
que no fue posible rechazar la Ho.
8. De acuerdo al paso anterior, establecer la conclusión referente a si ambas distribuciones se
ajustan bien o no.
Problema resuelto
El Secretario Académico de una escuela de medicina aplicó un examen departamental a la generación de
236 alumnos de primer año. Resumió las calificaciones con promedio y desviación estándar, encontrando
valores de 7.0 y 1.5 respectivamente. El funcionario sabía que solo es válido usar el promedio y la
129
Jesús Reynaga Obregón
desviación está ndar si los valores son cuantitativos continuos y si, además, se distribuyen como la curva
normal.
La distribución observada de ¡as calificaciones de los alumnos fue la siguiente:
• Entre el promedio más una desviación estándar; es decir entre 7.01 y 8.50 se encontraron 74
calificaciones
• Entre el promedio menos una desviació n estándar; es decir entre 5.50 y 7.00 se encontraron 86
cal ificaciones
• 44 calificaciones tenian un valor superior a 8.50
• 32 cal ificaciones tenían un valor inferior a 5.50
Debido a sus conocimientos de estadística, el funcionario sabía que, si las 236 calificaciones se
distribuían de acuerdo a la curva normal, habría que esperar que los valores se distribuye ran
aproximadamente así:
• Entre el promedio más una desviación estándar debería haber el 0.3413 de los valores; esto
equivalía aproximadamente a 81 calificaciones con valor de 7.01 a 8.50
• Entre el promedio menos una desviación estándar debería haber el 0.3413 de los val ores; esto
equivalía aproximadamente a 81 calificaciones con valor de 5.50 a 700
• Debería haber un 0.1587 de las calificaciones con valor mayor de 8.50; esto equivalía
aproximadamente a 37 calificaciones con valor superior a 8.50
• Debería haber un 0.1587 de las calificaciones con valor menor de 5.50: esto equivalía
aproximadamente a 37 calificacio nes con valor inferior a 5.50
Para evaluar sus datos los acomodó de la siguiente manera:
Menos de Más de
5.50 a 7.00 7.01 a 8.50 Total
5.50 8.50
O 32 74 86 44 236
e 0.1587 x 0.34 13 X 0.3413 X 0.1587X
236
236 = 37 236 = 81 236 = 81 236 = 37
(o - e) -5 -7 5 7
(o-e )2 25 49 25 49
(O - e)2 0.68 0.60 0.31 1.32
Suma=
2.91
130
Jesús Reynaga Obregón
Lo que el Secretario Académico hizo fu e estimar el valor de Chi cuadrada calculada mediante la fórmula :
2 (o _e)2
X =¿ =2.91
e
En seguida, el funcionario calculó que los grados de libertad que debería considerar para encontrar el
valor critico de Chi cuadrada mediante la fórmula G.L. = k -1 correspondían a la operación 4 - 1 = 3.
A continuación acudió a la tabla de valores críticos de Chi cuadrada
2
Fragmento de la tabla de valores críticos de X
Valores críticos al nivel
Grados de libertad
de significancia de 0.05
1 3.84
2 5.99
3 7.81
4 9.49
5 11.07
100 124.34
Encontró que el valor crítico de 7.81 no era rebasado por el valor calculado ( 2.91 ).
Decidió que no podía rechazar a la hipótesis estadística nula Ho: Fe = Fe .
Por lo ante rior concluyó que la distribución observada de las calificaciones se ajustaba bien a la
distribución esperada de las mismas. En otras palabras las 236 calificaciones parecían distribuirse de
manera semejante a la curva normal y, por el lo, se consideró autorizado a utilizar legítimamente al
promedio ya la desviación está ndar para resumir su serie de datos.
Problemas a resolver
Problema 1
Al estudiar a una aislada población de la costa, un antropólogo descubrió que los rasgos étnicos de los
pobladores eran semejantes a los de los oriundos de otro continente. En una muestra de 174 miembros
de dicho lugar encontró la siguiente distribución de grupos sanguíneos:
Tipo A Tipo B Tipo AB Tipo O
70 personas 22 personas 24 personas 58 personas
131
Jesús Reynaga Obregón
El antropólogo sabía que la población general del país tenía una distribución de grupos sanguíneos de la
siguiente forma:
Tipo A Tipo B Tipo AB Tipo O
15% 7% 8% 70%
El antropólogo se preguntaba sí la población costeña podría tener ancestros en otro continente. Para
resolver la cuestión decidió efectuar una prueba de análisis estadístico denominada Prueba de bondad
de ajuste.
Preguntas:
1.1 ¿Cuál podría ser el propósito de la prueba de análísis estadístico usada por el antropólogo?
1.2 ¿Cómo es la distribución de frecue ncias observada? ; describa cuál era el grupo sanguíneo más
frecuente y cuál el más infrecuente en el grupo de 174 personas observadas.
1.3 ¿Cómo es la distribución de frecuencias del grupo de referencia?; describa cuál era el grupo
sanguíneo más frecuente y cuál el más infrecuente en la población general del país.
1.4 ¿Cómo es la distribución de frecuencias esperada?; efectúe el cálculo de las frecuencias esperadas
(Fe)
1. 5 ¿Cómo es la tabla auxiliar de trabajo?
1.6 El valor de Chi cuadrada calculada ¿rebasa o no al valor crítico de Chi cuadrada?
1.7 ¿Se puede rechazar a la hipótesis estadística Ho?
1.8 ¿Se ajustan bien la Fo y la Fe?; es decir, ¿hay bondad de ajuste entre ambas distribuciones?
1.9 ¿Cuál fue la conclusión a la que llegó el antropólogo?
Problema 2
El administrador de un hospital supon ía que los ingresos al servicio de cirugia provenían
equivalentemente de tres fuentes: a) consulta externa, b) urgencias o c) traslados desde otros
hospital es.
Al estudiar el origen de los internamientos en cirugía en los últimos tres años, encontró lo siguiente:
, Ingresos al servicio de cirugía
.Consulta externa Urgencias Traslados
735 684 795
Pregunta: ¿Qué tan razonable era la suposición del administrador del hospital?
132