0% encontró este documento útil (1 voto)
467 vistas36 páginas

Capítulo 3

Este documento describe el uso de la prueba de Ji cuadrada para probar la independencia y bondad de ajuste. Explica Ji cuadrada como una prueba de independencia para determinar si dos variables están asociadas y como una prueba de bondad de ajuste para comparar las frecuencias observadas con las esperadas. Luego presenta un ejemplo para ilustrar el cálculo de Ji cuadrada y su uso para determinar si la utilización de servicios de una empresa difiere significativamente entre cuatro regiones.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (1 voto)
467 vistas36 páginas

Capítulo 3

Este documento describe el uso de la prueba de Ji cuadrada para probar la independencia y bondad de ajuste. Explica Ji cuadrada como una prueba de independencia para determinar si dos variables están asociadas y como una prueba de bondad de ajuste para comparar las frecuencias observadas con las esperadas. Luego presenta un ejemplo para ilustrar el cálculo de Ji cuadrada y su uso para determinar si la utilización de servicios de una empresa difiere significativamente entre cuatro regiones.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

CAPÍTULO

3
Ji cuadrada Contenido

y análisis
de varianza 3.1 Ji cuadrada como una prueba de
independencia
3.2 Ji cuadrada como una prueba de bondad de
ajuste: prueba de lo apropiado de una
distribución.
3.3 Análisis de varianza
3.4 Inferencia acerca de una varianza de
población
3.5 Inferencias acerca de las varianzas de dos
poblaciones
40 CAPÍTULO 3

En capítulos anteriores se han estudiado pruebas de hipótesis, utilizando medias y proporciones


tanto de muestras como de poblaciones, de igual forma nos hemos apoyado en las tablas “z” de
distribución normal y “t”, de distribución t de Student, para determinar los puntos críticos que li-
mitan las áreas de aceptación y rechazo. La estadística ji-cuadrada (o chi cuadrada), tiene su propia
distribución de probabilidad del mismo nombre, que permite la prueba hipótesis.
Usaremos ji-cuadrada como una prueba de independencia, para probar la asociación entre
dos variables, y como una prueba de bondad de ajuste para determinar cómo se ajusta la distribu-
ción de frecuencias observadas o reales obtenidas mediante una muestra, a una distribución de
frecuencias teóricas o esperadas.
Ji CUADRADA.  Permite probar si más de dos proporciones de población pueden considerarse
iguales; también determinar si dos atributos son independientes entre sí, por ejemplo, si se clasifi-
ca una población en diferentes categorías con respecto a los atributos de una persona como el nivel
académico y el desempeño en el trabajo, o la categoría de un puesto laboral y el sueldo devengado.

3.1  Ji cuadrada como una prueba de independencia


Tratar de probar si hay o no, una diferencia significativa entre más proporciones de población.

Ejemplo:

DACPROH S.DE R.L., es una empresa dedicada a prestar servicios de cualquier índole, a las
empresas que lo solicitan. Desea determinar si los servicios prestados tienen alguna diferencia
significativa en 4 regiones del departamento de Olancho en Honduras. Los datos según su pre-
ferencia, son:

Tabla 3.1

DACPROH S. DE R.L.
Servicios prestados durante los años 2010 a 2015
Cantidad demandada por ciudad
Servicio
Culmí(A) Salamá(B) S.F La Paz (C) S.F. Becerra(D) Total
Entrega avisos de cobro 107 159 137 126 529
Auditorias 121 120 122 150 513
Consultorías 180 130 151 170 631
Total 408 409 410 446 1673
A = Culmí, B = Salamá, C = San Francisco de la Paz, D = San Francisco de Becerra.

Se han ordenado los datos en una tabla de contingencia formada por renglones y columnas;
en este problema se tiene una tabla de contingencia de 3 3 4 (3 renglones y 4 columnas), sin
tomar en cuenta los títulos y totales en renglones y columnas.
Planteamiento del problema de manera simbólica:
H0: PA 5 PB 5 PC 5 PD
H1: PA, PB, PC, PD no son todas iguales
a 5 0.05
Donde: 
PA 5 Proporción de servicios prestados en Culmí
PB 5 Proporción de servicios prestados en Salamá
Ji cuadrada y análisis de varianza 41

PC 5 Proporción de servicios prestados en San Francisco de la Paz


PD 5 Proporción de servicios prestados en San Francisco de Becerra.
Si H0 es verdadera se pueden combinar los datos de las 4 muestras y estimar la proporción
de la población total que prefieren cada uno de los servicios, por ejemplo: 0.3172 (529/1673)
es la proporción que utilizan los servicios de entrega de avisos de cobro, 0.3066 (513/1673) es
la proporción que utilizan los servicios de auditorías y 0.3762 (631/1673) es la proporción que
utilizan los servicios de consultorías.
Seguidamente se puede estimar en cada municipio el número de transacciones muestrea-
das que se espera se realicen por cada uno de los servicios prestados. El cálculo de esta esti-
mación es conocido como frecuencias esperadas o teóricas que deben ser comparadas con las
frecuencias observadas o reales o más bien restar una de la otra. Si las diferencias son casi
iguales se puede aceptar la H0, en caso contrario rechazarla y concluir que existen diferencias
significativas en las proporciones que prefieren uno u otro servicio entre las 4 muestras. Pero
si se quiere profundizar más procedemos a calcular la Ji2 con la fórmula:
 ( f o 2 f e )2 
x2 5 ∑ 
 fe 

Donde:
fo 5 frecuencia observada o real
fe 5 frecuencia esperada o teórica.
TRi * TC j
fe 5
n
TR 5 Total renglón
TC 5 Total columna
n 5 Tamaño total de la muestra
i 5 1, 2, …, n
j 5 1, 2, …, n
por ejemplo: fe del Renglón 1, columna 1  S  fe 5 (529 * 408)/1,673 5 129.009
Tabla 3.2

(fo 2 fe )2
Renglón Columna Fo Fe
fe

1 1 107 129.009 3.75474642


1 2 159 129.325 6.80924512
1 3 137 129.641 0.41772958
1 4 126 141.025 1.60078444
2 1 121 125.107 0.13482418
2 2 120 125.414 0.2337171
2 3 122 125.72 0.11007318
2 4 150 136.759 1.281993
3 1 180 153.884 4.43220514
3 2 130 154.261 3.81558606
3 3 151 154.638 0.08558727
3 4 170 168.216 0.01892006
2
      X = 22.6954115
42 CAPÍTULO 3

Este resultado, quizá para algunos estadísticos, es muy elevado porque existe una diferencia signifi-
cativa entre las frecuencias observadas y esperadas que los obliga a rechazar la hipótesis nula, en
cambio para otros no representa una diferencia significativa, que los lleva a aceptar la hipótesis nula
y concluyendo que la utilización de los servicios prestados es independiente de la zona geográfica.
En cualquier caso y si echamos un vistazo a la fórmula se puede deducir que X2 siempre será
$ 0, puesto que la diferencia entre las frecuencias observadas y esperadas está elevada al cuadrado.
La distribución Ji cuadrada.  Se debe resolver una hipótesis planteada, si H0 es verdadera, la
distribución de muestreo de la estadística Ji cuadrada puede aproximarse mediante una curva
continua llamada distribución Ji cuadrada que está sesgada a la derecha cuando el número de gra-
dos de libertad es pequeño y conforme aumenta, la curva se vuelve más simétrica pudiéndose
aproximar a una distribución normal. Ji cuadrada es una distribución de probabilidad y su área
total bajo la curva es siempre 5 1.0.
La tabla presenta una distribución Ji2 para cada número distinto de grados de libertad, calcu-
lada de la siguiente forma:
Grados de libertad (g.1.) 5 (# de renglones -1)*(# de columnas 21)
En el ejercicio anterior se busca a g.1. 5 (3 2 1)*(4 2 1) 5 6 y un a 5 0.05 S 12.592

X 2 5 22.695 s/cálculo


Área de aceptación

Área de rechazo

X 2 5 12.592 s/tabla

Interpretación: con 6 grados de libertad, la región que se halla a la derecha de X2 5 12.592 es el área
de rechazo de la H0 y contiene 0.05 del área bajo la curva; la región de aceptación de la H0 va desde
el extremo izquierdo al valor de X2 5 12.592. En la gráfica el valor de X2 5 22.695 se ubica en el
área de rechazo, por lo tanto, se rechaza la hipótesis nula y se concluye que la utilización de los
servicios prestados es independiente de la región geográfica.
La dependencia existe cuando la ocurrencia de uno o más eventos depende de la ocurrencia
de otros eventos. En el ejercicio que a continuación se presenta se asume que el turista depende de
la región de su residencia.
La Cámara Nacional de Turismo, brinda la información referente a la cantidad de turistas que
visitaron Honduras, durante los años 2010, 2011 y 2012; desde los países de Centro América, Nor-
te América, Europa y otros. A un a 5 0.10 se desea conocer si la cantidad de turistas que visitaron
Honduras depende de la región de residencia del turista.

Tabla 3.3

Región de residencia *2010 *2011 *2012 Total


Centro América 36,233 34,137 32,464 102,834
Norte América 23,799 26,385 24,335 74,520
Europa 7,772 7,842 10,532 26,146
Resto del mundo 4,074 4,259 7,226 15,558
Total 71,879 72,622 74,556 219,058
*Promedio mensual
Ji cuadrada y análisis de varianza 43

Para facilitar el manejo de la información, se calculó el promedio mensual de los datos anuales.

Tabla 3.4

(fo 2 fe )2
Renglón Columna Fo Fe
fe

1 1 36,233 33,743 183.82

1 2 34,137 34,092 0.06

1 3 32,464 35,000 183.688

2 1 23,799 24,452 17.415

2 2 26,385 24,705 114.267

2 3 24,335 25,363 41.635

3 1 7,772 8,579 75.862

3 2 7,842 8,668 78.754

3 3 10,532 8,899 299.655

4 1 4,074 5,105 208.299

4 2 4,259 5,158 156.693

4 3 7,226 5,295 703.592


2
      X  = 2063.74

1. Planteamiento de las hipótesis.


H0: El turista y la región de su residencia son independientes
H1: El turista y la región de su residencia son dependientes.
a 5 0.10 Nivel de significancia para probar estas hipótesis.

2. Grados de libertad (g.l.) 5 (# de renglones 21) *(# de columnas 21)


Para determinar el límite o frontera entre el área de aceptación y de rechazo, se busca en la
tabla, a g.l. 5 (4 2 1)*(3 2 1) 5 6 y un a 5 0.10 S X2 5 10.645

X 2 = 2063.74 s/cálculo


Área de aceptación

0.10 Rechazo
X 2 = 10.645
a 5 0.10 S X 2 5 10.645

Interpretación: con 6 grados de libertad, se puede observar en la gráfica que el valor de X2 5


2063.74 está en el área de rechazo, por lo tanto, se rechaza la hipótesis nula (H0) y se concluye
que el turista y la región de su residencia son dependientes entre sí.
44 CAPÍTULO 3

EJERCICIOS PROPUESTOS

1. Para ver si las ventas de pasteles que se generan en el día del padre son independientes de las ventas que se generan
en el día de la madre, se han recopilado algunos datos de las ventas generadas en estos dos días festivos; de la re-
postería La Exquisita. También se recopilaron los datos de los tipos de pasteles que la repostería ofrece para estos
días en especial. El tipo A es pastel de pan, el tipo B es pastel helado y el tipo C es pastel de tres leches.
Los resultados son los siguientes:

Tabla 3.5

Ventas de: Pasteles


Día festivo Tipo A Tipo B Tipo C
Del padre 218 146 136
De la madre 420 215 165

Con un nivel de significancia de 0.05, pruebe si las ventas de pasteles del día del padre y del día de la madre son
independientes o dependientes.
Ji cuadrada y análisis de varianza 45

2. Muchos de los problemas del aprendizaje se reflejan en la falta de hábitos de lectura y en no saber leer correcta-
mente. La mala ortograf ía, la falta de cultura, el déficit en la capacidad de crear argumentos para defender posi-
ciones y la evidente pérdida de habilidades comunicativas, son las principales consecuencias de no leer
regularmente.
La empresa Claro, realiza un estudio sobre la lectura; y afirma que quien la practica tiene un crecimiento
personal como ninguna otra actividad. Ha recopilado los siguientes datos sobre la profesión y el hábito de la
lectura:
Tabla 3.6

Profesión Hombres Mujeres


Bachiller 13 20
Magisterio 1 14
Perito mercantil 21 24
Técnico 1 0
Otros 7 5

Usando un nivel de significancia de 10%, se puede concluir según estos datos de la empresa Claro que la profesión
y el hábito de lectura son independientes.
46 CAPÍTULO 3

3. Los partidos políticos son representativos de los intereses de las clases o grupos sociales de un país, es por ello
que las luchas de clases de la sociedad, se materializan frecuentemente en los enfrentamientos entre partidos
políticos, incluso en las mismas estructuras internas de éstos.

Tabla 3.7

Actitud hacia la política según ocupación de las personas


Ocupación A favor Neutral Opuesto Total
Albañil 19 16 37 72
Oficinista 15 22 46 83
Profesional 24 11 32 67
Total 58 49 115 222

Use un nivel de significancia del 0.05, y pruebe que la ocupación y la actitud hacia los partidos políticos es inde-
pendiente.
Ji cuadrada y análisis de varianza 47

4. La gerente del Departamento de micro finanzas del Banco del País, la Lic. Betty Irías desea hacer un estudio sobre
los préstamos que el banco concede a sus clientes en los meses de: diciembre, julio y enero. ¿Existe una diferencia
significativa con los préstamos que el banco concede a sus clientes?
La siguiente tabla contiene la información:

Tabla 3.8

Diciembre Julio Enero


Préstamos Alta Media Baja
Negocios micros 470 MM 301 MM 100 MM
Préstamos personales 970 MM 521 MM 327 MM
Préstamos hipotecarios 3000 MM 910 MM 415 MM

La gerente quiere probar con un a 5 0.10, si los préstamos son independientes de las temporadas que hay en el año.
Observación: MM quiere decir en millones de Lempiras.
48 CAPÍTULO 3

5. La corporación de Ingeniería y maquinaria Sociedad Anónima, CORIMSA; está interesada en saber si las ventas
de cuatro tipos de materiales se venden por igual diariamente. Se tomó una muestra de cuatro días de una sema-
na aleatoria. Compruebe la suposición de que no hay una diferencia significativa en las ventas en metros cúbicos;
de estos materiales de construcción, usando un a 5 0.01.

Tabla 3.9

Producto Arena Grava 1 Grava 3/4 Grava 3/8


Lunes 30 50 60 30
Martes 35 40 68 18
Miércoles 25 45 80 25
Jueves 27 35 110 20
Ji cuadrada y análisis de varianza 49

6. El negocio variedades La Rosa, está ubicado en el mercado Zonal Belén, dos cuadras debajo de la posta policial,
calle principal. Están interesados en saber si sus jabones de diferentes marcas: Max, Sixx y Xtra; se venden de
igual manera en cualquier momento. Para llevar a cabo dicha investigación se tomaron los siguientes datos:

Tabla 3.10

Hora Max Sixx Xtra


7 am a 9 am 7 6 4
10 am a 12 pm 5 7 6
1 pm a 3 pm 4 5 6
4 pm a 6 pm 6 2 3

Probar la hipótesis de si las ventas de jabones son independientes de las horas. Tome un a 5 0.05. Haga sus
conclusiones.
50 CAPÍTULO 3

3.3 Ji cuadrada como prueba de bondad de ajuste:


prueba de lo apropiado de una distribución
También se puede usar el estadístico ji cuadrado para evaluar cuán buena puede resultar una dis-
tribución teórica, cuando pretende representar la distribución real de los datos de una muestra
determinada. A esto se le llama evaluar la bondad de un ajuste, es ver en qué medida se ajustan
los datos observados a una distribución teórica o esperada. En este sentido se deberá decidir si una
distribución de probabilidad en particular, como la binomial, la de Poisson o la normal, es la apro-
piada.
Cálculo de las frecuencias observadas y esperadas
El estadístico de prueba es Ji cuadrado que compara las frecuencias que contienen los datos de la
muestra (frecuencias observadas o reales) con las frecuencias teóricas o esperadas que son las
frecuencias que esperaríamos si la hipótesis nula fuera correcta. La frecuencia esperada (si los
hechos son independientes) se obtiene multiplicando los totales marginales y dividiendo por el
total general. Su fórmula es la siguiente:
TR * TC j
fe 5
n
Si ya se tienen las frecuencias observadas y esperadas, se procederá a evaluar la diferencia entre
ellas utilizando el estadístico ji cuadrado. Si la diferencia entre frecuencias observadas y esperadas
es grande, significará que la hipótesis nula es falsa, o sea, esta distribución no se ajusta a la distri-
bución teórica y si, por el contrario, resulta que esa diferencia no es muy grande, significará que la
hipótesis nula es verdadera; por lo tanto, la distribución en la muestra se ajusta a la distribución
teórica y diremos que no hay diferencia significativa.

Ejemplo 1:

Se analizaron las calificaciones finales de los alumnos de la clase de Análisis Cuantitativo II,
sección 1100, impartida por el Departamento de Administración de Empresas de la UNAH,
durante el tercer periodo del año 2015, que hacen un total de 7 grupos analizados. El catedrá-
tico asignado a esa sección cree que el proceso de calificaciones puede ser aproximado por una
distribución de Poison con l 5 2.8 de que cualquier estudiante pueda obtener un nivel de 0 a
6 o 1, donde 0 son calificaciones menores a 19% y 6 o 1 son calificaciones mayores o iguales
a 91%. A un a 5 0.01 probar la hipótesis desde el punto de vista del catedrático. Los datos son
los siguientes:
Tabla 3.11

(fo 2 fe )2
Clases Nivel X Fo Probabilidad Fe*  
fe

< 19 0 3 0.0608 1.34 2.056


1 a 19 1 5 0.1703 3.75 0.417
20 a 39 2 1 0.2384 5.24 3.431
40 a 59 3 1 0.2225 4.9 3.104
60 a 80 4 9 0.1557 3.43 9.045
81 a 90 5 3 0.0872 1.92 0.608
> 90 6+ 0 0.0651 1.43 1.430
Total   22 1.0000 22.01 20.091
*Fe (frecuencia esperada) = Total de Fo (frecuencia observada) * cada probabilidad.
Ji cuadrada y análisis de varianza 51

 ( f o 2 f e )2 
X2 5 ∑ 
 fe
 5 20.091 calculada

1. Planteamiento de las hipótesis:
H0: una distribución de Poisson con l 5 2.8 es buena para describir este proceso.
H1: una distribución de Poisson con l 5 2.8 no es buena para describir este proceso.
a 5 0.10 Nivel de significancia para probar estas hipótesis.
2. Para establecer el punto crítico que divide el área de aceptación de la de rechazo, se busca
en la tabla a k 2 1 grados de libertad (k es el número de clases de la distribución de fre-
cuencias), al nivel de significancia fijado. K 5 7, g.l. 5 7 2 1 5 6, a 5 0.01 X2 516.812
según la tabla.
3. Interpretación. Se observa en la gráfica a continuación, que el valor de X2 5 20.091 se
ubica en el área de rechazo, por lo tanto, se rechaza la hipótesis nula (H0) y se concluye
que una distribución de Poisson con l 5 2.8 no es buena para describir este proceso.

X 2 5 16.812 s/tabla

Área de aceptación
Área de rechazo

0.01

X 2 5 20.091 s/cálculo

Ejemplo 2:

Una compañía requiere que los estudiantes del último año de la universidad que buscan tra-
bajo sean entrevistados por 3 ejecutivos diferentes, quienes califican al candidato como posi-
tivo o negativo. Con el propósito de planear la contratación, el director de selección de perso-
nal de la compañía piensa que el proceso de entrevistas puede ser aproximado por una
distribución binomial con p 5 0.40, de que cualquier candidato obtenga una calificación po-
sitiva en cualquiera de las entrevistas. La tabla siguiente contiene los resultados de las entre-
vistas de 100 candidatos y el director desea probar esta hipótesis a un a 5 0.20.
Tabla 3.12

Calificaciones # de candidatos con esta


+ posibles calificación (Fo) Probabilidad Fe
00 18 0.2160 3 100 = 21.6
10 47 0.4320 3 100 = 43.2
20 24 0.2880 3 100 = 28.8
30 11 0.0640 3 100 = 16.4
n= Total 100 1.0 100.0

Para encontrar la probabilidad, se busca en la tabla de la distribución binomial, reconociendo


en la parte superior de la tabla, P 5 0.40. en la primer columna n 5 3 y en esa misma columna
los valores de r 5 0, 1, 2 y 3.
H0: una distribución binomial con p 5 0.40 es una buena descripción del proceso de en-
trevistas
52 CAPÍTULO 3

H1: una distribución binomial con p 5 0.40 no es una buena descripción del proceso de
entrevistas
a 5 0.20 Nivel de significancia para la prueba de estas hipótesis

Resolviendo:

Tabla 3.13

# candidatos P = 0.40 (fo 2 fe )2


Calificaciones Fo Probabilidad Fe fe

0 18 0.216 21.60 0.60


1 47 0.432 43.20 0.33
2 24 0.288 28.80 0.80
3 11 0.064 6.40 3.31
Total 100   100.00 5.04

A.A A.R

Xc2 = 4.642
a = 0.20 X 2 = 5.04
k=4
g.1 = k 2 1
g.1 = 3

Conclusión: se rechaza la hipótesis nula, o sea que la distribución binomial con P 5 0.40, no
describe el proceso de entrevistas de selección de personal en esta empresa.
Ji cuadrada y análisis de varianza 53

EJERCICIOS PROPUESTOS

1. El jefe de departamento del área de call center de Banpaís lleva un registro del número de clientes para poder
determinar el número de llamadas que se hacen y así lograr ser más eficientes. Se toma una muestra de 200 clien-
tes en 3 días; en el que: 0, o más clientes fueron atendidos, con las siguientes frecuencias: 5, 20, 80 y 95 respecti-
vamente. Con un nivel de significancia de 1%, ¿Podemos decir que la cantidad de clientes atendidos sigue una
distribución de Poisson con l 5 4?

2. Banco Davivienda quiere conocer la situación actual de atención a los clientes, específicamente en el área de re-
clamos. Como primera etapa del proceso de análisis y reformas de la institución financiera, se identifica el mon-
to que reclaman los clientes que no recibieron de retiros en efectivo de los BANET. Para esto el gerente toma una
muestra de 328 clientes, de los cuales 9, 114, 85, 86, 9, 8, 10 y 7 no recibieron el monto de: L100 (1), L.200 (2),
L.300 (3), L400 (4), L.1,000 (5), L.2,000 (6), L.5,000 (7) y más de L5,000 (8) respectivamente. Con un nivel de
significancia de 5% y una media de 2. ¿Puede el gerente del banco Davivienda suponer razonablemente que los
reclamos de los clientes siguen una distribución de Piosson?
54 CAPÍTULO 3

3. Kevin Amador es el administrador de la agencia de Banpaís de la zona Noroccidental; y sus vendedores de tarje-
ta de crédito tienen que alcanzar un máximo de 121 clientes en las visitas que éstos realizan por día. Podemos
afirmar con un a 5 0.05; que los datos siguientes son descritos correctamente siguiendo una distribución de
Poisson con una media de 2.
Tabla 3.14

No. de visitas 0 1 2 3 4 o más


Frecuencia de ventas 20 30 20 25 26

3.4  Análisis de Varianza


Permite probar la significancia de las diferencias entre más de 2 medias muestrales y hacer inferen-
cias acerca de si las muestras se tomaron de poblaciones que tienen la misma media.
Con el fin de utilizar el análisis de varianza, debemos suponer que cada una de las muestras se
toma de una población normal y que cada una de estas poblaciones tiene la misma varianza, s².
Sin embargo, si los tamaños de muestra son lo suficientemente grandes, no necesitamos la supo-
sición de normalidad.
Ji cuadrada y análisis de varianza 55

Ejemplo 1:

El director de capacitación de una compañía está evaluando tres métodos de capacitación


para empleados nuevos. El primero consiste en asignar un empleado nuevo a un experimen-
tado; el segundo, en ubicar a todos los empleados nuevos en un salón de capacitación; el ter-
cero, en utilizar películas y materiales de aprendizaje programados. El director selecciona al
azar 16 empleados nuevos asignados al azar a los tres métodos, posteriormente el personal de
estadística resumió los datos y registró su producción diaria después de terminar los progra-
mas de capacitación, así:

Tabla 3.15

Método 1 15 18 19 22 11
Método 2 22 27 18 21 17
Método 3 18 24 19 16 22 15

El director quiere saber si existen diferencias en la efectividad de los tres métodos.


Para resolver el problema veamos algunos conceptos básicos:
El análisis de varianza está basado en la comparación de dos estimaciones diferentes de
la varianza (s²) de la población. Como ambas son estimaciones de s², deben tener un valor
aproximadamente igual cuando la hipótesis nula sea verdadera; si la hipótesis nula no es ver-
dadera, estas dos estimaciones diferirán de manera considerable. Entonces, los tres pasos del
análisis de varianza son:
1. Determinar una estimación de la varianza de la población a partir de la varianza entre las
medias de las muestras, conocida como varianza entre columnas.

 2 x )2
Snj( xj
s12 5
k 21
donde:
s1² 5 nuestra primera estimación de la varianza de la población
nj 5 tamaño de la j-ésima muestra
xj 5 media muestral de la j-ésima muestra
x 5 gran media
k 5 número de muestras
2. Determinar una segunda estimación de la varianza de la población a partir de la varianza
dentro de las muestras, conocida como varianza dentro de columnas.

 nj 2 1 
s 22 5 ∑  nT 2 k  S 2
1

donde:
s22 5 nuestra segunda estimación de la varianza de la población
nj 5 tamaño de la j-ésima muestra
s2j 5 varianza muestral de la j-ésima muestra
k 5 número de muestras
nT 5 tamaño de la muestra total
3. Comparar estas dos estimaciones. Si su valor es aproximadamente igual, se acepta la hi-
pótesis nula.
56 CAPÍTULO 3

Prueba de hipótesis F: cálculo e interpretación del cociente del estadístico F


Primera estimación de la varianza entre columnas s1²
F5
Segunda estimación de la varianza dentro de columnas s2²
Procedimiento:

Tabla 3.16

Método 1 Método 2 Método 3


18
15 0 22 0 24
18 0 27 0 19
19 0 18 0 16
22 0 21 0 22
11 0 17 0 15
85 105 114
45 = 17 45 = 21 46 = 19 Medias muestrales(x)
n1 = 5 n2 = 5 n3 = 6 Tamaños de muestra

Para determinar la gran media o x (la media del grupo completo de 16 empleados nuevos),
podemos utilizar uno de dos métodos:
1. Gran media utilizando todos los datos S 304/16 = 19
2. Gran media como promedio ponderado de las medias muestrales, utilizando los tamaños
relativos de las muestras como pesos.
S  x1 5 17  x2 5 21  x3 5 19  x 5 5/16)(17) 1 (5/16)(21) 1 (6/16)(19) 5 19

Planteamiento de las hipótesis


La razón para utilizar análisis de varianza es decidir si estas tres muestras (una muestra es el grupo
de empleados capacitados por cualquier método), se tomaron de poblaciones (una población es el
número total de empleados que pudieron ser capacitados por ese método) que tienen las mismas
medias. Debido a que se está probando la efectividad de los tres métodos, se debe determinar si las
tres muestras, representadas por sus medias, x1 5 17, x2 5 21 y x3 5 19, pudieron haberse tomado
de poblaciones con la misma media, m. Un planteamiento formal de las hipótesis nula y alternativa
que deseamos probar sería:
H0: m1 5 m2 5 m3 Hipótesis nula  H1: m1, m2 y m3 no son todas iguales Hipótesis alternativa
La hipótesis nula establece que las tres poblaciones tienen la misma media, si ésta es verdade-
ra, no es necesario clasificar los datos en tres columnas, el conjunto entero de 16 mediciones de
productividad puede considerarse como una muestra de una sola población y esta población tiene
también una varianza s².
Si se concluye, a partir de la prueba, que las medias de las muestras no difieren significativa-
mente, se puede inferir que la selección del método de capacitación no influye en la productividad
del empleado. Por otro lado, si hay entre las medias muestrales, diferencias demasiado grandes
para atribuirlas al error aleatorio de muestreo, se puede inferir que el método utilizado para capa-
citar a los trabajadores sí influye en su productividad. En ese caso, se debe ajustar el programa de
capacitación de acuerdo con los resultados.
Siguiendo el procedimiento, ahora se puede calcular la primera estimación de la varianza en-
tre las medias muestrales o varianza entre columnas:
Ji cuadrada y análisis de varianza 57

Tabla 3.17

n x x (x 2 x)2 n(x 2 x)2


5 17 19 17 2 19 = 4 5 3 4 = 20
5 21 19 21 2 19 = 4 5 3 4 = 20
6 19 19 19 2 19 = 0 6 3 0 = 00
40
Total = 40 s1² = = 20
 3 2 1 

Cálculo de la segunda estimación de la varianza dentro de las muestras o varianza dentro de co-
lumnas:
 S 21   4  5
s21 5 17.5  s22 5 15.5  s23 5 12  s22 5  (17.5) 1   (15.5) 1   (12) 5 14.769
 16 2 3   13   16 

Ahora encontrar el cociente F 5 s21/s22


F 5 20/14.769 5 1.354
Interpretación del cociente F 5 1.354, primero examinamos el denominador, que está basado en
la varianza dentro de las muestras, es un buen estimador de s2 (la varianza de la población) ya sea
que la hipótesis nula sea verdadera o no. Segundo examinamos el numerador, si la hipótesis nula
de que los métodos de capacitación tienen el mismo efecto en la producción es verdadera, enton-
ces el numerador, o la variación entre las medias de la muestras de los tres métodos, es también
una buena estimación de s2. Como resultado, el denominador y el numerador deben ser aproxi-
madamente iguales si la hipótesis nula es verdadera. Cuanto más cercano a 1 esté el cociente F, hay
razón suficiente para aceptar la hipótesis nula. Al contrario, y conforme el cociente F crece, nos
inclinaremos más a rechazar la hipótesis nula y a aceptar la alternativa (de que existe una diferen-
cia en los efectos sobre la productividad de los tres métodos de capacitación). Cuando las pobla-
ciones no son las mismas, la varianza entre columnas (derivada a partir de la varianza entre las
medias muestrales) tenderá a ser mayor que la varianza dentro de columnas (derivada a partir de
la varianza dentro de las muestras), y el valor de F tenderá a ser grande. Esto nos conducirá a re-
chazar la hipótesis nula.

La distribución F
La distribución F es una familia completa de distribuciones, cada una está identificada por un par
de grados de libertad, la primera cantidad se refiere a los grados de libertad del numerador del
cociente F; la segunda, a los grados de libertad del denominador. La distribución F tiene una sola
moda y la forma específica de una distribución F depende del número de grados de libertad tanto
del numerador como del denominador del cociente F. Pero, en general, la distribución está sesgada
a la derecha y tiende a hacerse más simétrica conforme aumenta el número de grados de libertad
en el numerador y el denominador.

Uso de la distribución F: grados de libertad


Grados de libertad en el numerador del cociente F = (número de muestras 21)
Grados de libertad en el denominador del cociente F = S(nj 2 1) o nT 2 k
Donde:
nj = tamaño de la j-ésima muestra
k = número de muestras
nT = Snj = tamaño de la muestra total o sea la cantidad total de elementos de todas las mues-
tras
58 CAPÍTULO 3

Número de muestras – 1
F5
Tamaño de la muestra total 2 número de muestras
F 5 (3-1) / (16-3) 5 2/13

Uso de la tabla F
Para llevar a cabo pruebas de hipótesis F debemos utilizar una tabla F, en la cual las columnas
representan el número de grados de libertad del numerador y los renglones el número de grados
de libertad del denominador. Existen tablas separadas para cada nivel de significancia (a 5 0.01 y
a 5 0.05).
Si se desea probar una hipótesis al a 5 0.01, usando la distribución F, los grados de libertad son
8 para el numerador y 11 para el denominador. En este caso, vamos a la tabla 6(b) del apéndice. En
el cuerpo de dicha tabla, el valor apropiado para 8 y 11 grados de libertad es 4.74. Si el valor calcu-
lado de F excede este valor de la tabla, rechazamos la hipótesis nula. Si no es mayor, la aceptamos.

Prueba de hipótesis
El director de capacitación desea probar a un a 5 0.05 la hipótesis de que no existen diferencias
entre los tres métodos de capacitación. Se busca en la tabla 6(a) del apéndice, para 2 grados de li-
bertad en el numerador y 13 en el denominador. El valor que encontramos es 3.81.

F 5 3.81 s/tabla

F 5 1.354 s/calc.

La figura ilustra esta prueba de hipótesis con una gráfica, la región sombreada es el nivel de signi-
ficancia. El valor encontrado en la tabla, 3.81, establece el límite superior de la región de acepta-
ción. Como el valor de la muestra calculado para F, 1.354, se encuentra dentro de la región de
aceptación, se acepta la hipótesis nula y concluimos que, según la información de las muestras, no
existen diferencias significativas en los efectos de los tres métodos de capacitación sobre la pro-
ductividad de un empleado.

Ejemplo 2:

Una empresa que se dedica al financiamiento de la micro, pequeña y mediana empresa a em-
prendedores de las zonas marginales de Tegucigalpa, San Pedro Sula y la Ceiba están analizan-
do la productividad de los oficiales de crédito, la cual es medida por el monto promedio de
créditos otorgado por promotor, si la diferencia no es significativa el gerente de negocios de la
empresa estaría proponiendo la implementación de un plan de incentivos para estimular la
competencia entre los promotores
Se tomó una muestra de los créditos otorgados por un promotor seleccionado al azar de
una agencia en cada ciudad para determinar, con un nivel de significancia de 0.05, si hay algu-
na diferencia significativa en el promedio de créditos otorgados en las agencias en estas tres
ciudades.
Los datos que se presentan a continuación detallan el número de créditos otorgados por
promotor.
Ji cuadrada y análisis de varianza 59

Tabla 3.17

Promotor 1 Promotor 2 Promotor 3


5000 3900 6700
6300 8100 3500
4900 7600 4500
7100 5200 6000
6200 2300 8000
4800 6800 7000

El primer paso es formular las hipótesis:


H0: m15 m25 m3 el promedio de créditos otorgados por los promotores en las tres ciuda-
des es igual.
H1: m1, m2, m3 el promedio de créditos otorgados por los promotores en las tres ciudades
no es igual.
Usando un nivel de significancia de 0.05 tenemos:
Estadístico de prueba:
El estadístico para una prueba de más de dos medias es F, que es el cociente de dos varianzas,
la primera es la varianza entre las columnas y la segunda es la varianza dentro de las columnas,
su fórmula es la siguiente:
F 5 varianza entre columnas/varianza dentro de columnas
Debemos calcular cada una de estas varianzas para poder determinar el estadístico de prueba F.
Segundo paso, varianza entre columnas o entre medias:

Tabla 3.18

Montos de créditos otorgados


(en Lempiras)
Promotor 1 Promotor 2 Promotor 3
9 000 3 900 6 700
6 300 8 100 3 500
4 900 7 600 4 500
7 100 5 200 6 000
6 200 2 000 8 000
8 100 6 800 7 000
Promedio 6 933.33 5 600.00 5 950.00
Media de medias 6 161.11
media de (media-media diferencia al
Promotor n media medias de medias) cuadrado n(dif al cuadrado)
1 6 6 933.33 6 161.11 772.22 596 327.1605 3 577 962.96
2 6 5 600.00 6 161.11 2561.11 314 845.679 1 889 074.07
3 6 5 950.00 6 161.11 2211.11 44 567.90123 267 407.407
5 734 444.44
k= 3
Varianza entre columnas = Σn(diferencia al cuadrado)/k 2 1 2 867.222
60 CAPÍTULO 3

Tercer paso, varianza dentro de las columnas o dentro de las medias:


Tabla 3.19

Promotor 1 Media (obsv.-media) (obsv.-media)^2


5000 6 933.33 21 933.33 3 737 777.778
6300 6 933.33 2633.33 401 111.1111
4900 6 933.33 22 033.33 4 134 444.444
7100 6 933.33 166.67 27 777.77778
6200 6 933.33 2733.33 537 777.7778
4800 6 933.33 22 133.33 4 551 111.111
      13390000
Varianza (obsv.-media)^2/n-1   2678000

Tabla 3.20

Promotor 1 media (obsv.-media) (obsv.-media)^2


5000 6,933.33 21,933.33 3737777.778
6300 6,933.33 2633.33 401111.1111
4900 6,933.33 22,033.33 4134444.444
7100 6,933.33 166.67 27777.77778
6200 6,933.33 2733.33 537777.7778
4800 6,933.33 22,133.33 4551111.111
      13390000
Varianza (obsv.-media)^2/n-1   2678000
Promotor 2 media (obsv.-media) (obsv.-media)^2
3900 5,600.00 21,700.00 2890000
8100 5,600.00 2,500.00 6250000
7600 5,600.00 2,000.00 4000000
5200 5,600.00 2400.00 160000
2300 5,600.00 23,300.00 10890000
6800 5,600.00 1,200.00 1440000
      25630000
Varianza (obsv.-media)^2/n-1   5126000

Tabla 3.21

Promotor 2 Media (obsv.-media) (obsv.-media)^2


3900 5,600.00 21,700.00 2890000
8100 5,600.00 2,500.00 6250000
7600 5,600.00 2,000.00 4000000
5200 5,600.00 2400.00 160000
2300 5,600.00 23,300.00 10890000
6800 5,600.00 1,200.00 1440000
      25630000
Varianza (obsv.-media)^2/n-1   5126000
Ji cuadrada y análisis de varianza 61

Tabla 3.22

Promotor 3 media (obsv.-media) (obsv.-media)^2


6700 5,950.00 750.00 562500
3500 5,950.00 22,450.00 6002500
4500 5,950.00 21,450.00 2102500
6000 5,950.00 50.00 2500
8000 5,950.00 2,050.00 4202500
7000 5,950.00 1,050.00 1102500
13975000
Varianza (obsv.-media)^2/n 2 1 2795000
Varianza dentro de columnas = Σ((n 2 1)/(nt 2 k)*varianza)
promotor 1 892666.6667
promotor 2 1708666.6667
promotor 3 931666.6667
3533000.0000
Estadistico F = Varianza entre medias/varianza dentro de medias
F= 286222/3533000 0.81
Grados de libertad numerados K21
deniminador nt 2 K
nivel de significancia 0.05
valor critico 3.68

Respuesta: Se acepta la hipótesis nula, el monto promedio otorgado por promotor en las tres
ciudades es igual, la diferencia en los promedios no es significativa, el gerente de negocios
debería implementar el plan de incentivos.

F = 0.81 3.68 0.05 Área de rechazo

EJERCICIOS PROPUESTOS

1. Una empresa ubicada en San Pedro Sula, vende equipo de reproducción para oficinas, ofrece a sus clientes cor-
porativos tres nuevos sistemas de impresión digital, antes de su lanzamiento al mercado la empresa quiere deter-
minar si hay alguna diferencia significativa en su rendimiento, el cual se medirá por el número de copias por
minuto, con esta finalidad se realizó un muestreo de la impresión de los tres modelos, dando el siguiente resul-
tado:
62 CAPÍTULO 3

Impresora A 50 67 62 52 52 58
Impresora B 53 51 60 41 61
Impresora C 63 56 69 59
Con un nivel de significancia de 0.05, ¿existe una diferencia significativa en el promedio de copias de estos tres
modelos de impresoras?

2. Un Centro de Educación Superior de Tegucigalpa está evaluando la efectividad de su personal docente en cuan-
to a la transmisión de conocimientos, el director de carrera docente elabora un instrumento de evaluación y se
lo aplica a un grupo de estudiantes de tres maestros seleccionados al azar de la planta docente, los resultados
obtenidos (puntuación máxima 60 puntos) por los estudiantes se presentan a continuación.
Maestro 1 46 41 51 40 54 45
Maestro 2 60 44 48 52 40 50
Maestro 3 42 38 44 41 53 38
Al nivel de significancia de 0.05, ¿los maestros de la planta docente tienen diferentes niveles promedio de desem-
peño?
Ji cuadrada y análisis de varianza 63

3. Amway usa el multinivel (venta directa por redes interactivas) es una modalidad que permite organizar un ne-
gocio en el cual los productos y servicios son ofrecidos para consumo final mediante una red de empresarios
independientes. Dados los siguientes valores de ventas en diferentes momentos:
Tabla 3.23

Periodo/Mes Septiembre Octubre Noviembre


Inicio 120 000 105 000 100 000
Pre cierre 250 000 265 000 200 000
Cierre 300 000 350 000 265 000

Aplique el ANOVA para analizar si son iguales los promedios de venta de esta compañía. Use un nivel de signi-
ficancia de 2 y de 5%. Haga sus conclusiones.

4. Los datos siguientes indican la cantidad de efectivo en miles de Lempiras obtenido diariamente por las ventas realiza-
das en la pulpería “San Benito” de la Colonia Monseñor Fiallos de Comayagüela, observadas durante 4 semanas. Prue-
be la hipótesis de que la venta promedio diaria es igual. Utilice un nivel de significancia de 0.05.
Tabla 3.24

Semana Lunes Martes Miércoles Jueves Viernes Sábado


1 6.42 5.35 3.81 7.60 7.45 3.92
2 3.56 3.58 6.80 4.77 3.61 5.34
3 4.70 6.31 5.37 7.04 8.05 9.16
4 6.35 9.50 7.03 8.47 9.60 8.95
64 CAPÍTULO 3

5. La Panetteria tiene tres especialidades en pan que la gente prefiere. Teniendo registro del número de ventas por
cada tipo de pan. La siguiente es la muestra de esos datos. Utilizando, un nivel de significancia de 0.05, ¿se puede
decir si los diferentes tipos de pan tienen la misma cantidad de ventas diarias?
Tabla 3.25

Pan Lunes Martes Miércoles Jueves Viernes Sábado Domingo


Francés 105 82 91 75 105 96 61
Panettero 98 80 74 75 60 91 75
Mantequilla 110 82 74 73 96 120 68

6. La gerente del Departamento de Micro finanzas del Banco del País, la Lic. Betty Irías desea hacer un estudio
sobre los préstamos que el banco concede a sus clientes en los meses de: diciembre, julio y enero. ¿Existe una
diferencia significativa con los préstamos que el banco concede a sus clientes? Use un a 5 0.10.
Tabla 3.26

Préstamos en millones de L. Diciembre Julio Enero


Negocios micros 470 301 100
Personales 970 521 327
Hipotecarios 3000 910 415
Ji cuadrada y análisis de varianza 65

3.5  Inferencia acerca de una varianza de población


Muchas veces, los tomadores de decisiones tienen que hacer inferencias sobre la variabilidad de
una población, para ello es necesario crear un intervalo de confianza, dentro del cual se espera
tener esa variabilidad.

Ejemplo 1:

El director de correos ha recibido muchas quejas respecto a la tardanza del correo que va
desde Tegucigalpa a San Salvador; por lo cual se inicia una investigación dando seguimiento a
9 cartas, para estimar la variabilidad en el tiempo de entrega. La tabla siguiente muestra los
datos y cálculo x, s2 y s, según cálculos la desviación estándar de la población, estimada a partir
de la desviación estándar de la muestra es, aproximadamente 23 horas. Pero también desea
saber qué tan precisa es esa estimación y la incertidumbre que se le asocia; es decir, que quie-
re un intervalo de confianza, dentro del cual encontrar la variabilidad.
Tabla 3.27

X (tiempo) (x 2 x)2 X (tiempo) (x 2 x)2


50 81 96 1,369
45 196 45 196
27 1,024 90 961
66 49 69 100
43 256 531 4,232
2
S(x 2 x)
x = 59 S2 = = 529 hrs. al cuadrado S = 23 hrs.
n21

Estadístico ji cuadrada para inferencias sobre una varianza

(n 2 1)S 2
X2 5
d2
El estadístico tiene una distribución ji cuadrada con n 2 1 grados de libertad. Este resultado
es exacto si la población es normal; incluso para muestras tomadas de poblaciones no norma-
les, suele ser una buena aproximación.

Intervalos de confianza para la varianza de población


Suponga que se quiere un intervalo de confianza de 95% para el problema de entrega de correo. La
figura muestra dos puntos en la distribución X2: XU2 corta 0.025 del área en la cola superior de la
distribución y XL2 corta 0.025 del área en la cola inferior de la distribución. (Para un intervalo de
confianza de 95%, tendríamos un a 5 0.05 del área total dividido en dos partes o colas, cada cola
5 0.025). Los valores de XL2 y XU2 , se pueden encontrar en la tabla 5 del apéndice. En este problema,
con 9 2 1 5 8 grados de libertad, XL2 = 2.180 y XU2 5 17.535 (a 5 1 2 0.025 5 0.975; y a 5 0.025).

(n 2 1)S 2
Ahora, despejamos la ecuación d 2 5 para formar los intervalos de confianza para d2
X2
(n 2 1)S 2 (n 2 1)S 2
d 2L 5 Límite inferior de confianza  d 2
U 5 Límite superior de confianza
XU2 X L2

(9 2 1)(529) (9 2 1)(529)
d 2L 5 5 241.35   dL 5 15.54  dU2 5 5 1941.28   dU 5 44.06
17.535 2.180
66 CAPÍTULO 3

Lim Inf Lim Sup

El director general de correos puede tener una certeza de 95% de que la varianza de la población
está entre 15.54 y 44.06 horas; es decir, que la variabilidad de la tardanza del correo entre Teguci-
galpa y San Salvador está dentro del intervalo comprendido de 15.54 y 44.06 horas.

Prueba de dos colas de una varianza


Un profesor de administración, ha diseñado sus exámenes con el fin de estar seguro de que un
examen distingue bien las diferencias en el logro de los estudiantes, la desviación estándar de los
resultados del examen no puede ser demasiado pequeña. Por el otro lado, si la desviación estándar
es muy grande, habrá una tendencia a tener muchas calificaciones muy bajas, lo cual es deprimen-
te para el ánimo de los estudiantes. Experiencias pasadas han hecho creer al profesor que una
desviación estándar de aproximadamente 13 puntos para un examen de 100, indica que el examen
logra un buen equilibrio de estos dos objetivos. El profesor acaba de hacer un examen a 31 estu-
diantes, la calificación promedio fue 72.7 y la desviación estándar de la muestra fue de 15.9. ¿Este
examen cumple con el criterio del profesor de un buen examen? Podemos resumir los datos:
dH0 5 13 Valor hipotetizado de la desviación estándar de la población
s = 15.9 Desviación estándar de la muestra
n = 31 Tamaño de la muestra
Si el profesor utiliza un a 5 0.10 en la prueba de su hipótesis, podemos plantear el problema en
símbolos:
H0: d 5 13 Hipótesis nula: la desviación estándar real es 13 puntos
H1: d ≠ 13 Hipótesis alternativa: la desviación estándar real no es 13 puntos
a 5 0.10 Nivel de significancia para probar estas hipótesis

(n 2 1)S 2 (31 2 1)(15.9)2


1. Calcular el estadístico X 2 5 5 5 44.88
d2 (13)2

0.05

18.493 43.773
X2 = 44.88
Ji cuadrada y análisis de varianza 67

2. Los valores de XL2 y XU2 , se pueden encontrar en la tabla 5 del apéndice. En este problema, con
31 2 1 5 30 grados de libertad, XL2 = 18.493 y XU2 5 43.773 (a 5 1 2 0.05 5 0.95; y a 5 0.05).
Podemos ver que los valores apropiados de X2 para que 0.05 del área se encuentre en cada cola
de la curva son 18.493 y 43.773. Estos dos límites definen la frontera entre la región de acep-
tación y la región de rechazo; y el estadístico de la muestra observada (X2 5 44.88) no se en-
cuentra en la región de aceptación, de modo que el profesor deberá rechazar la hipótesis nula
y concluir que el examen no cumple el criterio de un buen examen.

Prueba de una cola para la varianza


La empresa XYZ fabrica instrumentos de precisión y para conservar su reputación, mantiene un
estricto control de calidad en todos sus productos. No pone a la venta una balanza analítica, a
menos que muestre una variabilidad significativamente menor que un microgramo cuando se
pesan cantidades de casi 500 gramos. La línea de producción acaba de entregar una nueva balanza
a la división de control de calidad. Se prueba la nueva balanza utilizándola para pesar el mismo
peso estándar de 500 gramos 30 veces, resultando una desviación estándar de la muestra de 0.73
microgramos. A un a 5 0.01, ¿se deberá vender la balanza? Hacemos un resumen de los datos:
dH0 5 1 Valor hipotetizado de la desviación estándar de la población
s = 0.73 Desviación estándar de la muestra
n = 30 Tamaño de la muestra

Y planteamos el problema:
H0: d 5 1 Hipótesis nula: la desviación estándar real es 1 microgramo
H1: d < 1 Hipótesis alternativa: la desviación estándar real es menor que 1 microgramo
a 5 0.01 Nivel de significancia para probar estas hipótesis

(n 2 1)S 2 (30 2 1)(0.73)2


1. Calcular el estadístico X 2 5 5 5 15.45
d2 (1)2

0.01

X2 = 14.256 X2 = 15.45

2. El valor de XL2 se busca en la tabla 5 del apéndice, con 30 2 1 5 29 grados de libertad, XL2 =
14.256 (a 5 1 2 0.01 5 0.99).
La región de aceptación y el valor observado de ji cuadrada se ilustran en la gráfica, vemos
que no podemos rechazar la hipótesis nula. La balanza se tendrá que regresar a la línea de
producción para ajustes.
68 CAPÍTULO 3

EJERCICIOS PROPUESTOS

1. Un profesor del área operativa investiga la variabilidad en las notas finales obtenidas por sus alumnos en las tres
secciones de diferentes clases que tiene asignadas. Con el fin de estar razonablemente seguro de que las notas de
los exámenes de sus alumnos no varíen significativamente; se procedió a calcular una varianza referencial de
140.2. El supone que la variabilidad ha disminuido con el nuevo modelo educativo basado en competencias. El
profesor seleccionó aleatoriamente una muestra de 10 calificaciones de sus alumnos y encontró una varianza
muestral de 60.84. Use un nivel de significancia del 0.10 para probar la creencia del catedrático. ¿Cuál es su con-
clusión al respecto?

2. El profesor Carlos Vásquez imparte la clase de ciencias naturales a los alumnos del sexto grado en la escuela
Froylan Turcios Canela; en el Municipio del distrito central del Francisco Morazán. Desea estimar la variabilidad
en las calificaciones del primer parcial. Se tomó una muestra de 10 estudiantes de un total de 50 alumnos, para
determinar un intervalo de confianza dentro del cual se espera encontrar la variabilidad de la población. Haga su
análisis utilizando un a 5 0.05.
Ji cuadrada y análisis de varianza 69

3. Un pediatra reconocido ha registrado datos referentes a la variabilidad en lapso de atención de sus pacientes de
cinco años de edad que puede resumir por s2 5 64 minutos al cuadrado. Se pregunta si el lapso de atención de
pacientes de seis años o más es diferente. Una muestra de 20 pacientes de seis años o más da s2 528 minutos al
cuadrado. Pruebe la hipótesis a un nivel de confianza de 99%.

4. Un banco estatal considera estrategias de reducción de costos asociados con las cuentas de ahorro. Ha encontra-
do que la varianza en el número de días entre transacciones para esas cuentas es 80 días al cuadrado. El banco
desea reducir la varianza desalentando el uso de las cuentas para guardar dinero por poco tiempo. Se implanta
una nueva política que penaliza al cliente con cargos de servicio por más de un retiro al mes. Se toma una mues-
tra de 25 cuentas de ahorro, y encuentra que la varianza es 28 días al cuadrado. ¿Está justificado este banco al
asegurar que la nueva política reduce la varianza de días entre transacciones? Pruebe las hipótesis al nivel de
significancia de 0.05.
70 CAPÍTULO 3

3.6 Inferencias acerca de las varianzas


de dos poblaciones
Tratar de comparar las varianzas de dos poblaciones, más que buscar la diferencia de dos varianzas
muestrales, es más conveniente estudiar su cociente. Los siguientes ejemplos muestran cómo se
hace este procedimiento.

Prueba de una cola de dos varianzas


Una socióloga de la universidad cree que los ingresos de los graduados de la universidad tienen
una variabilidad mayor que los ingresos de las personas que no cursaron la universidad y con el fin
de probar esta teoría, se investigan los ingresos de dos poblaciones (Teg., S.P.S), se toma una mues-
tra de 21 graduados y se encuentra que sus ingresos tienen una desviación estándar de la muestra
s1 5 L17,000. Se toma una segunda muestra de 25 no graduados y se obtiene una desviación están-
dar s2 5 L7,500. Los datos de nuestro problema se pueden resumir de la siguiente manera:
s1 5 17,000 Desviación estándar de la primera muestra
n1 5 21 Tamaño de la primera muestra
s2 5 7,500 Desviación estándar de la segunda muestra
n2 5 25 Tamaño de la segunda muestra
Debido a que la socióloga tiene la teoría de que los ingresos de los egresados de la universidad son
más variables que los ingresos de las personas que no cursaron la universidad, una prueba de una
cola es apropiada. La socióloga desea verificar su teoría a un a 5 0.01. Podemos establecer de ma-
nera formal sus hipótesis:
H0: d12 5 d22 (o d12/ d22 5 1) Hipótesis nula: las dos varianzas son iguales
H1: d12 . d22 (o d12/ d22 . 1) Hipótesis alternativa: los ingresos de los egresados de la universidad
tienen una varianza más grande
a 5 0.01 Nivel de significancia para probar estas hipótesis
Sabemos que s12 y s22 se pueden utilizar para estimar d12 y d2.2 También se sabe que s12 debe ser mayor
que s22, pero, ¿qué tanto deberá ser mayor s2 para que podamos rechazar la hipótesis nula? Para
responder a esta pregunta, debemos conocer la distribución de s21/s22. Si suponemos que las dos
poblaciones están razonablemente bien descritas por distribuciones normales, entonces el cocien-
te es:
(17.000)2
F = s12/ s22 5 5 5.14
(7.000)2
Tiene una distribución F con n1 2 1 grados de libertad en el numerador y n2 2 1 grados de libertad en
el denominador, por lo tanto, en el numerador hay 20 g.l. (21 2 1) y 24 (25 2 1) en el denominador, la
tabla 6 del apéndice nos indica que el valor crítico que separa a las regiones de aceptación y de rechazo
es 2.74. La figura siguiente muestra la región de aceptación y el estadístico F observado de 5.14. Nuestra
socióloga rechaza la hipótesis nula y concluye que los datos de la muestra apoyan su teoría.
En este punto son necesarias unas palabras de advertencia respecto al uso de la tabla 6 del apéndi-
ce. Se habrá dado cuenta de que la tabla da los valores del estadístico F que son apropiados sólo para
pruebas de cola superior. ¿De qué manera podemos manejar hipótesis alternativas de la forma d12 < d22 ó
d12/d22 < 1? Es sencillo si notamos que d12/d22 <1 es equivalente a d22/d12.1. Así, todo lo que necesitamos es
calcular el cociente s22 /s12, que también sigue una distribución F (pero con n2 2 1 grados de libertad en
el numerador y n1 2 1 grados de libertad en el denominador), y después usamos la tabla 6 del apéndice.
Existe otra forma de decir lo mismo: siempre que realice una prueba de una cola de dos varianzas,
numere las poblaciones de modo que la hipótesis alternativa tenga la forma:
H0: d12 . d22 ó d12/d22 . 1 y luego proceda como en el ejemplo de los ingresos.
Ji cuadrada y análisis de varianza 71

Una prueba de dos extremos de dos varianzas


El procedimiento para ésta es parecido al de la prueba de una cola. El único problema surge en la
búsqueda del valor crítico del extremo inferior. Éste se relaciona con el problema de las pruebas de
cola inferior analizadas en el último párrafo, y lo resolveremos de manera parecida.
Un criterio para la evaluación de anestésicos orales odontológicos es la variabilidad de la can-
tidad de tiempo entre la inyección y la pérdida de sensibilidad en el paciente. (Esto se conoce como
tiempo de demora del efecto.) Una compañía farmacéutica ha desarrollado dos nuevos anestésicos
orales, que comercializará con los nombres de “O” y “N”; a partir de similitudes en la estructura
química de los dos compuestos, se ha predicho que deben mostrar la misma varianza en el tiempo
de demora del efecto. En la tabla siguiente se presentan los datos para las pruebas sobre los dos
compuestos.
Tabla 3.28

Anestésico n s2
O 31 1,296
N 41 0, 784

La compañía desea probar a un nivel de significancia de 2% si los dos anestésicos tienen la misma
varianza en el tiempo de demora del efecto. En símbolos, las hipótesis son:
1. H0: d12 5 d22 (o d12/d22 5 1) Hipótesis nula: las dos varianzas son iguales
H1: d12 Z d22 (o d12/d22 Z 1) Hipótesis alternativa: las dos varianzas son diferentes
a 5 0.02) Nivel de significancia de la prueba

1296
2. F = s12/s22 5 5 1.65 según cálculo
784
n1 2 1 31 2 1 30
3. F de la tabla 6 5 5 5
n2 2 1 41 2 1 30
Usemos la notación: F (n, d, a) para denotar el valor de F con n grados de libertad en el numerador,
d grados de libertad en el denominador y un área “a” en la cola superior. En este problema, la re-
gión de aceptación se extiende de F (30, 40, 0.99) a F (30, 40, 0.01), como se ilustra en la figura si-
guiente.

F 5 1.65

0.01 Aceptación 0.01

Fi 5 0.43 Fs 5 2.20
F (30,40,0.99)  F (30,40,0.01)

Podemos obtener el valor de F (30, 40, 0.01) directamente de la tabla 6 del apéndice; éste es 2.20.
Sin embargo, el valor de F (30, 40, 0.99) no está en la tabla, para obtener el valor del extremo infe-
rior de F para pruebas de dos colas, se usa la notación:
F (n, d, a) 5 1/F (d, n, 1 2 a) 5 S F (30, 40, 0.99) 5 1/F (40, 30, 0.01) 5 0.43
Para buscar en la tabla se asume que 40 corresponde al numerador y 30 al denominador.
72 CAPÍTULO 3

Se observa en la figura la región de aceptación para esta prueba de hipótesis y el valor obser-
vado de F. Vemos ahí que la hipótesis nula se acepta, de modo que concluimos que la diferencia
observada en las varianzas de muestras de los tiempos de demora del efecto para los dos anestési-
cos no es estadísticamente significativa.

EJERCICIOS PROPUESTOS

1. El supervisor de una agencia bancaria, está preocupado por dar un servicio de calidad en cada una de las tran-
sacciones que el banco le brinda a sus clientes. Dada la siguiente información:
Tabla 3.29

Número de transacciones Retiros Depósitos


Media/día (x∙ ) 8.2 9.8
2
Varianza (s ) 0.3136 0.0784
Tamaño de la muestra (n) 125 150

Desea saber si el número de retiros diarios tiene una variabilidad significativamente mayor que el número de de-
pósitos diarios en su agencia. Pruebe a un nivel de significancia del 0.05.
Ji cuadrada y análisis de varianza 73

2. Una compañía de seguros está interesada en la duración de la hospitalización por varias enfermedades. Seleccio-
naron una muestra aleatoria de 20 pacientes del hospital A y 25 del hospital B internados por la misma enferme-
dad. El tiempo que pasaron en el hospital A tuvo un promedio de 2.4 días con desviación estándar de 0.6 días. El
tiempo de tratamiento en el hospital B promedió 2.3 días con desviación estándar de 0.9 días. ¿Los pacientes del
hospital A tienen significativamente menor variabilidad en su tiempo de recuperación? Pruebe para un nivel de
significancia de 0.01.

3. La empresa Office Depot vende artículos de oficina, como computadoras, artículos escolares, muebles, etc. A
continuación, se da la información de los precios de resmas de papel de dos marcas de alta demanda:
Tabla 3.30

Marca de papel (resmas) Comex Hammermill


Precio promedio en Lempiras (x∙ ) 79.90 94.94
2
Varianza en L. (s ) 14.44 18.49
Tamaño de la muestra (n) 12 9

Se puede afirmar que no existe una variabilidad significativa entre las dos marcas de papel que vende esta empre-
sa. Use un nivel del 0.01.
74 CAPÍTULO 3

4. La corporación Galaxy le compra a un fabricante grandes cantidades de glucosa en miles de kilogramos mensua-
les. A continuación, se recopilaron las siguientes compras entre dos periodos históricos.
Tabla 3.31

Periodo 2010 - 2012 2013 – 2015


Compra promedio mensual en kilogramos (x∙ ) 32.28 42.63
Desviación estándar mensual en kilogramos (s) 14.83 16.94
Tamaño de la muestra en meses (n) 25 24

A un nivel de significancia de 0.05, pruebe si existe una menor variabilidad en el primer periodo de compras.

5. El Banco Lafise recopiló datos de la cartera de clientes que compran divisas en las principales sucursales que
tiene en las ciudades de Tegucigalpa y San Pedro Sula.
Tabla 3.32

Agencia principal Tegucigalpa San Pedro Sula


Número de clientes (n) 90 100
Compra promedio de divisas en dólares (x∙ ) 35,000 50,000
Desviación estándar de divisas en dólares (s) 23,000 27,000

A un nivel de significancia de 0.01, pruebe si existe una mayor variabilidad en la compra de divisas en la agencia
de San Pedro Sula.

También podría gustarte