INTEGRANTES :
ANGELES TORREJON, MILEYDI
ATOCHE ORIHUELA, KARINA
OYOLA MASLUCAN, JOHANN
RUIZ CERVERA, GUISELA
VALDIVIA TORRES, EDUARD
I. PRUEBA DE BONDAD DE AJUSTE
• En la ciudad de Jaén se observó ciertos indicios de contaminación de atmosférica por la
emisión de CO generados por el parque automotor y algunas ladrilleras locales. Ante dicha
problemática la municipalidad contrató a ing. Ambientales quienes realizaron un estudio que
pretendía medir la cantidad de monóxido de carbono en la atmosfera, para ello se utilizó un
instrumento que registró las lecturas de dicho contaminante en un período de 14 días.
• La siguiente tabla, muestran las frecuencias observadas con un nivel de significancia del 5%
DÍAS INSTRUMENTO A
1 0.96
2 0.82
3 0.75
4 0.61
5 0.89
6 0.64
7 0.81
8 0.68
9 0.65
10 0.84
11 0.59
12 0.94
13 9.91
14 0.77
Para resolver el anterior problema bajo el método de chi- cuadrado con bondad de ajuste, en donde el la
municipalidad quiere verificar si el 𝑛𝑖𝑣𝑒𝑙 𝑑𝑒 𝑐𝑜𝑛𝑡𝑎𝑚𝑖𝑛𝑎𝑐𝑖ó𝑛 resecto al periodo es uniforme, se define
un nivel de significancia del 5%
Paso 1:
• 𝐻0 = 𝐸𝑙 𝑛𝑖𝑣𝑒𝑙 𝑑𝑒 𝑐𝑜𝑛𝑡𝑎𝑚𝑖𝑛𝑎𝑐𝑖ó𝑛 𝑠𝑖𝑔𝑢𝑒 𝑢𝑛𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 𝑛𝑜𝑟𝑚𝑎𝑙 𝑡𝑜𝑑𝑜𝑠 𝑙𝑜𝑠 𝑑í𝑎𝑠.
• 𝐻𝑎 = 𝐸𝑙 𝑛𝑖𝑣𝑒𝑙 𝑑𝑒 𝑐𝑜𝑛𝑡𝑎𝑚𝑖𝑛𝑎𝑐𝑖ó𝑛 𝑛𝑜 𝑠𝑖𝑔𝑢𝑒 𝑢𝑛𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 𝑛𝑜𝑟𝑚𝑎𝑙 𝑡𝑜𝑑𝑜𝑠 𝑙𝑜𝑠 𝑑í𝑎𝑠.
Paso 2
Como el ejercicio se desarrollara mediante software R, se tiene que instalar el paquete
“nortest” y luego activarlo, ya que este se utiliza para la prueba de ajuste de bondad.
Paso 3
Activar el formato de datos, este nos permitirá exportar nuestros de Excel, donde se
encuentran la variable de estudio y los valores asociados.
• Posteriormente nos saldrá una ventana emergente, donde se agregará los datos
del Excel.
Paso 4
Se escribe el comando correspondiente, en donde se especifica el tipo de test según la
distribución, el nombre de la data y la variable de estudio.
PASO 5: cuestionar las hipótesis y concluir
0.5153 > 0.05
Decisión :Se acepta la Ho
Conclusión:𝐸𝑙 𝑛𝑖𝑣𝑒𝑙 𝑑𝑒 𝑐𝑜𝑛𝑡𝑎𝑚𝑖𝑛𝑎𝑐𝑖ó𝑛 𝑠𝑖𝑔𝑢𝑒 𝑢𝑛𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 𝑛𝑜𝑟𝑚𝑎𝑙 𝑡𝑜𝑑𝑜𝑠 𝑙𝑜𝑠 𝑑í𝑎𝑠.
II. PRUEBA DE HOMOGENEIDAD
En un estudio sobre la propuesta de aplicación del fracking en Perú como un método válido para la
extracción de hidrocarburos, se seleccionó una muestra de 125 geólogos y 125 ingenieros ambientales y
se les preguntó si estaban a favor, en contra ó son indiferentes acerca de dicha propuesta. La tabla que
sigue señala los resultados de la encuesta, que formula la siguiente pregunta: ¿son compatibles estos
datos con la hipótesis, que consiste en que tanto los geólogos e ingenieros ambientales son homogéneos
respecto a sus opiniones acerca del fracking? Utilize un nivel de significancia de 0.05.
GEÓLOGOS ING. AMBIENTALES TOTAL
A favor 90 85 175
En contra 30 25 55
Sin Decisión 5 15 20
Total 125 125 250
SOLUCIÓN:
1. Plantear las hipótesis:
Ho: Las opiniones tanto de geólogos como ingenieros ambientales son homogéneas respecto a la
propuesta de aplicación de fracking en Perú.
𝐇𝟏: Las opiniones tanto de geólogos como ingenieros ambientales no son homogéneas respecto a la
propuesta de aplicación de fracking en Perú
2. Reconocer el nivel de significancia α=0.05 y grados de libertad v=2
3. Identificar la región crítica:
𝑥2 = 5.99
GEÓLOGOS ING. TOTAL
AMBIENTALES
A favor 90 (87.5) 85 (87.5) 175
En contra 30 (27.5) 25 (27.5) 55
Sin Decisión 5 (10) 15 (10) 20
Total 125 125 250
Decisión: Se acepta la hipótesis nula.
Conclusión: Las opiniones tanto de geólogos como ingenieros ambientales son homogéneas respecto a la
propuesta de aplicación de fracking en Perú.
III. PRUEBA DE INDEPENDENCIA
Se usa para analizar la frecuencia de dos variables con categorías múltiples para determinar si
las dos variables son independientes o no.
Ho: Las variables x, y son independientes.
𝐇𝟏: Las variables x,y son dependientes.
EJEMPLO:
Una institución ambiental hizo un estudio para determinar si los niveles de Arsénico en el agua se relaciona con la
zona de procedencia. Para lo cual se elige una muestra aleatoria de 300 personas a las que se les examinó y se
obtuvieron los siguientes resultados:
Zona de Nivel de Contaminación
Procedencia Total
Alto Medio Bajo
Gran Vía 18 6 12 36
La molina 42 24 30 96
Claveles 36 72 60 168
Total 96 102 102 300
a) ¿Cree usted que la zona de procedencia se relaciona con los niveles de Arsénico en el agua? Use un nivel de
significación de 5% en su conclusión.
PASO 1 : FORMULACIÓN DE LAS HIPOTESIS
Ho La zona de procedencia es independiente del nivel de contaminación.
Hi La zona de procedencia no es independiente del nivel de contaminación.
PASO 2 : ESPECIFICAR EL NIVEL DE SIGNIFICANCIA Y GRADOS DE LIBERTAD
Zona de Nivel de Contaminación (α) = 0.05
Procedencia Alto Medio Bajo Total
GRADOS DE LIBERTAD (gl):
Gran Vía 18 6 12 36
La molina 42 24 30 96 gl= (n° filas – 1) x (n° columnas – 1)
gl= (3– 1) x (3– 1)
Claveles 36 72 60 168 gl= 4
Total 96 102 102 300
PASO 3: CALCULAR LAS FRECUENCIAS ESPERADAS, CORRESPONDIENTES A CADA
FRECUENCIA OBSERVADA( frecuencias esperadas entre paréntesis)
36 𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑙𝑎 𝑝𝑟𝑖𝑚𝑒𝑟𝑎 𝑐𝑜𝑙𝑢𝑚𝑛𝑎 𝑥96(𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑙𝑎 𝑝𝑟𝑖𝑚𝑒𝑟𝑎 𝑓𝑖𝑙𝑎) 3456
=
300(𝑡𝑜𝑡𝑎𝑙 𝑑𝑒 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑐𝑖𝑜𝑛𝑒𝑠) = 11.52
300
Zona de Nivel de Contaminación
procedencia Total
Alto Medio Bajo
Gran Vía 18(11.52) 6(12.24) 12(12.24) 36
La molina 42(30.72) 24(32.64) 30(32.64) 96
Claveles 36(53.76) 72(57.12) 60(57.12) 168
Total 96 102 102 300
PASO 4: CALCULAR EL CHI-CUADRADO TEÓRICO Y CRÍTICO
• CHI-CUADRADO TEÓRICO: Para calcular el CHI-CUADRADO teórico utilizamos la
siguiente fórmula.
𝑛 (𝑓 − 𝑓 )2
𝑜 𝑒
𝑋 𝑡𝑒𝑜𝑟𝑖𝑐𝑜 =
2
𝑖=0 𝑓𝑒
(18 − 11.52)2 (6 − 12.24) (12 − 12.24) (42 − 30.72) (24 − 32.64)
2 2 2 2
𝑋 =
2 + + + +
11.52 12.24 12.24 30.72 32.64
(30 − 32.64)2
+ (36 − 53.76)2 (70 − 57.12)2 (60 − 57.12)2
32.64 + + +
53.76 57.12 57.12
𝑋 Zona de Nivel de Contaminación
Procedencia Alto Medio Bajo Total
Gran Vía 18(11.52) 6(12.24) 12(12.24) 36
La molina 42(30.72) 24(32.64) 30(32.64) 96
Claveles 36(53.76) 72(57.12) 60(57.12) 168
Total 96 102 102 300
2
= 23.36
• CHI-CUADRADO CRÍTICO: Para hallar el valor de este se utiliza α y gl.
𝑋2𝑐𝑟𝑖𝑡𝑖𝑐𝑜 = 𝑋2𝑔𝑙,
𝑋2𝑐𝑟𝑖𝑡𝑖𝑐𝑜 = 𝑋24,0. =9.488
PASO 5: CUESTIONAR LAS HIPOTESIS Y CONCLUIR
𝑋2𝑡𝑒𝑜𝑟𝑖𝑐𝑜 = 23.36 > 𝑋2𝑐𝑟𝑖𝑡𝑖𝑐𝑜=9.488
Conclusión: La zona de procedencia y el nivel de contaminación por arsénico son dependientes
con (α) = 5%.
PRUEBA DE INDEPENDENCIA EN R ESTUDIO