Parcial Estadística II
Universidad de la Costa - CUC
Mirtha Andrea Bonilla Noriega
Taller
Elabore los siguientes problemas Aplicando el test de Kruskal-Wallis. En la solución
de los problemas debe tener lo siguiente
a. Plantear las hipótesis
b. Cálculos (Plantilla Excel)
c. Interpretación
1. El Incora desea determinar si los cambios de temperatura en el agua de mar causados
por una planta nuclear para generar energía eléctrica tendrán un efecto importante en
la fauna de la región. Recientemente, especímenes recién nacidos de ciertos peces se
han dividido aleatoriamente en cuatro grupos que se colocan en ambientes oceánicos
simulados y separados que son idénticos en todo excepto en la temperatura del agua.
Seis meses después se pesan los especímenes y los resultados (en onzas) se dan en la
siguiente tabla. ¿Los datos arrojan suficiente evidencia para indicar que una (o más)
de las temperaturas tiende a producir aumentos de peso mayores que las otras
temperaturas? Pruebe usando α = .10.
Solución
a. Planteamiento de las hipótesis:
𝐻0 : 𝜇38°𝐹 = 𝜇42°𝐹 = 𝜇46°𝐹 = 𝜇50°𝐹
𝐻1 : 𝐿𝑎𝑠 𝑐𝑢𝑎𝑡𝑟𝑜 𝑚𝑒𝑑𝑖𝑎𝑠 𝑠𝑜𝑛 𝑑𝑖𝑓𝑒𝑟𝑒𝑛𝑡𝑒𝑠.
b. Cálculos:
Datos:
38°F 42°F 46°F 50°F
22 15 14 17
24 21 28 18
16 26 21 13
18 16 19 20
19 25 24 21
17 23
Rangos:
Datos Datos No. Rango
ordenados
22 13 1 1
24 14 2 2
16 15 3 3
18 16 4 4,5
19 16 5 4,5
15 17 6 6,5
21 17 7 6,5
26 18 8 8,5
16 18 9 8,5
25 19 10 10,5
17 19 11 10,5
14 20 12 12
28 21 13 14
21 21 14 14
19 21 15 14
24 22 16 16
23 23 17 17
17 24 18 18,5
18 24 19 18,5
13 25 20 20
20 26 21 21
21 28 22 22
38°F 42°F 46°F 50°F
16 3 2 6,5
18,5 14 22 8,5
4,5 21 14 1
8,5 4,5 10,5 12
10,5 20 18,5 14
6,5 17
Total R 58 69 84 42
Cálculo de H:
12 582 692 842 422
𝐻= ( + + + ) − 3(22 + 1) = 2.03
22(22 + 1) 5 6 6 5
Cálculo del valor crítico:
2
𝑥0.10,3 = 6,251
c. Interpretación:
Como h = 2.03 no cae en la región crítica h > 4.61, no hay evidencia suficiente para
rechazar la hipótesis nula. Esto quiere decir que no hay suficiente evidencia para
indicar que una (o más) de las temperaturas tienden a producir aumentos de pesos
mayores que las otras temperaturas.
2. Una compañía piensa promover un nuevo producto mediante el uso de una de tres
campañas publicitarias. Para investigar la magnitud del reconocimiento del producto
que resulte de las campañas, se seleccionaron 15 áreas de mercado y a cada 5 se les
asignó aleatoriamente una campaña. Al final de las campañas se seleccionaron
muestras aleatorias de 400 adultos en cada área y las proporciones de quienes
indicaron familiaridad con el producto aparecen en la siguiente tabla. Α=0.01
Las campañas 2 y 3 fueron, respectivamente, las más y menos costosas. ¿Hay
suficiente evidencia para indicar que la campaña 2 es más exitosa que la campaña 3?
Pruebe usando el procedimiento Rangos de Wilcoxon. Proporcione el valor p
asociado.
Solución:
a. Planteamiento de las hipótesis:
𝐻0 : 𝜇1 = 𝜇2 = 𝜇3
𝐻1 : 𝐿𝑎𝑠 𝑡𝑟𝑒𝑠 𝑚𝑒𝑑𝑖𝑎𝑠 𝑠𝑜𝑛 𝑑𝑖𝑓𝑒𝑟𝑒𝑛𝑡𝑒𝑠.
b. Cálculos:
Datos:
Campaña
1 2 3
0,33 0,28 0,21
0,29 0,41 0,30
0,21 0,34 0,26
0,32 0,39 0,33
0,25 0,27 0,31
Rangos:
Datos Datos No. Rango
ordenados
0,33 0,21 1 1,5
0,29 0,21 2 1,5
0,21 0,25 3 3
0,32 0,26 4 4
0,25 0,27 5 5
0,28 0,28 6 6
0,41 0,29 7 7
0,34 0,30 8 8
0,39 0,31 9 9
0,27 0,32 10 10
0,21 0,33 11 11,5
0,30 0,33 12 11,5
0,26 0,34 13 13
0,33 0,39 14 14
0,31 0,41 15 15
Campaña
1 2 3
11,5 6 1,5
7 15 8
1,5 13 4
10 14 11,5
3 5 9
Total R 33 53 34
Cálculo de H:
12 332 532 342
𝐻= ( + + ) − 3(15 + 1) = 2.54
15(15 + 1) 5 5 5
Cálculo del valor crítico:
2
𝑥0.01,2 = 9.21
c. Interpretación:
Como h = 2.54 no cae en la región crítica h > 9.21, no hay evidencia suficiente
para rechazar la hipótesis nula. Esto quiere decir que no hay suficiente evidencia
para indicar que una (o más) de las campañas difieren entre sí.
Prueba de Rangos de Wilcoxon:
Planteamiento de las hipótesis:
𝐻0 : 𝜇̅2 ≤ 𝜇̅3
𝐻1 : 𝜇̅2 > 𝜇̅3
Cálculo del valor crítico:
𝑈0.01,5,5 = 1
Cálculo del estadístico de prueba:
Datos Datos No. Rango
originales ordenados
0,28 0,21 1 1
0,41 0,26 2 2
0,34 0,27 3 3
0,39 0,28 4 4
0,27 0,30 5 5
0,21 0,31 6 6
0,30 0,33 7 7
0,26 0,34 8 8
0,33 0,39 9 9
0,31 0,41 10 10
𝑤2 = 3 + 4 + 8 + 9 + 10 = 34
(5 + 5)(5 + 5 + 1)
𝑤3 = − 34 = 21
2
Por lo tanto,
(5)(5 + 1)
𝑢3 = 21 − =6
2
Conclusión:
A un nivel del 1% de significancia, no se rechaza la hipótesis nula y se concluye que
no hay diferencia significativa en las campañas 2 y 3. (u =6 no es menor que u =1,
por lo tanto, no entra en región crítica).
3. Se realizó un experimento para comparar el tiempo que una persona tarda en
recuperarse de cada uno de los tres tipos de gripe, Victoria A, Texas y Rusa. Veintiún
personas fueron seleccionadas aleatoriamente de un grupo de voluntarios y divididas
en tres grupos de 7 cada uno. A cada grupo se le asignó al azar una variedad del virus
y la gripe fue inducida en las personas, todas las cuales recibieron atención médica
en condiciones idénticas y se registró el tiempo de recuperación (en días). Los rangos
de los resultados aparecen en la siguiente tabla.
¿Los datos aportan suficiente evidencia para indicar que los tiempos de recuperación
para uno (o más) tipo(s) de gripe tiende(n) a ser más largos que para los otros tipos?
¿Los datos aportan suficiente evidencia para indicar una diferencia en las
localizaciones de las distribuciones de tiempos de recuperación para los tipos Victoria
A y Rusa?
Solución:
a. Planteamiento de las hipótesis:
𝐻0 : 𝜇𝑉𝐴 = 𝜇 𝑇 = 𝜇𝑅
𝐻1 : 𝐿𝑎𝑠 𝑡𝑟𝑒𝑠 𝑚𝑒𝑑𝑖𝑎𝑠 𝑠𝑜𝑛 𝑑𝑖𝑓𝑒𝑟𝑒𝑛𝑡𝑒𝑠.
b. Cálculos:
Rangos:
Victoria Texas Rusa
A
20 14,5 9
6,5 16,5 1
21 4,5 9
16,5 2,5 4,5
12 14,5 6,5
18,5 12 2,5
9 18,5 12
Total R 103,5 83 44,5
Cálculo de H:
12 103.52 832 44.52
𝐻= ( + + ) − 3(21 + 1) = 6.66
21(21 + 1) 7 7 7
Cálculo del valor crítico:
2
𝑥0.05,2 = 5.99
c. Interpretación:
Como h = 6.66 cae en la región crítica h > 5.99, si hay evidencia suficiente para
rechazar la hipótesis nula. Esto quiere decir que si hay suficiente evidencia para
que los tiempos de recuperación para uno (o más) tipo(s) de gripe tiende(n) a ser
más largos que para los otros tipos.
Prueba de rangos de Wilcoxon
Planteamiento de las hipótesis:
𝐻0 : 𝜇̅𝑉𝐴 = 𝜇̅𝑅
𝐻1 : 𝜇̅𝑉𝐴 ≠ 𝜇̅𝑅
Cálculo del valor crítico:
𝑈0.05,7,7 = 11
Cálculo del estadístico de prueba:
𝑤𝑉𝐴 = 20 + 6.5 + 21 + 16.5 + 12 + 18.5 + 8 = 103.5
(7 + 7)(7 + 7 + 1)
𝑤𝑅 = − 103.5 = 1.5
2
Por lo tanto,
(7)(7 + 1)
𝑢𝑉𝐴 = 103.5 − = 75.5
2
(7)(7 + 1)
𝑢𝑅 = 1.5 − = −26.5
2
Conclusión:
A un nivel del 5% de significancia, no se rechaza la hipótesis nula y se
concluye que no hay diferencia significativa entre Victoria A y Rusa. (u
negativo = 26.5 no es menor que u =11, por lo tanto, no entra en región
crítica).
4. Cada año los gorgojos ocasionan pérdidas de millones de dólares en las cosechas de
algodón. Se aplican tres sustancias químicas diseñadas para controlar las poblaciones
de gorgojos. Después de 3 meses, diez lotes de igual tamaño se seleccionan
aleatoriamente dentro de cada campo y, para cada uno, se registra el porcentaje de
plantas de algodón dañadas por los gorgojos. ¿Los datos de la siguiente tabla aportan
suficiente evidencia para indicar una diferencia en la localización entre las
distribuciones de porcentajes de daños correspondientes a los tres tratamientos?
Solución:
a. Planteamiento de las hipótesis:
𝐻0 : 𝜇𝐴 = 𝜇𝐵 = 𝜇𝐶
𝐻1 : 𝐿𝑎𝑠 𝑡𝑟𝑒𝑠 𝑚𝑒𝑑𝑖𝑎𝑠 𝑠𝑜𝑛 𝑑𝑖𝑓𝑒𝑟𝑒𝑛𝑡𝑒𝑠.
b. Cálculos:
Datos:
Sustancia Sustancia Sustancia
química química química
A B C
10,8 22,3 9,8
15,6 19,5 12,3
19,2 18,6 16,2
17,9 24,3 14,1
18,3 19,9 15,3
9,8 20,4 10,8
16,7 23,6 12,2
19,0 21,2 17,3
20,3 19,8 15,1
19,4 22,6 11,3
Rangos:
Datos Datos No. Rango
ordenados
10,8 9,8 1 1,5
15,6 9,8 2 1,5
19,2 10,8 3 3,5
17,9 10,8 4 3,5
18,3 11,3 5 5
9,8 12,2 6 6
16,7 12,3 7 7
19,0 14,1 8 8
20,3 15,1 9 9
19,4 15,3 10 10
22,3 15,6 11 11
19,5 16,2 12 12
18,6 16,7 13 13
24,3 17,3 14 14
19,9 17,9 15 15
20,4 18,3 16 16
23,6 18,6 17 17
21,2 19,0 18 18
19,8 19,2 19 19
22,6 19,4 20 20
9,8 19,5 21 21
12,3 19,8 22 22
16,2 19,9 23 23
14,1 20,3 24 24
15,3 20,4 25 25
10,8 21,2 26 26
12,2 22,3 27 27
17,3 22,6 28 28
15,1 23,6 29 29
11,3 24,3 30 30
Sustancia Sustancia Sustancia
química química química
A B C
3,5 27 1,5
11 21 7
19 17 12
15 30 8
16 23 10
1,5 25 3,5
13 29 6
18 26 14
24 22 9
20 28 5
Total R 141 248 76
Cálculo de H:
12 1412 2482 762
𝐻= ( + + ) − 3(30 + 1) = 19.47
30(30 + 1) 10 10 10
Cálculo del valor crítico:
2
𝑥0.05,2 = 5.99
c. Interpretación:
Como h = 19.47 cae en la región crítica h > 5.99, hay evidencia suficiente para
rechazar la hipótesis nula. Esto quiere decir que hay suficiente evidencia para
indicar una diferencia en la localización entre las distribuciones de porcentajes
de daños correspondientes a los tres tratamientos.
5. Un estudio midió la tasa de sorción (ya sea absorción o adsorción) de tres tipos
diferentes de solventes químicos orgánicos. Estos solventes se utilizan para limpiar
partes industriales metálicas, y son desechos potencialmente riesgosos. Se probaron
muestras independientes de solventes de cada tipo y se registraron sus tasas de sorción
como un porcentaje molar.
¿Existe una diferencia significativa en la tasa promedio de sorción de los tres
solventes?
Solución:
a. Planteamiento de las hipótesis:
𝐻0 : 𝜇𝐴 = 𝜇𝐶 = 𝜇𝐸
𝐻1 : 𝐿𝑎𝑠 𝑡𝑟𝑒𝑠 𝑚𝑒𝑑𝑖𝑎𝑠 𝑠𝑜𝑛 𝑑𝑖𝑓𝑒𝑟𝑒𝑛𝑡𝑒𝑠.
b. Cálculos:
Datos:
Aromáticos Cloroalcalinos Esteres
1,06 1,58 0,29
0,79 1,45 0,06
0,82 0,57 0,44
0,89 1,16 0,55
1,05 1,12 0,61
0,95 0,91 0,43
0,65 0,83 0,51
1,15 0,43 0,10
1,12 0,53
0,34
0,06
0,09
0,17
0,17
0,60
Rangos:
Datos Datos No. Rango
ordenados
1,06 0,06 1 1,5
0,79 0,06 2 1,5
0,82 0,09 3 3
0,89 0,10 4 4
1,05 0,17 5 5,5
0,95 0,17 6 5,5
0,65 0,29 7 7
1,15 0,34 8 8
1,12 0,43 9 9
1,58 0,43 10 10
1,45 0,44 11 11
0,57 0,51 12 12
1,16 0,53 13 13
1,12 0,55 14 14
0,91 0,57 15 15
0,83 0,60 16 16
0,43 0,61 17 17
0,29 0,65 18 18
0,06 0,79 19 19
0,44 0,82 20 20
0,55 0,83 21 21
0,61 0,89 22 22
0,43 0,91 23 23
0,51 0,95 24 24
0,10 1,05 25 25
0,53 1,06 26 26
0,34 1,12 27 27,5
0,06 1,12 28 27,5
0,09 1,15 29 29
0,17 1,16 30 30
0,17 1,45 31 31
0,60 1,58 32 32
Aromáticos Cloroalcalinos Esteres
26 32 7
19 31 1,5
20 15 11
22 30 14
25 27,5 17
24 23 10
18 21 12
29 9 4
27,5 RC = 188,5 13
RA = 8
210,5
1,5
3
5,5
5,5
16
RE = 129
Cálculo de H:
12 210.52 188.52 1292
𝐻= ( + + ) − 3(32 + 1) = 20.03
32(32 + 1) 9 8 15
Cálculo del valor crítico:
2
𝑥0.05,2 = 5.99
c. Interpretación:
Como h = 20.03 cae en la región crítica h > 5.99, hay evidencia suficiente para
rechazar la hipótesis nula. Esto quiere decir que hay suficiente evidencia para
indicar que existe una diferencia significativa en la tasa promedio de sorción de
los tres solventes.