Análisis Bioestadístico en Investigación
Análisis Bioestadístico en Investigación
ENTREGADO POR:
CURSO: BIOESTADÍSTICA
INGENIERÍA AGROFORESTAL
10 DE DICIEMBRE DE 2024
Introducción
evalúa hipótesis y así tomar decisiones fundamentales. Este trabajo se centra en analizar un
dispersión, así como el uso de distribuciones como la de Poisson. Por último, se aplican análisis
avanzados como el cálculo del análisis de varianza (ANOVA) para comparar grupos, evaluando
General
Evaluar la calidad metodológica y solidez desde una perspectiva bioestadística, con el fin
biológicos.
Específicos
revisados.
de los datos.
Parte 1:
En grupo deben seleccionar un artículo científico a partir del cual harán un análisis en
tomando como base el diagrama 1 que se muestra a continuación. Esto es, a partir de la lectura
científico, modelo estadístico, diseño experimental usado, datos obtenidos (principales), análisis
de su preferencia.
conocimiento.
[Link]
=DAGYjiNkYaA&utm_campaign=designshare&utm_medium=link2&utm_source=sharebutton
Parte 2: Ejercicios de aplicación
Ejercicio 1
y la condición de fertilidad del suelo en diferentes parcelas de una plantación. Se han recogido
datos de una muestra de 200 parcelas y se han observado las siguientes distribuciones:
siguiente:
De estas parcelas con suelo fértil fue posible establecer la relación entre el tipo de hongo
azar (P(B)).
80
𝑃(𝐵) = = 0.4
200
es de 0.4 o 40%.
b) Calcule la probabilidad de que una parcela seleccionada al azar tenga suelo fértil (P(F)).
120
𝑃(𝐹) = = 0.6
200
La probabilidad de que una parcela seleccionada al azar tenga suelo fértil es de 0.6 0
60%.
c) Calcule la probabilidad de que una parcela seleccionada al azar tenga suelo fértil dado
Probabilidad de parcelas con hongo tipo C y suelo fértil, que se calcula como el número
Se aplica la fórmula:
0.1
𝑃(𝐹/𝐶) = = 0.6667
0.15
La probabilidad de que una parcela seleccionada al azar tenga suelo fértil dado que tiene
En el contexto agroforestal, podría ser una asociación positiva entre la presencia del hongo
tipo C y la fertilidad del suelo. Este tipo de relación podría sugerir que el hongo tipo C
contribuye a mejorar la fertilidad del suelo o que prefiere condiciones de suelo fértil para
su crecimiento.
Ejercicio 2
Supóngase que se sabe que en cierta área de una gran ciudad el número promedio de ratas
por manzana es de 12. Suponiendo que el número de ratas sigue una distribución de Poisson,
El problema nos proporciona un valor promedio de 12 ratas por manzana y se nos pide
calcular varias probabilidades relacionadas con este número, con la distribución de Poisson es
fijo, en este caso, el evento es “encontrar una rata” y el Intervalo es “una manzana”.
Parámetro:
𝜆 = 12
𝑒 −𝜆 ∗ 𝜆𝑘
𝑃(𝑋 = 𝑘) =
𝑘!
Donde:
𝑘! Es la factorial de k
Calculando las probabilidades:
𝑘 = 12
𝑒 −12 ∗ 1212
𝑃(𝑋 = 12) =
12!
1212
𝑃(𝑋 = 12) =
12! ∗ 𝑒 12
Usando 𝑛! = 𝑛 ∗ (𝑛 − 1)
12! = 12 ∗ 11 ∗ 10 ∗ 9 ∗ 8 ∗ 7 ∗ 6 ∗ 5 ∗ 4 ∗ 3 ∗ 2 ∗ 1 = 479001600
1212
𝑃(𝑋 = 12) =
(479001600) ∗ 𝑒 12
(248832) ÷ 8916100448256
𝑃(𝑋 = 12) =
(248832) ÷ (479001600) ∗ 𝑒 12
35831808
𝑃(𝑋 = 12) =
(1925) ∗ 𝑒 12
Aproximadamente 11.4 %.
𝜆 = 12
𝑋 > 12
𝑥 = {0,1,2,3,4,5,6,7,8,9,10,11,12}
𝑒 −𝜆 ∗ 𝜆𝑥
𝑃(𝑥, 𝜆) =
𝑥!
𝒙=𝟎
𝑒 −12 ∗ 120
𝑃(𝑋 = 0) =
0!
Por definición 0! = 1
𝑒 −12 ∗ 1
𝑃(𝑋 = 0) =
1
1
𝑃(𝑋 = 0) =
𝑒 12
𝑃(𝑋 = 0) = 0.00000614
𝒙=𝟏
𝑒 −12 ∗ 121
𝑃(𝑋 = 1) =
1!
𝑃(𝑥 > 12) 1
𝑒 −12 ∗ 12
𝑃(𝑋 = 1) =
1
12
𝑃(𝑋 = 1) =
𝑒 12
𝑃(𝑋 = 1) = 0.0000737
𝒙=𝟐
𝑒 −12 ∗ 122
𝑃(𝑋 = 2) =
2!
122
𝑃(𝑋 = 2) =
2! ∗ 𝑒 12
144
𝑃(𝑋 = 2) =
2 ∗ 𝑒 12
72
𝑃(𝑋 = 2) =
𝑒 12
𝑃(𝑋 = 2) = 0.000442
𝒙=𝟑
123
𝑃(𝑋 = 3) =
3! ∗ 𝑒 12
123
𝑃(𝑋 = 3) =
6 ∗ 𝑒 12
1728
𝑃(𝑋 = 3) =
6 ∗ 𝑒 12
(6) ÷ 1728
𝑃(𝑋 = 3) =
(6) ÷ 6 ∗ 𝑒 12
𝑃(𝑋 = 3) = 0.00177
𝒙=𝟒
𝑒 −12 ∗ 124
𝑃(𝑋 = 4) =
4!
124
𝑃(𝑋 = 4) =
4! ∗ 𝑒 12
124
𝑃(𝑋 = 4) =
24 ∗ 𝑒 12
20736
𝑃(𝑋 = 4) =
24 ∗ 𝑒 12
864
𝑃(𝑋 = 4) =
𝑒 12
𝑃(𝑋 = 4) = 0.00530
𝒙=𝟓
𝑒 −12 ∗ 125
𝑃(𝑋 = 5) =
5!
125
𝑃(𝑋 = 5) =
5! ∗ 𝑒 12
125
𝑃(𝑋 = 5) =
120 ∗ 𝑒 12
248832
𝑃(𝑋 = 5) =
120 ∗ 𝑒 −12
(24) ÷ 248832
𝑃(𝑋 = 5) =
(24) ÷ 120 ∗ 𝑒 −12
10368
𝑃(𝑋 = 5) =
5 ∗ 𝑒 12
𝑃(𝑋 = 5) = 0.0127
𝒙=𝟔
𝑒 −12 ∗ 126
𝑃(𝑋 = 6) =
6!
126
𝑃(𝑋 = 6) =
6! ∗ 𝑒 12
126
𝑃(𝑋 = 6) =
720 ∗ 𝑒 12
2985984
𝑃(𝑋 = 6) =
720 ∗ 𝑒 12
(144) ÷ 2985984
𝑃(𝑋 = 6) =
(144) ÷ 720 ∗ 𝑒 12
20736
𝑃(𝑋 = 6) =
5 ∗ 𝑒 12
𝑃(𝑋 = 6) = 0.0254
𝒙=𝟕
𝑒 −12 ∗ 127
𝑃(𝑋 = 7) =
7!
127
𝑃(𝑋 = 7) =
7! ∗ 𝑒 12
127
𝑃(𝑋 = 7) =
5040 ∗ 𝑒 12
35831808
𝑃(𝑋 = 7) =
5040 ∗ 𝑒 12
(144) ÷ 35831808
𝑃(𝑋 = 7) =
(144) ÷ 5040 ∗ 𝑒 12
248832
𝑃(𝑋 = 7) =
35 ∗ 𝑒 12
𝑃(𝑋 = 7) = 0.0436
𝒙=𝟖
𝑒 −12 ∗ 128
𝑃(𝑋 = 8) =
8!
128
𝑃(𝑋 = 8) =
8! ∗ 𝑒 12
128
𝑃(𝑋 = 8) =
40320 ∗ 𝑒 12
429981696
𝑃(𝑋 = 8) =
40320 ∗ 𝑒 12
(1152) ÷ 20736
𝑃(𝑋 = 8) =
(1152) ÷ 40320 ∗ 𝑒 12
373248
𝑃(𝑋 = 8) =
35 ∗ 𝑒 12
𝑃(𝑋 = 4) = 0.0655
𝒙=𝟗
𝑒 −12 ∗ 129
𝑃(𝑋 = 9) =
9!
129
𝑃(𝑋 = 9) =
9! ∗ 𝑒 12
129
𝑃(𝑋 = 9) =
362880 ∗ 𝑒 12
5159780352
𝑃(𝑋 = 9) =
362880 ∗ 𝑒 12
(10368) ÷ 5159780352
𝑃(𝑋 = 9) =
(10368) ÷ 362880 ∗ 𝑒 12
497664
𝑃(𝑋 = 9) =
35 ∗ 𝑒 12
𝑃(𝑋 = 9) = 0.0873
𝒙 = 𝟏𝟎
𝑒 −12 ∗ 1210
𝑃(𝑋 = 10) =
10!
1210
𝑃(𝑋 = 10) =
10! ∗ 𝑒 12
1210
𝑃(𝑋 = 10) =
3628800 ∗ 𝑒 12
61917364224
𝑃(𝑋 = 10) =
3628800 ∗ 𝑒 12
(20736) ÷ 61917364224
𝑃(𝑋 = 10) =
(20736) ÷ 3628800 ∗ 𝑒 12
2985984
𝑃(𝑋 = 10) =
175 ∗ 𝑒 12
𝒙 = 𝟏𝟏
𝑒 −12 ∗ 1211
𝑃(𝑋 = 11) =
11!
1211
𝑃(𝑋 = 11) =
11! ∗ 𝑒 12
1211
𝑃(𝑋 = 11) =
39916800 ∗ 𝑒 12
743008370688
𝑃(𝑋 = 11) =
39916800 ∗ 𝑒 12
(20736) ÷ 743008370688
𝑃(𝑋 = 11) =
(20736) ÷ 39916800 ∗ 𝑒 12
35831808
𝑃(𝑋 = 11) =
1925 ∗ 𝑒 12
𝒙 = 𝟏𝟐
𝑒 −12 ∗ 1212
𝑃(𝑋 = 12) =
12!
1212
𝑃(𝑋 = 12) =
12! ∗ 𝑒 12
1212
𝑃(𝑋 = 12) =
479001600 ∗ 𝑒 12
8916100448256
𝑃(𝑋 = 12) =
479001600 ∗ 𝑒 12
(248832) ÷ 8916100448256
𝑃(𝑋 = 12) =
(248832) ÷ 479001600 ∗ 𝑒 12
35831808
𝑃(𝑋 = 12) =
1925 ∗ 𝑒 12
Sumando
𝜆 = 12
𝑋 < 12
+ 𝑃(𝑋 = 11)
+ 0.1143
𝑥 = {12,13,14,15}
𝒙 = 𝟏𝟐
𝒙 = 𝟏𝟑
𝑒 −12 ∗ 1213
𝑃(𝑋 = 13) =
13!
1213
𝑃(𝑋 = 13) =
13! ∗ 𝑒 12
1213
𝑃(𝑋 = 13) =
6227020800 ∗ 𝑒 12
106993205379072
𝑃(12 ≤ 𝑋 ≤ 15) 𝑃(𝑋 = 13) =
6227020800 ∗ 𝑒 12
= 𝑃(𝑋 = 12) + 𝑃(𝑋 = 13)
Cancelando el factor común 248832
+ 𝑃(𝑋 = 14) + 𝑃(𝑋 = 15) (248832) ÷ 106993205379072
𝑃(𝑋 = 13) =
(248832) ÷ 6227020800 ∗ 𝑒 12
429981696
𝑃(𝑋 = 13) =
25025 ∗ 𝑒 12
𝒙 = 𝟏𝟒
𝑒 −12 ∗ 1214
𝑃(𝑋 = 14) =
14!
1214
𝑃(𝑋 = 14) =
14! ∗ 𝑒 12
1214
𝑃(𝑋 = 14) =
87178291200 ∗ 𝑒 12
1283918464548864
𝑃(𝑋 = 14) =
87178291200 ∗ 𝑒 12
(497664) ÷ 1283918464548864
𝑃(𝑋 = 14) =
(497664) ÷ 87178291200 ∗ 𝑒 12
2579890176
𝑃(𝑋 = 14) =
175175 ∗ 𝑒 12
𝒙 = 𝟏𝟓
𝑒 −12 ∗ 1215
𝑃(𝑋 = 15) =
15!
1215
𝑃(𝑋 = 15) =
15! ∗ 𝑒 12
1215
𝑃(𝑋 = 15) =
1307674368000 ∗ 𝑒 12
15407021574586368
𝑃(𝑋 = 15) =
1307674368000 ∗ 𝑒 12
(1492992) ÷ 15407021574586368
𝑃(𝑋 = 15) =
(1492992) ÷ 1307674368000 ∗ 𝑒 12
10319560704
𝑃(𝑋 = 15) =
875875 ∗ 𝑒 12
Sumando
𝑃(12 ≤ 𝑋 ≤ 15) = 𝑃(𝑋 = 12) + 𝑃(𝑋 = 13) + 𝑃(𝑋 = 14) + 𝑃(𝑋 = 15)
un área forestal específica. Según estudios previos, se tiene una media esperada de 25 metros
para la altura de los árboles en esta región. Los estudiantes de bioestadística deberán determinar
Se proporciona a los estudiantes una muestra de tamaño n (número de árboles) con las
24.5 26.2 25.8 23.9 25.3 26.5 25.1 24.7 25.6 25.9
Datos iniciales: 24.5, 26.2, 25.8, 23.9, 25.3, 26.5, 25.1, 24.7, 25.6, 25.9
Basándose en la fórmula:
(𝑥̅ − 𝜇)
𝑡= 𝑠
√𝑛
Donde:
• 𝑛 es el tamaño de la muestra
∑ 𝑥𝑖 24.5, 26.2, 25.8, 23.9, 25.3, 26.5, 25.1, 24.7, 25.6, 25.9
Ẋ= = = 25.35
𝑛 10
∑( 𝑥𝑖 − 𝑥̅ )2
𝑠=√
𝑛−1
𝑥𝑖 𝑥𝑖 − 𝑥̅ (𝑥𝑖 − 𝑥̅ )2
+ 0.0625 + 0.3025
Cálculo:
5.925 5.925
𝑠=√ =√
𝑛−1 9
𝑠 = √0.6583 = 0.8114
Media muestral Ẋ.25.35m
la media esperada 𝜇 = 25
de la media esperada. 𝜇 ≠ 25
c) Realice el cálculo necesario para obtener el valor del estadístico de prueba (t) utilizando.
Fórmula:
𝑥̅ − 𝜇
𝑡= 𝑠
√𝑛
25.35 − 25
𝑡=
0.8114
√10
0.35
𝑡= = 1.3641
0.2567
𝑑𝑓 = 𝑛 − 1 = 10 − 1 = 9
e) Utilizando una tabla t de Student o software estadístico, encuentre el valor crítico de t
• 𝐺𝑟𝑎𝑑𝑜𝑠 𝑑𝑒 𝑙𝑖𝑏𝑒𝑟𝑡𝑎𝑑: 𝑑𝑓 = 9
f) Interprete los resultados y llegue a una conclusión sobre si la altura promedio de los
25 metros.
𝑡 = 1.3641
Esto es menor del valor critico 𝑡𝑐𝑟𝑖𝑡𝑖𝑐𝑜 = ±2.2622 por lo tanto no rechazamos la
hipótesis nula.
Conclusión
No hay evidencia suficiente para concluir que la altura promedio de los árboles en el
aleatoriamente 10 unidades experimentales para cada tratamiento y se midió la altura final de los
árboles después de 6 meses. Los datos de altura final (en cm) obtenidos son los siguientes:
Pruebe la hipótesis nula de no diferencia en los efectos de los tratamientos y pruebe si existen
A B C D
82 78 75 84
85 80 76 85
88 81 78 82
90 79 79 86
83 82 77 83
86 83 80 88
87 77 81 85
89 85 79 87
84 79 82 89
91 84 80 90
Nota: En la tabla se muestran las medidas en metros tomada de los árboles en cada tratamiento
de fertilización aplicado
Hipótesis nula (𝑯𝟎 ): No se tienen diferencias significativas entre las alturas promedio
𝐻0 : 𝜇1 + 𝜇2 + 𝜇3 = 𝜇4
Hipótesis alternativa (𝑯𝟏 ): Hay al menos una altura de los árboles que es diferente.
factor. Describa, con base en los supuestos de esta, porqué es el estadístico de prueba más
apropiado (revisar los supuestos o requerimiento de los datos que exige este tipo de
pruebas)
d) Realice los cálculos correspondientes, es decir la tabla que relacione los cálculos
incluyendo: suma de cuadrados total (TSS), suma de cuadrados del factor (SST); Suma
A 865 10 86.5
B 808 10 80.8
C 787 10 78.7
D 859 10 85.9
+ (86 − 82.975)2 + (87 − 82.975)2 + (89 − 82.975)2 + (84 − 82.975)2 + (91 − 82.975)2 )
+ ((78 − 82.975)2 + (80 − 82.975)2 + (81 − 82.975)2 + (79 − 82.975)2 + (82 − 82.975)2
+ (83 − 82.975)2 + (77 − 82.975)2 + (85 − 82.975)2 + (79 − 82.975)2 + (84 − 82.975)2 )
+ ((75 − 82.975)2 + (76 − 82.975)2 + (78 − 82.975)2 + (79 − 82.975)2 + (77 − 82.975)2
+ (80 − 82.975)2 + (81 − 82.975)2 + (79 − 82.975)2 + (82 − 82.975)2 + (80 − 82.975)2 )
+ ((84 − 82.975)2 + (85 − 82.975)2 + (82 − 82.975)2 + (86 − 82.975)2 + (83 − 82.975)2
+ (88 − 82.975)2 + (85 − 82.975)2 + (87 − 82.975)2 + (89 − 82.975)2 + (90 − 82.975)2 )}
∑{(0.95 + 4.10 + 25.25 + 49.35 + 0.000625 + 9.15 + 16.20 + 36.30 + 1.050 + 64.40
∑ = 690.95 𝑇𝑆𝑆
• SST: Suma de Cuadrados del Factor: Suma de los cuadrados de las desviaciones
de la media de cada tratamiento con respecto a la media general.
∗ (85.9 − 82.975)2 }
∑ = 439.87 𝑆𝑆𝑇
∑{((82 − 86.5)2 + (85 − 86.5)2 + (88 − 86.5)2 + (90 − 86.5)2 + (83 − 86.5)2 + (86 − 86.5)2
+ ((78 − 80.8)2 + (80 − 80.8)2 + (81 − 80.8)2 + (79 − 80.8)2 + (82 − 80.8)2
+ (83 − 80.8)2 + (77 − 80.8)2 + (85 − 80.8)2 + (79 − 80.8)2 + (84 − 80.8)2 )
+ ((75 − 78.7)2 + (76 − 78.7)2 + (78 − 78.7)2 + (79 − 78.7)2 + (77 − 78.7)2
+ (80 − 78.7)2 + (81 − 78.7)2 + (79 − 78.7)2 + (82 − 78.7)2 + (80 − 78.7)2 )
+ ((84 − 85.9)2 + (85 − 85.9)2 + (82 − 85.9)2 + (86 − 85.9)2 + (83 − 85.9)2
+ (88 − 85.9)2 + (85 − 85.9)2 + (87 − 85.9)2 + (89 − 85.9)2 + (90 − 85.9)2 )}
∑{(20.25 + 2.25 + 2.25 + 12.25 + 12.25 + 0.25 + 0.25 + 6.25 + 6.25 + 20.25 + 7.84
+ 0.64 + 0.04 + 3.24 + 1.44 + 4.84 + 14.44 + 17.64 + 3.24 + 10.24 + 13.69
+ 7.29 + 0.49 + 72.25 + 0.09 + 2.89 + 1.69 + 5.29 + 0.09 + 10.89 + 1.69
+ 3.61 + 0.81 + 15.21 + 0.01 + 8.41 + 4.41 + 0.81 + 1.21 + 9.61 + 16.81)}
∑ = 251.1 𝑆𝑆𝐸
40 − 1 = 39
𝑆𝑆𝑇𝑔𝑙 = 4 − 1 = 3
𝑆𝑆𝐸𝑔𝑙 = 39 − 3 = 36
• Cuadrados medios:
𝑇𝑆𝑆
𝐶𝑀𝑇𝑆𝑆 =
𝑆𝑢𝑚𝑎 𝑑𝑒 𝐶𝑢𝑎𝑑𝑟𝑎𝑑𝑜𝑠 𝑇𝑜𝑡𝑎𝑙𝑒𝑠
690.95
𝐶𝑀𝑇𝑆𝑆 =
39
𝐶𝑀𝑇𝑆𝑆 = 17.71
𝑆𝑆𝑇
𝐶𝑀𝑆𝑆𝑇 =
𝑆𝑆𝑇𝑔𝑙
439.87
𝐶𝑀𝑆𝑆𝑇 =
3
𝐶𝑀𝑆𝑆𝑇 = 146.62
𝑆𝑆𝐸
𝐶𝑀𝑆𝑆𝐸 =
𝑆𝑆𝐸𝑔𝑙
251.1
𝐶𝑀𝑆𝑆𝐸 =
36
𝐶𝑀𝑆𝑆𝐸 = 6.975
𝐶𝑀𝑆𝑆𝑇
𝐹 − 𝑟𝑎𝑡𝑖𝑜 =
𝐶𝑀𝑆𝑆𝐸
146.62
𝐹 − 𝑟𝑎𝑡𝑖𝑜 =
6.975
𝐹 − 𝑟𝑎𝑡𝑖𝑜 = 21.02
e) Subraye el valor de probabilidad (P) obtenido y tome una decisión con base en este.
escribe cuando se concluye con base en los datos estadísticos, no es igual que con las
hipótesis de investigación).
existe evidencia estadística suficiente para concluir que al menos uno de los tratamientos
El valor de P asociado al 𝐹𝑐𝑎𝑙𝑐𝑢𝑙𝑎𝑑𝑜 = 21.02 es bastante grande, así que es probable que
Así que el valor 𝑝 = 4.83 ∗ 10−18 , mucho menor que el nivel de significancia
establecido, por lo tanto, se rechaza la hipótesis nula (𝐻0 ), indicando que existen
diferencias significativas en las alturas promedio de los árboles entre los diferentes
tratamientos.
Conclusiones
interpretación de datos.
Por otro lado, el ANOVA resultó ser una herramienta eficaz para evaluar diferencias
Artículo:
Fernández, L., Lara, A. M., Pereyra, A. M., Guerra, W., & Calzadilla, de. (2024). Estadística
00542013000200014&script=sci_arttext&tlng=en
Otras referencias:
[Link]
121%211908&cid=57ACC56615534121
[Link]