Bioestadistica
Bioestadistica
ESCUELA DE POSGRADO
CURSO:
BIOESTADISTICA
cletounsaac@[Link]
ABANCAY – PERU
2019
1
Bioestadística. Dr. Cleto De La Torre Dueñas
CONTENIDO
CAPITULO I:
INTRODUCCION
CAPITULO II:
ORGANIZACIÓN Y PRESENTACIÓN DE DATOS.
CAPITULO III:
MEDIDAS DESCRIPTIVAS DE UNA DISTRIBUCIÓN DE DATOS.
CAPITULO IV:
DISTRIBUCIONES BIDIMENSIONALES
CAPITULO V:
PROBABILIDADES
CAPITULO VI:
VARIABLE ALEATORIA Y DISTRIBUCIONES DE PROBABILIDAD.
CAPITULO VII:
INTRODUCCION AL MUESTREO
CAPITULO VIII:
ESTIMACION POR INTERVALOS Y PRUEBAS DE HIPOTESIS
CAPITULO IX:
PRUEBA DE CHI-CUADRADO
CAPITULO X:
DISEÑO EXPERIMENTAL
CAPITULO XI:
ANEXOS.
2
Bioestadística. Dr. Cleto De La Torre Dueñas
CAPITULO I
INTRODUCCION
3
Bioestadística. Dr. Cleto De La Torre Dueñas
Muestra Inferencias
Población
4
Bioestadística. Dr. Cleto De La Torre Dueñas
Tipos de variables.
Las variables estadísticas pueden ser de dos tipos:
Variables cualitativas o atributos: describen cualidades y no toman valores
numéricos, estas a su vez pueden ser:
Nominales.- Las cualidades no presentan ningún orden. Ejemplo Sexo de
estudiantes.
Ordinales.- Este tipo de variables presentan orden
Ejemplo: Nivel de estudios.
Variables cuantitativas: toman valores numéricos. A su vez pueden ser:
• Discretas: Solo toman un número finito o infinito numerable de valores
distintos (generalmente números naturales o enteros). Ejemplos: numero de
compras de un producto en un mes, el año de fabricación de un vehiculo,
numero de entradas de cine vendidas en un intervalo de tiempo, resultado
de lanzar un dado, numero de hijos,. . .
• Continuas: Toman valores en un intervalo. Generalmente corresponden a
medir magnitudes continuas, por ejemplo, peso, altura, temperatura,
intensidad de corriente, el tiempo entre dos llamadas telefónicas, el tiempo
de servicio o de operación de una maquina, etc.
5
Bioestadística. Dr. Cleto De La Torre Dueñas
Una característica esencial de este tipo de variables es que sus valores nunca
son observables con exactitud, sino que dependen (las observaciones) de la
precisión del instrumento de medida.
1.4 MEDICION
Se llama medición al proceso de atribuir números a las características.
Tenemos las siguientes escalas de medición: nominales, ordinales,
cuantitativas de intervalo y cuantitativas de razón.
Escala de Intervalo.- Aquí los números para clasificar los objetos representan
también incrementos iguales del atributo que se esta midiendo. Esto significa
que los números pueden ser comparados. La diferencia en 1 y 2 es la misma
6
Bioestadística. Dr. Cleto De La Torre Dueñas
7
Bioestadística. Dr. Cleto De La Torre Dueñas
Grado de
Relaciones “mayor Funciones
Ordinal toxicidad, nivel
que” o “igual que” crecientes
socioeconómico.
Igualdad o Parametricas.
Temperatura,
Intervalo desigualdad de A + b.x (b 0)
inteligencia
diferencias
Tiempo de
Igualdad o
tratamiento,
Razón desigualdad de B .x (b 0)
Número de
razones
fármacos.
8
Bioestadística. Dr. Cleto De La Torre Dueñas
9
Bioestadística. Dr. Cleto De La Torre Dueñas
10
Bioestadística. Dr. Cleto De La Torre Dueñas
11
Bioestadística. Dr. Cleto De La Torre Dueñas
PM--------------------I----------------------I----------------------I------------------PT
Ejemplo:
( ) Definitivamente sí
( ) Probablemente sí
( ) Indeciso
( ) Probablemente no
( ) Definitivamente no
12
Bioestadística. Dr. Cleto De La Torre Dueñas
Ejemplo
El director del hospital se preocupa por el bienestar del recurso humano.
Categorías de Frecuencia Porcentaje Asignación de
Respuesta puntajes
Totalmente de 2 4.4% 2(5)
acuerdo
De acuerdo 4 9% 4(4)
Indeciso 7 15.6% 7(3)
En desacuerdo 9 20% 9(2)
Totalmente en 23 51% 23(1)
desacuerdo
N=45 100% Total=88
Promedio=1.95
13
Bioestadística. Dr. Cleto De La Torre Dueñas
TIPOS DE INVESTIGACION:
Nivel o Tipo de Investigación el cual se presenta de acuerdo a la finalidad o
propósito, al alcance, amplitud, profundidad, fuentes, lugar donde se
desarrolla y a la naturaleza del estudio.
14
Bioestadística. Dr. Cleto De La Torre Dueñas
15
Bioestadística. Dr. Cleto De La Torre Dueñas
las vacunas. Tanto en los estudios clínicos como en los de campo, se busca
que el sujeto desconozca lo que se le está aplicando, y que de ser posible,
la persona que está en contacto directo con los sujetos también lo
desconozca. Esto disminuye un error, que en estadística se conoce como
sesgo (bias). Estos estudios se conocen como doble ciego.
5. Estudios prospectivos. En estos estudios, no se aplica tratamiento. Los
más comunes son del tipo de panel donde se toman mediciones repetidas
sobre los mismos individuos en un determinado período de tiempo.
6. Estudio de casos. Se estudian casos de pacientes que ya fueron
diagnosticados con la enfermedad, y se busca encontrar la causas
probables que la pudieron ocasionar.
3. Recopilación de datos.
Dentro de un proceso de investigación una de las actividades que se
realizan es la recopilación de datos, la cual es el acopio de información y se
16
Bioestadística. Dr. Cleto De La Torre Dueñas
17
Bioestadística. Dr. Cleto De La Torre Dueñas
18
Bioestadística. Dr. Cleto De La Torre Dueñas
6. Interpretación y decisión.
Consiste en la fase final del estudio la cual determinará si una solución es
adecuada o no, dependiendo de los resultados obtenidos.
19
Bioestadística. Dr. Cleto De La Torre Dueñas
CAPITULO II
ORGANIZACIÓN Y PRESENTACIÓN DE DATOS.
20
Bioestadística. Dr. Cleto De La Torre Dueñas
f
i 1
i f 1 f 2 ...... fk n
Fi
H i h1 h 2 ...... hi , Hi
n
Una tabla de frecuencias tiene la siguiente estructura:
GRAFICAS.
21
Bioestadística. Dr. Cleto De La Torre Dueñas
22
Bioestadística. Dr. Cleto De La Torre Dueñas
creciente en lugar de las categorías, sobre cada valor levantamos una barra
de altura igual a la frecuencia (absoluta o relativa).
Diagrama de Pareto.
Se ordenan las categorías de mayor a menor importancia y se dibujan los
rectángulos correspondientes.
Diagrama de sectores.
Es el más usual en variables cualitativas. Se representan mediante
círculos. A cada valor de la variable se le asocia el sector circular
proporcional a su frecuencia.
Para hallar el ángulo usamos la siguiente proporción: al tener una
circunferencia 360º, el cociente entre la frecuencia absoluta (o relativa) total y
la frecuencia absoluta (o relativa) que queramos representar será igual al
cociente entre los 360º de la circunferencia y el ángulo a determinar, así :
n 360º 1 360º
fi hi
Pictogramas.
Expresan con dibujos alusivos al tema de estudio las frecuencias de las
modalidades de la variable. La escala de los dibujos debe ser tal que el área
de cada uno de ellos sea proporcional a la frecuencia de la modalidad que
representa.
23
Bioestadística. Dr. Cleto De La Torre Dueñas
DISCRETAS
Una vez obtenida una muestra de cualquier población y observados los
valores que toma la variable en los individuos de la muestra, estos valores se
suelen ordenar. Si la variable es cuantitativa la ordenación será de menor a
mayor.
Dada una variable X, consideramos una muestra de tamaño n que toma k
valores distintos, x1, . . . , xk (x1 < x2 < . . . < xk).
La organización es en forma similar al caso cualitativo.
Observaciones
Los datos iniciales se pueden representar utilizando los gráficos.
Diagrama de cajas(box-plot)
Presentación visual que describe al mismo tiempo varias características
importantes de un conjunto de datos, tales como el centro, la dispersión, el
alejamiento de la simetría, y la identificación de valores extremos (puntos
atípicos), es decir, de valores que se alejan de una manera poco usual del
resto de los datos. Presenta los tres cuartiles, (y los valores mínimos y
24
Bioestadística. Dr. Cleto De La Torre Dueñas
25
Bioestadística. Dr. Cleto De La Torre Dueñas
………………………..
LI i LSi
Determinación de las marcas de clase, mi
2
Donde LI : Limite inferior
LS : Limite superior.
Realizar la clasificación y el conteo de datos en cada clase construida.
26
Bioestadística. Dr. Cleto De La Torre Dueñas
Histograma de frecuencias
Un histograma es la representación más frecuente con datos agrupados, se
construye a partir de la tabla estadística, representando sobre cada intervalo,
un rectángulo que tiene a este segmento como base. El criterio para calcular
la altura de cada rectángulo es el de mantener la proporcionalidad entre las
frecuencias absolutas (o relativas) de cada intervalo y el área de los mismos.
Polígono de frecuencias
El polígono se construye fácilmente si tenemos representado previamente el
histograma, ya que consiste en unir mediante líneas rectas los puntos del
histograma que corresponden a las marcas de clase. Para representar el
polígono de frecuencias en el primer y último intervalo, suponemos que
adyacentes a ellos existen otros intervalos de la misma amplitud y frecuencia
nula, y se unen por una línea recta los puntos del histograma que
corresponden a sus marcas de clase.
Curva de frecuencias.
Resulta de suavizar el polígono de frecuencias, en sus puntos angulosos.
Ojivas
Resumen de graficos.
Variable Tipo Grafico
Cualitativa Nominal Sectores circulares,
Ordinal barras, pictogramas,
pareto.
Cuantitativa Discreta Bastones, barras.
Continua Histogramas, polígonos
de frecuencia, Ojivas,
Grafico de cajas.
27
Bioestadística. Dr. Cleto De La Torre Dueñas
Prevalecía
Es una valoración Puntual y estática (Fotografía instantánea) de la frecuencia
(Proporción) de una enfermedad en una población.
La prevalecía refleja el número de casos de una enfermedad determinada o de
otra situación en una población y en un momento dado.
Prevalecía= N o de Enfermos/Población
Grupo 1 2 3 4 5 6 Total
1 10 1 2 1 0 1 15
2 6 1 2 1 0 10
3 11 1 0 3 15
4 8 1 1 10
5 10 5 15
6 10 10
Total 10 7 14 12 12 20 75
28
Bioestadística. Dr. Cleto De La Torre Dueñas
Incidencia.
Es una valoración dinámica de la enfermedad en la población (Película)
Tiene una doble acepción como un indicador de la velocidad de difusión de la
enfermedad (Incidencia Verdadera) o como un estimador de riesgo (Incidencia
Acumulada)
EJERCICIOS RESUELTOS
29
Bioestadística. Dr. Cleto De La Torre Dueñas
LI - LS mi fi Fi hi= fi/n pi Hi
[12.2 – 14.2) 13.2 2.22
2 2 0.02 0.02
[14.2 – 16.2) 15.2 6.67
6 8 0.07 0.09
[16.2 – 18.2) 17.2 20
18 26 0.2 0.29
[18.2 – 20.2) 19.2 40
36 62 0.4 0.69
[20.2 – 22.2) 21.2 17.8
16 78 0.18 0.87
[22. 2– 24.2) 23.2 10
9 87 0.1 0.97
[24.2 – 26.2) 25.2 3.33
3 90 0.03 1
30
Bioestadística. Dr. Cleto De La Torre Dueñas
Histogram
40
30
Porcentaje
20
10
0
12 15 18 21 24 27
hemoglobina en la sangre
Grupo Sanguíneo. fi hi Pi
A 10
0.27 27.03
AB 4
0.108 10.81
B 8
0.216 21.62
0 15
0.405 40.54
Total n=37 1 100
31
Bioestadística. Dr. Cleto De La Torre Dueñas
50
40
percentage
30
20
10
0
A AB B O
27.03%
Grupo Sanguineo
40.54% A
AB
B
{[}
O
{\}
{]}
10.81%
{^}
{_}
{`}
21.62%
Frecuencia Porcentaje
cefaleas 20 25.0
mareos 11 13.8
nauseas 5 6.3
vómitos 13 16.3
dolores estomacales 16 20.0
sueño 2 2.5
sudoración 4 5.0
alergias 2 2.5
Otros ( edemas, taquicardia,
7 8.8
diarreas)
Total 80 100.0
32
Bioestadística. Dr. Cleto De La Torre Dueñas
25
20
15
Porcentaje
10
0
cefaleas mareos nauseas vómitos dolores sueño sudoración alergias Otros
estom.
Conocimiento
Frecuencia Porcentaje
Deficiente 26 63.4
Regular 8 19.5
Bueno 7 17.1
Total 41 100.0
33
Bioestadística. Dr. Cleto De La Torre Dueñas
60,0%
Porcentaje
40,0%
20,0%
0,0%
Deficiente Regular Bueno
Conocimiento
34
Bioestadística. Dr. Cleto De La Torre Dueñas
Sexo
Masculino Femenino
8,00 8,00
6,00 6,00
Edad
Edad
4,00 4,00
2,00 2,00
0,00 0,00
600 500 400 300 200 100 0 100 200 300 400 500 600
Frecuencia
EJERCICIOS PROPUESTOS
35
Bioestadística. Dr. Cleto De La Torre Dueñas
36
Bioestadística. Dr. Cleto De La Torre Dueñas
37
Bioestadística. Dr. Cleto De La Torre Dueñas
38
Bioestadística. Dr. Cleto De La Torre Dueñas
39
Bioestadística. Dr. Cleto De La Torre Dueñas
6.- Los datos siguientes representan en kilos los pesos de 36 niños hospitalizados
en una Clínica en Agosto de 2007 los que fueron obtenidos con dos
instrumentos diferentes:
INSTRUMENTO 1
4.15 4.27 4.62 4.68 4.68 4.80 4.86 4.92 4.98 5.15 5.15 5.27
5.27 5.33 5.33 5.33 5.39 5.45 5.51 5.51 5.57 5.63 5.63 5.63
5.63 5.74 5.86 5.86 6.04 6.10 6.33 6.75 6.92 6.98 6.98 7.10
INSTRUMENTO 2
5.86 6.02 6.02 6.10 6.18 6.26 6.26 6.34 6.34 6.34 6.42 6.58
6.58 6.58 6.58 6.66 6.66 6.66 6.74 6.74 6.74 6.82 6.82 6.90
6.90 7.06 7.06 7.14 7.22 7.22 7.30 7.38 7.54 7.70 7.94 8.02
40
Bioestadística. Dr. Cleto De La Torre Dueñas
b) Construya una tabla de frecuencias completa para los datos proporcionados por
cada instrumento escribiéndole un título y entregue la siguiente información a
la nutricionista:
i) El número de niños, pesados con el instrumento 1, que pesó a lo más 6 kilos.
ii) El número de niños, pesados con el instrumento 1,cuyo peso fue mayor a 4.89
kilos.
iii) El número de niños, pesados con el instrumento 2, cuyo peso fue menor o igual
a 7.48 kilos.
iv) El porcentaje de niños, pesados con el instrumento 2, cuyo peso fue mayor a
6.67 kilos.
c) Calcule la media aritmética, media geométrica y media armónica en ambos
grupos y compare los resultados.
d) Si el 15% de los niños son considerados obesos.¿Cuál será su peso mínimo
entregado por ambos instrumentos?
8.- El espectro de masa de una muestra de óxido de plomo contiene iones de fórmula
Pb0. El óxido de plomo ha sido preparado a partir de 16O isotópicamente puro.
Las masas de los iones en gramos por mol, se listan a continuación:
220.03 220.90 226.92 225.20 216.80 229.56
222.15 232.11 235.00 223.50 224.30 227.23
224.78 218.45 231.45 222.62 228.56 224.05
230.30 215.00 223.06 228.92 223.82 230.82
225.62 229.10 224.05 232.50 221.95 218.42
41
Bioestadística. Dr. Cleto De La Torre Dueñas
10.- A un grupo de alumnos se les aplico una prueba de inteligencia, estos han
sido:
87 105 88 103 114 125 108 107 118 114 129 100 106 113 105 111 94
115 89 82 141 92 132 112 97 135 101 104 130 99 114 91 145 95
101 115 104 87 108 115 103 132 110 113 102 109 124 98 140 107 93
108 122 117 114 141 116 108 102 101 118 138 99 105 112 94 96 132
118 123 108 131 127 100 91
a) Agrupe los datos en y confeccione una tabla de frecuencias
b) Traze las graficas adecuadas.
42
Bioestadística. Dr. Cleto De La Torre Dueñas
CAPITULO III
MEDIDAS DESCRIPTIVAS DE UNA DISTRIBUCIÓN DE
DATOS.
Las técnicas estudiadas anteriormente permiten una descripción visual de la
distribución de una variable. En muchos casos, el resumen puede hacerse
eficazmente de una forma más sencilla y precisa: utilizando valores numéricos que
den idea de la ubicación o del centro de los datos -medidas de posición- usando
cantidades que informen de la concentración de las observaciones alrededor de
dicho centro -medidas de dispersión- y mediante números que reflejen la forma
(asimetría y apuntamiento) de la distribución -medidas de forma.
La conjunción de técnicas numéricas y gráficas permite una buena descripción de
la variable.
Los estadísticos resúmenes tratan de reflejar numéricamente distintos aspectos de
la variable en estudio. Podemos distinguir 4 aspectos o características principales
que pueden resumirse en una distribución. (Ver cuadro siguiente)
43
Bioestadística. Dr. Cleto De La Torre Dueñas
Media, ( x )
x1 x 2 ..... xn x i
x i 1
n n
f 1 x1 f 2 x 2 ..... fkxk k
x xi hi
n i 1
Si los datos están agrupados por intervalos, para hallar la media tomamos la
marca de las clases,
f 1m1 f 2 m 2 ..... fkmk k
x hi mi
n i 1
44
Bioestadística. Dr. Cleto De La Torre Dueñas
Mediana, (Me)
Se calcula para variables cuantitativas; es el valor de la serie de datos que se
sitúa justamente en el centro de la muestra una vez se ha ordenado ésta,
corresponde a un 50% de valores son inferiores y otro 50% son superiores.
Me x n 1 , para n impar
2
x n x n
1
Me 2 2
, Si n es par.
2
n
2 Fi 1 0.5 H i 1
Me LI A LI A
f i hi
La mediana sólo tiene en cuenta la posición de los valores en la muestra y por lo
tanto tiene mejor comportamiento que la media cuando hay observaciones
anómalas.
45
Bioestadística. Dr. Cleto De La Torre Dueñas
Moda, (Mo)
Es el valor con mayor frecuencia. Si hay más de una moda, la variable se dice
multimodal y puede calcularse para cualquier tipo de variable (Cuantitativas o
cualitativas).
Si los datos están agrupados hablamos de clase modal y será aquella para la que la
frecuencia absoluta sea mayor.
1 fi fi 1
Mo LI A LI A
1 2 fi fi 1 fi fi 1
Donde:
1 fi fi 1
1 fi fi 1
46
Bioestadística. Dr. Cleto De La Torre Dueñas
Clases de Distribuciones
Distribución Simétrica se presenta si todas las observaciones están concentradas
en un solo valor de la variable, en este caso la media, mediana y moda
coincidirían en el mismo.
x Me Mo
47
Bioestadística. Dr. Cleto De La Torre Dueñas
i.n
4 Fk 1
Qi LI i A
fk
- Q1, primer cuartil, al menos el 25% de los datos son menores o iguales
que él y al menos el 75% de los datos son mayores o iguales que él.
- Q2, segundo cuartil, es la mediana, Q2 = Me.
- Q3, tercer cuartil, al menos el 75% de los datos son menores o iguales que
él y al menos el 25% de los datos son mayores o iguales que él.
Percentiles
Dividen la muestra ordenada en 100 partes iguales.
i.n
100 Fk 1
Pi LI i A
f k
Deciles
Dividen el conjunto de datos en 10 partes iguales y se denota con D i , i=1,…9
i.n
10 Fk 1
Di LI i A
fk
48
Bioestadística. Dr. Cleto De La Torre Dueñas
Varianza.
Sólo tienen sentido para variables cuantitativas y se define:
n n
xi x x
2 2
i
S2 i 1
i 1
x 2 , Para datos no tabulados.
n n
n n
xi x fi fx
2 2
i i
S2 i 1
i 1
x 2 , Para datos tabulados de variable discreta
n n
49
Bioestadística. Dr. Cleto De La Torre Dueñas
n n
m x fm
2 2
i fi i i
S2 i 1
i 1
x 2 , Para datos tabulados por intervalos, para
n n
variables continuas.
Observaciones sobre la varianza:
Las unidades de la varianza son los cuadrados de las unidades de los datos
y en muchas ocasiones no son fáciles de interpretar.
Puede sufrir un cambio desproporcionado por la existencia de valores
extremos en el conjunto.
s s2
La desviación típica poblacional suele denotarse por .
Observaciones sobre la desviación típica:
Nos permite determinar con mayor grado de precisión dónde se sitúan los
valores de una distribución de frecuencia en relación con la media.
Las unidades de la desviación típica se expresan en las mismas unidades de
los datos.
Puede sufrir un cambio desproporcionado por la existencia de valores
extremos en el conjunto.
Variables tipificadas
Los distintos conjuntos de datos están asociados por lo general a diferentes
medias, ya sea porque son de naturaleza diferente (escalas de medidas
diferentes). Con el propósito de reducir los datos a un mismo punto de
referencia y a una escala común, se realiza entre ellos una transformación
llamada tipificación.
Se conoce por tipificación de una variable “x” a efectuar el cambio de origen
y de escala de la variable.
50
Bioestadística. Dr. Cleto De La Torre Dueñas
xx
z s para muestras
Fórmulas:
z x - para población
Ejemplo:
Un medico del Hospital Regional obtuvo 84 puntos en el test de aplicación de
protocolos de salud, en el que la nota media fue 76, y la desviación típica 10;
Otro medico del Hospital Antonio Lorena obtuvo 90 puntos, siendo la media
82 y la desviación típica 16. ¿ Cual de los médicos aplica mejor los protocolos
de Salud?.
Medico del HR Medico del HAL
x = 76 x = 82
s = 10 s = 16
x = 84 x = 90
84 76 90 82
z= 0,8 z= 0,5
10 16
Sobresalió más el Medico del Hospital Regional.
51
Bioestadística. Dr. Cleto De La Torre Dueñas
Recorrido o rango
Es la diferencia entre el mayor y menor valor de una muestra.
R x max x min
52
Bioestadística. Dr. Cleto De La Torre Dueñas
positiva
Ap 0 , entonces la media menor que la moda, asimetría a la izquierda
negativa.
53
Bioestadística. Dr. Cleto De La Torre Dueñas
EJERCICIOS RESUELTOS.
54
Bioestadística. Dr. Cleto De La Torre Dueñas
SOLUCION:
La variable de estudio es el cociente intelectual (X)
xi fi fi x i fixi2 Fi Hi
70 4 280 19600 4 0.0083
74 9 666 49284 13 0.0271
78 16 1248 97344 29 0.0604
82 28 2296 188272 57 0.1188
86 45 3870 332820 102 0.2125
90 66 5940 534600 168 0.35
94 85 7990 751060 253 0.5271
98 72 7056 691488 325 0.6771
102 54 5508 561816 379 0.7896
106 38 4028 426968 417 0.8688
110 27 2970 326700 444 0.925
114 18 2052 233928 462 0.9625
118 11 1298 153164 473 0.9854
122 5 610 74420 478 0.9958
126 2 252 31752 480 1
1470 n=480 46064 4473216
a) Media
f 1 x1 f 2 x2 ..... fkxk 46064
x 95.96
n 480
b) Varianza y desviación.
n n
xi x fx
2 2
fi i i
4473216
95.96 110.88
2
S2 i 1
i 1
x2
n n 480
s 110.88 10.52
c) Mediana.
n=480 ( Par)
55
Bioestadística. Dr. Cleto De La Torre Dueñas
x n x n x 480 x 480
1
1 x 240 x 241 94 94
Me 2 2
2 2
94
2 2 2 2
d) Percentil 85
P85 106
e) Percentil 25
P25 90
2) Un investigador desea evaluar la efectividad de dos tipos de extracto como
antiinflamantes, medido en porcentajes. Los resultados de este estudio se
muestran a continuación.
Extracto Efectividad
1 2 3 4 5 6 7
A 57 55 54 52 62 55 59
B 80 40 62 72 46 80 40
56
Bioestadística. Dr. Cleto De La Torre Dueñas
a) Estadísticos de A.
n
x1 x 2 ..... xn
xi
394
xA i 1 56.28
n n 7
MeA x n 1 , para n impar n=7
2
MeA x n 1 x 7 1 x 4 55
2 2
MoA 55
Estadísticos de B.
n
x1 x 2 ..... xn x i
420
xB i 1
60
n n 7
MeB x n 1 , para n impar n=7
2
MeB x n 1 x 7 1 x 4 62
2 2
MoB1 40
MoB 2 80
b) Calcular la varianza
n n
x x x
2 2
i i
22244
S A2 i 1
i 1
xA2 (56.28) 2 10.27
n n 7
S 10.27
CVA 0.057
| X A | 56.28
n n
x x x
2 2
602 277.7
i i
27144
S B2 i 1
i 1
xB2
n n 7
S 277.7
CVB 0.277
| XB | 60
57
Bioestadística. Dr. Cleto De La Torre Dueñas
80
70
Efectividad
60
50
40
A B
Extracto
3.- En un estudio sobre la contaminación del aire efectuado por una estación
experimental, se recolectaron cantidades de benceno soluble suspendido en
materia orgánica (en microgramos por metro cúbico) en 24 diferentes muestras
de aire:
Cantidades de
benceno soluble Frecuencia
[0, 1> 2
[1, 2> 2
[2, 3> 3
[3, 4> 6
[4, 5> 7
[5, 6> 1
[6, 7> 1
[7, 8> 1
[8, 9> 1
58
Bioestadística. Dr. Cleto De La Torre Dueñas
SOLUCION:
I fi mi mifi mi2fi Fi
[0, 1> 2 0.5 1 0.5 2
[1, 2> 2 1.5 3 4.5 4
[2, 3> 3 2.5 7.5 18.75 7
[3, 4> 6 3.5 21 73.5 13
[4, 5> 7 4.5 31.5 141.75 20
[5, 6> 1 5.5 5.5 30.25 21
[6, 7> 1 6.5 6.5 42.25 22
[7, 8> 1 7.5 7.5 56.25 23
[8, 9> 1 8.5 8.5 72.25 24
Total 24 40.5 92 440
a) Media, varianza, desviación y coeficiente de variación.
Media.
fm i i
92
x 3.83
n 24
Varianza.
m 2
f
i i
440
S
2
x2 3.83 3.66
n 24
Desviación.
s 3.66 1.91
59
Bioestadística. Dr. Cleto De La Torre Dueñas
Coeficiente de Variación.
S 1.91
CV 0.498
| X | 3.83
Mediana
12 7
Me 3 *1 3.833
6
Moda
Mo Li 1 A
1 2
1 7 6 1
1 7 1 6
1
Mo 4 *1 4.14
1 6
60
Bioestadística. Dr. Cleto De La Torre Dueñas
SOLUCION:
Intervalo fi. Fi mi mifi mi2fi
0-5 10 10 2.5 25 62.5
5 -10 15 25 7.5 112.5 843.75
10-13 25 50 11.5 287.5 3306.25
13-18 8 58 15.5 124 1922
18-20 2 60 19 38 722
60 56 587 6856.5
a) Media y varianza
Media.
fm i i
587
x 9.78
n 60
Varianza.
m 2
f
i i
9.782 18.63
6856.5
S 2
x2
n 60
Desviación.
s 18.63 4.31
b) Mediana y moda
Mediana
n
2 F k 1
Me Li A
f K
n 60
Determinamos 30
2 2
n
2 F k 1 30 25
Me Li A 10 3 10.6
f K 25
Moda
61
Bioestadística. Dr. Cleto De La Torre Dueñas
Mo Li 1 A
1 2
1 25 15 10
1 25 8 17
10
Mo Li 1 A 10 3 11.11
1 2 10 17
i.n
4 F k 1
Qi Li A
f K
Cuartil 1
1.n
4 F k 1 15 10
Q1 Li A 5 5 6.67
f K 15
El 25% de los pacientes presentan niveles de depresión menores a 6.67
Cuartil 3
3.n
4 F k 1 45 25
Q3 Li A 10 3 12.4
fK 25
El nivel de depresión máximo del 75% de los pacientes es de 12.4.
i.n
100 F k 1
Pi Li A
f
K
62
Bioestadística. Dr. Cleto De La Torre Dueñas
Percentil 10
10.n
100 F k 1 60
P10 Li A 0 5 3
fK 10
El 10% de los pacientes tienen niveles de depresión entre 0 a 3
Percentil 90
90.n
100 F k 1 54 50
P90 Li A 13 5 15.5
fK 8
d) Coeficiente de Asimetría.
x M o 9.78 11.11
Ap -0.308
s 4.31
EJERCICIOS PROPUESTOS.
1. Un especialista esta diseñando tres terapias para tratar la depresión en
adolescentes, con tal fin aplica un test de depresión a 50 adolescentes, los
resultados básales se muestran a continuación.
63
Bioestadística. Dr. Cleto De La Torre Dueñas
2.- Los siguientes datos representan lecturas de presión sistólica ([Link].) en una
muestra de 41 sujetos hospitalizados en la Clínica Central el 1º Semestre de
2002.
138 164 150 132 144 125 149 157 146 158 140 147 136 148
152 149 168 126 138 176 163 119 154 165 146 173 142 147
135 153 153 140 135 161 145 135 142 150 156 145 128
64
Bioestadística. Dr. Cleto De La Torre Dueñas
2.- Un psicólogo desea evaluar la eficacia de dos terapias para tratar problemas de
estrés, para ello selecciona al azar 16 pacientes y forma aleatoriamente dos
grupos. El primer grupo de 8 pacientes fue tratado con la terapia A y el segundo
grupo de 8 pacientes con la terapia B. Al cabo de un tiempo se les mide su nivel
reducción de estrés en una escala de o a 120. Los resultados se muestran a
continuación:
Terapia A 50 40 60 40 60 50 35 25
Terapia B 60 70 60 80 60 50 80 70
En base a los resultados, cual de las terapias es más adecuado para los pacientes
que estén interesados en:
a).- Una efectiva mayor.
b).- Resultados similares de la terapia para todo el grupo.
4.- Los siguientes son los pesos en gramos (redondeados al gramo más próximo) de
30 ratones, de un ensayo realizado en un Laboratorio de Química usadas en un
estudio de deficiencias vitamínicas:
a) Construya una distribución de frecuencia con 6 clases que incluya límites dados y
reales.
b) Interprete la frecuencia absoluta de la clase 3.
c) Construya el polígono de frecuencias.
d) Se le pide a un analista experimentado la evaluación de dos métodos diferentes
para la determinación de trazas de plomo en ácido acético glacial, y se le entrega
una muestra que contiene precisamente 1.282 ppm. de Pb, por litro (dato
65
Bioestadística. Dr. Cleto De La Torre Dueñas
GRUPO A GRUPO B
k Intervalos Frecuencias nk k Intervalos Frecuencias nk
66
Bioestadística. Dr. Cleto De La Torre Dueñas
5.- Los casos de SIDA diagnosticados en un País en los últimos años vienen dados
en la siguiente tabla, clasificados por grupo de riesgo del paciente:
67
Bioestadística. Dr. Cleto De La Torre Dueñas
CAPITULO IV
DISTRIBUCIONES BIDIMENSIONALES
4.1 CUALITATIVA-CUALITATIVA.
Cuando las variables de estudio son cualitativas (categóricas) o cuantitativas
discretas con poca modalidades, se suele presentar las observaciones de las
variables X e Y, mediante pares ordenados (xi, yi), esta forma de
presentaciones se denomina tablas de contingencia. Las tablas de contingencia
son de doble entrada organizada por filas y columnas y donde se presenta la
distribución de frecuencias conjuntas de las dos variables.
Dada una variable bidimensional ( X, Y ), consideramos una muestra de
tamaño n en la que X toma k valores distintos, x1, . . . , xk, e Y toma l valores
distintos, y1, . . , yl, obtenemos, por tanto, observaciones del tipo (xi, yj).
f
i 1 j 1
ij n
68
Bioestadística. Dr. Cleto De La Torre Dueñas
k l
fij
hij
n
, se cumple: h
i 1 j 1
ij 1
Distribuciones marginales
Nos indican el comportamiento aislado de cada una de las variables X e Y que
dan lugar a una variable bidimensional.
Frecuencia absoluta marginal de xi,
l
fi. fi1 fi 2 fil fij
j 1
fi .
hi .
n
Frecuencia absoluta marginal de yj,
k
f . j f1 j f 2 j f kj fij
i 1
Y y1 y2 ..... yl ni.
X
x1 f11 f12 ..... f1l f1.
x2 f21 f22 ..... f2l f2.
.. .. .. ..... .. ..
69
Bioestadística. Dr. Cleto De La Torre Dueñas
Ejemplos.
Grado de Extracto
toxicidad A B C Total
Leve Frecuencia 40 25 10 75
Porcentaje 40.0% 26.3% 13.3% 27.8%
Moderada Frecuencia 25 55 5 85
Porcentaje 25.0% 57.9% 6.7% 31.5%
Severa Frecuencia 35 15 60 110
Porcentaje 35.0% 15.8% 80.0% 40.7%
Total Frecuencia 100 95 75 270
Porcentaje 100.0% 100.0% 100.0% 100.0%
70
Bioestadística. Dr. Cleto De La Torre Dueñas
60
50
Grado de toxicidad
Leve
Moderada
Severa
40
Recuento
30
20
10
0
A B C
Extracto
4.2 CUALITATIVA-CUANTITATIVA.
Supongamos que tenemos datos cuantitativos (numéricos) para varias
cualitativa (categorías), por ejemplo en un experimento donde hacemos
mediciones numéricas en dos o más grupos. En estos casos, lo que se realiza
es un estudio descriptivo de la variable numérica en cada una de las
muestras y se comparamos los resultados.
Ejemplo
1) Un investigador esta analizando el efecto de un grupo de tratamientos,
como desinflamante. El uso 5 tratamientos, en el cuadro siguiente se
muestra la disminución de la inflamación.
71
Bioestadística. Dr. Cleto De La Torre Dueñas
SOLUCION:
Variable tratamiento Mean StDev Variance CoefVar Median
reduccion Cloroformo 0.05430 0.01673 0.000280 30.82 0.05830
Etanol Absoluto 0.21 130 0.01643 0.000270 7.78 0.20330
Etanol 70% 0.17530 0.01789 0.000320 10.20 0.17330
Extracto 0.09600 0.01817 0.000330 18.92 0.09000
Piroxicam 0.11630 0.01483 0.000220 12.75 0.11830
72
Bioestadística. Dr. Cleto De La Torre Dueñas
0.25
0.20
reduccion
0.15
0.10
0.05
4.3 CUANTITATIVA-CUANTITATIVA.
Análisis de dos variables cuantitativas y establecimiento de una relación
entre ellas. La forma mas sencilla de estudiar la posible asociación entre estas
variables es el diagrama de dispersión (Nube de puntos). Si reconocemos
una tendencia, entonces el interés ahora será el análisis de regresión.
Media y varianza
La información de las dos variables X e Y se puede resumir usando la media
y la varianza como se muestra a continuación:
Media de la variable X: x
fx i i
Media de la variable Y: y
fy i i
Varianza de la variable X: s 2
fx 2
i i
x
2
x
n
73
Bioestadística. Dr. Cleto De La Torre Dueñas
Varianza de la variable Y: s y2
fyi
2
i
y
2
La covarianza
Es una medida de la asociación lineal existente entre dos variables. Resume la
información contenida en el diagrama de dispersión. Presenta la siguiente
expresión:
cov( x, y ) sxy
fxy
i i i
x. y
n
Correlación.
Estudia la relación o dependencia que existe entre dos variables que
intervienen en una distribución bidimensional.
74
Bioestadística. Dr. Cleto De La Torre Dueñas
Análisis de Regresión.
Regresión: conjunto de técnicas que son usadas para establecer una relación
entre una variable cuantitativa llamada variable dependiente y una o más
variables independientes, llamadas predictoras. Estas también deberían ser
cuantitativas, sin embargo algunas de ellas podrían ser cualitativas.
n n n
n xi yi xi yi
S xy
ˆ i 1
n
i 1
n
i 1
n xi2 ( xi ) 2
S xx
i 1 i 1
ˆ y ˆ x
75
Bioestadística. Dr. Cleto De La Torre Dueñas
Ejemplos.
1.- Se realizo una investigación sobre la temperatura anual media X ( Grados
Fa) en varias ciudades y la tasa de mortalidad (Y) de un tipo de cáncer de
pecho en mujeres. Los datos que obtuvo fueron los siguientes:
X 51.3 49.9 50 49.2 48.5 47.8 47.3 45.1 46.3 42.1 44.2 43.5 42.3 40.2 31.8 34
Y 102..5 104.5 100.4 95.9 87 95 88.6 89.2 78.9 84.6 81.7 72.2 65.1 68.1 67.3 52.5
110
100
90
80
Y
70
60
50
30 35 40 45 50
X
76
Bioestadística. Dr. Cleto De La Torre Dueñas
X Y X.Y X2 Y2
51.3 102.5 5258.25 2631.69 10506.25
49.9 104.5 5214.55 2490.01 10920.25
50 100.4 5020 2500 10080.16
49.2 95.9 4718.28 2420.64 9196.81
48.5 87 4219.5 2352.25 7569
47.8 95 4541 2284.84 9025
47.3 88.6 4190.78 2237.29 7849.96
45.1 89.2 4022.92 2034.01 7956.64
46.3 78.9 3653.07 2143.69 6225.21
42.1 84.6 3561.66 1772.41 7157.16
44.2 81.7 3611.14 1953.64 6674.89
43.5 72.2 3140.7 1892.25 5212.84
42.3 65.1 2753.73 1789.29 4238.01
40.2 68.1 2737.62 1616.04 4637.61
31.8 67.3 2140.14 1011.24 4529.29
34 52.5 1785 1156 2756.25
713.5 1333.5 60568.34 32285.29 114535.33
x
x i
713.5
44.59375 ;
n 16
y
y i
1333.5
83.34375 ;
n 16
s 2
x 2
i
x
2 32285.29
44.593752 29.228
x
n 16
s y2
y 2
i
y
2 114535.33
83.343752 212.277 ;
n 16
sxy
x y i i
x. y
60568.34
(44.59375).(83.34375) 68.9
n 16
77
Bioestadística. Dr. Cleto De La Torre Dueñas
Recta de regresión
n n n
n xi yi xi yi
S xy 68.9
ˆ i 1
n
i 1
n
i 1
2
2.357
n xi2 ( xi ) 2
S x 29.228
i 1 i 1
x i 31,5 y i 770 x 2
i 68,25 y 2
i 38508 x y
i i 1595
x y 31,5770
x y i i
n
i i
1595
18
b1 18,8571
xi 2 31,5
2
x 2
i
n
68,25
18
b0 y b1 x 42,7778 18,85711,75 9,7779
78
Bioestadística. Dr. Cleto De La Torre Dueñas
b1 xi yi
xi y i
18,85711595 31,5770
n 4667,13
SCR 18
r2 0,84
SCT yi
2
770
2
5569,11
yi n
2 38508
18
[Link]. g.l. SC CM Fc
79
Bioestadística. Dr. Cleto De La Torre Dueñas
80
Bioestadística. Dr. Cleto De La Torre Dueñas
Porcentaje de
hierro, X 17 22 35 43 80 85 91 92 96 100
Porcentaje de
plomo, Y 8 17 18 25 58 59 41 30 43 58
81
Bioestadística. Dr. Cleto De La Torre Dueñas
CAPITULO V
PROBABILIDADES
82
Bioestadística. Dr. Cleto De La Torre Dueñas
Espacio muestral.
Es el conjunto de todos los resultados posibles del experimento y se denota
por . A cada elemento de se denomina punto muestral w , es decir:
w / w es un punto muestral .
Ac ocurre si A no ocurre.
83
Bioestadística. Dr. Cleto De La Torre Dueñas
P : y que verifica:
A P(A)
i) 0 P( A) 1 A
ii) P 1
P A B P A P B
iv) P( Ac ) 1 P A
v) P ( ) 0
vi) Si A B , P( A) P( B)
vii) P( A \ B) P( A) P( A B) , A,B
P A1 A2 ... An P A1 P A2 ... P An
P( A) P A Bc P A B
84
Bioestadística. Dr. Cleto De La Torre Dueñas
En consecuencia,
P(A B) =P ( A) P ( B )
A
Independencia.
Dos sucesos A, B se dicen independientes si:
P ( A) P ( A | B ) , o bien P ( B ) P ( B | A)
P( A B) P( B).P( A)
cada par (Ai, Aj), P( Ai Aj ) P( Ai ) P( Aj ) si i j , si para cada trío (Ai, Aj, Ak)
P( Ai Aj Ak ) P( Ai ) P( Aj ) P( Ak ) si i j k y así sucesivamente. En general,
85
Bioestadística. Dr. Cleto De La Torre Dueñas
iii) P ( Ai ) 0 , i 1,....n .
P( B) P( A1 ) P( B ) P( A2 ) P( B ) ....... P( An ) P( B )
A1 A2 An
Teorema de Bayes.
El procedimiento que se utiliza para encontrar probabilidades posteriores, a partir de
probabilidades previas, se llama regla Bayesiana. Las probabilidades apriori o
previas se conocen antes de obtener información alguna del experimento en cuestión.
86
Bioestadística. Dr. Cleto De La Torre Dueñas
P( Ai B) P( Ai ) P( B | Ai )
P( Ai | B) , i = 1, ...., n.
i1 P( Ai) P( B | Ai)
n
P( B)
P( Ai ) P( B | Ai )
P( Ai | B)
P( A ) P( B ) P( A2 ) P( B ) ....... P( An ) P( B )
1 A1 A2 An
Problemas Resueltos.
87
Bioestadística. Dr. Cleto De La Torre Dueñas
Solución.
Denotemos con P, si el resultado es positivo y con N, si la prueba descarta la
presencia de la enfermedad.
a) PP
1 2 N3 , PP
1 2 P3 , PN 1 2 P3 , N1 P2 P3 , N1 P2 N3 , N1 N 2 P3 , N1 N 2 N3
1 2 N3 , PN
A PP 1 2 P3 , N1 P2 P3
1 2 N3 , PN
n( A) 3
P( A)
n ( ) 8
C PP
1 2 N3 , P1 N 2 N3
n(C ) 2
P(C )
n ( ) 8
d) Sea el evento D: Por lo menos una prueba da positivo.
D PP 1 2 P3 , P1 N 2 N3 , P1 N 2 P3 , N1 P2 P3 , N1 P2 N3 , N1 N 2 P3
1 2 N3 , PP
n( D ) 7
P( D)
n ( ) 8
88
Bioestadística. Dr. Cleto De La Torre Dueñas
P A B P A P B P A B
P(A B) = 0,10 + 0,15 - 0,03 = 0,22
3) Se ha comprobado que en una ciudad están enfermos con diarrea el 60% de los
niños; con sarampión el 50% y el 20% con ambas enfermedades. Calcular la
probabilidad de que elegido un niño al azar esté enfermo con diarrea,
sarampión o ambas enfermedades.
Sean los sucesos:
A: "estar enfermo con diarrea".
B: "estar enfermo con sarampión".
P A B P A P B P A B
El 90% de los niños tienen alguna de las dos enfermedades.
Solución
89
Bioestadística. Dr. Cleto De La Torre Dueñas
Presenta RAM
1%
99%
No presenta RAM
A
40%
2% Presenta RAM
98%
Medicina 30% B No presenta RAM
3%
Presenta RAM
30%
C
a) P ( D ) P ( A) P ( D A) P ( B ) P ( D B) P (C ) P ( D C )
b) P(B D) =P ( B) P( D B)
P(C D) P(C ) P( D | C )
c) P(C | D)
P( D) P( A) P( D | A) P( B) P( D | B) P(C ) P( D | C )
0.3*(0.03)
P (C | D ) 0.473 47.3%
0.4*(0.01) 0.3*(0.02) 0.3*(0.03)
90
Bioestadística. Dr. Cleto De La Torre Dueñas
91
Bioestadística. Dr. Cleto De La Torre Dueñas
Solución
Sean los eventos
A: Enfermedad producida por el virus A.
B: Enfermedad producida por el virus B.
C: Enfermedad producida por el virus C.
E: El virus produce la enfermedad.
E
1/3
A D
3/10
2/3 E
2/10 B
D
1/7
5/10 E
C
p(C E ) p (C ) p ( E | C )
p(C | E )
p( E ) p( A) p( E | A) p( B) p( E | B) p(C ) p ( E | C )
3 1
*
10 3 21
p(C | E ) 32.8%
3 1 2 2 5 1 64
* * *
10 3 10 3 10 7
92
Bioestadística. Dr. Cleto De La Torre Dueñas
Solución
Sean los eventos
B: La prueba da positivo
V: La persona tiene Virus
P( B / V ) 0.99 , P(V ) 0.05
P( B / A).P(V )
P(V / B)
P( B / V ) P(V ) P( B / V c ).P(V c )
0.99*0.05
P(V / B) 0.6346
0.99*0.05 0.03*0.95
Proporciones. Son los cocientes entre dos mediciones, por ejemplo si en una
población de 2500 habitantes se diagnostican 150 casos de gripe aviar, entonces, la
proporción de enfermos es de 150/2500 = 0.06 (6%). El valor de una proporción
puede variar así de 0 a 1, y suele expresarse como un porcentaje.
Razones. Al igual que en el caso anterior es una división, pero aquí el numerador
no forma parte del denominador como en le caso anterior, por ejemplo, la razón
entre la población con gripe aviar y la sana es 150/2350 = 3/47 =0,064. Cuando,
como en el caso del ejemplo, la razón se calcula entre la probabilidad de que
ocurra un evento y la probabilidad de que éste no ocurra, la razón recibe también
el nombre de odds. El valor de una odds varía entre cero y el infinito. El valor 0
corresponde al caso en que la enfermedad nunca ocurra, mientras que el valor
infinito correspondería teóricamente a una enfermedad que esté siempre presente.
93
Bioestadística. Dr. Cleto De La Torre Dueñas
Odds Proporcion
Proporcion Odds
Odds 1 1 Proporcion
94
Bioestadística. Dr. Cleto De La Torre Dueñas
Tests diagnósticos
Los tests diagnósticos son una aplicación del teorema de Bayes a la Medicina, y se
basan en lo siguientes tres puntos:
95
Bioestadística. Dr. Cleto De La Torre Dueñas
Previamente, sobre el test diagnóstico a utilizar, han debido ser estimadas las
cantidades:
Sensibilidad.
padece, P(T / Ac ) . Con tal fin se entrena el istrumento o test con pacientes
negativos y se mide el grado de acierto de resultados negativos.
La sensibilidad y especificidad se denominan también respectivamente tasa
de verdaderos positivos y tasa de verdaderos negativos. Estas cantidades
son calculadas de modo aproximado, antes de utilizar el test diagnóstico,
considerando grupos suficientemente numerosos de personas de las que
sabemos si padecen la enfermedad o no, y estimando los porcentajes
correspondientes. Por ejemplo se toman 100 personas sanas y 100 enfermas,
y se observa que:
96
Bioestadística. Dr. Cleto De La Torre Dueñas
A Ac
T 89 3
T 11 97
Total 100 100
P(T / A) P( A)
P( A / T )
P(T / A) P( A) P(T / Ac ) P( Ac )
P(T / Ac ) P( Ac )
P( A / T )
c
P(T / Ac ) P( Ac ) P(T / A) P( A)
Ejemplo
1.- Con el objeto de diagnosticar la colelietasis se usan los ultrasonidos. Tal técnica
tiene una sensibilidad del 91% y una especificidad del 98%. En la población que
nos ocupa, la probabilidad de colelietasis es de 0,2.
a).- Si a un individuo de tal población se le aplican los ultrasonidos y dan
positivos, ¿cuál es la probabilidad de que sufra la colelietasis?
97
Bioestadística. Dr. Cleto De La Torre Dueñas
Solución:
P(T / A) Sensibilidad=0.91
P(T / Ac ) Especificidad=0.98
P( A) 0.20
P(T / A) P( A)
P( A / T )
P(T / A) P( A) P(T / Ac ) P( Ac )
P(T / A) P( A)
P( A / T )
P(T / A) P( A) (1 P(T / Ac ))(1 P( A))
(0.91)(0.2)
0.9192
(0.91)(0.2) (0.02)(0.8)
Negativos, P( Ac / T ) ,
98
Bioestadística. Dr. Cleto De La Torre Dueñas
P(T / Ac ) P( Ac )
P( Ac / T )
P(T / Ac ) P( Ac ) P(T / A) P( A)
P(T / Ac ) P( Ac )
P( Ac / T )
P(T / Ac ) P( Ac ) (1 P(T / A)) P( A)
(0.98)(0.8)
0.9775
(0.98)(0.8) (0.09)(0.2)
Problemas Propuestos.
1.-Una anomalía física de una persona puede deberse sólo a las siguientes tres
razones: Mala postura al sentarse, razones genéticas o por accidentes.
Se ha observado que el 60% de las anomalías físicas se debe a razones genéticas,
el 30% de estas se debe a mala postura al sentarse y el 34% a accidentes. El 12%
se debió a mala postura y no a razones genéticas. El 30% de debió a accidentes y
no a razones genéticas. El 29% se debió a accidentes y no a mala postura. El 72%
se debió a mala postura o a razones genéticas.
Si se elige una persona con anomalía física, calcular la probabilidad de que:
a) La anomalía se produzca por las tres razones mencionadas.
b) La anomalía se produzca por razones genéticas y no por mala postura.
c) La anomalía se produzca sólo por accidente y no por las otras dos razones.
99
Bioestadística. Dr. Cleto De La Torre Dueñas
3.- Una prueba diagnóstica para el cáncer uterino tiene una proporción de falsos
positivos de 0.05 y de falsos negativos de 0.10. Una mujer con una probabilidad
de 0.15 de padecer la enfermedad tiene un resultado negativo en la prueba.
a) ¿Cuál será la probabilidad de que no esté enferma?
b) Si el resultado es positivo en la prueba ¿Cuál será la probabilidad de esté
realmente enferma?
4.- En una clínica hay internados 50 pacientes de los cuales 8 poseen insuficiencia
cardiaca. Si se eligen 4 pacientes sin reemplazo de la clínica
¿Cuál será la probabilidad de que?
a) a lo más uno tenga insuficiencia cardiaca
b) a lo menos tres no tengan insuficiencia cardiaca
c) exactamente dos tengan insuficiencia cardiaca
d) Ninguno tenga insuficiencia cardiaca
5.- Una prueba de laboratorio para detectar heroína en la sangre tiene un 92% de
precisión. Si se analizan 7 muestras en un día, ¿Cuál es la probabilidad de que?:
100
Bioestadística. Dr. Cleto De La Torre Dueñas
6.- Una mujer portadora de hemofilia tiene 3 hijos ¿Cuál es el espacio muestral
apropiado para estudiar la posible hemofilia de estos?
101
Bioestadística. Dr. Cleto De La Torre Dueñas
a).- Hallar la “tasa falsa positiva” del test, esto es, la probabilidad que el test
resulte negativo dado que el paciente sufre de afecciones renales.
b).- Hallar la “tasa falsa negativa” del test, esto es la probabilidad que el test
resulte positivo dado que el paciente no sufre de afecciones renales.
102
Bioestadística. Dr. Cleto De La Torre Dueñas
12.- En un grupo de 50 personas hay 4 que tienen sangre con factor RH- . Hallar la
probabilidad de que escogidos 5 personas al azar y de una sola vez , dos de
ellas tengan el factor indicado.
14.- En una industria de productos Químicos, las unidades son producidas por
tres líneas en proporciones [Link]. Un 5% un 4% y un 2% de las unidades
producidas por cada línea, respectivamente, son defectuosos. Las unidades
son mezcladas y enviadas a los compradores.
a).- Determine la probabilidad que una unidad escogida al azar sea
defectuosa
b).- Si un cliente encuentra una unidad defectuosa, determine la probabilidad
que se haya producido en la primera línea
15.- Un banco de sangre dispone de diez unidades de sangre tipo A .De ellas,
cuatro están contaminadas con suero de hepatitis. Se ha seleccionado
aletoriamente tres unidades de entre las diez para utilizarlas con tres pacientes
diferentes. ¿Cual es la probabilidad de que un solo paciente este expuesto a
contraer la hepatitis por esta causa?
16.- Una prueba diagnóstica para el cáncer uterino tiene un coeficiente falso-
positivo de 0,05 y falso-negativo de 0,10. Una mujer con una probabilidad
pre-prueba de padecer la enfermedad de 0,15 tiene un resultado negativo con
la misma. Calcular la probabilidad de que no esté enferma.
103
Bioestadística. Dr. Cleto De La Torre Dueñas
17.- El 60% de los individuos de una población están vacunados contra una cierta
enfermedad. Durante una epidemia se sabe que el 20% la ha contraído y que
2 de cada 100 individuos están vacunados y son enfermos. Calcular el
porcentaje de vacunados que enferma y el de vacunados entre los que están
enfermos.
104
Bioestadística. Dr. Cleto De La Torre Dueñas
22.- Con objeto de diagnosticar la colelitiasis se usan los ultrasonidos. Tal técnica
tiene una sensibilidad del 91% y una especificidad del 98%. En la población
que nos ocupa la probabilidad de colelitiasis es del 20%.
a).- Si a un individuo de tal población se le aplican los ultrasonidos y dan
positivos, ¿cuál es la probabilidad de que sufra la colelitiasis?
b) Si el resultado fuese negativo, ¿cuál es la probabilidad de que no tenga la
enfermedad?
23.- Los estudios epidemiológicos indican que el 20% de los ancianos sufren un
deterioro neuropsicológico. Sabemos que la tomografía axial computerizada
(TAC) es capaz de detectar este trastorno en el 80% de los que lo sufren, pero
que también da un 3% de falsos positivos entre personas sanas. Si tomamos un
anciano al azar y da positivo en el TAC, ¿cuál es la probabilidad de que esté
realmente enfermo?
25.- Los genetistas han identificado dos cromosomas sexuales X e Y en los seres
humanos. Todo individuo tiene un cromosoma X, y la presencia de un
cromosoma Y, distingue al individuo como varón, por lo que los dos sexos se
caracterizan como XX (hembra) y XY (macho). El daltonismo es causado por
105
Bioestadística. Dr. Cleto De La Torre Dueñas
Mujeres Varones
XX (normal) XY (normal)
Xx (portadora) xY(daltónico)
xx (daltónica)
106
Bioestadística. Dr. Cleto De La Torre Dueñas
27.- Supongamos que en un examen para detectar cáncer, el 90% de quienes tienen
cáncer y el 5% de los que no tienen cáncer muestran una reacción positiva. Se sabe
que en un hospital el 1% de los pacientes tiene cáncer. Si un paciente es elegido al
azar del hospital y tiene una reacción positiva en este examen ¿Cuál será la
probabilidad de que tenga realmente cáncer?
30.-El 60% de los habitantes de una población están vacunados contra una cierta
enfermedad. Durante una epidemia se sabe que el 20% la ha contraído y que 2 de
cada 100 habitantes están vacunados y están enfermos.
a) ¿Qué porcentaje de los vacunados enferma?
b) ¿Qué porcentaje de los que están enfermos está vacunado?
107
Bioestadística. Dr. Cleto De La Torre Dueñas
independiente ¿Cuál de las dos siguientes estrategias utilizaría usted para curar a
un sujeto con tal enfermedad?
c) Aplicar ambos tratamientos a la vez.
d) Aplicar primero el tratamiento B y, si no hace efecto, aplicar el A.
32.-En un estudio sobre enfermedades pulmonares, se ha examinado a 5000
personas de más de 60 años de edad, de las cuales 2000 son fumadores habituales.
Entre los fumadores 900 tiene alguna afección pulmonar y entre los no fumadores,
750 tienen alguna afección pulmonar.
e) Si se escoge una persona al azar determine la probabilidad de que:
i) presente afección pulmonar si no fuma.
ii) fume si presenta alguna afección pulmonar.
f) Si se escogen tres personas, determine la probabilidad de que:
i) ninguna presente afecciones pulmonares.
ii) exactamente dos fumen.
iii) a lo más dos presenten afecciones pulmonares.
g) ¿Son independientes las enfermedades pulmonares del hábito de
fumar?
33.-Si el 20% de lentes para microscopio producidos por una máquina son
defectuosos.
h) Determinar la probabilidad de que de 4 lentes elegidos al azar :
i) uno sea defectuoso.
ii) ninguno sea defectuoso
iii) a lo más 2 sean defectuosos.
i) Si se envía un pedido de 400 lentes para microscopios ¿Cuál es el
número esperado de lentes defectuosos en el pedido?
j) Si se eligen sucesivamente estos lentes hasta que aparece el primero
defectuoso, encuentre la probabilidad de seleccionar 12 lentes.
108
Bioestadística. Dr. Cleto De La Torre Dueñas
109
Bioestadística. Dr. Cleto De La Torre Dueñas
CAPITULO VI
VARIABLE ALEATORIA Y DISTRIBUCIONES DE
PROBABILIDAD.
X :
X
PX x P X x P / X x , tal que P ( x) 1
X
xRx
f X ( x)dx 1
110
Bioestadística. Dr. Cleto De La Torre Dueñas
Propiedades.
F es continua por la derecha y es creciente
dF ( x)
Si X es una v.a continua , entonces F ' ( x) f ( x)
dx
lim x FX ( x) 0 y lim x FX ( x) 1
Definición.-
La esperanza o media de una variable aleatoria X, denotada por E ( X ) o X se
x.P X x , si X es discreta
xRx
EX
x. f ( x)dx, si X es continua
xRx
Propiedades.
El valor esperado de una constante es dicha constante
E a bX a bE X
V X X2 E X X E X E X E X E 2 X
2 2 2
Propiedades.
La raíz cuadrada de la varianza se llama desviación estándar.
X2 E X X2
2
V aX b a 2V ( X )
Desigualdad de Chebyshev.
111
Bioestadística. Dr. Cleto De La Torre Dueñas
P X X k X 1
1
k2
Ejercicio resuelto.
1.- Sea X la variable aleatoria definida como la suma de los valores que aparecen
al lanzar dos dados.
a) Determine la distribución de probabilidad.
b) Calcule la probabilidad P(5<X<8)
c) La media y su varianza.
Solución.
a)
Resultados en 1 2 3 4 5 6
los dos dados
1 2 3 4 5 6 7
2 3 4 5 6 7 8
3 4 5 6 7 8 9
4 5 6 7 8 9 10
5 6 7 8 9 10 11
6 7 8 9 10 11 12
c) Media
112
Bioestadística. Dr. Cleto De La Torre Dueñas
1 2 3 4 5 6 5 4 3 2 1
E X 2 3 4 5 6 7 8 9 10 11 12
36 36 36 36 36 36 36 36 36 36 36
252
EX
36
Varianza.
X2 E X E 2 X
2
DISTRIBUCIONES IMPORTANTES.
Existen, como en el caso de la última variable ejemplificada, otras variables cuyas
funciones de probabilidad o densidad resultan ser modelos de mucha utilidad
para una serie de aplicaciones. Nosotros citaremos brevemente algunos de los
modelos de mayor importancia.
DISTRIBUCIONES DISCRETAS.
Un experimento de Bernoulli, es un experimento aleatorio con solo dos
posibles resultados: Éxito y Fracaso. Sea p = P (Éxito).
Distribución Binomial.
La distribución binomial aparece cuando se dan las condiciones siguientes:
-Tenemos un experimento aleatorio simple, con una situación dicotómica,
es decir Éxito y Fracaso.
- Repetimos este experimento simple n veces de manera independiente.
113
Bioestadística. Dr. Cleto De La Torre Dueñas
C rx11 1 p p r
x r
, si x r , r 1, r 2,...
PX x
0 , en otro caso.
r r 1 p
Valor esperado: X . Varianza: X2 .
p p2
Nota: Si r = 1, X se dice que es una variable aleatoria con distribución
geométrica de parámetro p, y se le denota por X G(p).
C xM C nNxM
, si x 0,1,2,...,n
PX x C nN
0 , en otro caso.
M M M N n
Valor esperado: X n . Varianza: X2 n 1 .
N N N N 1
Notas:
114
Bioestadística. Dr. Cleto De La Torre Dueñas
M
X B n, p .
N
Distribución de Poisson.
La distribución de Poisson aparece en situaciones en las que se cuenta el
número de apariciones de un determinado suceso o bien en un intervalo de
tiempo dado (como el número de partículas emitidas en un segundo por un
material radioactivo, o el número de pacientes que llegan a un servicio en
un intervalo de tiempo dado) o bien en un recinto físico (como el número
de fallos en un metro de alambre de hierro producido.
X = Número de eventos en 0, t .
Función de Probabilidad:
x e
, si x 0,1,2,...
PX x x!
0 , en otro caso.
DISTRIBUCIONES CONTINUAS.
1
, si x a, b
f X x b a
0 , en otro caso.
Valor esperado: X
ab
. Varianza: X
2 b a 2
.
2 12
115
Bioestadística. Dr. Cleto De La Torre Dueñas
f X x
1
e 2
2
Valor esperado: X . Varianza: X2 2 .
EJERCICIOS RESUELTOS
Solución
Consideremos los sucesos
A = Mejore el paciente, P (A) = 0.25
116
Bioestadística. Dr. Cleto De La Torre Dueñas
10
a) P(Mejore 4 pacientes) = PX 4 (0.25) 4 (0.75) 6 0.1460
4
10
b) P (Ninguno mejore) = PX 0 (0.25)0 (0.75)10 0.0563
0
10
c) P(Mejoran todo los pacientes) = PX 10 (0.25)10 (0.75) 0 0
10
d) P(Mejoran por lo menos 8 pacientes) =
PX 8 PX 8 PX 9 PX 10
10 10
(0.25)8 (0.75) 2 (0.25)9 (0.75) 0 0.005
8 9
e) P( Mejoran a lo sumo 3 pacientes ) =
P X 3 PX 0 PX 1 PX 2 PX 3
f) Media y Varianza
np 10 (0.25) 2.5
2.- El treinta por ciento de los niños sufre efectos secundarios tras la
administración de un determinado tratamiento. Si este fue aplicado a siete niños,
determinar la probabilidad de que.
a) Ninguno de los 7 sufran efectos secundarios
b) Todos presenten efectos secundarios
c) Al menos 2 presenten efectos secundarios.
Solución
117
Bioestadística. Dr. Cleto De La Torre Dueñas
7
a) PX 0 (0.3)0 (0.7)7 0.0824
0
7
b) PX 7 (0.3)7 (0.7)0 0.0002
7
7 7
PX 2 1 PX 1 1 PX 0 PX 1 1 (0.3)0 (0.7)7 (0.3)1 (0.7)6 0.6705
0 1
118
Bioestadística. Dr. Cleto De La Torre Dueñas
(0.67)
0 z=0.67
X 57 57 60
b) P( X 57) P( ) P( Z ) P( Z 0.5) (0.5) 0.5
6
(0.5)
z= 0.5 0
0.19146+0.5=0.69146=69.146%
X 63 63 60
c) P( X 63) P( ) P( Z ) P( Z 0.5) 0.5 (0.5)
6
(0.5)
0 z=0.5
0.5 0.19146=0.30854=30.854%
57 X 65 57 60 65 60
d) P(57 X 65) P( ) P( Z )
6 6
X
P(0.50 0.83) (0.50) (0.83) 0.19146+0.29373=0.48519=48.519%
119
Bioestadística. Dr. Cleto De La Torre Dueñas
(0.5) (0.83)
X 50 50 60
e) P( X 50) P( ) P( Z ) P( Z 0.167)
6
(0.167)
z= 0.167 0
64 X 70 64 60 70 60
f) P(64 X 70) P( ) P( Z )
6 6
X
P(0.67 1.67) (1.67) (0.67) 0.45254-0.24857=0.20397=20.397%
0 z=0.67 z=1.67
(0.67)
(1.67)
57 X 64 57 60 64 60
g) P(57 X 64) P( ) P( Z )
6 6
X
P(0.5 0.67) (0.5) (0.67) 0.19146+0.24857=0.44003=44.003%
Cabe esperar el 44.003% de paciente, es decir 0.44003*200 88
120
Bioestadística. Dr. Cleto De La Torre Dueñas
EJERCICIOS PROPUESTOS
2.- Se llama cociente intelectual (C.I.) al cociente entre la edad mental y la edad
real. Se sabe que la distribución del C.I. se distribuye normalmente con media
0.95 y desviación típica 0.22. En una población con 2600 personas se desea
saber:
a) Cuantas tendrían un C.I. superior a 1.3?
b) Cuantas tendrían un C.I. inferior a 0.07?
c) Cuantas tendrían un C.I. entre 0.8 y 1.15?
121
Bioestadística. Dr. Cleto De La Torre Dueñas
distribución normal con media de 11.9 y variancia 1.21. ¿Qué porcentaje de las
medidas de resistencia a la humedad es menor que 11.8?
5.- Una compañía de productos químicos elimina sus residuos en un río situado en
la vecindad de su ubicación. Para verificar el grado de contaminación creado
por estos residuos desea obtener algunas estimaciones. Suponga que los
residuos de contaminante tienen una distribución normal con media de 1.7
gramos por litro (g/l) y desviación estándar de 0.223 gramos por litro (g/l) Cuál
es la probabilidad que los residuos del contaminante:
a) Sean mayores de 1.72
b) Entre 1.46 y 1.88
c) Inferiores de 2.05
122
Bioestadística. Dr. Cleto De La Torre Dueñas
d).- El nivel de glucemia basal tal que por debajo de él están el 25% de los
diabéticos, es decir, el primer cuartil.
123
Bioestadística. Dr. Cleto De La Torre Dueñas
CAPITULO VII
INTRODUCCION AL MUESTREO
INTRODUCCION.
El objetivo de la estadística es hacer inferencias acerca de una
población con base en la información contenida en una muestra. Este
mismo objetivo motiva el estudio del problema de muestreo.
Consideraremos el problema particular del muestreo de una
población finita (colección finita de mediciones).
En lo referente al muestreo, la inferencia consiste en la estimación de
un parámetro de población, tal como una medida, un total o una
proporción con un límite para el error de estimación (precisión).
Para un buen entendimiento del problema de muestreo,
introduciremos enseguida, ciertos aspectos técnicos comunes a las
encuestas de muestreo.
124
Bioestadística. Dr. Cleto De La Torre Dueñas
125
Bioestadística. Dr. Cleto De La Torre Dueñas
P(| ˆ | E)
Para cualquier entre 0 y 1.
cumple:
P(| ˆ | E) 0.95
Limite para el error de estimación: Denotado por E es dado por E 1.96 V (ˆ) . El
Error de Muestreo: Este error se debe a que una muestra no produce información
completa sobre una población. Puede ser controlado por un diseño cuidadoso de
la muestra y es estimado en gran parte por el factor E. Por esta razón, algunos
autores denominan al factor E, error de muestreo.
126
Bioestadística. Dr. Cleto De La Torre Dueñas
- La no respuesta.
- El sesgo de respuesta.
- Diseño pobre del instrumento de medición.
Sin embargo, los errores de no muestreo pueden ser controlados mediante una
atención cuidadosa en todas las etapas de la encuesta.
ENCUESTA.
La función de la encuesta es la medición del comportamiento, actitudes o
características del encuestado, que es un individuo de la población en estudio
seleccionado para la muestra.
Diseño de la encuesta
Pasos a seguir:
Definir los objetivos
Determinar el marco
Diseñar el procedimiento de muestreo
Diseñar el cuestionario
Diseñar y realizar el trabajo de campo
Codificar, depurar y analizar las respuestas
Redactar el informe
Diseño de la muestra
El diseño de la muestra incluye:
La elección del procedimiento de muestreo
La determinación del tamaño de la muestra
Existen varios procedimientos de muestreo, entre las principales se tiene
muestreo: aleatorio simple, estratificado y sistemático.
127
Bioestadística. Dr. Cleto De La Torre Dueñas
Procedimiento de selección.
Tamaño de la muestra
128
Bioestadística. Dr. Cleto De La Torre Dueñas
ser aceptada para poder realizar el trabajo, pues aparte de que estudiar una
población resulta ser un trabajo en ocasiones demasiado grande.
Para calcular el tamaño de una muestra hay que tomar en cuenta tres factores:
- El porcentaje de confianza con el cual se quiere generalizar los datos desde la
muestra hacia la población total.
- El porcentaje de error que se pretende aceptar al momento de hacer la
generalización.
- El nivel de variabilidad que se calcula para comprobar la hipótesis.
Z (12 / 2) * 2
n , Población infinita.
2
Donde
2 Es la varianza poblacional
En la practica el valor de 2 estimado por S2 a partir de una encuesta
anterior o de una muestra piloto
2. Tamaño de la muestra para estimar P.
De manera simular, la fórmula del tamaño de muestra n para la estimación
de p con error máximo de estimación de y un nivel de confianza del
100(1 - )%:
Z (12 / 2) * N * p(1 p)
n , Población finita.
Z (12 / 2) * p(1 p) ( N 1)
2
y si N :
Z (12 / 2) * p(1 p)
n , Población infinita.
2
129
Bioestadística. Dr. Cleto De La Torre Dueñas
MUESTREO ESTRATIFICADO.
Una muestra estratificada es la obtenida mediante la separación de los elementos
de la población en grupos heterogéneos disjuntos, llamados estratos y la selección
posterior de una muestra aleatoria simple en cada estrato.
Consideremos una población de tamaño N, la cual es dividida en k estratos (sub
poblaciones) de tamaños Ni, i=1,2…., k, tal que N N1 N 2 ... N k
N1 N2 … NK
130
Bioestadística. Dr. Cleto De La Torre Dueñas
N
ni n * i n * wi , i 1,..., k
N
Cuando se realiza un muestreo estratificado, los tamaños muestrales en cada uno
de los estratos, ni, los elige quien hace el muestreo, Así en un estrato dado, se
tiende a tomar una muestra más grande cuando:
- El estrato es más grande;
- El estrato posee mayor variabilidad interna (varianza);
- El muestreo es más barato en ese estrato.
MUESTREO SISTEMATICO
Definición.- Una muestra obtenida al seleccionar aleatoriamente un elemento de
los primeros k elementos en el marco y después cada k-ésimo elemento, se
denomina muestra sistemática de intervalo de selección k.
El muestreo sistemático puede ser de dos formas, muestreo sistemático simple y
muestreo sistemático circular.
Procedimiento de selección del muestreo sistemático simple.
Una muestre sistemática simple se obtiene cuando el intervalo de selección k es
exactamente un numero entero.
El procedimiento de selección de una muestra sistemática simple consiste:
i) Las unidades del marco deben ser ordenados en magnitud de acuerdo con
algún esquema de ordenación (población ordenada) es base al orden se
establece la numeración desde 1 hasta N
N
ii) Determinar el intervalo de selección k (k exactamente un numero
n
entero)
iii) Seleccionar un numero aleatorio entre 1 y k (arranque aleatorio) sea “a” el
arranque aleatorio elegido, entonces los elementos de la muestra
sistemática, son los que ocupan las posiciones en el marco:
131
Bioestadística. Dr. Cleto De La Torre Dueñas
EJERCICIOS RESUELTOS
1. Un investigador, desea hacer una estimación del gasto medio que tienen los
pacientes en un hospital, con 99% de confianza, suponiendo que el máximo
error permitido es de 1, además de una muestra piloto se obtuvo una
varianza de 25. También se sabe que el hospital atiende semanalmente 2500
pacientes ¿Que tamaño de muestra necesitara para investigar?
Solución.
N 2500, 1, 2 25, Z(1 / 2) 2.58
Solución.
Consideremos que no se tiene ningún estudio de este tipo, por tanto P 0.5 ,
del problema: N 25000, 0.05, z(1 / 2) 1.96
Z (12 / 2) * NP(1 P)
n
Z (12 / 2) * P(1 P) ( N 1)
2
n
1.96 * 25000*0.5(1 0.5)
2
378.361 379
1.96 *0.5(1 0.5) (25000 1) 0.05
2 2
132
Bioestadística. Dr. Cleto De La Torre Dueñas
Solución.
La población materia de estudio, no es finita, por tanto la relación para
estimar el tamaño de muestra es:
Z (12 / 2) * P(1 P)
n
2
133
Bioestadística. Dr. Cleto De La Torre Dueñas
Solución.
En este ejemplo, las ciudades forman los estratos:
Ciudad Ni wi
A 2000 =2000/8200=0.24
B 1200 =1200/8200=0.15
C 5000 =5000/8200=0.61
Total N=8200 1
n=245.
Usando la relación,
N
ni n * i n * wi , i 1,..., k , Se determina el tamaño de muestra para cada
N
ciudad.
N
nA n * A n * wA 0.24* 245 59.76 60
N
N
nB n * B n * wB 0.15* 245 35.85 36
N
N
nC n * C n * wC 0.61* 245 149.39 149
N
134
Bioestadística. Dr. Cleto De La Torre Dueñas
CAPITULO VIII
ESTIMACION POR INTERVALOS Y PRUEBAS DE
HIPOTESIS
DISTRIBUCIONES MUESTRALES.
DISTRIBUCION NORMAL.
En este capitulo abordaremos el estudio de la distribución normal y de otras
distribuciones asociadas a funciones de una muestra al azar de esta variable. El
porque de la importancia de la distribución normal se ilustra a través de las
siguientes propiedades y distribuciones.
PROPOSICION
1. Teorema del limite central (TLC). Si X 1 , X 2 ,..., X n son n v.a.’s
independientes, donde cada Xi tiene la misma distribución de valor
esperado y varianza 2, entonces para n suficientemente grande (en la
práctica n 30) se cumple que aproximadamente
X i n
n
X
Z i 1 N (0, 1).
n / n
2. Aproximación de la Binomial por la Normal. Si X B (n, p) y n es
suficientemente grande, entonces aproximadamente:
X np
Z N (0, 1).
np1 p
Aquí, para el cálculo de probabilidades, se recomienda utilizar la llamada
corrección por continuidad: Si a b son dos números naturales, entonces
aproximadamente:
135
Bioestadística. Dr. Cleto De La Torre Dueñas
1 b 12 np a 12 np
Pa X b P a X b Fz
1 Fz .
2 2 np1 p np1 p
LA DISTRIBUCION CHI-CUADRADO.
Una v.a. X tiene distribución chi-cuadrado con n grados de libertad, y se le
denota por X 2 (n).
PROPOSICION.
1. Si Z N (0, 1), entonces Z2 2 (1).
libertad.
3. Si X 1 , X 2 ,..., X n es una m.a de X N (,2), entonces
W
n 1S 2
2 (n -1).
2
LA DISTRIBUCION T DE STUDENT.
Una v.a. X tiene distribución t de Student con n grados de libertad, y se le
denota por X t(n).
PROPOSICION.
1. Sea X t(n). Si n es grande, entonces aproximadamente X N (0, 1).
Z
T t(n). En particular, dada una m.a. X 1 , X 2 ,..., X n de X N (,2),
2
n
se cumple que:
136
Bioestadística. Dr. Cleto De La Torre Dueñas
X
T t (n -1).
S/ n
LA DISTRIBUCION F DE FISHER.
Una v.a. X tiene distribución F de Fisher con n grados de libertad en el
numerador y m grados de libertad en el denominador, y se le denota por X F
(n, m).
PROPOSICION.
12 / n
F F (m, n). En particular, si X 1 , X 2 ,..., X n es una v.a. de X N
22 / m
independientes, entonces
S12 22
F F (n -1, m - 1),
S 22 12
INFERENCIA ESTADÍSTICA
137
Bioestadística. Dr. Cleto De La Torre Dueñas
(a) PUNTUAL
( I ) ESTIMACIÓN
(b) POR INTERVALOS
INFERENCIA ESTADÍSTICA
( II ) PRUEBAS DE HIPÓTESIS
INTERVALOS DE CONFIANZA.
Cuando tratamos la estimación puntual, uno de los problemas que se
plantearon es que el valor de la estimación es solo uno de los valores
(posiblemente infinitos) del estimador, obtenido al extraer una muestra
concreta, de forma que si extraemos dos muestras distintas, las estimaciones
serán distintas.
Al hacer cualquier estimación se está cometiendo un error, y seria deseable
proporcionar una medida de la precisión de la estimación del parámetro. En
este tema vamos a introducir el concepto de intervalo de confianza como un
intervalo cuyos extremos son variables que dependen de la muestra, y en el
cual se confía que esté el valor de parámetro. El intervalo se obtendrá a partir
de un estadístico generalmente relacionado con un estimador puntual, cuya
distribución no depende del parámetro desconocido, y una medida de la
validez del intervalo es el nivel de confianza, que indica la proporción de
intervalos de todos los que se podrían construir a partir de muestras distintas,
que realmente contienen al parámetro.
Definición.
Un intervalo de confianza (IC) al 100(1 - )% para un parámetro poblacional
de una v.a. X es un intervalo con estadísticas L 1 y L2 en los extremos (IC = L1,
L2) tal que PL1 L2 1 .
138
Bioestadística. Dr. Cleto De La Torre Dueñas
X
pivote a Z N (0, 1) y vienen dado por
/ n
X z1 X z1
2
n 2
n
1
/2 /2
Z(1/2 Z(1/2
X
como pivote a T t (n -1) y vienen dado por
S/ n
S S
X t(1 , n 1) X t(1 , n 1) ,
2
n 2
n
1
/2 /2
t(1/2 t(1/2
Donde t1 n 1 denota al valor de la distribución t de Student con n – 1
2
x x
2
i
grados de libertad y la varianza muestral dado por S 2 i 1
n 1
139
Bioestadística. Dr. Cleto De La Torre Dueñas
n 1 S 2 2 n 1 S 2
12 n 1
2 n 1
2 2
1
/2 /2
2(/2) 2(1/2)
Donde 2 n 1 y 12 n 1 denotan a los valores en la distribución chi-
2 2
x x
2
i
S2 i 1
n 1
S12 / 12
F F n1 1, n2 1 y vienen dado por
S 22 / 22
S12 12 S12
f / 2,n2 1, n1 1 2 2 f1 / 2,n2 1, n1 1
S22 2 S2
independientes de tamaños n1 y n2
140
Bioestadística. Dr. Cleto De La Torre Dueñas
X 1 X 2 ( 1 2 )
como pivote a z y vienen dado por:
12 22
n1 n2
12 22 12 22
( X 1 X 2 ) z(1 / 2) * 1 2 ( X 1 X 2 ) z(1 / 2) *
n1 n2 n1 n2
p p
Z N (0, 1),
p 1 p
n
p 1 p p 1 p
p z1 n p p z1 n
2 2
( p1 p2 ) ( p1 p2)
Z N (0, 1),
p1 1 p1 p2 1 p2
n1 n2
141
Bioestadística. Dr. Cleto De La Torre Dueñas
La diferencia de Medias 1 1
( X 1 X 2 ) t0 * S p
Asumiendo que: 12 22 y 1 1 n1 n2
( X 1 X 2 ) t0 * S p
to t(1 / 2,n1 + n2 -2)
desconocidos n1 n2
La varianza
n 1 S 2 n 1 S 2
12 n 1
2 n 1
2 2
La razón de varianzas.
S12 S12
f / 2,n2 1, n1 1 f1 / 2,n2 1, n1 1
S 22 S 22
142
Bioestadística. Dr. Cleto De La Torre Dueñas
EJERCICIOS RESUELTOS
Solución.
Reemplazando en la relación
X z1 X z1
2
n 2
n
1
/2 /2
Z(1/2 Z(1/2
94 94
5900 1.96 5900 1.96
250 250
5888.34 5911.65
143
Bioestadística. Dr. Cleto De La Torre Dueñas
Solución.
Reemplazando en la relación
S S
X t(1 , n 1) X t(1 , n 1) ,
2
n 2
n
32 32
256 2.045 256 2.045
30 30
244.05 267.9
Solución.
p 1 p p 1 p
p z1 n p p z1 n
2 2
144
Bioestadística. Dr. Cleto De La Torre Dueñas
Solución.
Extracto A
75
p1 0.3 , n1 250
250
Extracto B
80
p2 0.4 , n1 200
200
z1 1.96
2
-0.18 ( p1 p2 ) -0.011
El intervalo contiene solo valores negativos, entonces.
( p1 p2 ) 0 p1 p2
De la relación anterior se concluye que la proporción de reacciones adversas
no es similar para ambos extractos, observándose que el extracto A presenta
menor nivel reacciones que el extracto B.
5. Un psicólogo desea evaluar la efectividad de dos terapias para tratar el
problema de autoestima en adolescentes. Para ello agrupo a 50 adolescentes
con problemas de autoestima y se trato con la terapia A y 40 adolescentes se
les trato con la terapia B. Al final del estudio se midió el nivel de reducción
del problema de autoestima en una escala de 0 a 120, resultando las medias
de 13 y 15 para las terapias A y B respectivamente y las desviaciones estándar
respectivamente son 3 y 4. Utilizando un intervalo de confianza del 95% para
la diferencia de medias ¿Podemos concluir que la reducción media de los
rendimientos de la terapia B es mayor que la de A?
Solución.
Terapia A
145
Bioestadística. Dr. Cleto De La Torre Dueñas
x1 13, 1 3, n1 50
Terapia B
x2 15, 2 4, n2 40
z1 1.96
2
12 22 12 22
( X 1 X 2 ) z(1 / 2) * 1 2 ( X 1 X 2 ) z(1 / 2) *
n1 n2 n1 n2
9 16 9 16
(13 15) 1.96* 1 2 (13 15) 1.96*
50 40 50 40
3.49 1 2 0.50
Como 1 2 0 , entonces 1 2 .
X N , 2 2 desconocida
1 0,99 t 0 2,7969
x t0
s
n
x t0
s
n
160 2,7969
5
25
160 2,7969
5
25
157,2031 162,7969
146
Bioestadística. Dr. Cleto De La Torre Dueñas
7.- Un biólogo desea estudiar los efectos de ciertas drogas sobre el consumo de
agua en una especie particular de animales de laboratorio. La droga A que
contiene un agente que produce sed, se administró a una m.a.s. de 25 animales y la
droga B que no contiene tal agente se administró a una m.a.s. independiente de 22
animales similares. El biólogo registró la cantidad de agua consumida por cada
animal durante un periodo de tiempo determinado después de la administración
de las drogas. Las cantidades promedio de agua consumida por animal en cada
desviaciones típicas de s A 5,3 s B 5,6 El biólogo supone que las dos muestras
de respuestas son equivalentes a m.a.s. independientes de poblaciones
normalmente distribuidas ¿cuál será el I de C del 95% para A B
s 2p
n1 1 s12 n2 1 s22 25 1 5,32 22 1 5,6 2 29,616
n1 n2 2 25 22 2
s 2p s 2p s 2p s 2p
x A x B - t0 1 2 x A x B t0
n1 n2 n1 n2
21,7958 A B 28,2041
147
Bioestadística. Dr. Cleto De La Torre Dueñas
S12 S12 2
( n )
v 2
n1
( S1 / n1 ) 2
1
( S 22 / n2 ) 2
n1 1
n 1
2
2
5,32 5, 62
25 22
v 2, 0726
5,32 5, 62
25 1 22 1
x A xB -
s A2 sB2
nA nB
A
B
x A xB
s A2 sB2
nA nB
21,6909 A B 28,3090
Podemos afirmar con un nivel de confianza del 95%, que la diferencia verdadera entre las medias
poblacionales está aproximadamente entre 22 y 28 ml .
EJERCICIOS PROPUESTOS
148
Bioestadística. Dr. Cleto De La Torre Dueñas
2.- La cantidad mínima requerida para que un anestésico surta efecto en una
intervención quirúrgica fue por término medio de 50 mg, con una desviación
típica de 10,2 mg, en una muestra de 60 pacientes. Obtener un intervalo de
confianza para la media al 99%, suponiendo que la muestra fue extraída mediante
muestreo aleatorio simple sobre una población normal.
5.- Una psicóloga afirma que los hombres, son menos variables en agresividad
hacia sus hijos cuando tienen conflictos con su pareja que las mujeres.
149
Bioestadística. Dr. Cleto De La Torre Dueñas
8.- Debido a las variaciones en las técnicas de laboratorio, a las impurezas de los
materiales y a otros factores desconocidos, los resultados de un experimento en
un laboratorio de química no siempre dan las mismas respuestas numéricas. En
un experimento de electrólisis, una clase mide la cantidad de cobre precipitado
de una solución saturada de sulfato de cobre, durante un período de 30
minutos. Los 40 estudiantes consiguieron una media de 0.145 moles y una
desviación estándar de 0.051 moles. Encuentre un intervalo de confianza del
90% para la cantidad media de cobre precipitado.
150
Bioestadística. Dr. Cleto De La Torre Dueñas
Aceptar Ho Rechazar Ho
151
Bioestadística. Dr. Cleto De La Torre Dueñas
152
Bioestadística. Dr. Cleto De La Torre Dueñas
Para H a : 0
1
/2 /2
Z(1/2 Z(1/2
R.R. H0 R.A. H0 R.R. H0
Para H a : 0
1
Z(1
R.A. H0 R.R. H0
Para H a : 0
1
Z(1
R.R. H0 R.A. H0
153
Bioestadística. Dr. Cleto De La Torre Dueñas
Tc t1 n 1
2 es desconocido
Prueba de Z c z1
2
diferencias de Ha: 1 2 X1 X 2
Zc
Medias Ha: 1 > 2
12
n1
2
n2
2
Z c z1
H0: 1 = 2 vs: Ha: 1 < 2
Zc X1 X 2 Z c z1
Asumiendo
s12 s22
12 y 22 Conocidos n1 n2
154
Bioestadística. Dr. Cleto De La Torre Dueñas
n1 30 y n2 30
Prueba de diferencia Tc t1 n1 n2 2
de Medias Ha: 1 2 Tc S X1 1X21 2
Tc t1 n1 n2 2
p n1 n2
H0: 1 = 2 vs Ha: 1 > 2
Asumiendo que: Ha: 1 < 2 n1 1S12 n2 1S22
Sp n1 n2 2 Tc t1 n1 n2 2
12 22 y
desconocidos
Prueba de diferencia X1 X 2 Tc t1 v
de Medias Ha: 1 2
Tc S12 S22
2
H0: 1 = 2 vs Ha: 1 > 2
n1 n2 Tc t1 v
Tc t1 v
Asumiendo que: S12 S12 2
Ha: 1 < 2 ( n )
v n1 1
12 22 y ( S12 / n1 ) 2 ( S 22 / n2 ) 2
n 1
n1 1 2
desconocidos
Prueba de varianzas Ha: 2 02 c2 2 n 1 ó c2 12 n 1
2 2
H0: 2 = 02 vs n1S 2
Ha: 2
02
2
c 02
Ha: 2 02 c2 1 n 1
c2 n 1
Prueba de razón de Ha: 2 2
1 2 Fc F nmax 1, nmin 1 ó Fc F1
2 2
varianzas. 2
Ha: 12 22
Fc S 2
Smax
Ha: 12 22
min
Fc F1 n1 1, n2 1
H0: 12 22 vs
Fc F n1 1, n2 1
Prueba de
proporciones Zc
p p0 Zc z1
Ha: p p0 p (1 p )/ n 2
Ha: p > p0
Z c z1
H0: p =p0 Vs Ha: p < p0
Zc z1
155
Bioestadística. Dr. Cleto De La Torre Dueñas
EJERCICIOS RESUELTOS
Zc 180
580 355
/ 60
9.68
Región critica
156
Bioestadística. Dr. Cleto De La Torre Dueñas
=5%
Z0=1.645 Zc =9.68
Región Región
Aceptación Crítica
Conclusión.
Como Z c Z o
Antes 25 25 27 44 30 67 53 53 52
Después 27 29 37 56 46 82 57 80 61
Diferencia 2 4 10 12 16 15 4 27 9
157
Bioestadística. Dr. Cleto De La Torre Dueñas
Nivel de significancia, 5%
Estadística de prueba.
X 0
Tc S/ n
n 9, x1 11
11 0
Tc 4.25
7.76 / 9
Región critica
Conclusión.
Se rechaza la hipótesis nula, por que los fumadores presentan una mayor
tendencia a la formación de coágulos.
Solución.
Formulación de hipótesis.
H0: 1 = 2
Ha: 1 2
Nivel de significancia, 5%
158
Bioestadística. Dr. Cleto De La Torre Dueñas
Estadística de prueba.
Supongamos que las varianzas poblacionales son iguales, entonces el estadístico
de prueba es:
X1 X 2
Tc Sp 1 1 t (n1 + n2 -2)
n1 n2
De la información se tiene:
X1 X 2 138.6 125.8
Tc 6.50
5.27 * 13 16
Sp 1 1
n1 n2 1 1
Región critica
T0 t1 n1 n2 2 t0.975 13 16 2 t0.975 27 2.052
2
Conclusión.
159
Bioestadística. Dr. Cleto De La Torre Dueñas
Solución.
Formulación de hipótesis.
Ho : 1 2 , el medicamento es inocuo.
Nivel de significancia, 5%
Estadística de prueba.
tc
25 19 0 7.06
9 4
20 15
Región critica
Es un ensayo de dos colas donde los valores críticos se buscan en la Tabla t-
student, interpolando entre 30 y 40 grados de libertad.
Conclusión.
Se acepta la hipótesis nula.
Solución.
Formulación de hipótesis.
H0: p1 =p2
Ha: p1 p2
Nivel de significancia, 5%
160
Bioestadística. Dr. Cleto De La Torre Dueñas
Estadística de prueba.
p1 p2
Zc pc (1 pc ) pc (1 pc )
n1 n2
Tratamiento A.
p1 0.2 , n1 600
Tratamiento B.
p2 0.15 , n2 600
n1 p1 n2 p2 600*0.2 600*0.15
pc 0.175
n1 n2 600 600
p1 p2
Zc pc (1 pc ) pc (1 pc )
0.20 0.15
0.175(1 0.175) 0.175(1 0.175)
2.279
n1 n2 600 600
Región critica
=5%
Z0=1.96 Zc =2.279
Región Región
Aceptación Crítica
Conclusión.
EJERCICIOS PROPUESTOS
1. Se escogen al azar dos grupos formados por 20 individuos cada uno, entre
los que padecen cierta alergia. Se administra una droga curativa al primer
grupo y se observa una mejoría en 15 de los casos. Al segundo grupo se le
161
Bioestadística. Dr. Cleto De La Torre Dueñas
162
Bioestadística. Dr. Cleto De La Torre Dueñas
Paciente 1 2 3 4 5
Vieja 0.38 0.54 0.22 0.11 0.23
Nueva 0.33 0.45 0.15 0.09 0.22
Diferencia 0.05 0.09 0.07 0.02 0.01
6. Un dentista afirma que el 40% de los niños de 10 años presentan indicios de
caries dental. Tomada una muestra de 100 niños, se observó que 36
presentaban indicios de caries. Contrastar la hipótesis del dentista para un
nivel de confianza del 90%.
Antes: 25 25 27 44 30 67 53 53 52 60 28
Después 27 29 37 56 46 82 57 80 61 59 43
163
Bioestadística. Dr. Cleto De La Torre Dueñas
Intervención 2:
10. Se sabe que los individuos con un infarto temprano (antes de los 35 años)
tienen un riesgo alto de volver a sufrir otro infarto en los siguientes 5 años.
Se piensa que tal riesgo se reduce si las personas con infarto temprano se
someten a una serie prolongada de ejercicios de esfuerzo. a) ¿Qué se puede
decir de la efectividad de tales ejercicios si, de 60 personas sometidas a ellos,
16 registraron un nuevo infarto, en tanto que ello sucedió en 83 personas de
las 198 que no se sometieron a los mismos? b) Evaluar la ganancia obtenida;
c) Sin la información anterior, ¿con qué tamaño de muestra debería haberse
diseñado el experimento para que un test al 5% de error detecte una
diferencia de riesgos del 10% en el 90% de las ocasiones?
164
Bioestadística. Dr. Cleto De La Torre Dueñas
165
Bioestadística. Dr. Cleto De La Torre Dueñas
15.- Se sospecha que una nueva droga es efectiva en el 90% de los casos para una
cierta enfermedad, pero el laboratorio que fabrica dicha droga cree que es
efectiva en menos del 90%. En una muestra aleatoria de 400 personas que
tenían esa enfermedad, 320 sanaron con la aplicación de la droga.
a) ¿Cree Ud. que el laboratorio tiene razón? Use una significación de 1%.
b) ¿Entre qué valores se encuentra la verdadera proporción de efectividad de la
droga con una confiabilidad de 95%?
c) Si se desea estimar la proporción de efectividad de la droga con un error de 5%
y una confiabilidad de 95% ¿En cuántas personas deberá ser aplicada la droga?
(Use la muestra anterior como muestra piloto)
17.-Un psicólogo desea evaluar la eficacia de dos terapias para tratar problemas de
estrés, para ello selecciona al azar 70 pacientes y forma aleatoriamente dos
grupos. El primer grupo de 30 pacientes fue tratado con la terapia A y el
segundo grupo de 40 pacientes con la terapia B. Al cabo de un tiempo se les
mide su nivel de estrés en una escala de o a 100. los resultados son, para la
terapia A, su media es 40 y para la terapia B es 60. Suponiendo que las
desviaciones son 1 55, 2 20 . Al nivel de significancía del 2%, cual es su
conclusión.
166
Bioestadística. Dr. Cleto De La Torre Dueñas
19.- Se afirma que cierta terapia que se prescribe para tratar la ansiedad es efectiva
en menos del 50% de los casos. Al parecer esta afirmación no se ajusta a la
realidad, por lo que se les aplica esta terapia a 70 pacientes, resultando que 50
de ellos han experimentado mejoras. Esta suficiente evidencia para concluir
que realmente la terapia es efectiva en más del 50% de los casos al nivel de
significancia del 5%.
21.- Un psicólogo desea evaluar la eficacia de dos terapias (Ay B) para tratar
problemas de estrés, para ello selecciona al azar 100 pacientes y forma
aleatoriamente dos grupos de tamaños iguales. Al cabo de un tiempo se les
mide su nivel de estrés en una escala de o a 100. los resultados son, para la
terapia A, su media es 55 y para la terapia B es 65. Suponiendo que las
desviaciones son 1 105, 2 120 . Al nivel de significancía del 5%, cual es su
conclusión.
167
Bioestadística. Dr. Cleto De La Torre Dueñas
23.- Se afirma que cierta terapia que se prescribe para tratar la ansiedad es efectiva
en 60% de los casos. Al parecer esta afirmación no se ajusta a la realidad, por
lo que se les aplica esta terapia a 35 pacientes, resultando los siguientes datos
1,0,0,1,1,1,1,0,1,0,1,1,1,1,1,0,0,1,0,0,1,1,1,1,1,0,0,0,1,0,1,0,1,0,1 donde 1 indica que
el tratamiento es efectivo y 0 que no es efectivo para tratar la ansiedad. En
base a la información, cual es su conclusión respecto a la terapia al 98%.
168
Bioestadística. Dr. Cleto De La Torre Dueñas
26.- El límite superior especificado de impurezas de una sustancia es 0.01 por 100.
El analista repite el análisis cinco veces y encuentra los siguientes resultados:
0.009, 0.012, 0.0113, 0.0821 y 0.0915. Teniendo en cuenta el error experimental,
¿es significativamente superior el promedio de impurezas al especificado del
0.01%?. =0.01
169
Bioestadística. Dr. Cleto De La Torre Dueñas
CAPITULO IX
PRUEBA DE CHI-CUADRADO
Tabla de contingencia.
Es relativamente frecuente encontrarse con información referida a la observación
de dos características de una población, en las que se establecen modalidades o
categorías, mediante las cuales se clasifican los individuos o elementos que
constituyen una muestra de la misma. Este tipo de distribución bidimensional de
frecuencias suele presentarse en forma de tabla de doble entrada, también llamada
tabla de contingencia.
170
Bioestadística. Dr. Cleto De La Torre Dueñas
PRUEBA DE HOMOGENEIDAD.
En ocasiones ocurre que tenemos a varias poblaciones clasificadas de acuerdo con
las categorías definidas para una determinada variable. La pregunta que se
sugiere inmediatamente es si la proporción de individuos pertenecientes a cada
una de las clases es la misma en todas las poblaciones. Si, con la información
suministrada por las muestras obtenidas, se puede aceptar que esto es así, diremos
que las poblaciones son homogéneas con respecto a la variable de clasificación
utilizada.
171
Bioestadística. Dr. Cleto De La Torre Dueñas
Hipótesis:
Regla de decisión:
172
Bioestadística. Dr. Cleto De La Torre Dueñas
PRUEBA DE INDEPENDENCIA
Fila r O r2 O r2 . .. 0 rc n ro
Total n .i n .2 . .. n., n..
Hipótesis:
173
Bioestadística. Dr. Cleto De La Torre Dueñas
Regla de decisión:
Se adopta la siguiente regla de decisión:
EJERCICIOS RESUELTOS
Solución.
H0: El porcentaje de reacciones adversas es homogéneo para los tres
tratamientos.
174
Bioestadística. Dr. Cleto De La Torre Dueñas
70 106.67 100 106.67 150 106.67 130 93.33 100 93.33 50 93.33
2 2 2 2 2 2
2
c
106.67 106.67 106.67 93.33 93.33 93.33
c2 65.625
1
o2=5.99 o2=65.625
R.A. H0 R.R. H0
175
Bioestadística. Dr. Cleto De La Torre Dueñas
Nivel Socioeconómico
Habito de fumar
Alto Medio Bajo Total
Actualmente 51 (68.75) 22(16.94) 43(30.30) 116
En el pasado 92(83.57) 21(20.60) 28(36.83) 141
Nunca 68(58.68) 9(14.46) 22(25.86) 99
Total 211 52 93 356
o eij
2
3 3
18.510 x 2 (3 1)(3 1)
2 ij
xc
i 1 j 1 eij
176
Bioestadística. Dr. Cleto De La Torre Dueñas
Respuesta
Positiva Parcial Ninguna Total
Histilogia PL Frecuencia observada 74 18 12 104
Frecuencia esperada 60.7 18.9 24.4 104.0
EN Frecuencia observada 68 16 12 96
Frecuencia esperada 56.0 17.5 22.5 96.0
CM Frecuencia observada 154 54 58 266
Frecuencia esperada 155.2 48.5 62.3 266.0
AL Frecuencia observada 18 10 44 72
Frecuencia esperada 42.0 13.1 16.9 72.0
Total Frecuencia observada 314 98 126 538
Frecuencia esperada 314.0 98.0 126.0 538.0
177
Bioestadística. Dr. Cleto De La Torre Dueñas
este caso influye el factor; en el caso que p > 0.05 la decisión es aceptar la hipótesis
nula, no influye el factor.
En nuestro ejemplo p-valo<0.05, se rechaza la hipótesis nula. La respuesta al
tratamiento esta relacionado con el tipo de Histología. ¿Cual es el tipo de
relación que existe?
Respuesta
Histilogia Positiva Parcial Ninguna Total
PL Frecuencia 74 18 12 104
Porcentaje 71.2% 17.3% 11.5% 100.0%
EN Frecuencia 68 16 12 96
Porcentaje 70.8% 16.7% 12.5% 100.0%
CM Frecuencia 154 54 58 266
Porcentaje 57.9% 20.3% 21.8% 100.0%
AL Frecuencia 18 10 44 72
Porcentaje 25.0% 13.9% 61.1% 100.0%
Total Frecuencia 314 98 126 538
Porcentaje 58.4% 18.2% 23.4% 100.0%
c2
60 50,282 32 282 28 41,712 28 31,712 17 212 45 31,28 16,234
50,28 28 41,71 31,71 21 31,28
grados de libertad 2 1 3 1 2
178
Bioestadística. Dr. Cleto De La Torre Dueñas
RC 2 / 2 5,991 si 0,05
c2 RC Re chazamos H 0
RC 2 / 2 10,597 si 0,005
c2 es significativo más allá del nivel 0,005 es decir existe una diferencia
significativa del grado de mejoría entre el grupo del placebo y el grupo del
medicamento.
Enfermedad
Factor de exposición Si No Total
Si a b c1
No c d c2
Total r1 r2 n
179
Bioestadística. Dr. Cleto De La Torre Dueñas
Prob(Expuestos/Enfermos)
1-Prob(Expuestos/Enfermos)
OR
Prob(Expuestos/ No Enfermos)
1-Prob(Expuestos/ No Enfermos)
Se demuestra que ambas expresiones son equivalentes por lo que la estimación del
OR para estudios prospectivos y retrospectivos es la misma y viene dada pro:
a.d
OR
b.c
Cálculo del IC 95%(OR)
Para calcular el IC(OR)es conveniente trabajar con el transformado logarítmico de
OR para lo cual es necesario calcular:
1 1 1 1
EE(LnOR)=
a b c d
Con lo que
IC 95%(OR)=(exp( LnOR - [Link](LnOR)); (LnOR + 1.96. EE(LnOR))
La significación del OR viene dada pro la prueba chi-cuadro que en el caso de una
tabla 2x2 tiene la siguiente expresión.
ad bc
2
.n
2
r1 r2 c1 c 2
180
Bioestadística. Dr. Cleto De La Torre Dueñas
Cálculo de IC95%(RR)
Para calcular el IC(RR) es conveniente trabajar con el transformado logaritmo de
RR para lo cual es necesario calcular.
1 1 1 1
EE(LnRR)=
a c1 b c2
Con lo que
IC 95%(RR)=(exp( LnRR - [Link](LnRR)); (LnRR + 1.96. EE(LnRR))
EJERCICIOS RESUELTOS
Enfermedad
Factor de exposición Si No Total
Si 21 8 29
181
Bioestadística. Dr. Cleto De La Torre Dueñas
No 16 31 47
Total 37 39 76
Calculo de OR
Con la notación introducida en el apartado de formulación básicas, se tiene que
a.d 21.31
OR 50859
b.c 16.8
1 1 1 1 1 1 1 1
EE(Ln OR)= = = 0.51571
a b c d 21 16 8 31
IC 95%(OR)=(exp( LnOR - [Link](LnOR)); (LnOR + 1.96. EE(LnOR)))
= (exp( Ln 5.0859 - 1.96.0.5171);exp(Ln 5.0859 + 196.0.05171))
=(exp( 0.6130)); exp (26400))=(1.8459;14.0127)
Riesgo relativo
Para los mismos datos del ejemplo anterior, calcular el riesgo relativo RR. Su
intervalo de confianza al 95% y su significación estadística.
Calculo del RR
Con la notación introducida en el apartado de fórmulas, se tiene qué
a.c2 21.47
RR 2.1272
b.c1 16.29
182
Bioestadística. Dr. Cleto De La Torre Dueñas
1 1 1 1 1 1 1 1
EE(Ln RR)= = = 0.2332
a c1 b c 2 21 29 16 47
EJERCICIOS PROPUESTOS
1.- Se desea evaluar la efectividad de una nueva vacuna antigripal. Para ello se
decide suministrar dicha vacuna, de manera voluntaria y gratuita, a una
pequeña comunidad. La vacuna se administra en dos dosis, separadas
por un perıodo de dos semanas, de forma que algunas personas han recibido
una sola dosis, otras han recibido las dos y otras personas no han recibido
ninguna. La siguiente tabla indica los resultados que se registraron durante la
siguiente primavera en 1000 habitantes de la comunidad elegidos al azar.
No
vacunados Una dosis Dos dosis
Gripe 24 9 13
No gripe 289 100 565
2.- Las células infectadas por el virus del SIDA HIV-1 producen una
proteína llamada TAT. Se lleva a cabo un estudio para contrastar la
183
Bioestadística. Dr. Cleto De La Torre Dueñas
184
Bioestadística. Dr. Cleto De La Torre Dueñas
5.- En un estudio realizado a, 341 pacientes fueron clasificados por grupo etáreo y
Presión. Los resultados se presentan en la siguiente tabla:
GRUPO PRESION
Total
ETAREO Alta Normal Baja
Joven 15 25 40 80
Adulto 30 100 43 173
Adulto Mayor 43 27 18 88
Total 118 150 73 341
a) ¿Existe alguna relación significativa entre la presión y grupo etáreo de los
pacientes? Use un nivel de confiabilidad de 99%
185
Bioestadística. Dr. Cleto De La Torre Dueñas
Grupo sanguíneo
Tensión arterial A B AB O Total
Baja 28 9 7 31 75
Normal 543 211 90 476 1320
Alta 44 22 8 31 105
Total 615 242 105 538 1500
Efectividad Terapias
A B C
Sin mejoras 10 20 15
Cierta mejora 40 30 20
Mejora Total. 10 10 25
¿Podemos concluir al nivel de significancia del 5%, que las tres terapias son
igualmente efectivos para mejorar el rendimiento?
8.-.- Un hospital desea determinar si la causa del estrés se relaciona con la edad,
para lo cual se toma una muestra de 200 al azar y se les clasifica según edad y
presencia del estrés obteniendo los siguientes datos:
EDAD
Presencia de estrés
Menos de 30 30 - 50 Más de 50
Si 40 28 52
No 20 36 24
186
Bioestadística. Dr. Cleto De La Torre Dueñas
a) ¿Está la edad relacionada con la presencia del estrés? Use una confiabilidad de
95%.
10.- Se estudian dos grupos de 120 y 500 hombres adultos c/u. seleccionados
aleatoriamente. Los del primer grupo son portadores de Ca. De páncreas y el
segundo clínica y laboratorialmente sano. En ambos grupos se indaga el
antecedente de consumo de alcohol según tiempo, frecuencia y cantidad. En el
grupo de enfermos el 40% registra el antecedente de consumo y en el grupo de
sanos el 85% no consumió. Calcule usted:
a) La razón de probabilidades (ODDS RATIO) ……………………………….
b) RAP …………..X2 ……………….IC95%.....................................................
187
Bioestadística. Dr. Cleto De La Torre Dueñas
Mujeres con cáncer de mama con antecedente positivo (Primer embarazo a la edad
de 30 o más años) = 30. Mujeres sin cáncer de mama con dicho antecedente =20
El estudio es:
a) Experimental
b) Observacional
c) Longitudinal
d) Cohertes
e) Casos y controles
Calcula usted:
a) El OR:………………… b) RAP:…………………. c)X2………………………
d) IC95%.....................................
Tener la primera estación tardíamente (30 años) es un factor de riesgo?
SI……….. NO………….
Por qué?...............................................................................................................
188
Bioestadística. Dr. Cleto De La Torre Dueñas
CAPITULO X
DISEÑO EXPERIMENTAL
FACTOR.
Son todas aquellas variables cuyo efecto se desea medir, en algunos casos se les
llama tratamiento.
NIVEL
Es el conjunto de valores que tiene la variable independiente o factor en el
experimento.
UNIDAD EXPERIMENTAL
Es la entidad más pequeña a lo que se aplica el tratamiento, es decir; es el
elemento donde se realiza la medición.
189
Bioestadística. Dr. Cleto De La Torre Dueñas
ERROR EXPERIMENTAL
Es la medida de la variación, existente entre observaciones de las unidades
experimentales.
En un Diseño Experimental se tiene variabilidad inherente a la unidad
experimental y otra variabilidad debida a los tratamientos.
Para reducir el error experimental se siguen algunos pasos:
Repetir el experimento
Adicionar más tratamientos
Introducir variables o bloques
El proceso o sistema bajo estudio puede representarse por medio del modelo:
190
Bioestadística. Dr. Cleto De La Torre Dueñas
VENTAJAS Y DESVENTAJAS
VENTAJAS
Este Diseño es fácil de planear y es flexible en cuanto al número de
repeticiones y unidades experimentales del tratamiento
DESVENTAJAS
Solo es aplicable, cuando el material experimental es homogéneo
Los resultados del experimento se pueden agrupar de la siguiente
forma:
yij
factor variedad
repetición.
191
Bioestadística. Dr. Cleto De La Torre Dueñas
En resumen:
1 2 i a
Tratam
Donde:
n
Yi. Yij , Total del i-ésimo tratamiento
j 1
n
Yi .
Yi . Yij , Media del i-ésimo tratamiento
j 1 n
a a n
Y.. Yi. Yij , Total
i 1 i 1 j 1
Y..
Y.. , Media total
an
En esta parte desarrollaremos el Análisis de Varianza para el modelo de Efectos
fijos del Diseño Completamente al Azar. (DCA).
192
Bioestadística. Dr. Cleto De La Torre Dueñas
ANALISIS DE VARIANZA
Es la técnica mediante el cual se mide los efectos de los tratamientos puesto que
descompone la Varianza Total en diferentes fuentes de variabilidad definida por el
modelo.
Para el cual se siguen los siguientes pasos:
H 0 : 1 2 a
H1: i j , para algún par (i,j)
La fórmula asumida para calcular la suma de los cuadrados es la siguiente:
y..2
SCT yij y..
a n a n
yij
2
, N an
i 1 j 1 i 1 j 1 N
a
yi2. y..2
SCA N an
i 1 ni N
193
Bioestadística. Dr. Cleto De La Torre Dueñas
1
f(1
R.A. H0 R.R. H0
Análisis de la varianza.
Fuentes de g.l SC CM FCAL
Varianza
Tratamiento a-1 SCA CMA CMA
CME
Error a(n-1) SCE CME
Total an-1 STT
Conclusiones:
Si Fc F0 Se rechaza H0
Si Fc F0 Se acepta H0
194
Bioestadística. Dr. Cleto De La Torre Dueñas
cada factor A contiene los elementos del factor B el cual disminuye el error
experimental.
TABLA DE ANALISIS DE VARIANZA
Fuentes de g.l SC CM FCAL
Varianza
Factor A a-1 SCA CMA CMA
CME
Factor B b-1 SCB CMB CMB
CME
Interacción (a-1)(b-1) SCAB CMAB CMAB
AB CME
Total abn-1
Donde:
2 2 2 2 2
SCT Y Y ,
a b n
2 ...
SCA Y
a
i ..
Y ...
, SCB
b
Y . j.
Y ...
,
ijk
abn
i 1 j 1 k 1 i 1 bn abn j 1 an abn
2 2
SCAB
a b
Y Y
i 1
j 1 n
ij.
abn
...
SCA SCB
SCE = SCT-(SCA+SCB+SCAB)
El cuadrado medio, se obtiene:
SCA
Para el factor A : CMA
a 1
SCB
Para el factor B : CMB
b 1
SCAB
Para la interacción AB : CMAB
(a 1)(b 1)
SCAB
Para el error : CME
ab(n 1)
195
Bioestadística. Dr. Cleto De La Torre Dueñas
respuesta.
APLICACIONES.
1.- Puesto que el hígado es el principal lugar para el metabolismo de los fármacos,
se espera que los pacientes con enfermedades de hígado tengan dificultades en
la eliminación de fármacos. Uno de tales fármacos es la fenilbutazona. Se realiza
un estudio de la respuesta del sistema a este fármaco. Se estudian tres grupos:
controles normales, pacientes con cirrosis hepática, pacientes con hepatitis
activa crónica. A cada individuo se les suministra oralmente 19 mg de
fenilbutazona/Kg. de peso. Basándose en los análisis de sangre se determina
para cada uno el tiempo de máxima concentración en plasma (en horas). Se
obtienen estos datos:
196
Bioestadística. Dr. Cleto De La Torre Dueñas
¿Se puede concluir que las tres poblaciones difieren respecto del tiempo de
máxima concentración en plasma de fenilbutazona?
Solución
La hipótesis estadística esta dado por:
H 0 : 1 2 a
H1: i j
Normal Cirrósis Hepatítis
35 36 37
30.6 30.7 30.8
26.8 26.9 26.10
37.9 37.10 37.11
13.7 13.8 13.9
49 50 51
n 6 6 6 N=18
197
Bioestadística. Dr. Cleto De La Torre Dueñas
a
y..2
n
2582
SCT yij 35 30.6 26.8 .... 51
2 2 2 2
2194.57
i 1 j 1 N 18
a
yi. y..2 842 862 882 2582
SCA 0.7059
i 1 ni N 6 18
0 fc .22 f3.68
De la tabla FO=3.68, Se acepta HO, por lo tanto las tres estrategias de ventas
presenta similar efecto.
198
Bioestadística. Dr. Cleto De La Torre Dueñas
Disminución Disminución
Tiempo Tratamiento de Volumen Tiempo Tratamiento de Volumen
30 EE1 -0.085 90 EE3 0.09
30 EE1 0.045 120 EE3 0.2
60 EE1 -0.1 120 EE3 0.25
60 EE1 0.02 150 EE3 0.26
90 EE1 -0.075 150 EE3 0.34
90 EE1 0.085 30 EE4 0
120 EE1 -0.073 30 EE4 0.07
120 EE1 0.087 60 EE4 0.03
150 EE1 0.25 60 EE4 0.1
150 EE1 0.17 90 EE4 0.09
30 EE2 -0.11 90 EE4 0.17
30 EE2 0.03 120 EE4 0.21
60 EE2 -0.1 120 EE4 0.2
60 EE2 0.02 150 EE4 0.35
90 EE2 -0.08 150 EE4 0.42
90 EE2 0.07 30 Naproxeno 0.03
120 EE2 -0.05 30 Naproxeno 0.06
120 EE2 0.11 60 Naproxeno 0.11
150 EE2 0.12 60 Naproxeno 0.1
150 EE2 0.25 90 Naproxeno 0.17
30 EE3 -0.06 90 Naproxeno 0.15
30 EE3 0 120 Naproxeno 0.21
60 EE3 -0.04 120 Naproxeno 0.32
60 EE3 0.02 150 Naproxeno 0.44
90 EE3 0.02 150 Naproxeno 0.42
199
Bioestadística. Dr. Cleto De La Torre Dueñas
ANALISIS DE VARIANZA
Fuentes de variación Suma de gl Cuadrado Fc P-Value
cuadrados medio
Factores
A:Tratamiento 0.242096 4 0.0605239 12.40 0.0000
B:Tiempo 0.611808 4 0.152952 31.34 0.0000
Interaccion
AB 0.0524227 16 0.00327642 0.67 0.7941
Error 0.122 25 0.00488
Total 1.02833 49
200
Bioestadística. Dr. Cleto De La Torre Dueñas
0.24
Disminucion de Volumen
0.19
0.14
0.09
0.04
-0.01
EE1 EE2 EE3 EE4 Naproxeno
Tratamiento
0.36
Disminucion de Volumen
0.26
0.16
0.06
-0.04
30 60 90 120 150
Tiempo
201
Bioestadística. Dr. Cleto De La Torre Dueñas
0.45 Tratamiento
EE1
Disminucion de Volumen
0.35 EE2
EE3
EE4
0.25
Naproxeno
0.15
0.05
-0.05
30 60 90 120 150
Tiempo
De este análisis se puede concluir que todos los tratamientos presentan mejor
efecto a los 150 minutos.
EJERCICIOS
202
Bioestadística. Dr. Cleto De La Torre Dueñas
A B C
Diuréticos 227 233 210
Betabloq. 231 241 190
Alfabloq. 216 252 186
IECAS 222 237 175
ARAII 217 242 177
Calcioant 211 250 168
¿Hay diferencias entre los valores del colesterol obtenidos mediante los
tratamientos de los tres hipolipemiantes? ¿Hay efecto de bloques?
203
Bioestadística. Dr. Cleto De La Torre Dueñas
5.- Los siguientes datos representan los tiempos de reacción (en segundos) a tres
tipos de estímulos:
Estímulo A: 4.9 6.1 4.3 4.6 5.3
Estímulo B: 5.5 5.4 6.2 5.8 5.6 5.2 4.8
Estímulo C: 6.4 6.8 5.7 6.5 6.3 6.6
a) Pruebe si el tiempo de reacción al tipo de estímulo B es superior al tipo de
estímulo A. Use 0.05.
b) Pruebe utilizando la prueba adecuada, si el tiempo de reacción es diferente
a los tres tipos de estímulos. Use un nivel de significación de 1%.
204
Bioestadística. Dr. Cleto De La Torre Dueñas
6.- La tabla siguiente muestra los niveles de residuo pesticida (PPB) en muestras
de sangre de 4 grupos de personas. Contrastar a un nivel de confianza de 0.05,
la hipótesis nula de que no existe diferencia en los niveles de PPB en los cuatro
grupos considerados.
Niveles de PPB
Grupo I 10 37 12 31 11 9 23
Grupo II 4 35 32 19 33 18 8
Grupo III 15 5 10 12 6 6 15
Grupo IV 7 11 1 8 2 5 3
Medida de la extraversión
Forma A 12 18 21 10 15 27 31 6 15 13 8 10
Forma B 10 17 20 5 21 24 29 7 11 13 8 11
205
Bioestadística. Dr. Cleto De La Torre Dueñas
CAPITULO XI
Regresión probit.
i p[U xi ] F ( xi ) f (u )du
206
Bioestadística. Dr. Cleto De La Torre Dueñas
EJERCICIO RESUELTO
X= Dosis yi mi
0.649 0 6
0.791 0 6
1.044 2 6
1.493 2 6
1.917 4 6
2.43 5 6
3.087 5 6
3.926 6 6
4.886 6 6
OBJETIVOS
Los objetivos de este tipo de experimentos son en general, modelar la
probabilidad de sucesos i como función de variables explicatorios o
independientes.
Determinar la dosis Efectiva (DLp) que causan la mudanza de estado del
p% de los individuos.
Comparar la potencia de diferentes productos.
207
Bioestadística. Dr. Cleto De La Torre Dueñas
Y=0, Sobrevive.
El test den chi cuadrado, con un valor 1.150 y 5 grados de libertad y un grado de
significación p=0.950 , no establece dudas acerca de la bondad del ajuste del
modelo a los datos.
En conclusión el modelo ajusta adecuadamente los datos para este problema.
208
Bioestadística. Dr. Cleto De La Torre Dueñas
209
Bioestadística. Dr. Cleto De La Torre Dueñas
210
Bioestadística. Dr. Cleto De La Torre Dueñas
Regresión Logística.
Sea la variable categórica y, que toma dos valores y=1 (padece la enfermedad) e
y=0 ( no padece la enfermedad). Con probabilidad de tomar el valor 1, denotado
por P, la probabilidad que y no es igual a 1, es 1-P , la razón de disparidades
(ODDS) que favorece a y tomar el valor 1, está dado por
P
ODSS ( y 1)
1 P
0.65
ODSS ( y 1) 1.857 2
0.35
Este valor indica que es dos veces más probable de no tener la enfermedad
P
L log( )
1 P
L 0 1 x1 ... p x p
211
Bioestadística. Dr. Cleto De La Torre Dueñas
EJERCICIO RESUELTO
212
Bioestadística. Dr. Cleto De La Torre Dueñas
p
log 1.335 1.181* [Link]
1 p
exp(1.335)
p 0.792
1 exp(1.335)
213
Bioestadística. Dr. Cleto De La Torre Dueñas
214
Bioestadística. Dr. Cleto De La Torre Dueñas
gl 1
0.75 0.80 0.85 0.9 0.95 0.975 0.99 0.995
1 1 1.376 1.963 3.078 6.314 12.706 31.821 63.657
2 0.816 1.061 1.386 1.886 2.920 4.303 6.965 9.925
3 0.765 0.978 1.250 1.638 2.353 3.182 4.541 5.841
4 0.741 0.941 1.190 1.533 2.132 2.776 3.747 4.604
5 0.727 0.920 1.156 1.476 2.015 2.571 3.365 4.032
6 0.718 0.906 1.134 1.440 1.943 2.447 3.143 3.707
7 0.711 0.896 1.119 1.415 1.895 2.365 2.998 3.499
8 0.706 0.889 1.108 1.397 1.860 2.306 2.896 3.355
9 0.703 0.883 1.100 1.383 1.833 2.262 2.821 3.250
10 0.7 0.879 1.093 1.372 1.812 2.228 2.764 3.169
11 0.697 0.876 1.088 1.363 1.796 2.201 2.718 3.106
12 0.695 0.873 1.083 1.356 1.782 2.179 2.681 3.055
13 0.694 0.870 1.079 1.350 1.771 2.160 2.650 3.012
14 0.692 0.868 1.076 1.345 1.761 2.145 2.624 2.977
15 0.691 0.866 1.074 1.341 1.753 2.131 2.602 2.947
16 0.69 0.865 1.071 1.337 1.746 2.120 2.583 2.921
17 0.689 0.863 1.069 1.333 1.740 2.110 2.567 2.898
18 0.688 0.862 1.067 1.330 1.734 2.101 2.552 2.878
19 0.688 0.861 1.066 1.328 1.729 2.093 2.539 2.861
20 0.687 0.860 1.064 1.325 1.725 2.086 2.528 2.845
21 0.686 0.859 1.063 1.323 1.721 2.080 2.518 2.831
22 0.686 0.858 1.061 1.321 1.717 2.074 2.508 2.819
23 0.685 0.858 1.060 1.319 1.714 2.069 2.500 2.807
24 0.685 0.857 1.059 1.318 1.711 2.064 2.492 2.797
25 0.684 0.856 1.058 1.316 1.708 2.060 2.485 2.787
26 0.684 0.856 1.058 1.315 1.706 2.056 2.479 2.779
27 0.684 0.855 1.057 1.314 1.703 2.052 2.473 2.771
28 0.683 0.855 1.056 1.313 1.701 2.048 2.467 2.763
29 0.683 0.854 1.055 1.311 1.699 2.045 2.462 2.756
30 0.683 0.854 1.055 1.310 1.697 2.042 2.457 2.750
40 0.681 0.851 1.050 1.303 1.684 2.021 2.423 2.704
60 0.679 0.848 1.046 1.296 1.671 2.000 2.390 2.660
120 0.677 0.845 1.041 1.289 1.658 1.980 2.358 2.617
0.674 0.842 1.036 1.282 1.645 1.960 2.326 2.576
215
Bioestadística. Dr. Cleto De La Torre Dueñas
gl 0.01 0.01 0.025 0.05 0.1 0.2 0.4 0.6 0.8 0.9 0.95 0.975 0.99 0.995
1 0 0 0 0 0.02 0.06 0.27 0.71 1.64 2.71 3.84 5.02 6.63 7.88
2 0.01 0.02 0.05 0.1 0.21 0.45 1.02 1.83 3.22 4.61 5.99 7.38 9.21 10.6
3 0.07 0.11 0.22 0.35 0.58 1.01 1.87 2.95 4.64 6.25 7.81 9.35 11.34 12.84
4 0.21 0.3 0.48 0.71 1.06 1.65 2.75 4.04 5.99 7.78 9.49 11.14 13.28 14.86
5 0.41 0.55 0.83 1.15 1.61 2.34 3.66 5.13 7.29 9.24 11.07 12.83 15.09 16.75
6 0.68 0.87 1.24 1.64 2.2 3.07 4.57 6.21 8.56 10.64 12.59 14.45 16.81 18.55
7 0.99 1.24 1.69 2.17 2.83 3.82 5.49 7.28 9.8 12.02 14.07 16.01 18.48 20.28
8 1.34 1.65 2.18 2.73 3.49 4.59 6.42 8.35 11.03 13.36 15.51 17.53 20.09 21.95
9 1.73 2.09 2.7 3.33 4.17 5.38 7.36 9.41 12.24 14.68 16.92 19.02 21.67 23.59
10 2.16 2.56 3.25 3.94 4.87 6.18 8.3 10.47 13.44 15.99 18.31 20.48 23.21 25.19
11 2.6 3.05 3.82 4.57 5.58 6.99 9.24 11.53 14.63 17.28 19.68 21.92 24.73 26.76
12 3.07 3.57 4.4 5.23 6.3 7.81 10.18 12.58 15.81 18.55 21.03 23.34 26.22 28.3
13 3.57 4.11 5.01 5.89 7.04 8.63 11.13 13.64 16.98 19.81 22.36 24.74 27.69 29.82
14 4.07 4.66 5.63 6.57 7.79 9.47 12.08 14.69 18.15 21.06 23.68 26.12 29.14 31.32
15 4.6 5.23 6.26 7.26 8.55 10.31 13.03 15.73 19.31 22.31 25 27.49 30.58 32.8
16 5.14 5.81 6.91 7.96 9.31 11.15 13.98 16.78 20.47 23.54 26.3 28.85 32 34.27
17 5.7 6.41 7.56 8.67 10.09 12 14.94 17.82 21.61 24.77 27.59 30.19 33.41 35.72
18 6.26 7.01 8.23 9.39 10.86 12.86 15.89 18.87 22.76 25.99 28.87 31.53 34.81 37.16
19 6.84 7.63 8.91 10.12 11.65 13.72 16.85 19.91 23.9 27.2 30.14 32.85 36.19 38.58
20 7.43 8.26 9.59 10.85 12.44 14.58 17.81 20.95 25.04 28.41 31.41 34.17 37.57 40
21 8.03 8.9 10.28 11.59 13.24 15.44 18.77 21.99 26.17 29.62 32.67 35.48 38.93 41.4
22 8.64 9.54 10.98 12.34 14.04 16.31 19.73 23.03 27.3 30.81 33.92 36.78 40.29 42.8
23 9.26 10.2 11.69 13.09 14.85 17.19 20.69 24.07 28.43 32.01 35.17 38.08 41.64 44.18
24 9.89 10.9 12.4 13.85 15.66 18.06 21.65 25.11 29.55 33.2 36.42 39.36 42.98 45.56
25 10.5 11.5 13.12 14.61 16.47 18.94 22.62 26.14 30.68 34.38 37.65 40.65 44.31 46.93
30 13.8 15 16.79 18.49 20.6 23.36 27.44 31.32 36.25 40.26 43.77 46.98 50.89 53.67
35 17.2 18.5 20.57 22.47 24.8 27.84 32.28 36.47 41.78 46.06 49.8 53.2 57.34 60.27
40 20.7 22.2 24.43 26.51 29.05 32.34 37.13 41.62 47.27 51.81 55.76 59.34 63.69 66.77
45 24.3 25.9 28.37 30.61 33.35 36.88 42 46.76 52.73 57.51 61.66 65.41 69.96 73.17
50 28 29.7 32.36 34.76 37.69 41.45 46.86 51.89 58.16 63.17 67.5 71.42 76.15 79.49
55 31.7 33.6 36.4 38.96 42.06 46.04 51.74 57.02 63.58 68.8 73.31 77.38 82.29 85.75
60 35.5 37.5 40.48 43.19 46.46 50.64 56.62 62.13 68.97 74.4 79.08 83.3 88.38 91.95
65 39.4 41.4 44.6 47.45 50.88 55.26 61.51 67.25 74.35 79.97 84.82 89.18 94.42 98.1
70 43.3 45.4 48.76 51.74 55.33 59.9 66.4 72.36 79.71 85.53 90.53 95.02 100.4 104.2
75 47.2 49.5 52.94 56.05 59.79 64.55 71.29 77.46 85.07 91.06 96.22 100.8 106.4 110.3
80 51.2 53.5 57.15 60.39 64.28 69.21 76.19 82.57 90.41 96.58 101.88 106.6 112.3 116.3
85 55.2 57.6 61.39 64.75 68.78 73.88 81.09 87.67 95.73 102.1 107.52 112.4 118.2 122.3
90 59.2 61.8 65.65 69.13 73.29 78.56 85.99 92.76 101.05 107.6 113.15 118.1 124.1 128.3
95 63.3 65.9 69.92 73.52 77.82 83.25 90.9 97.85 106.36 113 118.75 123.9 130 134.3
216
Bioestadística. Dr. Cleto De La Torre Dueñas
217
Bioestadística. Dr. Cleto De La Torre Dueñas
218