Estadistica Descriptiva: 1.1. Organización de Datos
Estadistica Descriptiva: 1.1. Organización de Datos
ESTADISTICA DESCRIPTIVA
características de interés.
Varones Mujeres
% de % de
Sujeto Edad Sobresaturación Sujeto Edad Sobresaturación
1 23 40 1 40 65
2 31 86 2 33 86
3 58 111 3 49 76
4 25 86 4 44 89
5 63 106 5 63 142
6 43 66 6 27 58
7 67 123 7 23 98
8 48 90 8 56 146
9 29 112 9 41 80
10 26 52 10 30 66
11 64 88 11 38 52
12 55 137 12 23 35
13 31 88 13 35 55
14 20 80 14 50 127
15 23 65 15 47 77
16 43 79 16 36 91
17 27 87 17 74 128
18 63 56 18 53 75
19 59 110 19 41 82
20 53 106 20 25 69
21 66 110 21 57 84
22 48 78 22 42 116
23 27 80 23 49 73
24 32 47 24 60 87
25 62 74 25 23 46
26 36 58 26 48 107
27 29 88 27 44 84
28 27 73 28 37 120
29 65 118 29 57 123
30 42 67
31 60 57
Fuente: Dawson, B y Trapo R. Bioestadística Médica. 2ª Edición, 1997 (36)
ascendentemente:
Varones Mujeres
% de % de
Orden Sujeto Edad Sobresaturación Orden Sujeto Edad Sobresaturación
1 14 20 80 1 7 23 98
2 1 23 40 2 12 23 35
3 15 23 65 3 25 23 46
4 4 25 86 4 20 25 69
5 10 26 52 5 6 27 58
6 17 27 87 6 10 30 66
7 23 27 80 7 2 33 86
8 28 27 73 8 13 35 55
9 9 29 112 9 16 36 91
10 27 29 88 10 28 37 120
11 2 31 86 11 11 38 52
12 13 31 88 12 1 40 65
13 24 32 47 13 9 41 80
14 26 36 58 14 19 41 82
15 30 42 67 15 22 42 116
16 6 43 66 16 4 44 89
17 16 43 79 17 27 44 84
18 8 48 90 18 15 47 77
19 22 48 78 19 26 48 107
20 20 53 106 20 3 49 76
21 12 55 137 21 23 49 73
22 3 58 111 22 14 50 127
23 19 59 110 23 18 53 75
24 31 60 57 24 8 56 146
25 25 62 74 25 21 57 84
26 5 63 106 26 29 57 123
27 18 63 56 27 24 60 87
28 11 64 88 28 5 63 142
29 29 65 118 29 17 74 128
30 21 66 110
31 7 67 123
Fuente: Dawson, B y Trapo R. Bioestadística Médica. 2ª Edición, 1997 (36)
tendencia de la edad para los varones y mujeres es mejor organizar los datos
en forma agrupada.
Agrupamiento de datos
(c), como:
K = R/c o c = R/k
Sugerencias:
a) 5 ≤ k ≤ 10
tratamos de no tener muchos, ni muy pocos. La razón básica para agrupar los
intervalos.
intervalos de clase, luego se dibuja una serie de rectángulos que tienen como
base los intervalos de clase y cuyas superficies deben ser proporcionales a las
Gráfico 1
12
10
Nº de mujeres
8
6
4
2
0
10 - 19 20 - 29 30 - 39 40 - 49 50 - 59 60 - 69 70 - 79 80 - 89
Edad (años)
Polígono de frecuencias
de gravedad de la enfermedad.
Etapa de la Número de
enfermedad pacientes Porcentaje
1 3 3%
2 28 24%
3 63 55%
4 21 18%
Total 115 100%
Fuente: Dawson, B y Trapo R. Bioestadística Médica. 2ª Edición, 1997 (31)
Gráfico de barras
Gráfico 2
70
60
50
40
30
20
10
0
1 2 3 4
Etapa de la enfermedad
Datos Nominales
Si los datos son nominales ilustramos sus frecuencias con un gráfico pastel, el
cual tiene por objeto mostrar que parte del todo es cada categoría, como se
Nº de
Bacteriemia pacientes %
Si 4 20%
No 16 80%
Total 20 100%
Fuente: Dawson, B y Trapo R. Bioestadística Médica. 2ª Edición, 1997 (28)
Gráfico 3
20%
Si
No
80%
Fuente: Dawson, B y Trapo R. Bioestadística Médica. 2ª Edición, Manual Moderno 1997 (28)
Llamadas también medidas descriptivas por que tienen por objeto describir la
Medidas de Posición. Indican los valores que tienden a tomar los datos
- Moda
- Amplitud o rango
- Asimetría
- Curtosis
- Proporciones y Porcentajes
- Razones
- Medición epidemiológica:
∑x i
Media Poblaciona l : µ = i =1
; N = Número de elementos en la población
N
∑x i
Media Muestral : x= i =1
; n = Número de elementos en la muestra
n
Es una medida de posición que proporciona el valor que tiende a tomar la
corresponda.
k k
∑x i ni ∑x i ni
Media Poblacional : µ = i =1
; Media Muestral : x= i =1
;
N n
x i = Valor individual o punto medio del intervalo
k = Número de valores diferentes o de intervalos
el número de hijos por familia y los productos del número de hijos (xi) por el
medios de cada intervalo, así como la frecuencia respectiva para una muestra
Edad xi * ni xi ni
5 – 14 9.5 5 47.5
15 – 24 19.5 10 195.0
25 – 34 29.5 20 590.0
35 – 44 39.5 22 869.0
45 – 54 49.5 13 643.5
55 – 64 59.5 5 297.5
TOTAL 75 2642.5
Fuente: Datos simulados por el autor
Moda
Es el valor que ocurre con mayor frecuencia, por lo que se considera que
el intervalo.
CUANTILAS O CUANTILES
Cuantila : X p
mayores o iguales a X p.
Mediana: Me = X0.50
Indica que la mitad o el 50% de los datos toma medidas menor o igual a Me y
Son puntos que dividen al conjunto de datos en 4 partes, esto es en cada parte
Indica que el 25% de las personas tienen hasta 27 años y que el 75% tiene a
Son puntos que dividen al conjunto de datos en 10 partes donde cada una
Indica que el 10% de las personas tienen a lo más 17 años y que el 80% tiene
máximo 52 años, también podemos deducir que el 70% de las personas tiene
Son puntos que dividen al conjunto de datos en 100 partes cada una con 1%
las personas tiene más de 57 años, también podemos deducir que el 75% de
X p = X(r)
Ejemplo 1.5. Consideremos nuevamente los datos del ejemplo 1.1 ordenados
Varones Mujeres
% de % de
Orden Sujeto Edad Sobresaturación Orden Sujeto Edad Sobresaturación
1 14 20 80 1 7 23 98
2 1 23 40 2 12 23 35
3 15 23 65 3 25 23 46
4 4 25 86 4 20 25 69
5 10 26 52 5 6 27 58
6 17 27 87 6 10 30 66
7 23 27 80 7 2 33 86
8 28 27 73 8 13 35 55
9 9 29 112 9 16 36 91
10 27 29 88 10 28 37 120
11 2 31 86 11 11 38 52
12 13 31 88 12 1 40 65
13 24 32 47 13 9 41 80
14 26 36 58 14 19 41 82
15 30 42 67 15 22 42 116
16 6 43 66 16 4 44 89
17 16 43 79 17 27 44 84
18 8 48 90 18 15 47 77
19 22 48 78 19 26 48 107
20 20 53 106 20 3 49 76
21 12 55 137 21 23 49 73
22 3 58 111 22 14 50 127
23 19 59 110 23 18 53 75
24 31 60 57 24 8 56 146
25 25 62 74 25 21 57 84
26 5 63 106 26 29 57 123
27 18 63 56 27 24 60 87
28 11 64 88 28 5 63 142
29 29 65 118 29 17 74 128
30 21 66 110
31 7 67 123
Varones Mujeres
xi ni Ni
X1 n1 N1
X2 n2 N2
... ... ...
Xj-1 nj-1 Nj-1
xj nj Nj
... ... ...
xk nk Nk
Ejemplo 1.6. Del ejemplo 1.4. y del cuadro 4 obtenemos las frecuencias
acumuladas con las que determinamos los percentiles 10, 25, 50, 75, 90 y 95
nº de nº de Nº acumulado
hijos familias de familias
(xi) (ni) Ni
0 4 4
1 8 12
2 11 23
3 15 38
4 10 48
5 13 61
6 3 64
Total 64
Intervalos ni Ni
L1I – L1s n1 N1
L2I – L2s n2 N2
.......... ... ...
Lj-1 I – L1j-1 s nj-1 Nj-1
LjI – Ljs nj Nj
......... ... ...
L1I – L1s nk Nk
2) X p = L jI + c
(np − N )j −1
, donde
nj
c: Amplitud del intervalo j
LjI: Frontera de clase del intervalo j (el punto medio entre los extremos
continuos.
Nº de
Edad (años) mujeres Porcentaje Nº acumulado
20 - 29 5 17% 5
30 - 39 6 21% 11
40 - 49 10 34% 21
50 - 59 5 17% 26
60 - 69 2 7% 28
70 - 79 1 3% 29
Total 29 100%
acumuladas en porcentaje, para lo cual el gráfico debe ser hecho a escala para
Gráfico 4
70%
60%
50%
40%
30%
20%
10%
0%
20 29 39 49 59 69 79 Total
43 Edad (años)
1. Amplitud o rango:
Mide la variación total indicando los valores mínimo y máximo del conjunto de
datos, por ejemplo para las edades de las mujeres en el ejemplo 1.1,
Rango: 23 – 74 años
Miden la dispersión de los datos indicando en cuanto tienden a variar los datos
∑ ( xi − µ )2 ∑x 2
i
σ2 = i
= 1
− µ 2 Varianza Poblaciona l
N N
n n
∑(x ∑x
2
i − x) 2 2
i −n x
S2 = i
= 1
Varianza muestral
n−1 n−1
Desviación estándar σ = σ2 S= S2
La varianza indica cuan representativa de los datos es la media aritmética, ya
que una varianza pequeña indica que los datos están cerca de la media, en
cambio una varianza grande indica que los datos están alejados de la media.
9,1 ; 10,0 ; 11,4 ; 12,4 ; 9,8 ; 8,3 ; 9,9 ; 9,1 ; 7,5 ; 6,7
S
Coeficiente de Variación: C .V . = x 100
x
Indica la variabilidad de los datos en unidades porcentuales de media.
1.7
Por ejemplo para la hemoglobina de los niños C .V . = x 100 = 18%
9.42
∑ ( x i − x ) 2 ni ∑x
2
2
i ni − n x
S2 = i
= 1
Varianza muestral
n−1 n−1
Donde: K: Número de intervalos
Xi: Punto medio de cada intervalo
ni: Frecuencia simple para el intervalo
12.86
C .V . = x 100 = 36.5%
35.27
Los resultados nos indican que los pacientes en promedio tienen 35 años y
promedio.
Asimetría
situaciones:
x Me Mo Mo Me x
3 ( x − Me )
Coeficiente de asimetría de Pearson: S kP =
S
( x0.75 − x0.25 )
Coeficiente de curtosis: K=
2 ( x0.90 − x0.10 )
Distribución Mesocúrtica: k → 0.25 , esto ocurre cuando los datos tienen una
mesocúrtica K = 0.263
pequeña.
PRACTICA DOMICILIARIA 1
agrícolas, los que fueron irrigados con agua de diferente calidad bacteriana.
Persona Raza Sexo Edad Contextura Ejercicio Cigarrillos Tcortisona Lácteos DMO
1 Mestiza F 42 Delgada 2 2 No Mucho 0.79
2 Blanca F 36 Gruesa 0 1 No Poco 0.89
3 Negra F 28 Gruesa 4 2 si Mucho 1.12
4 Blanca M 51 Mediana 2 6 si Nada 0.73
5 Blanca F 47 Delgada 3 1 si Nada 0.69
6 Mestiza F 25 Delgada 1 2 No Poco 0.99
7 Negra M 53 Gruesa 1 0 si Poco 0.84
8 Mestiza F 44 Delgada 0 5 No Nada 0.74
9 Blanca F 70 Mediana 1 0 No Mucho 0.78
10 Blanca F 32 Gruesa 3 4 No Mucho 1.01
11 Blanca F 46 Delgada 4 4 si Poco 0.70
12 Mestiza M 48 mediana 2 0 si Nada 0.83
13 Mestiza F 26 Gruesa 1 2 No Nada 1.07
14 Blanca F 64 Delgada 1 5 si Poco 0.68
15 Negra F 71 Delgada 0 3 si Nada 0.71
16 Negra F 48 Delgada 0 1 si Poco 0.92
17 Blanca M 62 Gruesa 2 2 No Poco 0.77
18 Blanca F 55 Gruesa 1 1 si Mucho 0.84
19 Negra F 68 Mediana 1 0 No Mucho 0.93
20 Blanca M 73 Mediana 2 4 No Nada 0.72
21 Negra F 77 Delgada 0 2 No Poco 0.82
22 Blanca F 56 Delgada 0 5 si Poco 0.66
23 Blanca F 80 Delgada 1 6 si Nada 0.68
24 Blanca M 49 Mediana 3 0 No Poco 1.03
25 Blanca F 38 Gruesa 1 1 No Mucho 0.97
26 Mestiza F 64 Gruesa 3 1 si Mucho 0.81
27 Blanca F 45 Gruesa 3 0 si Poco 0.84
28 Negra M 82 Mediana 2 2 si Nada 0.78
29 Blanca F 31 Delgada 3 0 No Nada 1.04
30 Blanca F 67 Gruesa 1 1 No Nada 0.72
a
p=
a+b
Porcentaje
unidades por ciento, esta medida es más fácil de asimilar y trasmitir que la
Razón
Una razón es la comparación por cociente entre dos cifras de diferente o similar
a
naturaleza. R=
b
380 camas
R= = 4 camas / enfermera
95 enfermeras
R = 10 hab / vivienda
A esta razón se suele denominar índice de hacinamiento, nos indica cuan
20 cirujanos
R= = 1 cirujano / 2 int ernistas .
40 int ernistas
en medicina.
R1 18 alumnos / docente
R= = = 1.8 ⇒ R = 180%
R2 10 alumnos / docente
Esta razón compara dos razones y nos indica que los docentes del grupo 1
tienen 80% más de intensidad de trabajo que los docentes del grupo 2, para la
denominador.
MEDICION EPIDEMIOLOGICA
TASA
lugar
Tasa = a x base
a+b
población.
Los datos que integran una tasa ocurrieron en un período anterior al actual y en
estables.
le ocurra el fenómeno.
multiplicarse por 100, 1.000, 10.000, o 100.000 para una mejor comprensión
y fácil lectura.
N º de defunciones ocurridas en
una región y año dado
Tasa anual bruta de mortalidad = x 1000
Estimación de la población a mitad de año
en la misma región y el mismo año
Ejemplo 1.10
Población A Población B
Distancia Habitantes Habitantes
(Km) Nº % Casos Nº % Casos
0 – 0,9 1 531 13,8 279 5 438 9,1 462
1,0 – 1,9 1 904 17,2 69 4 489 7,5 117
2,0 – 2,9 2 599 23,5 141 10 351 17,4 802
3,0 – 3,9 4 672 42,2 2 36 994 62,0 37
4,0 y más 368 3,3 119 2 384 4,0 665
TOTAL 11 074 100,0 610 59 656 100,0 2083
Fuente: Centro Panamericano de Ecología Humana y Salud. Evaluación Epidemiológica
de riesgos causados por agentes químicos ambientales. Edición de 1985. México: OPS;
1985.
610
Tasa de A = x1000 = 55,1 casos de calcificaciones / 1000 habi tan tes
11074
2083
Tasa de B = x1000 = 34,9 casos de calcificaciones / 1000 habi tan tes
59656
Tasa de A 55,1
Al comparar por cociente R = x100 = x100 = 158%
Tasa de B 34,9
Lo que nos indica que los habitantes de la población A tienen un riesgo 58%
AJUSTE DE TASAS
apropiado comparar las tasas globales ya que está comparación podría no ser
válida debido a éstas diferencias, lo que nos permite, además explicar las
razones de la diferencia y las posibles causas del mayor riesgo en una de las
poblaciones.
mayor)
Población A Población B
Distancia Habitantes Habitantes
(Km) Nº Casos Tasa Nº Casos Tasa
0 – 0,9 1 531 279 182,2 5 438 462 85,0
1,0 – 1,9 1 904 69 36,2 4 489 117 26,1
2,0 – 2,9 2 599 141 54,3 10 351 802 77,5
3,0 – 3,9 4 672 2 0,4 36 994 37 1,0
4,0 y más 368 119 323,4 2 384 665 278,9
TOTAL 11 074 610 55,1 59 656 2083 34,9
Fuente: Centro Panamericano de Ecología Humana y Salud. Evaluación
Epidemiológica de riesgos causados por agentes químicos ambientales. Edición
de 1985. México: OPS; 1985.
calcificaciones pulmonares.
La comparación luego del ajuste (44,2/34,9 = 1,3) nos indica que si la población
expuestas.
A1 / N 1 R EXP
RR = =
A0 / N 0 R No Exp
Así para interpretar este coeficiente lo comparamos con la unidad, de manera
que
Estimación interválica
Para que podamos concluir, con certeza, que el factor considerado es un factor
sea significativamente mayor que 1, por ello para estar seguros de este
N 1 − A1 N 0 − A 0
ln( RR ) ± 1.96 +
N1A1 N0 A0
L=e
concluir que el factor considerado sea un factor de riesgo, porque con 95% de
Ejemplo 1.15
Este resultado nos indica que para los expuestos se tiene un 60% más de
Este resultado nos indica que no podemos concluir que el factor de exposición
(OR)
a b axd
OR = =
c d b xc
expuestos.
Estimación interválica
Para que podamos concluir, con certeza, que el factor considerado es un factor
sea significativamente mayor que 1, por ello para estar seguros de este
1 1 1 1
ln( OR ) ± 1.96 + + +
L=e a b c d
donde
concluir que el factor considerado sea un factor de riesgo, porque con 95% de
Ejemplo 1.16
OR = 53/43 = 1.98
53/85
Este resultado nos indica que hubo 98% más de exposición a la dieta con
frituras para los casos que para los controles, lo que probablemente influyó en
Estimación interválica:
1 1 1 1
ln( 1.98 ) ± 1.96 + + +
Li = e 53 43 53 85
= 1.167
1 1 1 1
ln( 1.98 ) ± 1.96 + + +
LS = e 53 43 53 85
= 3.359
Este resultado nos indica que podemos concluir que la dieta con frituras es un
encontrada es significativa.
Práctica domiciliaria 2
tabla siguiente:
clasificación socio-económica
Plomo en la % de trabajadores
Sangre (µg/dl) 2007 2017
10 – 19 11 38
20 – 29 12 15
30 – 39 14 13
40 – 49 15 15
50 – 59 17 10
60 – 69 13 7
70 – 79 10 1
80 – 90 8 1
Nº trabajadores 280 325
a) ¿En cuál de los dos años tienden los trabajadores a presentar niveles
5. Con el objeto de evaluar el riesgo al que están expuestos los niños que
Plomo Numero
(µg/dl) de niños
〈5.0 – 5.5] 40
〈5.5 – 6.0] 219
〈6.0 – 6.5] 286
〈6.5 – 7.0] 282
〈7.0 – 7.5] 206
〈7.5 – 8.0] 584
〈8.0 – 8.5] 343
〈8.5 – 9.0] 240
Total 2200
Interprete
X0.90 >7.5; pero X0.50< 7.5 y Alto, si X0.50 ≥7.5. Según este criterio, evaluar
País A País B
Edad Población Población
(miles) Muertes (miles) Muertes
0–4 10541 494 18152 666
5 – 14 22431 667 33860 1165
15 – 24 23922 1287 39021 2115
25 – 34 21339 3696 42779 5604
35 – 44 18333 11198 33070 14991
45 – 54 15512 26180 22815 37800
55 – 64 10572 39071 22232 98805
65 – 74 6377 44328 17332 146803
+ 75 2643 31279 11836 161381
Total 131670 158200 241097 469330
mensuales en promedio son de S/. 1200 para los obreros y de S/. 1800 para
Medida de
resumen Grupo A Grupo B
Media 3.2 4.3
Desv. Est. 3.4 2.3
Mediana 3 4
Percentil 90 5 6