Curso de Epidemiología Básica y Vigilancia de la Salud
Dirigido a quienes desempeñan rol de Capacitadores. En él, se incluyen informaciones y
orientaciones para desarrollar actividades como tutor y facilitador del aprendizaje
individual y grupal. Al completar el este Módulo, estará en condiciones de comprender y
programar su trabajo como Capacitador.
Describe qué es la Epidemiología, los cambios de sus concepciones en la historia y sus
tendencias actuales. Presenta los métodos epidemiológicos y aportes de la
Bioestadística. Al completar el trabajo con este Módulo, dispondrá de elementos para
comprender los aportes que la Epidemiología puede brindar para mejorar los procesos
de planificación, ejecución y evaluación de los servicios de salud.
Introduce el proceso de investigación epidemiológica en sus distintos diseños,
analizando las ventajas y las dificultades que se presentan. Al finalizar el trabajo con este
Módulo, se podrá seleccionar un tipo de diseño apropiado para el estudio que se
propone realizar.
Recomienda qué datos recolectar y cómo recolectarlos, procesarlos, interpretarlos y
presentarlos. Al finalizar el trabajo con este Módulo, se podrá elaborar un plan para la
cuantificación de un problema de salud local.
Presenta cómo cuantificar el riesgo a través de diferentes medidas que permiten
establecer la existencia de asociación entre diferentes factores y el evento estudiado. Al
completar el desarrollo de este módulo se espera que se pueda cuantificar el riesgo en el
marco de la epidemiología analítica y describir las principales fuentes de error en la
cuantificación.
Aborda qué es la Vigilancia Epidemiológica, sus usos en el área de la salud pública,
cómo debería funcionar un sistema para alcanzar las metas de salud deseadas. Al finalizar
el módulo se espera, que se puedan reconocer las diferentes estrategias y
fundamentalmente cómo analizar, interpretar, difundir y utilizar la información.
Presenta como realizar una investigación sobre un brote, saber el tipo de información
qué se puede necesitar, qué buscar, a qué prestar atención y qué significado tienen los
resultados obtenidos. Se espera que al finalizar el módulo se pueda describir cómo
realizar un estudio de brote y redactar el informe.
1
Marzo de 2001/ Versión Preliminar Cuantificación de los problemas de Salud
Autores
Ortiz Zulma
Médica, Reumatóloga, Universidad de Buenos Aires (UBA)
Gerente de Vigilancia de la Salud
Programa Nacional de Vigilancia de la Salud y Control de Enfermedades (VIGI+A)
Esandi, María Eugenia
Médica, UBA
Docente del Curso de Epidemiología Básica e Intermedia,
Centro de Investigaciones Epidemiológicas (CIE),
Academia Nacional de Medicina, de Buenos Aires
Verdejo, Guadalupe
Médica, Chile
Programa Especial de Análisis de Salud. SHA
Organización Panamericana de la Salud. OPS/OMS.
Colaboradores
Bortman, Marcelo
Eiman Grossi, Mirtha
Yánez, Loreto
Cabrini, Ana
Custer, Silvina
Procesamiento didáctico
Davini, Cristina
Goldenstein, Frida
Lomagno, Claudia
Todos los derechos reservados.
Este libro no puede reproducirse total o parcialmente por ningún método gráfico,
electrónico o mecánico, incluyendo los sistemas de fotocopia,
registro magnetofónico o de alimentación de datos, sin expreso consentimiento del autor.
Queda hecho el depósito que previene la ley 11.723
Buenos Aires, República Argentina. 2000
Organización Panamericana de la Salud 2
Curso de Epidemiología Básica y Vigilancia de la Salud
Módulo 3:
Cuantificación de los problemas de Salud.
Introducción
Objetivos
Contenidos
1. ¿Qué datos debemos recolectar para la investigación?
1.1 “ ¿Qué es una variable?”
1.2 Tipos de variables
1.2.1. Variables dependientes y variables independientes
1.2.2. Variables de persona, lugar y tiempo.
Variables universales: edad, sexo, grupo étnico, y cultural, ocupación, estado
civil.
1.3. Definición de variables
1.4 Cuántas variables deben considerarse en un estudio
1.5. ¿Cómo se miden las variables? Escalas de medición: nominal, ordinal,
numérica.
2. ¿Dónde y Cómo obtener los datos para la investigación?
2.1. ¿Dónde recolectar datos?
2.1.1. Fuentes Secundarias de Datos
2.1.2. Fuentes Primarias de Datos
2.2. ¿Cómo recolectar los datos?
Encuestas de Salud
3. ¿Cómo presentar los datos?
3.1 Presentación de datos en tablas.
3.2 Presentación de datos en gráficos.
Grafico de Sectores Circulares.
Gráfico de Barras.
Histograma.
Polígono de Frecuencias.
4. ¿Cómo procesar e interpretar los datos?
4.1. La sistematización de los datos
4.2. Medidas de Resumen
Razones y Tasas
Incidencia y Prevalencia
Medidas de Tendencia Central, de Orden y de Dispersión.
3
Marzo de 2001/ Versión Preliminar Cuantificación de los problemas de Salud
Prólogo
Considerando el rol que la epidemiología debe cumplir en la Salud Pública actual,
la capacitación en epidemiología básica para los niveles locales es un punto crítico
para alcanzar objetivos de Salud para Todos. De forma similar el desarrollo de la
Vigilancia Epidemiológica, herramienta fundamental para la toma de decisiones
en salud, resultará esencial en la migración del quehacer en salud hacia una
gestión cada vez más basada en la evidencia.
Estos módulos del Curso de Capacitación en Epidemiología Básica y Vigilancia
Epidemiológica, son el producto de una iniciativa de la Representación de
OPS/OMS en la Argentina y el Programa Especial de Análisis de Salud, OPS.
Sus contenidos básicos fueron desarrollados como parte del apoyo que esta
Representación realizó a la formulación del Programa VIGI+A que prevé una
amplia diseminación de los principios básicos de la epidemiología y la vigilancia
epidemiológica. Con el trabajo de sus autores y con los aportes de muchos otros
colaboradores se han elaborado estos módulos que esperamos contribuyan
significativamente a una mejor capacitación en epidemiología.
Dr. Juan Manuel Sotelo
Representante de la Organización Panamericana de la Salud
y Organización Mundial de la Salud.
Organización Panamericana de la Salud 4
Curso de Epidemiología Básica y Vigilancia de la Salud
Módulo 3
Cuantificación de los Problemas de Salud
Introducción
La Organización Panamericana de la Salud (OPS) y el Proyecto VIGI+A, en un
trabajo colaborativo han posibilitado la preparación, difusión y diseminación de
este material educativo que contiene conceptos básicos de Epidemiología y
Vigilancia Epidemiológica. En este módulo se presentarán los métodos para la
cuantificación de los problemas en salud.
Como ya hemos tratado, la epidemiología intenta describir la distribución y
determinantes de la salud y enfermedad en poblaciones humanas. Si bien esto
puede parecerle algo complicado, en realidad, la metodología de investigación no
difiere de la que seguramente Ud. aplica durante su práctica laboral, y aún en las
cosas cotidianas de la vida. Tal como presentamos en el Módulo anterior se
reconocen una serie de etapas en el proceso de investigación (figura 1), que se
5
Marzo de 2001/ Versión Preliminar Cuantificación de los problemas de Salud
inician con la definición del problema, el propósito y los objetivos. Sin embargo,
es necesario seguir avanzando ya que un paso previo e indispensable para
interpretar los procesos de salud y enfermedad es la cuantificación de los datos
observados. Probablemente Ud. se pregunte : “Pero, ¿qué datos debo recolectar y
cómo?”. Qué y cómo recolectar los datos es lo primero que trataremos en este
capítulo. Una vez que comprendamos esto, veremos qué hacer con estos datos,
es decir, como presentarlos, procesarlos e interpretarlos.
Figura 1. Plan de estudio
¿ Qué
estudiar y
para qué? PLAN DE ESTUDIO
PASOS PARA EL DESARROLLO DE
¿ Qué datos
recolectar ?
UNA INVESTIGACIÓN
¿ Dónde y cómo
recolectarlos ?
¿ Cómo
presentarlos ?
¿ Cómo
procesarlos e
interpretarlos ?
Organización Panamericana de la Salud 6
Curso de Epidemiología Básica y Vigilancia de la Salud
Objetivos
Se espera que al completar el trabajo en este Módulo, usted pueda elaborar un
plan de recolección de datos epidemiológicos en función de un problema de
salud local, reconociendo distintos tipos de variables, seleccionando diferentes
fuentes de información, construyendo instrumentos de relevamiento,
procesamiento e interpretación de la información y seleccionando la mejor forma
de presentación para sus datos.
1. ¿Qué datos debemos recolectar para la investigación?
Un dato es el valor que adopta la variable. Los datos que recolectaremos para
nuestra investigación dependen de las variables que escojamos. Ahora, ¿Qué es
una variable? Si bien a menudo utilizamos este término, poco conocemos acerca
de él.
...De la variable al dato...
1.1. “¿Qué es una variable?”
Como su nombre lo indica, “variable es algo que cambia”.
Por ejemplo:
7
Marzo de 2001/ Versión Preliminar Cuantificación de los problemas de Salud
Peso
Estatura Una variable puede ser definida como
cualquier cualidad del organismo, grupo
Frecuencia cardíaca
o situación capaz de adoptar valores
diferentes en un mismo individuo o entre
Edad
individuos
Temperatura
Si pensamos en los datos del ambiente que nos rodea, observaremos que casi
todos los aspectos pueden considerarse variables, precisamente porque las
personas y las condiciones ambientales varían. En los fenómenos de la salud y de
la enfermedad es necesario investigar no sólo cómo varían (epidemiología
descriptiva) sino también por qué varían (epidemiología analítica).
Ya mencionamos que los datos que recolectamos en nuestra investigación
dependen de las variables que seleccionamos y por otra parte, que casi todos los
aspectos pueden considerarse variables. Entonces, ¿Qué variables debemos
seleccionar? Las variables a estudiar se seleccionan sobre la base de su relevancia
para los objetivos de la investigación. Para facilitar el proceso de identificación y
selección de las variables nos será útil conocer los tipos de variables y sus
diferentes formas de clasificación.
1.2. Tipos de variables y formas de clasificación
Las variables pueden ser clasificadas utilizando diferentes criterios.
Organización Panamericana de la Salud 8
Curso de Epidemiología Básica y Vigilancia de la Salud
FICHA DE ORIENTACIÓN Nº 1:
Formas de clasificar una variable
Según la función que cumplan en la hipótesis
- Variable dependiente
- Variables independientes
Según la pregunta que responden en el estudio
- ¿Quiénes?: Variables de Persona
- ¿Cuándo?: Variables de Tiempo
- ¿Dónde?: Variables de Lugar
1.2.1. Variables dependientes y variables independientes
Las distintas variables que se consideran en un estudio mantienen, en general,
relaciones entre sí. Muy frecuentemente un estudio se centra no sólo en las
características en las cuales hay realmente interés, sino también en una o más
características asociadas a ella.
Por ejemplo, no sólo puede interesarnos investigar la ocurrencia de anemia
ferropénica en la población infantil de una región determinada en un
determinado período de tiempo, sino también, los factores potencialmente
asociados a la ocurrencia de esta enfermedad.
9
Marzo de 2001/ Versión Preliminar Cuantificación de los problemas de Salud
Denominamos variable dependiente a aquella variable que el investigador está
interesado en comprender, explicar o predecir, mientras que las variables
independientes son aquellas que utilizamos para explicar a la primera.
Considerando una asociación entre variables del tipo "causa - efecto", la o las
causas serán variables independientes y el efecto será la variable dependiente.
En nuestro ejemplo, la variable dependiente sería la ocurrencia de la anemia
ferropénica y las variables independientes, los factores que explicarían dicha
ocurrencia de la enfermedad.
FICHA INSTRUMENTO Nº 1
Para formular objetivos e identificar variables...
A continuación le presentamos un problema de investigación. Formule el/los
objetivos e identifique la variable dependiente y la variable independiente.
“En el año 1999, se observó en la Capital Federal un elevado número de suicidios
en la población adolescente; pudo saberse a través de fuentes informales que
muchos de estos casos ocurrieron en adolescentes adictos a las drogas que en ese
último período se habían iniciado en el consumo de una nueva droga importada
desde Europa”.
Organización Panamericana de la Salud 10
Curso de Epidemiología Básica y Vigilancia de la Salud
1.2.2. Variables de persona, tiempo y lugar
Como se mencionó en el módulo 1, tres son los determinantes principales de los
procesos de salud-enfermedad: persona, lugar y tiempo. Sus atributos o
características pueden ser factores o marcadores de riesgo que "determinan" la
aparición de un evento, enfermedad o el estado de salud. Por eso cada vez que
desarrollemos un plan de estudio, deberemos preguntarnos en quiénes, dónde y
cuándo sucede el evento de salud o enfermedad.
Las variables que permiten responder concretamente a la pregunta “¿en quiénes
sucede el evento?” son conocidas como variables de persona.
Por ejemplo, al investigar una enfermedad podríamos estar interesados en
establecer el sexo de las personas afectadas, su edad, profesión, ingresos, hábitos
alimentarios, etc. Todas estas son características de las personas enfermas que
permiten caracterizar mejor a quiénes afecta la enfermedad en cuestión.
Las variables que permiten responder concretamente a la pregunta “¿cuándo sucede
el evento?” son conocidas como variables de tiempo. Para medir el tiempo en el
que ocurre un evento de salud existen diferentes formas:
Por ejemplo, el tiempo de calendario es el que más a menudo se utiliza, como en
los estudios anuales de mortalidad (del 1 de enero al 31 de diciembre del año en
curso). Sin embargo, también podemos utilizar el tiempo cronológico si
estamos interesados, por ejemplo, en la frecuencia de un evento entre ciertas
edades (por ej. frecuencia de accidentes automovilísticos entre los 15 y los 45
años).
11
Marzo de 2001/ Versión Preliminar Cuantificación de los problemas de Salud
Las variables que permiten responder concretamente a la pregunta “¿dónde sucede el
evento?” son conocidas como variables de lugar.
Por ejemplo, si quisiéramos investigar la ocurrencia de tuberculosis en una ciudad,
será interesante determinar, entre otras cosas, las características relacionadas con
el lugar en el que sucede el evento, como domicilio y zona de residencia de las
personas afectadas.
Variables Universales
La definición de las características relacionadas con las personas, el lugar y el
tiempo son de singular importancia para cualquier investigación epidemiológica.
Existen dentro de este grupo ciertas variables llamadas "universales" por la
importancia que tienen en las investigaciones sobre grupos poblacionales, tanto
que se sugiere considerar siempre la necesidad de su inclusión. Esto no
significa que haya que incluirlas automáticamente, sino simplemente que es
necesario valorar siempre la posibilidad de hacerlo. Estas variables universales
son: edad, sexo, grupo étnico y cultural, ocupación y estado civil.
Edad
Siempre que desee realizar una investigación debe considerar la descripción de
esta variable. Las variaciones en la frecuencia de distintas enfermedades en
función de los cambios de la edad de las personas ocurren muy a menudo. En
Organización Panamericana de la Salud 12
Curso de Epidemiología Básica y Vigilancia de la Salud
numerosas ocasiones, esas variaciones de acuerdo a la edad le permitirán
conjeturar acerca de los factores responsables del desarrollo de una enfermedad.
Por ejemplo, la frecuencia de la enfermedad cardiovascular en las mujeres jóvenes
es mucho menor con respecto a la de las mujeres mayores de 50 años. Este
patrón de la enfermedad corroborado por diferentes estudios, permitió observar
que su frecuencia aumenta a partir de los 50 años, probablemente debido a la
menopausia y al descenso de los niveles de estrógenos. Este hallazgo hace
suponer la presencia de un efecto protector de las hormonas sexuales femeninas
en el desarrollo de la enfermedad cardiovascular.
Sin embargo, también se podría pensar que esa diferencia en la frecuencia de la
enfermedad podría ser explicada por otros factores: por ejemplo, las mujeres
mayores de 50 años son menos predispuestas a hacer ejercicios físicos, o no
tienen tanto interés en “los kilos de más” y llevan una dieta menos equilibrada,
etc. Todos estos factores están también asociados con una mayor frecuencia de
enfermedad cardiovascular.
FICHA INSTRUMENTO Nº 2
Para reconocer las variables dependientes e independientes
Relea el ejemplo anterior, relativo a las enfermedades cardiovasculares en mujeres
mayores de 50 años e indique cuál sería/n la/s variable/s dependiente/s y la/s
independiente/s, según las distintas posibilidades enunciadas
13
Marzo de 2001/ Versión Preliminar Cuantificación de los problemas de Salud
Sexo
Al igual que la edad, el sexo es otra variable que se debe considerar. Casi todas
las enfermedades ocurren de forma diferente de acuerdo al sexo de las personas.
Podríamos citar la mayor frecuencia del cáncer de pulmón en los hombres o del
cáncer de mama en las mujeres. A menudo encontrará en sus investigaciones
variaciones en la frecuencia de la enfermedad de acuerdo al sexo.
Sin embargo, siempre debe tener en cuenta que en la mayoría de las poblaciones,
los dos sexos también difieren en cuanto a la distribución por edades. Siempre
debe mirar con cuidado las diferencias encontradas entre las distintas frecuencias
de la enfermedad en estudio de acuerdo al sexo y edad.
FICHA INSTRUMENTO Nº 3
Para interpretar resultados de una tabla y elaborar un informe
Interprete la siguiente Tabla 1 identificando variaciones en la distribución
de la enfermedad según sexo y edad. Resuma los hallazgos que considere más importantes.
Tabla 1. Distribución por sexo y edad de 1759 casos de Tuberculosis declarados en la ciudad
(X), durante 1997.
0-4 5-14 15-24 25-34 35-44 45-54 55-64 65 y más
Hombres 1326 72 57 109 364 263 225 94 142
(69.7 %)
Mujeres 533 52 47 99 134 64 37 24 76
(30.3%)
Total 1859 124 104 208 498 327 262 118 218
(100%) (6,7 %) (5.6 %) (11.2%) (26.8%) (17.6%) (14.1%) (6.3%) (11.7 %)
Organización Panamericana de la Salud 14
Curso de Epidemiología Básica y Vigilancia de la Salud
Fuente: Departamento de Estadísticas de la ciudad X
Grupo étnico y cultural
El grupo étnico y cultural refiere al conjunto de personas que guardan similitud
con respecto a las costumbres (religión, historia, costumbres, hábitos dietéticos,
etc.) y también a la herencia biológica (raza) que los distingue de la población
general.
La “raza” (blanca, negra o amarilla) nos permite identificar grupos de personas
de color y rasgos físicos comunes. Sin embargo, la definición “grupo étnico” es
más amplia y expresa mejor el concepto epidemiológico al que nos referimos, ya
que generalmente resulta más útil investigar la frecuencia de una enfermedad
para grupos cuyos miembros han vivido juntos y se han casado o entremezclado
por un período de tiempo suficiente como para haber adquirido características
comunes, tanto por mecanismos biológicos como por mecanismos sociales.
15
Marzo de 2001/ Versión Preliminar Cuantificación de los problemas de Salud
FICHA INSTRUMENTO Nº 4
Para interpretar resultados de una tabla y elaborar un informe
Interprete la siguiente tabla identificando las
variaciones en la prevalencia de dolor de pecho
en las distintas poblaciones, según edad y sexo.
A partir de sus observaciones elabore una
hipótesis.
Tabla 2. Tasas de Prevalencia de dolor de pecho en diferentes poblaciones .
Hombres Mujeres
Lugar Grupos de edad
% %
Población general 45-54 5.3 6.4
España 55-64 5.0 7.1
65-74 5.4 8.8
45-74 5.2 7.7
Población general 45-54 3.4 2.0
Islandia 55-64 5.1 2.5
65-74 8.9 3.1
Población general 20-29 0.8 1.7
Italia 30-39 0.4 1.9
40-49 1.9 3.9
50-59 5.0 6.7
Estados Unidos 25-34 5.1 5.2
Población Negra 35-54 7.3 6.8
55-74 6.0 8.5
Estados Unidos 25-34 2.0 5.2
Población Blanca 35-54 3.1 6.1
55-74 6.9 7.5
Estados Unidos
Hispanos 25-34 1.9 4.5
35-54 2.3 6.0
55-74 4.5 5.4
Fuente: Revisión Bibliográfica, 1999
Organización Panamericana de la Salud 16
Curso de Epidemiología Básica y Vigilancia de la Salud
Ocupación
La ocupación, afortunadamente, forma parte de muchos registros llevados en
forma sistemática y se usa como variable epidemiológica descriptiva con
propósitos diferentes. Ella permite identificar riesgos específicos de salud
asociados a ciertas ocupaciones, como, por ejemplo, la mayor incidencia de
cáncer de pulmón en los trabajadores de minas de carbón.
FICHA DE REFLEXIÓN N° 1
Para pensar y analizar...
Le pedimos que observe las siguientes figuras. Cada una de ellas se refiere a distintas
ocupaciones.
¿Podría Ud. identificar desde sus conocimientos previos cuál/es serían las enfermedades,
efectos, cuadros o lesiones que se pueden presentar como consecuencia de las siguientes
ocupaciones?
17
Marzo de 2001/ Versión Preliminar Cuantificación de los problemas de Salud
OCUPACION RIESGO DE
Organización Panamericana de la Salud 18
Curso de Epidemiología Básica y Vigilancia de la Salud
Estado civil
Esta variable ha sido muy estudiada en relación con el estado de salud. El estado
civil es más fácil de medir pudiéndose efectuar una rápida división de la
población en cuatro grupos mayores: soltero, casado, viudo y divorciado. La
mayoría de los estudios han demostrado que las enfermedades tienen más
incidencia en mujeres y hombres solteros que en mujeres y hombres casados. Si
bien existen muchas investigaciones que demuestran la relación entre estado civil
casado y salud, su uso está perdiendo vigencia en la actualidad, pues la mayoría
de las características de la vida matrimonial que muy probablemente tienen un
efecto positivo sobre la salud, están extendiéndose a otros tipos como las parejas
que viven juntas o en concubinato.
FICHA INSTRUMENTO Nº 5
Para aprender a interpretar tablas...
Interprete la siguiente tabla identificando las variaciones en las tasas de mortalidad de
individuos solteros y casados.
A partir de sus observaciones elabore una hipótesis.
19
Marzo de 2001/ Versión Preliminar Cuantificación de los problemas de Salud
Tabla 3. Tasa de mortalidad de individuos solteros y casados en ciudad X, 1989-
1991
Causas seleccionadas de Hombres Mujeres
defunción Solt. Casad. Solt. Casad.
Tuberculosis respiratoria 96,7 22,7 25,0 11,4
Otras formas de tuberculosis 3,4 1,3 1,8 0,8
Sífilis 14,8 6,6 2,0 2,2
Neoplasmas malignos, total 260,0 207,1 470,4 182,5
Bucales y faríngeos 13,7 7,0 1,6 1,8
Órganos digestivos 115,7 87,6 73,0 65,5
Aparato respiratorio 44,5 33,5 7,8 7,2
Mamas 0,7 0,4 54,0 33,2
Órganos genitales 23,7 25,0 40,0 38,2
Aparato urinario 15,5 13,3 6,6 5,8
Leucemia 8,0 8,8 5,6 5,8
Diabetes mellitus 21,9 18,3 16,5 29,0
Enfermedades cardíaco- 28,7 8,6 232,8 17,4
reumáticas
Nefritis crónica 33,0 23,1 20,0 18,4
Influenza y neumonía 73,5 27,0 34,1 18,3
Úlcera péptica 21,5 11,8 3,8 2,4
Accidentes automovilísticos 61,9 33,7 11,0 10,8
Otros accidentes 99,2 46,1 36,4 21,1
Suicidio 43,7 20,5 7,7 6,2
Tasa promedio anual por 100.000 habitantes. Fuente: Estadísticas Vitales de la ciudad (X)
Organización Panamericana de la Salud 20
Curso de Epidemiología Básica y Vigilancia de la Salud
1.3. Definición de variables
Al realizar una investigación epidemiológica, cualquiera sea el tipo de estudio, no
sólo es importante identificar las variables que se toman en consideración, sino
definirlas con la mayor precisión posible. Debe diferenciarse lo que significa
definir teóricamente una variable y lo que significa definirla operativamente,
proceso que recibe el nombre de operacionalización de una variable. Operacionalizar
una variable es simplemente definir la manera en que se observará y medirá cada
característica del estudio y tiene un sentido práctico fundamental.
Por ejemplo, podría definirse como desempleo: “cualquier persona que refiere no
tener trabajo”. Esta es la definición teórica de la variable. Pero si a esta definición
le agregamos “en los 6 meses previos al comienzo del estudio”, la convertimos
en una definición de tipo operacional. Sin embargo, también podríamos haber
definido desempleo como “cualquier persona sin empleo fijo en el último año”.
La definición teórica de la variable no cambia (“desempleo”), pero la definición
operacional es diferente de acuerdo a cómo se elija medir dicha variable.
No todos pueden estar de acuerdo con la forma en que el investigador definió
sus variables desde el punto de vista teórico u operacional. Sin embargo,
comunicar con exactitud lo que dichos términos significan, permite que el
estudio pueda ser reproducido por otros investigadores y comparar sus
resultados. Si se desconociera la forma en que se definieron las variables, no se
podría establecer si se está comparando lo mismo o cosas diferentes.
21
Marzo de 2001/ Versión Preliminar Cuantificación de los problemas de Salud
FICHA DE REFLEXIÓN N° 2
Para pensar y analizar...
A esta altura de nuestro trabajo, es importante que realicemos el análisis de un ejemplo, para
reconocer en un caso concreto las variables, sus definiciones operacionales y las relaciones
entre variables dependientes e independientes.
Supongamos que Ud. está interesado en conocer la relación que existe entre la pobreza y el
incumplimiento del tratamiento para la Tuberculosis:
¿Cómo definiría pobreza?
¿Es una variable dependiente o independiente?
La pobreza ¿es un fenómeno uni o multi-dimensional?
¿Dónde podría obtener una definición teórica de pobreza que sea ampliamente
utilizada?
Considera importante incluir la percepción de la gente pobre respecto de la
pobreza para preparar la definición operativa de la misma?
Organización Panamericana de la Salud 22
Curso de Epidemiología Básica y Vigilancia de la Salud
1.4. ¿Cuántas variables deben considerarse en un estudio en
particular?
La única respuesta a esta pregunta es: “tantas como sean necesarias y tan pocas como sea
posible”. No hay un número exacto de variables a considerar en una investigación.
Sin embargo, es útil que recuerde que en principio suele seleccionarse una lista
enorme de variables, a la que de a poco debemos acotar con sentido común y
determinando la relevancia que podría tener la información aportada por cada
variable seleccionada. Por otra parte, recuerde que siempre deberá también tener
en cuenta la factibilidad para la recolección y el procesamiento de los datos en el
momento de seleccionar las variables de su investigación.
1.5. ¿Cómo se miden las variables?
Escalas de medición: nominal, ordinal, numérica.
Para poder “medir”, cuantificar las variables que seleccionamos en nuestra
investigación debemos tener en cuenta que existen diferentes escalas de
medición.
Así por ejemplo, si estamos evaluando el sexo de las personas y su edad,
rápidamente percibiremos que ambas variables son diferentes: mientras que la
edad puede expresarse en números, el sexo sólo puede medirse en dos
alternativas, masculino y femenino.
Se reconocen tres tipos de escalas de medición: nominal, ordinal y
numérica.
Escala nominal
23
Marzo de 2001/ Versión Preliminar Cuantificación de los problemas de Salud
Se usa para la forma más simple de medición, cuando los datos se distinguen por un
nombre que expresa una cualidad, categoría o atributo. Al utilizar este tipo de
escala, simplemente se cuantifica la cantidad de datos que corresponden a cada
una de las categorías de la variable.
Un ejemplo, es cuando se utiliza este tipo de escala para “medir” el grupo
sanguíneo de las personas, cuyas categorías son A, B, AB y O. Al utilizar la escala
nominal, lo que estamos haciendo es simplemente clasificar los individuos de
acuerdo a cada uno de los grupos sanguíneos. La presencia o ausencia de
enfermedad también puede ser medida con una escala de tipo nominal.
Los datos valorados en esta escala se llaman observaciones cualitativas,
categóricas o atributos. Si el número de categorías posibles es dos, la variable
se dice dicotómica ó binaria como es el caso del "sexo" (hombre o mujer).
Escala ordinal
Permiten establecer una relación de "orden” entre los datos que pertenecen a distintas
categorías. La escala ordinal permite clasificar los datos de acuerdo a su posición
relativa con respecto a otros, en función de una variable determinada. A
diferencia de la escala nominal, en la que sólo se clasifican los datos de acuerdo a
las categorías de la variable, con la escala ordinal los datos se clasifican en
categorías y se ordenan conforme a un determinado criterio.
Por ejemplo, en la variable "nivel socioeconómico" puede distinguirse un orden
entre las categorías: bajo, intermedio o alto. Los individuos con un nivel
Organización Panamericana de la Salud 24
Curso de Epidemiología Básica y Vigilancia de la Salud
socioeconómico alto son equivalentes entre sí pero son “más”, en lo referente a
esta variable, respecto a los individuos de las otras dos categorías.
Sin embargo, la medición ordinal no informa acerca de que tanto es mayor un
atributo con respecto a otro de otro nivel. Volviendo al ejemplo anterior, lo que
no puede establecerse es “cuanto más” nivel socioeconómico tiene un individuo de
nivel alto respecto a otro individuo de nivel intermedio u otro de nivel bajo.
Escala numérica
Las observaciones individuales realizadas con una escala numérica corresponden
a cantidades numéricas, y provienen de mediciones o recuentos. Reciben el
nombre de observaciones cuantitativas.
La escala numérica a su vez puede diferenciarse en:
Discreta, cuando los valores que se obtienen sólo pueden ser números
enteros y se originan de recuentos. Por ejemplo: número de hijos de una
persona; como se imaginará no pueden tenerse 2 hijos y medio, sino
2, 3, 4, etc.
Continua, cuando los valores que se obtienen provienen de mediciones y
pueden adoptar un intervalo de valores continuo e ininterrumpido,
restringido sólo por el grado de exactitud del instrumento de medición.
Por ejemplo: el peso, la temperatura corporal son ejemplos de variables
que pueden medirse con la escala numérica continua.
25
Marzo de 2001/ Versión Preliminar Cuantificación de los problemas de Salud
Como podrá observar, existen variables que solo pueden medirse con una escala
de tipo nominal, por ejemplo el sexo, mientras que existen otras variables que
pueden medirse con cualquiera de las escalas mencionadas. Es muy importante
tener en cuenta que la escala que utilicemos estará estrechamente ligada a la
definición operacional dada a cada una de las variables de la investigación.
FICHA DE ORIENTACIÓN Nº 2:
Operacionalización de una variable y escalas de medición
Diferentes formas de medir la presencia del hábito tabáquico
Distintos tipos de Definiciones Escala Forma de “medir” el
Operacionales dato
Se considerará la presencia de tabaquismo Nominal Fuma
cuando el individuo refiera fumar o no. No Fuma
La presencia de tabaquismo se considerará de
acuerdo al siguiente criterio
- No tabaquismo: cuando el individuo
refiere no Ausencia de Tabaquismo
fumar Ordinal Tabaquismo Leve
- Tabaquismo leve: cuando el Tabaquismo Moderado
individuo refiera Tabaquismo Severo
fumar menos de 5 cigarrillos/día
- Tabaquismo moderado: cuando el
individuo
refiera fumar menos de 20
cigarrillos/día
- Tabaquismo severo: cuando el
individuo refiera
fumar 20 o más cigarrillos/ día.
Se valorará la presencia de tabaquismo de Numérica Cantidad de
acuerdo a la cantidad de cigarrillos que refiere cigarrillos/día
fumar un individuo por día
Como podrá observar en el ejemplo anterior, tenemos más información si
sabemos si un individuo es tabaquista leve, moderado o severo, que si sólo
Organización Panamericana de la Salud 26
Curso de Epidemiología Básica y Vigilancia de la Salud
sabemos si el individuo fuma o no fuma. Y aún más, sabemos más respecto al
hábito tabáquico de ese individuo si conocemos la cantidad de cigarrillos/día
que refiere fumar.
Las escalas de medición tienen una cierta jerarquía, dado que una escala
numérica brinda más información que una escala ordinal, y ésta más que una
escala nominal. Es muy importante que al momento de definir operativamente
sus variables y al procesar los datos obtenidos tenga en cuenta este concepto.
Determinar el tipo de escala que se utilizará para la medición de la variable es de
fundamental importancia, ya que los análisis estadísticos posteriores dependerán
de la escala de medición utilizada para cada variable.
27
Marzo de 2001/ Versión Preliminar Cuantificación de los problemas de Salud
FICHA INSTRUMENTO Nº 6
Pensar y resolver
Le pedimos que lea atentamente el caso que se describe a continuación:
“ Dos médicos investigaban la prevalencia de enfermedad coronaria y los probables factores de
riesgo asociados a esta condición en hombres entre 25 y 65 años de edad de un barrio de la
ciudad de Bahía Blanca. Para ello entrevistaron personas con enfermedad coronaria e
indagaron: edad, sexo, antecedentes previos de enfermedad coronaria, tabaquismo (al que
clasificaron en leve, moderado y severo de acuerdo a la cantidad de cigarrillos/día), y a la
actividad física practicada por ellos (simplemente establecieron dos categorías: actividad física
presente; actividad física ausente). Registraron, también, en todos los individuos la presión
arterial y les realizaron un análisis de sangre con el objeto de medir la concentración sanguínea
de colesterol”.
Ahora le sugerimos que:
Seleccione al menos seis variables.
Identifique la variable dependiente
Distinga las variables universales del resto de variables.
Reconozca las distintas escalas de medición que requieren los distintos tipos de variables
Organización Panamericana de la Salud 28
Curso de Epidemiología Básica y Vigilancia de la Salud
2. ¿Dónde y cómo obtener los datos para la investigación?
2.1. ¿Dónde recolectar la información?
Como mencionamos al inicio del módulo, los datos son los valores que adoptan
las variables. Estos datos pueden existir o pueden ser provocados por el
investigador. De acuerdo a esto, se reconocen dos tipos de fuentes de datos:
fuentes secundarias o documentales, de las que obtendremos datos ya
“existentes” y que son elaboradas por otras personas o instituciones con fines
diferentes a los planteados para una determinada investigación. Como ejemplo pueden
citarse los certificados de defunción, publicaciones del censo, registros
personales, clínicos y de otros tipos
fuentes primarias o de recolección directa, constituidas por el
conjunto de datos obtenidos por medio de diferentes métodos
“planeados y provocados por el mismo investigador de acuerdo a los fines de su
estudio”. Como ejemplo pueden citarse los datos obtenidos por medio de
observaciones, encuestas personales y encuestas auto administradas.
2.1.1. Fuentes Secundarias de Datos
Como mencionamos, los datos secundarios se obtienen de fuentes que han sido
creadas con otros fines diferentes a los de la investigación y que han sido
registrados por una o inclusive varias personas. Estas características constituyen
las limitaciones más importante de todos los tipos de fuentes documentales. Sin
embargo, resultan muy interesantes y útiles, en determinadas circunstancias, por
ser una forma relativamente sencilla de obtener datos.
29
Marzo de 2001/ Versión Preliminar Cuantificación de los problemas de Salud
Lo importante es que podamos reconocer cuáles son las limitaciones
propias de cada fuente de datos que utilizamos para no cometer
errores en la interpretación de la información que de ellas se obtiene.
Existen fuentes secundarias de carácter permanente, como el Registro Civil o
el de Estadísticas Vitales, o de carácter eventual, como los Censos,
Empadronamientos y Encuestas Nacionales, de gran utilidad como fuente
complementaria de la información obtenida de los registros permanentes. Estos
últimos aportan datos de mortalidad y de morbilidad.
a) Fuentes Secundarias Permanentes
El Registro Civil es la fuente permanente más importante y aporta,
fundamentalmente, datos de nacimiento, casamiento y muerte de las personas.
Las Estadísticas Vitales son la segunda fuente de importancia, y representan la
información tabulada sistemáticamente de estos datos recolectados en el Registro
Civil.
Estas Estadísticas tienen una relación directa con el grado de desarrollo socio-
económico de cada país, en general están mejor desarrolladas en los países con
más alto nivel socio-económico.
Organización Panamericana de la Salud 30
Curso de Epidemiología Básica y Vigilancia de la Salud
Los registros de mortalidad de las personas característicos son los certificados de
defunción y las estadísticas de mortalidad derivadas de ellos. Si bien el origen de dichos
certificados es de índole legal, no es menos cierto que los datos sobre mortalidad
obtenidos a partir de ellos han desempeñado un papel fundamental en la
investigación epidemiológica. Es escaso el porcentaje de muertes que no son
avaladas por un certificado de defunción. Sin embargo, tanto los certificados
como las estadísticas de mortalidad están sujetos a muchas inexactitudes.
Estos errores pueden cometerse en diferentes etapas:
Cuando el médico responsable completa dichos certificados. En
este caso, las causas de este error son variadas: desconocimiento de la
verdadera causa de muerte o de cómo debe completar el certificado;
desinterés para completarlos, ya que ve esta tarea sólo desde el punto de
vista administrativo; utilización del tan mentado “paro cardio-
respiratorio”, sin entrar en mayores detalles a veces por temores a algún
problema de tipo legal; etc.
Durante el procesamiento de dichos certificados para la elaboración
de las estadísticas de mortalidad. Esto se debe a que la selección y
codificación de las causas básicas de muerte reportadas puede diferir
según la metodología utilizada por cada codificador.
31
Marzo de 2001/ Versión Preliminar Cuantificación de los problemas de Salud
En cuanto a los registros de morbilidad, los más utilizados son:
Tipos de Registros ¿Qué limitaciones pueden tener este tipo de
registros?
Notificación obligatoria: En la mayoría de los En general se dan las mismas situaciones que para el
países, todo médico tiene la obligación legal de certificado de defunción, como el desinterés para
declarar a las autoridades de salud pública (denuncia completarlos, ya que se ve esta tarea sólo desde el punto
nacional) los casos de determinadas enfermedades. de vista administrativo; y tanto los profesionales de la
Lo mismo sucede con las denuncias internacionales salud como la población en general desconocen los
obligatorias, a la OPS/OMS; Paraguay (ARPA), alcances de este tipo de registro.
Bolivia (ARBOL), MERCOSUR. Las dos formas de
denuncia de las enfermedades tienen como objetivo
evitar la propagación de enfermedades y la aparición
de epidemias.
Registros específicos: En este caso se registran los Nuestro país adolece de registros específicos confiables,
datos de una enfermedad en particular o de un razón por la que es muy difícil realizar estadísticas
grupo de ellas de naturaleza similar, como por nacionales.
ejemplo el Registro Nacional de Cáncer en Estados
Unidos, y en la Argentina el registro de Fiebre
Hemorrágica Argentina, Tuberculosis, Lepra, entre
otros. Otros registros son los registros locales en el
Ministerio de Salud de la Provincia de Buenos Aires,
en el Instituto Nacional Regional de Oncología de
Santa Fe y en el Hospital R. De Santamarina de
Tandil, Bs. As.
Registros hospitalarios y demás registros Los datos hospitalarios no reflejan la morbilidad de la
clínicos. En ocasiones, los registros hospitalarios se población, ya que representan un subgrupo muy pequeño
han utilizado para formular estadísticas de egresos de las personas que padecen una enfermedad cuya
de dichas instituciones agrupados por diagnóstico. frecuencia se está investigando. Es necesario considerar
que estos datos fueron generados por otras personas que
utilizaron definiciones y procedimientos diferentes a los
que Ud. puede decidir utilizar en su propia investigación.
Organización Panamericana de la Salud 32
Curso de Epidemiología Básica y Vigilancia de la Salud
b) Fuentes secundarias eventuales
El ejemplo más característico de una fuente eventual de datos es el censo. El
censo es “el conjunto de operaciones que consiste en reunir, elaborar y publicar
datos demográficos, económicos y sociales correspondientes a todos los
habitantes de un país o territorio, referidos a un momento determinado "
(Naciones Unidas). Estos censos se realizan a intervalos regulares, en nuestro
país cada 10 años.
FICHA INSTRUMENTO Nº 7
Para buscar y resolver
Describa donde están ubicadas las fuentes permanentes de datos en su lugar de residencia,
seleccione una y explique cómo funciona, y qué fortalezas y limitaciones reconoce en su
funcionamiento. Recomendamos realizar esta actividad con la colaboración de algún
profesional de la salud que conozca en detalle como funciona la fuente que seleccionó.
33
Marzo de 2001/ Versión Preliminar Cuantificación de los problemas de Salud
2.1.2. Fuentes Primarias de Datos
Como mencionamos al inicio, las fuentes primarias están constituidas por el
conjunto de datos generados por el propio investigador de acuerdo a los
objetivos de su estudio. Este tipo de datos se denominan datos primarios, en
contraste con los datos “existentes”, denominados secundarios ya que se
originan en este tipo de fuentes.
En líneas generales, el investigador puede recabar datos primarios para su
investigación observando el evento que desea investigar o preguntando a las
personas, para lo cual entonces utilizará la encuesta, como forma de recolección
de datos.
Como podrá observar las fuentes primarias son el producto de la aplicación de
diferentes formar de recolección de datos por parte del investigador. Sin
embargo, es importante diferenciar fuente de forma de recolección de datos.
Lo que diferencia las fuentes primarias de las secundarias no es la forma de
recolección de los datos, sino, como ya mencionamos, el hecho de que en el
primero de los casos, la recolección de los datos es planeada y ejecutada por el
propio investigador de acuerdo a los objetivos de su estudio. En el caso de las
fuentes secundarias, si bien los datos pudieron haber sido recolectados con los
mismos métodos, dicha recolección fue planeada y ejecutada por otras personas
de acuerdo a fines diferentes a los del investigador.
Organización Panamericana de la Salud 34
Curso de Epidemiología Básica y Vigilancia de la Salud
FICHA DE ORIENTACIÓN Nº 3:
Fuentes y formas de recolección de datos
Para diferenciar estos conceptos le daremos un ejemplo:
“ Un investigador desea estudiar el tabaquismo en su ciudad, para lo cual decide recabar datos de diferentes
tipos de fuentes:
Por un lado, decide consultar los datos “existentes” en la Encuesta Nacional realizada en el último
año y por otro, decide planificar y realizar una encuesta en su ciudad con el fin de determinar no
sólo la prevalencia del hábito, sino también otras características de la exposición (duración, tipo, cantidad, etc.).
La primera de las fuentes mencionadas es de tipo secundaria eventual, mientras que la
segunda es una fuente primaria, porque el investigador la diseña con el fin de poder recolectar
datos que le permitan alcanzar los objetivos de su investigación. Sin embargo, la forma de
recolección de datos es la misma en uno y otro caso (encuesta)
35
Marzo de 2001/ Versión Preliminar Cuantificación de los problemas de Salud
2.2. ¿Cómo recolectar los datos?
Los datos pueden ser obtenidos mediante tres métodos básicos:
La Observación: bajo este nombre se incluye el uso de técnicas que van
desde la simple observación a otro tipo de mediciones que pueden realizarse
tanto in vivo (medición de la presión arterial) como in vitro.
Los Registros: es un método de recolección de datos sistemático, periódico,
continuo y en algunas ocasiones permanente. Este método de recolección
genera datos generalmente de tipo secundario. El ejemplo característico son
los datos recolectados por el Registro Civil.
Las Encuestas: es un método de recolección de datos sistemático pero
eventual, de corte transversal. Como vimos, cuando se realizan en el total de
la población se denominan censos.
Las encuestas producen generalmente datos de tipos primarios, aunque
como mencionamos en el apartado anterior también pueden ser utilizadas
para generar datos que se constituirán en fuentes secundarias eventuales
(Censos y Encuestas Nacionales).
No existe un método o instrumento perfecto para la recolección de datos: todos
tienen sus ventajas y sus limitaciones, por lo que no es infrecuente que el
investigador combine dos o más de ellos para recoger los datos deseados.
Organización Panamericana de la Salud 36
Curso de Epidemiología Básica y Vigilancia de la Salud
Las encuestas en salud
Las encuestas constituyen una de las formas de recolección de datos más
utilizadas por los profesionales de la salud en sus investigaciones.
En las encuestas, el área de investigación o el problema de interés debe estar
claramente definido. Para ello puede ser útil el tratar de responder las siguientes
preguntas ¿a quién se va a encuestar y /o entrevistar? ¿qué objetivo se persigue?
¿cuándo y dónde será conducida la encuesta y/o entrevista? ¿qué se espera
encontrar y por qué?.
En la encuesta se recolecta información preguntando a los individuos acerca de un área
definida de investigación o un problema de interés. La forma de preguntar a los
individuos puede ser personalmente (mediante entrevistas personales o en forma
telefónica) o por correo.
El instrumento que se utiliza para la recolección de datos es un cuestionario, el
que puede ser leído por el encuestador en entrevistas personales o puede ser
autoadministrado (es decir, leído y respondido por el encuestado).
Existen varios métodos para poner en práctica una encuesta, pero los principales
son las encuestas personales (entrevistas) y las encuestas auto-
administradas (por correo o en forma personal).
37
Marzo de 2001/ Versión Preliminar Cuantificación de los problemas de Salud
a) Las Encuestas Personales: Entrevistas
En la recolección de datos se entrevistan a aquellas personas que serán objetos
de estudio. Estas entrevistas pueden hacerse en una forma flexible, no
estructurada, de modo tal que el contenido, la formulación y el orden de las
preguntas sean diferentes de entrevista a entrevista o, por el contrario, en forma
estructurada, con un cuestionario pre-elaborado.
Ventajas y limitaciones de las entrevistas no estructuradas
Al no imponer límites al entrevistado, permite mayor profundidad en la
información.
Al incluir temáticas no prefijadas, permite mayor riqueza.
Los datos obtenidos son más difíciles de analizar e interpretar.
Se analizan e interpretan por métodos distintos que no permiten
cuantificación.
Requieren la inversión de un tiempo prolongado para entrevistar a cada
persona.
El número de personas entrevistadas en la mayoría de las situaciones suele ser
pequeño.
Requiere entrevistadores calificados.
Organización Panamericana de la Salud 38
Curso de Epidemiología Básica y Vigilancia de la Salud
Ventajas y limitaciones de la entrevista estructurada
Permite recoger toda la información requerida en un tiempo determinado
Es costosa en tiempo y dinero porque requiere la preparación de un
protocolo analítico y un entrevistador por cada entrevistado
Debe ser realizada por entrevistadores entrenados para evitar posibles sesgos
y errores.
b) Encuestas auto-administradas
Este procedimiento consiste en la entrega a la persona de una serie de preguntas
que ella lee y contesta por sí misma sin mediar la acción de un entrevistador.
¿Cuándo debería utilizarse?
Cuando dispone de menos tiempo y recursos económicos.
Cuando investigue aspectos delicados o de carácter personal.
Cuando no tenga la posibilidad de contar con personal calificado para realizar
entrevistas.
Cuando necesite obtener respuestas de muchas personas o de personas que
viven en lugares diferentes, ya que pueden enviarse por correo.
39
Marzo de 2001/ Versión Preliminar Cuantificación de los problemas de Salud
Limitaciones de encuestas auto-administradas
Tienen un número menor de respuestas por parte de las personas.
Exige un determinado nivel de comprensión y habilidades por parte de
quienes deben cumplimentarlos.
FICHA DE ORIENTACIÓN N° 4
Algunas recomendaciones respecto a las preguntas que se realicen en una encuesta:
- Deben ser claras, estar focalizadas y tener un objetivo preciso.
- Deben ser breves.
- No deben exigir recuerdos con demasiada exactitud.
- No se debe enfatizar demasiado al preguntar algo ya que puede
inducir sesgo
de respuesta
- No se deben usar palabras ambiguas que tengan más de un significado.
- Es importante reservar las preguntas sobre información personal para un
momento avanzado de la encuesta.
- Los aspectos éticos en relación con la información brindada y la calidad de las
preguntas siempre deben ser considerados.
Organización Panamericana de la Salud 40
Curso de Epidemiología Básica y Vigilancia de la Salud
FICHA INSTRUMENTO Nº 8
Para reconocer los tipos de fuentes y el instrumento
para la recolección de datos
Seleccione, junto a su grupo, un problema epidemiológico local relevante en su contexto de
trabajo. Le proponemos que programen en conjunto el trabajo de recolección de
informaciones para su estudio:
a) ¿Qué tipo de fuentes secundarias utilizarían y por qué?
b) ¿ Qué métodos utilizarían para recoger los datos primarios y por qué?
c) Construyan un instrumento, organizando una encuesta personal.
d) Dramaticen la situación de entrevista
y analicen posteriormente las
dificultades y posibilidades de dicha
situación.
e) Presenten a su tutor o coordinador un breve informe de lo elaborado en los
pasos anteriores.
41
Marzo de 2001/ Versión Preliminar Cuantificación de los problemas de Salud
3. ¿Cómo presentar los datos?
Una vez que se han recolectado los datos necesarios, es importante organizarlos
o agruparlos de alguna manera para poder “manejarlos” más fácilmente. Sin la
ayuda de la Bioestadística, los datos recolectados para una investigación podrían
resultar algo así como una masa caótica de números. La presentación de estos
datos en tablas o gráficos permite apreciarlos con mayor claridad, permitiendo
explorar la información antes de analizarla. Mientras que las tablas aportan una
descripción más detallada de los datos, los gráficos permiten observar los
patrones generales. Veremos entonces cómo organizar los datos en tablas y
posteriormente como presentarlos en gráficos.
4.1. Presentación de datos en tablas
Para organizar los datos y presentarlos en forma de tabla lo primero que
tenemos que hacer es agrupar a los individuos o unidades del estudio (personas,
viviendas, enfermedades, etc.) según alguna de sus características. La forma de
agrupación dependerá de la escala que hayamos utilizado para medir la variable.
Organización Panamericana de la Salud 42
Curso de Epidemiología Básica y Vigilancia de la Salud
Si la escala que utilizamos es nominal u ordinal deberemos agrupar los datos de
acuerdo a las diferentes categorías de la variable.
Si la escala que utilizamos es numérica discreta, deberemos observar el rango
de valores diferentes que adoptó esa variable. Si este rango es pequeño,
entonces los datos se agruparán de acuerdo a cada uno de los valores de la
variable. Pero si dicho rango de valores es muy amplio, entonces deberán
construirse intervalos.
Por ejemplo, si la variable es “número de consultas en un año” y el rango
va desde individuos con 1 consulta a individuos con hasta 20 consultas
en el año, convendrá establecer intervalos como:
o 1. Individuos con 0-4 consultas al año
o 2. Individuos con 5-9 consultas al año
o 3. Individuos con 10-14 consultas al año
o 4. Individuos con más de 15 consultas al año
Este procedimiento es más apropiado que contar para cada valor de la
variable, el número de individuos que reunieron esa característica:
o 1. Individuos con 1 consulta al año
o 2. Individuos con 2 consultas al año...hasta llegar al último valor posible de la
variable.
Si la escala que utilizamos para medir la variable es numérica continua,
siempre deben formarse intervalos o clases.
Una vez lograda la agrupación de los datos en diferentes categorías o intervalos,
es posible su cuantificación. Este último paso es el que nos permite determinar la
frecuencia de observaciones en cada categoría o intervalo de la variable y
43
Marzo de 2001/ Versión Preliminar Cuantificación de los problemas de Salud
construir la Tabla de Distribución de frecuencias en el primero de los casos y la
Tabla de Frecuencias con Intervalos de Clases, en el segundo de los casos.
a) Tabla de Distribución de frecuencias
La tabla de distribución de frecuencia permite ordenar el número de individuos
que pertenecen a cada categoría de la variable. La frecuencia de observaciones
en cada categoría puede expresarse como una frecuencia absoluta (total de
observaciones en una determinada categoría) o como una frecuencia relativa
(proporción en que un atributo o cualidad se manifiesta dentro de una
determinada categoría)
FICHA DE ORIENTACIÓN N° 5
Tomemos, por ejemplo, una población formada por 500 personas, que estudiaremos en función
de la variable “gravedad de la enfermedad”
Si decimos que, del total de la población (500), 200 personas están enfermas estamos
definiendo la frecuencia absoluta de enfermos (f = 200).
Si de las 200 personas enfermas 50 están graves, podremos elegir dos alternativas diferentes
para calcular la frecuencia relativa (fr)de casos graves:
- Dividir la cantidad de casos graves (50) por el total de la población examinada (500),
en cuyo caso la frecuencia relativa es igual a 0,1.
- Dividir el número de enfermos graves (50) por el total de personas enfermas (200),
en cuyo caso la frecuencia relativa es 0,25.
La frecuencia relativa es una proporción y se obtiene dividiendo el número de casos por el
total de los casos examinados. Cuando a la frecuencia relativa la multiplicamos por 100,
obtenemos un porcentaje de distribución de casos en la población total. En nuestro caso, 10%
y 25% respectivamente (Ver Tablas 4 y 5)
Organización Panamericana de la Salud 44
Curso de Epidemiología Básica y Vigilancia de la Salud
Tabla 4. Cantidad de enfermos graves en el total de la población (n=500)
Frecuencia Frecuencia relativa o Porcentaje
absoluta Proporción
Enfermos 50 0,1 10%
graves
Tabla 5. Cantidad de enfermos graves en el total de la enfermos (n=200)
Frecuencia Frecuencia relativa o Porcentaje
absoluta Proporción
Enfermos 50 0,25 25%
graves
La variable “gravedad de la enfermedad” puede agruparse en las categorías “enfermos graves”,
“enfermos moderados” y “enfermos leves”. Los datos correspondientes pueden presentarse en
una tabla de distribución de frecuencia (tabla 6).
Tabla 6. Distribución de enfermos según gravedad de enfermedad
“Gravedad Frecuencia Frecuencia relativa o Porcentaje
de la enfermedad” absoluta Proporción
Enfermos leves 50 0,25 25%
Enfermos moderados 100 0,50 50%
Enfermos graves 50 0,25 25%
TOTAL 200 1,00 100%
Es muy importante tener en cuenta ciertos aspectos al trabajar con porcentajes:
Cuando exprese la frecuencia de observaciones en forma de porcentaje, siempre informe
el dato del numerador y el denominador con el que está trabajando.
La ventaja de los porcentajes es que permiten comparar grupos de
diferentes tamaños con una única medida. La desventaja es que puede
perderse perspectiva si sólo se informan los porcentajes.
Por ejemplo, decir que el tratamiento fue eficaz en 20% de los pacientes
tratados, puede ser cierto tanto para 1 paciente entre 5 tratados, como
para 1000 pacientes entre 5000 tratados.
45
Marzo de 2001/ Versión Preliminar Cuantificación de los problemas de Salud
El porcentaje suele expresarse junto con el numerador y el
denominador encerrados por paréntesis : 20 % (1000/5000).
Cada vez que lea porcentajes, verifique los numeradores y denominadores y recalcule
cada porcentaje.
Un problema característico con los porcentajes ocurre cuando los
mismos se expresan no para el total de la población sino para una
muestra de la misma.
Por ejemplo, “de cada 1000 hombres con enfermedad cardiovascular, 800
(80%) tuvieron colesterol alto; de estos 800, 250 (31%) fueron
sedentarios”. El 31% es 250/800, no 250/1000.
No es conveniente utilizar porcentajes cuando el denominador es un número muy
pequeño (Denominadores menores a 20).
Especialmente con muestras pequeñas, los porcentajes pueden ser muy
confusos, porque su magnitud puede ser mucho mayor que el número
que representa: Supongamos un informe efectuado sobre la evolución
de 3 pacientes “En ese estudio, 33% de los pacientes (1 paciente)
sobrevivió, 33 % (1 paciente) murió y del tercer paciente se perdieron
los datos”. El uso de porcentajes en casos como este lleva a confusión y
no sirve para simplificar la presentación de los datos.
Otra forma de expresar la frecuencia de observaciones respecto a una variable
determinada, es utilizando la “frecuencia acumulada”. La frecuencia acumulada es
el número o porcentajede observaciones para un valor dado de la variable más todos los valores
menores.
Organización Panamericana de la Salud 46
Curso de Epidemiología Básica y Vigilancia de la Salud
Por ejemplo, en un estudio se realizó una encuesta a 120 pacientes diabéticos y se
determinó el “número de hospitalizaciones que refería haber presentado en el
último año”. Los datos fueron volcados en la tabla que se presenta a
continuación (Tabla 7).
Tabla 7. Tabla de frecuencias del “Número de hospitalizaciones en el último año”
Número de Nº de Frecuencia relativa % Frecuencia acumulada %
hospitalizaciones individuos (f) (fr%) (fa%)
0 22 18.4 18.4
1 39 32.5 50.9
2 31 25.8 76.7
3 16 13.4 90.1
4 8 6.6 96.7
5 3 2.5 99.2
6 1 0.8 100.0
TOTAL 120 100.0
Si quisiéramos establecer cuantos de los 120 pacientes diabéticos encuestados
referían haber presentado 1 o menos de 1 internación en el último año,
sabríamos por la tabla, que fue del 50.9% .
FICHA INSTRUMENTO Nº 9
Analice resuelva las siguientes situaciones
47
Marzo de 2001/ Versión Preliminar Cuantificación de los problemas de Salud
A) Al considerar el grupo sanguíneo de 400 personas elegidas al azar, se observó que 191
tenían grupo 0; 156 grupo A; 31 grupo B y 22 grupo AB.
Calcule la frecuencia absoluta y la frecuencia relativa para cada uno de los grupos sanguíneos y
presente estos datos en una tabla.
B) Una trabajadora social determinó el número de hijos de 120 familias de cierta zona para un
estudio que estaba realizando acerca de la población de ese lugar. Para un mejor manejo de los
datos que obtuvo, decidió ordenarlos en una tabla de frecuencias, en la que además de
representar la frecuencia absoluta y relativa, representó también la frecuencia acumulada. De
este modo, organizó la siguiente tabla.
Analícela e interprétela. ¿Cuál es el significado de 32,5%; 76,6% y 3? Intente interpretar otros
valores de la tabla 8.
Tabla 8. Tabla de frecuencias: “Número de hijos por familia”.
Nº de hijos Nº de familias (f) Frecuencia relativa % (fr%) Frecuencia acumulada %
0 22 18.3 18.3
1 39 32.5 50.8
2 31 25.8 76.6
3 16 13.4 90.0
4 8 6.6 96.6
5 3 2.5 99.1
6 1 0.8 100.0
TOTAL 120 100%
b) Tabla de frecuencias con intervalos de clase
Cuando la variable cuyos datos pretendemos organizar fue medida con una
escala numérica continua o con una escala numérica discreta pero con un rango
amplio de valores deben construirse intervalos y presentar esta información en
una Tabla de frecuencias con intervalos.
Organización Panamericana de la Salud 48
Curso de Epidemiología Básica y Vigilancia de la Salud
Por ejemplo, en el caso de la variable “nivel de ácido úrico en sangre” utilizaríamos
una escala numérica continua para su medición y los datos deberían agruparse en
intervalos para facilitar su interpretación (Tabla 9).
Tabla 9. Tabla de frecuencias: “Niveles de ácido úrico en la población X”
Intervalos Nº de individuos Frecuencia relativa % Frecuencia acumulada %
(f) (fr%) (fa%)
3.0-3.9 17 6.3 18.3
4.0-4.9 73 27.2 50.8
5.0-5.9 101 37.7 76.6
6.0-6.9 54 20.1 90.0
7.0-7.9 18 6.7 96.6
8.0-8.9 4 1.5 99.1
9.0-9.9 1 0.3 100.0
TOTAL 268 100%
3,5
Los extremos de estos intervalos son llamados límites, distinguiéndose el límite
inferior de cada intervalo (3.0,4.0,..... en nuestro ejemplo) y el límite superior (3.9;
4.9.....). La diferencia entre el límite superior y el límite inferior se denomina
amplitud del intervalo.
Con la agrupación de los datos en intervalos se gana en comodidad, pero se
pierde información, ya que una vez agrupados, todos los datos pertenecientes a
un intervalo serán identificados para el análisis posterior con un punto medio o
marca de clase de ese intervalo. Para calcular dichas marcas de clase se realiza la
siguiente fórmula:
Marca de clase del Intervalo= Límite superior + límite inferior
2
49
Marzo de 2001/ Versión Preliminar Cuantificación de los problemas de Salud
Retomando nuestro ejemplo de los niveles de ácido úrico, la marca de clase para
el primer intervalo sería:
Marca de clase = 3.9 + 3.0 = 3.5
2
FICHA DE ORIENTACIÓN N° 6
Para construir intervalos...
Cuando agrupe los datos en intervalos tenga en cuenta que:
El número de intervalos recomendable varía entre 6 y 15. La utilización
de demasiados intervalos difiere poco de la tabulación original de los
datos, y un número demasiado reducido puede enmascarar
información esencial.
En lo posible construir intervalos de igual amplitud
Los intervalos construidos deben ser mutuamente excluyentes.
Para determinar los intervalos es recomendable:
1. Identificar el dato correspondiente al valor máximo y el
correspondiente al valor mínimo
2. Determinar la diferencia entre estos dos valores (rango)
3. Dividir esta diferencia por el número de intervalos que se desea obtener para identificar
así la amplitud de cada intervalo
FICHA INSTRUMENTO Nº 10
Resuelva el siguiente caso:
Organización Panamericana de la Salud 50
Curso de Epidemiología Básica y Vigilancia de la Salud
a) Marta, una estudiante de bioquímica, obtuvo los siguientes valores de seroalbúmina en g/l
de sangre de 50 mujeres sanas:
_________________________________
42 41 42 44 44 36 38 41 42 44
42 39 49 40 45 32 34 43 37 39
41 39 48 42 43 33 43 35 32 34
39 35 43 44 47 40 39 42 41 46
37 49 41 39 43 42 47 48 51 52
Su compañero de estudios le sugirió que de esa manera no podría interpretar muy bien todos
esos datos, sugiriéndole que los agrupe en 6 intervalos de clase o categorías de igual amplitud.
También le dijo que considerara al dato con el menor valor como el límite inferior del primer
intervalo. Además le sugirió agregar una columna para la “marca de clase” de cada intervalo.
Con estas sugerencias, Marta construyó una tabla de frecuencias con intervalos de clase.
Intente hacerlo usted mismo y, luego, coteje su tabla con las de sus compañeros.
A partir de la tabla elaborada por Ud., haga las siguientes interpretaciones.
a) ¿Cuál es el significado de una frecuencia absoluta igual a 19 en la tercera categoría?
b) ¿Cuál es el significado de una frecuencia acumulada de 88% en la cuarta categoría?
FICHA INSTRUMENTO N° 11:
Para avanzar en su investigación, junto con su grupo..
51
Marzo de 2001/ Versión Preliminar Cuantificación de los problemas de Salud
Retomen el plan y los instrumentos de recolección de datos que ustedes elaboraron y realicen
el relevamiento de la información en la localidad seleccionada.
Una vez recogida la información, elaboren tablas para presentar los resultados.
Interpreten los datos organizados en las tablas y anoten sus observaciones.
Presenten a su tutor el desarrollo y los resultados de todos los pasos anteriores.
3.2. Presentación de datos en gráficos
En ocasiones, preferirá representar gráficamente sus datos, con el objeto de
obtener una rápida impresión visual del conjunto. Para ello podrá utilizar
diferentes tipos de gráficos, pero lo que nunca debe olvidar son las siguientes
premisas:
- El gráfico debe ser sencillo y explicarse por sí mismo.
- No intente graficar “todos” los datos que tiene en un solo gráfico; por el
contrario, es preferible que no contenga demasiada información y su lectura sea
fácil.
- Utilice un diseño atractivo, pero sin deformar los hechos que está describiendo.
- Seleccione el gráfico más apropiado de acuerdo al tipo de variable y la escala de
medición utilizada para medirla.
El tipo de gráfico está condicionado por el tipo de escala utilizada para medir la
variable que desea graficar.
Organización Panamericana de la Salud 52
Curso de Epidemiología Básica y Vigilancia de la Salud
Gráfico de Sectores Circulares ó
Principales Tipos de “tortas”
Gráficos Gráfico de Barras
Histograma
Polígono de Frecuencias
a) Gráfico de Sectores Circulares
Consiste en l un círculo dividido en sectores con áreas proporcionales a la
e
frecuencia con que se presenta cada categoría.
¿Qué tipo de datos suelen presentarse de esta manera?
Habitualmente se utiliza este tipo de gráfico para presentar datos que se miden
con una escala nominal, pero también puede utilizarse para variables ordinales o
numéricas discretas con un rango pequeño de valores.
¿Qué errores puede cometer cuando utilice este tipo de gráfico para
presentar sus datos?
Representar una variable formada por múltiples categorías con una baja
frecuencia de observaciones por categoría; en estos casos resulta más
conveniente agruparlas y así facilitar su comprensión.
Omitir el número total de individuos estudiados (n). Este valor es muy
importante porque la interpretación del gráfico es muy diferente de
acuerdo al tamaño de la población cuyos datos se están representando. En
este sentido, por ejemplo, no es lo mismo un área correspondiente a un
20% de un gráfico circular que representa los datos de una población
formada por 10 personas que la de una formada por 1000.
Construiremos, ahora, un gráfico circular con los datos del ejemplo 1 sobre
grupo sanguíneo.
53
Marzo de 2001/ Versión Preliminar Cuantificación de los problemas de Salud
Ejemplo:
Distribución de Grupo Sanguíneo
n=1050
6% GRUPO O
8%
GRUPO A
47%
39% GRUPO B
GRUPO AB
Fuente: Instituto Hematológico General
Gráfico 1 - Sectores Circulares.
b) Gráfico de Barras
Este tipo de gráficos se construye dibujando barras o rectángulos en los cuales la
longitud indica la magnitud o la frecuencia de cada categoría de la variable.
Tomando los datos de la Ficha Instrumento N° 9, acerca del número de hijos por
familia, dibujamos el siguiente gráfico de barras.
Ejemplo:
Distribución de cantidad de hijos por familia.
Organización Panamericana de la Salud 54
Curso de Epidemiología Básica y Vigilancia de la Salud
45
Cantidad de Familias
40
35
30
25
20
15
10
5
0
0 1 2 3 4 5 6
Número de Hijos
Gráfico 2 – Gráfico de Barras
¿Qué tipo de datos suelen presentarse de esta manera?
Se utiliza para representar la distribución de frecuencias de variables en escala
nominal, así como para variables en escala ordinal y numérica discreta cuando el
rango de valores de la variable es reducido, como en el ejemplo anterior. Como
podrá apreciar, en el eje horizontal se indican los valores de la variable y en el
vertical sus correspondientes frecuencias.
Imagínese ahora, que recolectó datos sobre sexo y número de caries de una
población. En este caso, por tratarse de una variable nominal (sexo), en la base de
la barra deberá indicar cada una de las categorías de la variable sexo.
El número de caries podrá agruparse en..
Ninguna carie
Entre 1 y 3 caries
Más de 3 caries
.. en un gráfico de barras como el que sigue (Gráfico 3).
55
Marzo de 2001/ Versión Preliminar Cuantificación de los problemas de Salud
Ejemplo:
Número de caries en una población de
niños menores de 5 años
N=120
45
40
35
Número de niños
30
25 Ninguna
Entre 1 y 3
20 Más de 3
15
10
5
0
S. Femenino S. Masculino
Número de caries
Fuente: Asociación Odontológica
so far so good
Gráfico 3 – Gráfico de Barras
Observe que este gráfico es algo más complejo que el anterior, pero en él
pudimos representar no sólo la frecuencia de caries en los niños de cada sexo,
sino también el número de niños que se encontraron en cada una de las
categorías de la variable número de caries.
Organización Panamericana de la Salud 56
Curso de Epidemiología Básica y Vigilancia de la Salud
Como pueden observar, el gráfico de barras es muy útil para comparar no sólo la
distribución de frecuencias de las diferentes categorías de una variable, sino
también la distribución de acuerdo a más de una variable.
c) Histograma
Los histogramas se utilizan para representar una distribución de frecuencias de
una variable medida con una escala numérica continua. Es una representación
gráfica análoga al gráfico de barras. Se puede decir que el histograma es un
conjunto de rectángulos contiguos levantados sobre los intervalos de la variable y
cuya altura es proporcional a la frecuencia. A diferencia del gráfico de barras, la
información que un histograma comunica es del área de las barras que lo
constituyen, y no ya sólo de su altura. Por ello, si la amplitud de los intervalos no
varía, las áreas son proporcionales a las alturas y las frecuencias están
representadas tanto por las alturas como por las áreas. Si los intervalos fueran de
diferente amplitud, la altura de las barras deberán modificarse para conservar el
área correcta.
FICHA DE REFLEXION Nº 4
57
Marzo de 2001/ Versión Preliminar Cuantificación de los problemas de Salud
En este punto, le proponemos que repase los datos que Marta, la bioquímica, había
recolectado acerca del nivel de seroalbúmina en muestras de sangre de 50 mujeres que
presentamos en la Ficha Instrumento N° 9. Marta había mejorado su conocimiento sobre
tablas y gráficos y decidió construir un histograma, dado que la concentración de seroalbúmina
en la sangre era una variable numérica continua.
Gráfico 5. Histograma y Polígono de frecuencias de la “Concentración de
seroalbúmina en sangre” en una población de 50 mujeres:
Toda vez que construya un histograma de frecuencia, tenga en cuenta que estos
se utilizan para representar la frecuencia de variables medidas con la escala
numérica continua y que en este caso la frecuencia de cada intervalo está
representado por el área de la barra, no por su altura.
d) Polígono de Frecuencias
Se utilizan para representar una distribución de frecuencias en los mismos casos
en que se utiliza el histograma, pero en la mayoría de las veces a fin de comparar
Organización Panamericana de la Salud 58
Curso de Epidemiología Básica y Vigilancia de la Salud
dos o más distribuciones en una misma gráfica. Se construyen uniendo los
puntos medios de las bases superiores de los rectángulos del histograma con
segmentos rectilíneos. Se debe continuar la línea hasta las marcas de clase de
intervalos hipotéticos anterior al primero y posterior al último, de modo que el
área encerrada por el polígono sea igual al área encerrada por el histograma. En el
gráfico anterior podrá observar el polígono de frecuencias correspondiente a la
distribución de seroalbúmina.
El polígono de frecuencias permite determinar la forma de una distribución de
valores numéricos. Estas formas pueden ser de tipos muy variados. Se describen
dos aspectos de estas curvas: su simetría y su modalidad.
Se dice que una distribución es simétrica si al plegarla sobre sí misma sus
dos mitades se superponen aproximadamente. Las distribuciones
asimétricas se describen también como sesgadas.
Una distribución unimodal es aquella que sólo presenta un pico o punto alto,
en tanto que una distribución polimodal tiene dos o más picos; si tiene dos
recibe el nombre de bimodal.
FICHA INSTRUMENTO N° 12:
Le pedimos que resuelva el siguiente ejercicio
59
Marzo de 2001/ Versión Preliminar Cuantificación de los problemas de Salud
Observe las siguientes curvas y describa tanto su simetría como su modalidad
La primera de estas curvas recibe el nombre de Campana de Gauss, y como
seguramente la ha descripto, se trata de una curva simétrica y unimodal. En
Bioestadística se la conoce como curva de una distribución de frecuencias
normal Muchos de los atributos físicos y psicológicos del ser humano se
aproximan a esta distribución,; por ejemplo la estatura, la inteligencia y la
presión arterial.
FICHA INSTRUMENTO N° 13:
Le pedimos que resuelva el siguiente ejercicio
Organización Panamericana de la Salud 60
Curso de Epidemiología Básica y Vigilancia de la Salud
Seleccione el gráfico que considere más apropiado para representar la variable “número de
hijos por familia” cuya distribución de frecuencias se presenta a continuación. (Tabla 10 ).
Justifique su selección.
Tabla 10 . Tabla de frecuencias de la variable “ Número de hijos por familia”.
Nº de hijos Nº de familias Frecuencia relativa % Frecuencia acumulada %
por familia (f) (fr%) (fa%)
0 22 18.4 18.4
1 39 32.5 50.9
2 31 25.8 76.6
3 16 13.4 90.0
4 8 6.6 96.6
5 3 2.5 99.1
6 1 0.8 100.0
TOTAL 120 100%
FICHA INSTRUMENTO N° 14
Para avanzar en su investigación junto con su grupo...
Retomen el resultado del estudio local que están realizando
Seleccionen y diseñen el mejor gráfico para presentar estos resultados y analícenlo con su tutor
61
Marzo de 2001/ Versión Preliminar Cuantificación de los problemas de Salud
4. ¿Cómo procesar e interpretar los datos?
Una vez recolectados los datos del evento en estudio, debemos proceder a su
análisis. Dos pasos esenciales para poder llevar a cabo el análisis de los datos son
el procesamiento y la interpretación de los mismos. Para ello es fundamental
contar con un orden preestablecido. Proponemos una sistemática de trabajo que
ayudará a tener mejores resultados, cuyos pasos se encuentran enumerados en la
fig. 2.
Al describir un evento de salud, realizamos diferentes mediciones de la
frecuencia de aparición de una característica o de los valores de las diferentes
variables. Existen una serie de medidas que nos aporta la Bioestadística que nos
facilitan el procesamiento de los datos, “resumiendo” la información obtenida;
de ahí su nombre de “medidas de resumen” (fig. 2). Existen diferentes tipos de
medidas de resumen que deben ser seleccionadas de acuerdo a la escala de
medición utilizada para medir la variable, tal como se muestra el la fig. 2.
Nos referiremos a la sistematización del trabajo y resaltaremos algunos puntos
clave de las medidas de resumen
4.1. La sistematización de los datos
Le sugerimos que toda vez que deseen procesar los datos obtenidos se
sistematicen de alguna manera.
Organización Panamericana de la Salud 62
Curso de Epidemiología Básica y Vigilancia de la Salud
FICHA DE ORIENTACIÓN Nº 7
Una forma que nos parece conveniente para sistematizar el trabajo, es la siguiente:
(Fig.2)
1- Clasifique cada una de las variables de su estudio.
2- Organice y presente sus datos en el gráfico que considere más apropiado.
3- Resuma sus datos. Para hacerlo adecuadamente tenga en cuenta el tipo de
variable y analice en primer lugar los datos de una sola variable por vez (Análisis
Univariado). Una vez que analizaron las variables de a una por vez, podrán pasar a
analizar la relación entre dos variables (análisis bivariado)
Si superaron este desafío, podrán analizar entonces la relación entre tres o más
variables: análisis multivariado.
Fig. 2. Sistemática de trabajo y medidas de resumen
Sistemática de trabajo Medidas de Resumen
1 CLASIFIQUE
Numérica Ordinal Nominal
2 ORGANICE
3 RESUMA Media Moda Moda
Mediana Mediana Proporciones
Modo Proporciones Porcentajes
Percentiles Porcentajes Razones
63 Cuartiles Razones Tasas
Rango Tasas
Rango Interc.
Marzo de 2001/ Versión Preliminar Cuantificación de los problemas de Salud
ANALISIS
4 ANALISIS
UNIVARIADO
ANALISIS
5 BIVARIADO
ANALISIS
6 MULTIVARIADO
4.2. Las medidas de resumen
Ya conocemos que tipo de medida utilizar de acuerdo al tipo de variable. Sin
embargo, es necesario que también sepa reconocer las diferencias conceptuales
entre cada una de las medidas de resumen mencionadas.
En caso de que sea numérica, deberán utilizar alguna o varias de las medidas de
centralización (media, mediana y moda), de dispersión (rango, rango
intercuartílico, desvío estándar y varianza) y/o de orden (percentiles y cuartiles).
En caso de que se trate de una variable nominal, pueden utilizar en ocasiones la
moda, pero es conveniente que en estos casos resuma sus datos calculando
proporciones, porcentajes, razones y tasas. En caso de que la variable sea ordinal,
pueden utilizar en ocasiones la moda y la mediana entre las medidas de
centralización para poder describirla, pero más conveniente es el uso de
proporciones, porcentajes, razones y tasas.
Le proponemos entonces, repasar los conceptos de razón, proporción y tasa
(dentro de estos dos últimos grupos describiremos prevalencia, incidencia
Organización Panamericana de la Salud 64
Curso de Epidemiología Básica y Vigilancia de la Salud
acumulada, tasa de incidencia acumulada y densidad de incidencia), medidas de
tendencia central, medidas de dispersión y medidas de orden.
Razón
Proporción Prevalencia
Incidencia Acumulada
Tasa Tasa de Incidencia Acumulada
Medidas de Densidad de Incidencia
Resumen
Medidas de Centralización : modo, media,
Tendencia mediana
Central , Orden: Percentiles, cuartiles
de Orden y de Dispersión: Rango, rango
Dispersión intercuartílico, coeficiente de
variación y desvío estándar
Razón
Si está describiendo la presencia de una determinada variable nominal en una
población, una de las formas de hacerlo es estableciendo la relación entre el
número de individuos que poseen esta característica y el número de individuos
que no la poseen. De esta manera, lo que estará calculando es una medida que
recibe el nombre de razón.
Por ejemplo, En un hospital se realizó un estudio de casos y controles y se trabajó
con 100 casos de Infarto agudo de miocardio (IAM) y 200 controles. La razón de
los casos a controles es de 1:2 o sea, en este estudio se seleccionaron 2 controles
por cada caso.
En otras palabras, una razón es el número de observaciones del grupo de
pacientes con IAM dividido por el número de pacientes sin IAM; establece la
relación de una parte con otra parte.
65
Marzo de 2001/ Versión Preliminar Cuantificación de los problemas de Salud
FICHA DE ORIENTACIÓN N° 8
Si la variable que desea cuantificar es la presencia o ausencia de enfermedad, entonces deberá
calcular la razón dividiendo el número de personas con esa enfermedad por el número de
personas sin esa enfermedad.
Observe que básicamente la proporción (frecuencia relativa) se diferencia de la razón en
cuanto a la relación existente entre el numerador y el denominador: en la primera el
numerador es parte del denominador mientras que en la segunda no.
Tasas
La tasa es una medida que expresa en el numerador el número de eventos
ocurridos y en el denominador la población expuesta o “en riesgo” de
experimentar dicho evento. Las tasas se describen como proporciones ya que en
el numerador aparecen los eventos (casos nuevos de enfermedad, defunciones,
etc) y en el denominador la población de estudio de donde provienen los casos:
el numerador forma parte del denominador. Sin embargo, lo que diferencia a una
tasa de las proporciones y las razones es que:
1. En la tasa se relaciona un evento con
la población en riesgo de presentar
ese evento
Organización Panamericana de la Salud 66
Curso de Epidemiología Básica y Vigilancia de la Salud
2. Para expresar una tasa debe incluirse en el denominador el tiempo
durante el cual las personas estuvieron en riesgo de presentar el evento
(tiempo en riesgo)
3. Se multiplican por una constante (10 o múltiplos de 10) que facilita la
comparación de tasas de poblaciones diferentes, aún cuando las mismas sean
de diferente tamaño.
Por ejemplo, si en una población de 300 personas se produjeron 10 casos de
hepatitis durante un período de 1 mes, la tasa de ocurrencia de la enfermedad
durante ese período es igual a 10/300= 0.03; es decir, 3 de cada 100 personas de
esta población presentaron hepatitis.
En el campo de la salud la tasa es una medida muy utilizada porque, como
mencionamos, permite medir de alguna manera la frecuencia de un evento
(habitualmente una enfermedad) en una determinada población “expuesta” o
“en riesgo” de experimentar dicho evento en un determinado período de tiempo.
FICHA DE ORIENTACIÓN N° 9
Toda vez que piense en construir una tasa piense que necesita para ello
conocer:
- número de personas que desarrollan el evento
- número de personas que pueden desarrollar dicho evento,
- el tiempo en que esa población estuvo expuesta al riesgo
67
Marzo de 2001/ Versión Preliminar Cuantificación de los problemas de Salud
FICHA DE REFLEXIÓN N° 5
Le proponemos que analice el siguiente caso:
Un funcionario de gobierno del sector salud de un municipio (X) estaba
alarmado por el número importante de personas afectadas de una
enfermedad respiratoria cuya causa se desconocía. Según manifestó a otros
funcionarios del municipio vecino (Y), la cifra reportada había sido de 149
durante 1997 y 1998. La preocupación fue mayor aún cuando los otros
funcionarios del municipio (Y) le comentaron que en su ciudad sólo se habían
reportado 60 casos.
¿ Uds. también se hubieras alarmado?
¿ Con qué otros datos debería contar para poder comparar la ocurrencia de la
enfermedad en las dos poblaciones?
Con los datos de la siguiente tabla, calcule las tasas de ocurrencia de la
enfermedad para cada uno de los dos Municipios.
Tabla comparativa de los dos municipios
Municipio N° de casos de Tiempo de Población
enfermedad respiratoria Estudio
Municipio X 149 1997- 1998 25 000
Municipio Y 60 1998 5000
FICHA DE ORIENTACIÓN N° 10:
Recuerde…
Organización Panamericana de la Salud 68
Curso de Epidemiología Básica y Vigilancia de la Salud
Para comparar es necesario tener en cuenta el tiempo y la población de estudio, que en este
caso son diferentes porque el Municipio X es mayor que el Y, y además el tiempo en el que se
recogieron los datos también fue mayor para este municipio. Como el caso presentado esto no
se da, es necesario buscar alguna forma para hacer las tasas comparables. Una forma que
elegimos arbitrariamente podría ser considerar la mitad de casos en el Municipio por la
ocurrencia en un año y así dividir 79/25000 y 60/5000. ¿Qué le sugieren estos resultados?
Tasas Crudas y Tasas específicas
Las tasas de todas las personas enfermas o muertas se denominan tasas crudas
(totales o generales). En este tipo de tasas se consideran todas las causas y
características de los sujetos.
Por ejemplo, la tasa de mortalidad de una población es una tasa cruda.
Sin embargo, normalmente nos interesan más las enfermedades que causan casos
o muertes, las características de las personas involucradas, etc. El cálculo de las
tasas de sucesos de enfermedades o personas en particular da por resultado tasas
específicas.
Por ejemplo, podemos calcular tasas específicas por enfermedad (tasa de incidencia
de cáncer de pulmón); por edad (tasa de mortalidad infantil); por enfermedad y
edad (tasa de incidencia de accidentes de hogar en niños menores de 5 años)
Comparación de tasas
Cuando se utilizan tasas para comparar los riesgos de muerte o de enfermedad en
dos poblaciones diferentes, por ejemplo, dos hospitales, o dos ciudades, o dos
fábricas, es muy importante considerar si estas poblaciones difieren en algún
factor que se sabe influye en el riesgo de morir o contraer la enfermedad.
69
Marzo de 2001/ Versión Preliminar Cuantificación de los problemas de Salud
Por ejemplo, si se desea evaluar las tasas de mortalidad por neumonía de dos
hospitales diferentes, es muy importante considerar la distribución por edades de
las personas con neumonía en uno y otro hospital. Si en uno de los hospitales los
pacientes con neumonía son más añosos, las tasas serán seguramente mayores
debido a esta diferencia en la edad de la población afectada. Así como la edad
también podrían considerase otros factores que se saben asociados con peor
pronóstico pacientes con neumonía (inmunosupresión, bajo nivel
socioeconómico, etc).
Para evitar esta confusión que genera la presencia de estos factores
denominados, factores de confusión, al momento de comparar tasas se utiliza un
procedimiento denominado estandarización o ajuste de tasas. Por medio de este
método se calculan tasas crudas hipotéticas para cada grupo de comparación
(“tasas estandarizadas”). Estas tasas, si bien son hipotéticas, son comparables, y
permiten determinar en que medida se diferencian las dos poblaciones respecto al
riesgo de enfermar o morir por el evento en consideración.
La explicación de los diferentes métodos de estandarización las encontrará en textos de Epidemiología de nivel
intermedio o avanzado.
Organización Panamericana de la Salud 70
Curso de Epidemiología Básica y Vigilancia de la Salud
FICHA INSTRUMENTO Nº 15
“Tasas Proporcionales: ¡Cuidado!”
A continuación le presentamos un estudio y las conclusiones elaboradas por su autor.
a)¿Están de acuerdo o no con estas conclusiones? Justifiquen su respuesta.
b) Necesitaría alguna otra información para realizar este análisis? ¿Cual?
“En un estudio sobre Alto Peso al nacer (AP) , se comunicó que de un total de 51,000
partos ocurridos en una Clínica privada de la ciudad de Mendoza, se detectaron 125 casos para
los cuales el peso del recién nacido superó los 5,000 gramos. Los 125 casos estudiados se
distribuyen según paridad de la madre en la siguiente forma:
Paridad de la madre No. de Casos Porcentajes
1 9 7
2 24 19
3 17 14
4 16 13
5 9 7
6y7 19 15
8y9 9 7
10 y + 22 18
Total 125 100
Al analizar los resultados el autor escribe:
"En resumen 9 casos, es decir el 7%, son primíparas, el resto, 116, es decir el 93% eran
multíparas y de estas últimas, 24 eran secundíparas, lo que representa el 19% del total. Este es
el grupo más numeroso, lo que nos autorizaría a aceptar que la secundiparidad es el momento
más favorable para la producción de fetos gigantes."
71
Marzo de 2001/ Versión Preliminar Cuantificación de los problemas de Salud
Como mencionamos anteriormente, existen dos medidas de gran relevancia
desde el punto de vista epidemiológico, que permiten medir la frecuencia de las
enfermedades y que seguramente habrá oído mencionar en más de una
oportunidad: prevalencia e incidencia..
a) Prevalencia
Es el número de casos o eventos en una población de una determinada
enfermedad en un momento dado en el tiempo. La prevalencia intenta mostrar la
frecuencia con la que un evento de salud o enfermedad existe en el momento,
independientemente de cuándo se haya originado.
¿Cómo se calcula la prevalencia?
Se debe determinar el número de sujetos en quienes se presenta el evento
estudiado y relacionar dicho número con el total de individuos que forman el
grupo observado. Suele expresarse en forma de proporción o porcentaje.
Existen dos formas de calcular la prevalencia:
- Prevalencia puntual:
Se utiliza cuando se desea determinar la prevalencia de una enfermedad en
la población en un momento en el tiempo, independientemente de cuándo
se haya originado. Se denomina puntual porque la medición se hace en un
corto período de tiempo.
Casos de una enfermedad en un momento dado
Prevalencia Puntual = x 100
Población total en estudio en ese momento
Organización Panamericana de la Salud 72
Curso de Epidemiología Básica y Vigilancia de la Salud
- Prevalencia de período:
Determina la cantidad de casos existentes durante un período.
Es una forma práctica de resolver el problema de la aparición de casos
nuevos cuando se está ejecutando el estudio ya sea por una elevada
frecuencia de aparición de la enfermedad o porque el estudio no se puede
realizar en un corto período de tiempo. Esta medida informa el número de
casos existentes así como los casos nuevos producidos durante ese período.
Casos antiguos + casos nuevos en un período dado
Prevalencia x 100
de Período =
Población total en estudio en ese período
¿ Por qué es útil determinar la prevalencia de un evento o enfermedad?
La Prevalencia expresa la carga de una enfermedad en un momento dado,
de ahí su importancia para la elaboración de los programas de salud preventivos,
asistenciales y de control.
Por otra parte, la información suministrada por la prevalencia es, en muchas
ocasiones, un punto de partida para la investigación causal.
b) Incidencia
La incidencia de la enfermedad representa la frecuencia de casos nuevos en una
población durante un período determinado de tiempo. La duración de ese
período de observación influye en los resultados de la incidencia, pues si éste
aumenta ocurrirán más casos e hipotéticamente pueden llegar a enfermarse todos
73
Marzo de 2001/ Versión Preliminar Cuantificación de los problemas de Salud
los individuos y el valor entonces de la incidencia será igual a 1,00 o 100%. Por
eso, al usar esta medida, debe siempre expresarse el período de observación.
¿Cómo se calcula la incidencia?
Existen tres formas de calcular la incidencia:
- Incidencia acumulada:
Es una medida que representa la proporción de individuos sanos que
contraen la enfermedad en un período de tiempo determinado.
Casos nuevos
Incidencia Acumulada = x 100
Número de individuos al comienzo del período
- Tasa de Incidencia Acumulada
Mientras que la incidencia acumulada es una proporción, la tasa de
incidencia acumulada es una tasa porque el denominador es el tiempo
en riesgo de la población estudiada. Sin embargo, no siempre puede
calcularse este tiempo en riesgo dado que:
Frecuentemente no es posible excluir el tiempo en que los individuos que
se enferman ya no están en riesgo
En otras ocasiones es imposible identificar el período de exposición de
cada uno de los miembros de la población estudiada
Por este motivo, el tiempo en riesgo se determina mediante una
aproximación, resultado de multiplicar el tamaño promedio de la
población observada por la duración del período, generalmente un
año.
Casos nuevos
Organización Panamericana de la Salud 74
Curso de Epidemiología Básica y Vigilancia de la Salud
Tasa de Incidencia
Acumulada = x 100
Número de individuos a mitad del período
- Densidad de Incidencia:
Es el número de nuevos casos registrados, dividido por la suma de los
períodos de tiempo en riesgo correspondientes a todos los individuos
en estudio. Esta sería la “verdadera tasa de incidencia”, porque en este
caso se conocen los tiempos en riesgo de cada uno de los individuos y
no se recurre a una aproximación como lo es la tasa de incidencia
acumulada.
Esta medida se utiliza cuando la población observada es inestable en el
tiempo, es decir, cada sujeto ha estado “en riesgo” o expuesto al evento
de interés por períodos de tiempo distintos, ya sea por abandono del
estudio, por contraer la enfermedad, etc. Es una medida útil para el
seguimiento de poblaciones dinámicas en las que ingresan y salen
individuos. Su unidad de tiempo es personas-unidad de tiempo
utilizada para el estudio (personas-años, personas-días,etc.). Una
persona-año representa un individuo en riesgo de desarrollar la
enfermedad durante un año.
FICHA DE ORIENTACIÓN N° 11
Para comprender mejor la densidad de Incidencia...
Un ejemplo lo constituye el cálculo de la densidad de incidencia de accidentes laborales
en un grupo de enfermeros del Servicio de Pediatría de un hospital. Para este cálculo
75
Marzo de 2001/ Versión Preliminar Cuantificación de los problemas de Salud
importa saber la duración de la jornada laboral para cada uno de estos individuos, ya
que de ésta dependerá el tiempo que cada uno de ellos estuvo en riesgo de sufrir un
accidente laboral (Tabla de Accidentes Laborales)
Tabla de accidentes laborales en los enfermeros del hospital
Tipo de Cantidad Cantidad Cantidad Cantidad Densidad de
personal enfermeros accidentes horas/mes Horas/mes Incidencia
por enfermero total enfermeros (accidentes/
personas-mes)
Jornada 300 50 192 192 x 300= 50/57 600=
Completa 57 600 0,0008
Jornada 150 45 144 150 x 144= 45/21 600=
Parcial 21 600 0,002
Guardias 75 20 96 96 x 75= 20/7200=
7200 0,002
Observe que la densidad de incidencia es menor para el grupo de enfermeros con
jornada laboral completa, en comparación con los otros dos grupos, cuyas densidades
de incidencia son iguales.
A diferencia de las anteriores, esta medida tiene una unidad: personas-unidad de
tiempo (personas-año, persona-mes, personas-día). La suma persona- tiempo indica la
suma de todos los períodos de tiempo por persona estudiados. El período de tiempo
de observación se calcula para cada persona de forma individual, sumándose los de
todas las personas del estudio mientras están en riesgo (o sea, mientras está dentro del
estudio y no ha contraído la enfermedad).
¿Por qué es útil determinar la incidencia de un evento o enfermedad?
Organización Panamericana de la Salud 76
Curso de Epidemiología Básica y Vigilancia de la Salud
La principal utilidad de la incidencia es que permite medir el riesgo de que un
grupo de individuos desarrolle una enfermedad. Más adelante le explicaremos el
concepto de riesgo, pero por ahora es importante que recuerde que en
epidemiología, incidencia es sinónimo de “riesgo”.
FICHA INSTRUMENTO N° 16
Diferencias entre incidencia y prevalencia
Analice las principales diferencias entre los conceptos de incidencia y prevalencia y
complete el siguiente cuadro:
CARACTERISTICA INCIDENCIA PREVALENCIA
Numerador
Denominador
Tiempo
Formas de calcularla
Utilidad
77
Marzo de 2001/ Versión Preliminar Cuantificación de los problemas de Salud
Medidas de Tendencia Central, de Orden y de Dispersión
Para resumir el conjunto de datos de una variable medida con una escala
numérica deberemos utilizar las medidas de tendencia central (media, mediana y
modo) y las de dispersión (desvío estándar, rango intercuartílico). En otras
palabras, cuando los datos disponibles están dados en una escala numérica,
básicamente debemos calcular dos tipos de medidas llamadas medidas de
centralización y medidas de dispersión; las medidas de orden son utilizadas
en algunas ocasiones.
Los tres tipos de medidas son útiles no sólo para describir de manera más
sintética los datos obtenidos, sino para poder comparar de forma más precisa y
eficiente las observaciones realizadas.
a) Medidas de Centralización
Organización Panamericana de la Salud 78
Curso de Epidemiología Básica y Vigilancia de la Salud
Las medidas de centralización más utilizadas son:
Moda
Mediana
Media aritmética.
a.1. Moda (Mo)
Así como “algo” que está de moda, habitualmente es “algo” que se ve con
mucha frecuencia. En Bioestadística la Moda es el valor que se presenta con
mayor frecuencia en el conjunto de los datos obtenidos.
a.2. Media aritmética ( x )
La media aritmética se calcula como la suma de las observaciones dividida por el
número total de observaciones (n). Supongamos tener n datos que notaremos
como X1, X2, X3..., Xn. La media aritmética de estos valores se define como la
suma de todos ellos, dividida por n y se simboliza con x . Ud. puede encontrar
ese valor realizando el siguiente cálculo:
x = X1 + X2 + X3 .....+Xn.
n
Sólo puede ser utilizada si la distribución de los datos tiene una forma simétrica y
unimodal (curva normal). Por otra parte, una limitación importante de la media
aritmética es que su cálculo se ve muy influenciado por la presencia de valores
extremos. En estos casos, es conveniente utilizar otra medida de centralización,
llamada mediana.
a.3. Mediana (Md)
79
Marzo de 2001/ Versión Preliminar Cuantificación de los problemas de Salud
La mediana es la observación que deja la mitad de los datos (ordenados de
menor a mayor) a cada lado. Ud. puede fácilmente encontrar ese valor realizando
el siguiente cálculo:
Posición de la Md en un conjunto de datos ordenados = (n + 1)
(de menor a mayor) 2
Si el número total de observaciones (n) es impar existirá una única mediana y será el
valor que ocupe la posición central. Si el número de observaciones es par, no existe
un único valor central y la mediana corresponde a la media de los dos valores
centrales.
La mediana es la medida de centralización que se utiliza cuando la variable se
mide con una escala numérica u ordinal. Es la medida más apropiada en caso de
que las distribución de frecuencia de la variable sea asimétrica.
b) Medidas de Orden
b.1. Percentiles
Los percentiles son valores que dividen al conjunto de datos, dejando por debajo
de ellos determinados porcentajes.
Por ejemplo el percentil 10 deja por debajo al 10% de los valores observados.
Cuando definimos mediana dijimos que era el valor que separaba el conjunto de
los datos en dos mitades iguales, por lo que ahora también sabemos que la
Mediana es también el percentil 50. Los percentiles se denotan por P1,..... P99.
b.2. Cuartiles:
Organización Panamericana de la Salud 80
Curso de Epidemiología Básica y Vigilancia de la Salud
Los cuartiles son tres valores, que dividen al conjunto de datos observados en
cuatro partes de forma tal que el 25% queda por debajo del cuartil 1, el 50 % por
debajo del cuartil 2 y el 75% por debajo del cuartil 3. Los cuartiles, por lo tanto,
son los percentiles 25, 50 y 75, respectivamente. Los cuartiles se denotan por Q1,
Q2 y Q3
c- Medidas de Dispersión
Como mencionamos anteriormente, expresan el grado de variación de los datos.
Debe destacarse que dos series de mediciones pueden coincidir en media,
mediana y moda y sin embargo, los datos pueden distribuirse en forma muy
diferente alrededor de estas medidas de centralización. Por eso, una medida de
centralización siempre debe ir acompañada de una de dispersión. Las más
utilizadas son el rango, el rango intercuartílico, el desvío estándar, la
varianza y el coeficiente de variación.
A continuación describiremos todas estas medidas excepto la varianza.
c.1. Rango (R)
Se calcula como la diferencia entre la mayor observación y la menor. Es el valor
más simple de obtener. Sin embargo, debe tener cuidado de especificar siempre
precisamente el valor mayor y menor, ya que de lo contrario es muy difícil
interpretar esta medida. A menudo el rango se denota como: [valor menor
observado- valor mayor observado].
R= [valor menor observado- valor mayor observado]
81
Marzo de 2001/ Versión Preliminar Cuantificación de los problemas de Salud
¿Qué desventajas tiene?
Tiene como desventaja que su cálculo se basa en sólo dos valores que por ser los
extremos, pueden ser muy atípicos. No da información acerca de cómo se
dispersan los datos dentro del intervalo limitado por el menor y el mayor valor.
c.2. Rango intercuartílico (RI)
Para solucionar en parte el inconveniente que presenta el rango, se pensó en una
medida simple que no se basa en los valores extremos, sino calculando el intervalo
entre el primer y el tercer Cuartil. A esta medida de dispersión se la denominó Rango
intercuartílico (RI), y se define como la distancia entre los valores entre los cuales se
encuentra el 50% central de los datos.
Por lo tanto, la fórmula sería:
RI = Q3 – Q1
El rango intercuartílico debe utilizarse como medida de dispersión que complementa la
información suministrada por la mediana.
c.3. Desvío estándar (S ó DE)
Es la medida de dispersión más utilizada aunque su significado y su cálculo pueden
parecer algo complejos. El S mide la dispersión de los datos alrededor de la media
aritmética. Por lo tanto, su uso es correcto siempre que la media sea la medida de
centralización adecuada.
¿Cuándo era apropiado el uso de la media?
En una distribución simétrica.
Organización Panamericana de la Salud 82
Curso de Epidemiología Básica y Vigilancia de la Salud
Le daremos la fórmula del S, que de ninguna manera pretendemos memorice, sino
simplemente para que tenga una idea de cómo calcularlo (de todas maneras no se
preocupe, hoy con cualquier computadora podrá conocer el S del conjunto de sus datos
sin tener que andar haciendo tantos cálculos).
S
x x 2
n 1
El símbolo significa sumatoria. Ahora, ¿qué sumamos? Las diferencias entre
cada valor individual y la media (x - x ) elevado al cuadrado. Una vez que hicimos
este cálculo, se divide por el número de individuos de la población (n) menos 1 y
finalmente calculamos la raíz cuadrada de este resultado.
Existe un concepto muy importante acerca del S, y es que sin importar la forma
en que se distribuyen las observaciones, por lo menos 75% de los valores quedan
siempre entre la media menos dos desvíos y la media más dos desvíos.
Si la distribución es simétrica y unimodal:
o 67% de las observaciones están entre la media menos un desvío y la
media más un desvío
o 95% de las observaciones están entre la media menos dos desvíos y
la media más dos desvíos
o 99.7 % de las observaciones están entre la media menos tres desvíos
y la media más tres desvíos.
c.4. Coeficiente de Variación (CV %)
83
Marzo de 2001/ Versión Preliminar Cuantificación de los problemas de Salud
Es una medida de variabilidad relativa que se utiliza para comparar la dispersión
de dos o más variables numéricas cuando:
o - Las variables están medidas en unidades diferentes
Por ejemplo, desea comparar la dispersión de los datos
correspondientes a peso (en kg) con la dispersión de los
datos de la altura (en cm)
o - Las variables están medidas en la misma unidad, pero tienen
medias aritméticas de diferente magnitud
Por ejemplo, desea comparar la dispersión de los datos
correspondientes al peso en neonatos y la dispersión de
los datos correspondientes al peso en adultos.
No tiene unidades y expresa la variabilidad como un porcentaje de la media. A
menor CV%, menor variabilidad.
Se calcula dividiendo el desvío estándar por la media y multiplicando por 100.
S
CV % = x100
X
FICHA DE ORIENTACIÓN N° 12
Un consejo práctico para determinar la simetría de la curva
Si bien existen distintos métodos estadísticos para determinar la simetría de la curva, una
forma sencilla para conocer si la curva es simétrica o no, es calculando las media, la mediana y
la moda.
Si estas tres medidas son iguales o muy similares, la curva es simétrica o aproximadamente
simétrica; si son diferentes, entonces será asimétrica.
Organización Panamericana de la Salud 84
Curso de Epidemiología Básica y Vigilancia de la Salud
¿Qué medidas de centralización y dispersión utilizar?
Si la curva es simétrica, es conveniente utilizar la media acompañada del desvío
estándar para resumir los datos.
Si la curva es asimétrica, es conveniente utilizar la mediana acompañada del rango
intercuartílico.
FICHA INSTRUMENTO Nº 17:
Interpretemos resultados...
A continuación se transcriben los resultados correspondientes a los niveles de colesterol en
sangre y la presión arterial sistólica, extraídos de un estudio cuyo objetivo fue determinar la
prevalencia de enfermedad cardiovascular en un población y factores de riesgo asociados a esta
condición.
Variable Media Mediana Desvío Percentil 90
Estándar
Colesterolemia (mgrs %) 399 215 0.71 494
Presión sistólica 120 119 13 136
85
Marzo de 2001/ Versión Preliminar Cuantificación de los problemas de Salud
Les pedimos que respondan las siguientes preguntas:
¿En qué escala están medidas cada una de las variables?
¿Qué gráfico utilizarían para representar el nivel de colesterol en sangre de esta población?
Justifique su selección
Interpreten los valores sombreados
¿Qué pueden decir respecto a la simetría de la distribución de la presión arterial sistólica? ¿y
del colesterol? Justifiquen su respuesta.
¿ Les parece apropiado utilizar el desvío estándar como medida de dispersión para la
colesterolemia? Justifiquen su respuesta. Si opinan que no, ¿Cuál medida de dispersión
utilizarían?
Si quisieran comparar cuál de las dos variables tiene una mayor variabilidad entre los
individuos de la población investigada, ¿Qué medida de dispersión utilizaría? ¿Cuál de las
dos variables presenta una mayor variabilidad en sus datos?
FICHA INSTRUMENTO N° 18
Retomen los resultados del estudio local que están realizando.
Seleccionen y calculen las medidas de tendencia central, de dispersión y de orden
que pueden realizar con los datos que cuentan y analícenlo con su tutor.
En síntesis...
Organización Panamericana de la Salud 86
Curso de Epidemiología Básica y Vigilancia de la Salud
Si Ud. comprendió los conceptos presentados en éste Módulo, esta listo para
cuantificar los problemas de la Salud.
La cuantificación es un proceso absolutamente necesario para la
interpretación de los procesos de salud y enfermedad.
Para poder comprender por qué y cómo ocurren los eventos en salud y
enfermedad deberá recorrer además de éste, otros caminos.
87
Marzo de 2001/ Versión Preliminar Cuantificación de los problemas de Salud
NOTA:
Esta es una presentación preliminar de los Módulos a trabajar en los talleres
para Capacitadores.
Por lo mismo solicitamos su colaboración en la marcación y sugerencias
acerca de las dificultades en la comprensión de los conceptos.
Cualquier comentario por favor indicarlo en el siguiente espacio:
Organización Panamericana de la Salud 88
Curso de Epidemiología Básica y Vigilancia de la Salud
89