Encuestas transversales
AUTORES
Bernardo Hernández, [Link].,(1) Eduardo Velasco-Mondragón, M. en C.(1)
(1) Dirección de Epidemiología, Centro de Investigación en Salud Poblacional, Instituto Nacional de Salud
Pública. Cuernavaca, Morelos, México.
ABSTRACT
Solicitud de sobretiros: Dr. Bernardo Hernández. Dirección de Epidemiología, Centro de Investigación en Salud Poblacional, Instituto Nacional
de Salud Pública. Avenida Universidad 655, colonia Santa María Ahuacatitlán, 62508 Cuernavaca, Morelos, México. Correo
electrónico: bhernand@[Link]
Introducción
La encuesta transversal es un diseño de investigación epidemiológica de uso frecuente. Se trata de estudios
observacionales, también llamados encuestas de prevalencia.1-4 El diseño de una encuesta transversal debe
considerar aspectos relacionados con la población que se estudiará, los sujetos de quienes se obtendrá
información y la información que se busca captar.
En epidemiología las encuestas transversales se dirigen primordialmente al estudio de la frecuencia y
distribución de eventos de salud y enfermedad (estudios descriptivos), aunque también se utilizan para
explorar y generar hipótesis de investigación (estudios analíticos). En el primer caso, las encuestas tienen
como fin medir una o más características o enfermedades (variables) en un momento dado de tiempo; por
ejemplo: el número de enfermos con diabetes en la población en un momento dado; el número de
integrantes de las familias en un periodo de tiempo determinado; el promedio de edad de hombres y mujeres
que utilizaron o no utilizaron servicios de salud por trimestres del año; el nivel de satisfacción de pacientes
atendidos por médicos familiares el mes previo, o la intención en hombres y mujeres de cesar de fumar en
los meses siguientes.
Las encuestas transversales son de gran utilidad por su capacidad para generar hipótesis de investigación,
estimar la prevalencia de algunos padecimientos (esto es, la proporción de individuos que padece alguna
enfermedad en una población en un momento determinado), así como identificar posibles factores de riesgo
para algunas enfermedades.
Cuando el fin es explorar hipótesis de investigación, la característica distintiva de este tipo de estudios es que
la variable de resultado (enfermedad o condición de salud) y las variables de exposición (características de los
sujetos) se miden en un mismo momento o periodo definido. Como ejemplos se tiene el análisis de: la
relación entre alcoholismo (exposición) y violencia intrafamiliar (evento); la relación entre actividad física
(exposición) y obesidad (evento), y la relación entre estado marital (exposición) y mortalidad (evento).
A diferencia de otros diseños epidemiológicos, como los estudios de cohorte, en los cuales se realiza un
seguimiento de sujetos expuestos y la ocurrencia de eventos nuevos por un periodo determinado de tiempo,
en las encuestas transversales se obtiene únicamente una medición de las exposiciones y eventos en los
sujetos de estudio en un momento dado. Debido a esto, no es posible determinar si el supuesto factor de
exposición precedió al aparente efecto y establecer causalidad entre exposición y efecto, salvo en el caso de
exposiciones que no cambian con el tiempo. Su limitación para establecer causalidad se compensa por su
flexibilidad para explorar asociaciones entre múltiples exposiciones y múltiples efectos.
Las encuestas transversales son utilizadas para estudiar enfermedades de larga duración o cuyas
manifestaciones se desarrollan lentamente, como es el caso de enfermedades crónicas, problemas de
desnutrición o mala nutrición por exceso, etcétera. Estas encuestas no son adecuadas para el estudio de
enfermedades (o exposiciones) que se presentan con poca frecuencia en una población (enfermedades raras
o con baja prevalencia) o que son de corta duración, debido a que sólo captarían información sobre un
número reducido de individuos que las padezcan. A pesar de sus limitaciones, los estudios transversales son
comunes y útiles, ya que su costo es relativamente inferior al de otros diseños epidemiológicos, como los
estudios de cohorte, y proporcionan información importante para la planificación y administración de los
servicios de salud.
En el presente artículo se discuten algunos aspectos relevantes para el diseño, conducción, análisis,
interpretación y aplicaciones de las encuestas transversales, así como sus ventajas y limitaciones.
Población y muestra
En las encuestas transversales se obtiene información sobre una población definida para fines del estudio. A
diferencia de otros diseños, como los estudios de casos y controles, en las encuestas transversales se
recolectan datos de los sujetos sin estratificarlos a priori de acuerdo con la presencia o ausencia de la variable
de resultado que se desee estudiar.
Se define como población base del estudio aquella a la que el estudio hace referencia5 En muchas ocasiones
una encuesta transversal no obtiene información de todos los sujetos que integran la población bajo estudio,
sino sobre un grupo de ellos llamado muestra.
Al realizar una encuesta transversal es necesario definir la unidad de observación del estudio, esto es, la
unidad básica sobre la cual se captará información, como, por ejemplo, los individuos, familias, hogares o
escuelas.
El proceso de selección de informantes es muy importante en estos estudios. La muestra seleccionada debe
reflejar las características de la población base que se busca estudiar; por ejemplo, para obtener la media de
edad o la distribución de edades de la población general se deberá incluir sujetos de todas las edades. En
ocasiones el investigador puede estar interesado en estudiar características de algún subgrupo específico de
su población y, por lo mismo, puede aumentar la proporción de sujetos en la muestra que pertenecen a ese
subgrupo.
Existen diversos métodos de selección de sujetos para participar en el estudio llamados métodos de
muestreo. Algunos métodos de uso frecuente son el muestreo por conveniencia y formas de muestreo
probabilístico (aleatorio simple, estratificado, sistemático y por conglomerados). Los métodos de muestreo se
presentan en otro artículo de esta serie, por lo que solamente se destacan los sesgos potenciales de las
encuestas transversales.
Las encuestas transversales suelen sobrerrepresentar a los casos con larga duración de la enfermedad y a
subrepresentar aquéllos de corta duración (muestreo con sesgo de duración). Por ejemplo, en el caso de una
enfermedad de duración muy variable, una persona que contrae una enfermedad que dura desde los 20 a los
70 años tiene una gran posibilidad de ser incluida durante los 50 años de duración de la enfermedad; en
cambio, una persona que contrae la enfermedad a los 40 años y que muere al día siguiente, difícilmente será
incluida en el grupo prevalente.
En cuanto a la exposición, se debe considerar si ésta cambia con el tiempo (por ejemplo, en un periodo de
tiempo una persona puede dejar de fumar o fumar más) o no cambia (por ejemplo, el grupo sanguíneo, el
sexo).3 Además, si la exposición produce enfermedad leve y de larga duración –aun cuando no produzca
riesgo de enfermar la frecuencia de exposición será elevada en los casos y, por lo tanto, de aparente mayor
riesgo. En cambio, si la exposición produce una alta letalidad de la enfermedad, entonces la frecuencia de
exposición será muy baja entre los casos y la asociación exposición enfermedad puede resultar negativa, aun
cuando en realidad la exposición no resulte en menor riesgo de enfermar.
A los sesgos inherentes de los estudios transversales se agregan otros: si el modo de selección de los sujetos
de estudio (participación voluntaria) está relacionado con menor o mayor exposición, o con menor o mayor
enfermedad en comparación con la población base, entonces los resultados que obtengamos no serán válidos.
A esto se le conoce como sesgo de selección.6 Una de las estrategias para tratar de evitar este sesgo es
realizar un muestreo probabilístico o aleatorio en el que todos los individuos que conforman la población bajo
estudio tengan la misma probabilidad de ser incluidos en el estudio, o que se conozca la probabilidad que
tiene cada sujeto de la población de ser incluido en la muestra.
Otros sesgos son el sesgo de cortesía (la persona trata de complacer al entrevistador dándole la respuesta
que cree será aprobada); el sesgo de vigilancia (la enfermedad o evento se confirma mejor en la población de
estudio que en la población general), y el sesgo de información (debido a datos poco verídicos o incompletos
o a la no participación o no respuesta de los individuos seleccionados como población de estudio, lo cual se
puede relacionar con características de interés que hagan que la población participante sea diferente a la no
participante.) Esto afectará las estimaciones de prevalencias o de asociaciones entre exposiciones y efectos y
afectará la validez del estudio. Con el fin de analizar y corregir el efecto de dicha falta de participación es
necesario conocer las razones de no participación o no respuesta y las características de los sujetos no
participantes, para saber si se trata de valores perdidos al azar o de manera sistemática y cómo esto afecta
las mediciones.7 La comparación entre los estimadores obtenidos con y sin datos de estos sujetos nos
permitirá estimar la magnitud del sesgo. La inclusión de los sujetos no participantes permite obtener el
estimador más conservador, o sea, el peor escenario, sesgado contra la prevalencia o hipótesis de interés.
Cuando se hacen preguntas sobre exposiciones o eventos pasados, las personas que han sufrido una
experiencia traumática (enfermedad, aborto, accidente) pueden recordar las exposiciones más que los que no
tuvieron dicha experiencia, produciendo el llamado sesgo de memoria.
La ausencia de sesgos en la selección de los sujetos de estudio y en la medición de variables en la población
de estudio constituye su validez interna; esto es, los resultados obtenidos son ciertos para la población o
muestra estudiada. Si la muestra es representativa de la población base, esto aumentará la validez externa
del estudio; esto es, la posibilidad de inferir dichos resultados a la población base de la cual se obtuvo la
muestra, así como a poblaciones similares.
Generalmente, en las encuestas transversales el tamaño de muestra se calcula de tal forma que permita
estimar, con un determinado poder y nivel de confianza, la prevalencia de alguna enfermedad, alguna
característica de la población, o bien, la diferencia en nuestra variable de resultado de acuerdo con la variable
de exposición. Un tamaño de muestra pequeño no permitirá que el estudio tenga el poder suficiente para
encontrar asociaciones significativas entre las variables de exposición y resultado, y un tamaño excesivo
ocasionará dispendio de recursos y tiempo. Las características (exposiciones y efectos), el nivel de confianza
estadística y el poder del estudio se deberán establecer al inicio del mismo. El cálculo de nivel de confianza y
poder de un estudio obtenidos a posteriori en una muestra no son válidos. 8,9
Definición de variables en estudios transversales
Es importante definir, antes de iniciar el estudio, las variables de estudio, de resultado, de exposición y
potenciales variables confusoras o modificadores de efecto que se desea estudiar de manera teórica y
operacional. La definición operacional consiste en determinar la forma en que se medirá una variable. Esta,
junto con los indicadores e instrumentos que se utilizarán, definirá el tipo de análisis de dichas variables.
Conducción de encuestas transversales
Las encuestas transversales, si bien son logísticamente más sencillas que los estudios que implican un
seguimiento de sujetos, tienen dificultades importantes por los tamaños de muestra que pueden alcanzar.
Una vez diseñado el estudio, definidas la población y muestra, así como las variables que se investigarán es
necesario definir los instrumentos que se emplearán para recolectar la información. Las encuestas
transversales con frecuencia utilizan cuestionarios que pueden ser aplicados a los informantes por un(a)
entrevistador(a), o bien empleando cuestionarios autoadministrados; en otras ocasiones se tomarán muestras
biológicas (sangre, orina, saliva) o mediciones antropométricas (peso, talla, pliegues cutáneos).
En el caso de la utilización de cuestionarios es necesario definir al informante ideal para proporcionar la
información necesaria para el estudio. En general, la persona que responde debe ser capaz de entender el
vocabulario utilizado para hacer la pregunta. Los datos de ingreso económico familiar los deberá proporcionar
el jefe o jefa de familia. Asimismo, es necesario definir si los cuestionarios serán administrados por una
entrevistadora o entrevistador (ya sea en una entrevista cara a cara o por vía telefónica), o si los
cuestionarios serán contestados por escrito por los informantes, ya sea en presencia de personal del proyecto
o bien por medios como el envío de cuestionarios por correo. Ante el avance de los recursos computacionales,
también es posible que la información de la entrevista se capte en medios electrónicos al momento de la
entrevista. Esta decisión dependerá de las características de los informantes y de la naturaleza de la
información a recolectar. Las preguntas sobre conducta sexual, toxicomanías y otras sobre la vida privada de
las personas suelen producir respuestas incompletas o evasivas por parte de los sujetos de estudio, por lo
que se deberán probar de antemano y hacerse con particular cuidado.
Es necesario cuidar la integración de los instrumentos de recolección de información. Los cuestionarios deben
estar adaptados a la forma en que serán administrados y a la población bajo estudio. Los cuestionarios deben
tener un formato que permita su aplicación y posteriormente, su fácil codificación (transcripción de
respuestas a códigos numéricos) y captura de información en medios electrónicos. Se debe evaluar la
confiabilidad y validez de un cuestionario antes de su utilización en un estudio transversal. La confiabilidad se
refiere a la capacidad de un instrumento para dar resultados similares en distintos momentos en el tiempo. La
validez es la capacidad de un instrumento para medir la variable que realmente desea medir.10 La
confiabilidad y validez de las distintas secciones de un cuestionario pueden ser evaluadas en un estudio
específico (piloto) con una muestra menor de sujetos.
Al integrar un cuestionario no es necesario que todas las preguntas que contiene sean creadas
específicamente para él. Es posible integrar en un cuestionario preguntas o escalas que ya han sido utilizadas
y validadas con esa población o con poblaciones similares. El uso de instrumentos de medición similares y
estandarizados permitirá comparar los resultados del estudio con los de otros estudios. En todos los casos es
necesario llevar a cabo una prueba piloto de los instrumentos de recolección de información. Esta prueba,
llevada a cabo con una submuestra de la población bajo estudio, permitirá corregir errores y problemas en el
cuestionario y su procedimiento de aplicación.
Asimismo, si en dicha submuestra es posible obtener y verificar las respuestas correctas al cuestionario o
instrumento de medición, se podrá estimar el sesgo entre las respuestas del cuestionario inicial (cuestionario
a evaluar) y las del cuestionario validado (estándar de oro).11
El trabajo de campo es una etapa crucial del estudio. Es en ese momento cuando la información que se
empleará en los análisis será recolectada, y los errores u omisiones en esta etapa serán difíciles de corregir.
Por esta razón, es importante llevar a cabo un riguroso entrenamiento y supervisión del personal de campo.
Habitualmente, el equipo de trabajo en campo se integra por supervisores(as) que revisan y coordinan la
recolección de información, y encuestadores(as) que propiamente recogen la información (sea administrando
cuestionarios, tomando muestras biológicas o antropométricas, etc.). El personal de campo debe tener un
conocimiento general del proyecto que le permita recolectar la información necesaria, pero cuidando que no
les lleve a sesgar la información que se recolectará. El entrevistador o recolector de datos también puede ser
fuente de sesgo, cuando un mismo entrevistador obtiene mediciones diferentes de la característica o atributo
de interés (variabilidad intraobservador), y cuando una misma medición se obtiene de manera diferente entre
un observador y otro (variabilidad entre observadores).12
El personal de campo debe conocer a fondo los instrumentos de recolección de información, el equipo a
utilizar para la obtención de muestras, y debe estar estandarizado en la toma de las muestras a recolectar en
el estudio. Del mismo modo, debe conocer el esquema de muestreo a utilizar y los procedimientos a seguir
cuando un informante no se encuentre, cuando una entrevista no se pueda realizar, etcétera.
Una vez recolectada la información ésta debe ser cuidadosamente revisada por los supervisores de campo y
por personal de verificación. En caso de detectar omisiones o anomalías se aconseja regresar con la persona
entrevistada para completar o corregir la información, la cual, una vez verificada, debe ser codificada para
permitir su captura en medios electrónicos y, posteriormente, su análisis. El sesgo del observador o el llenado
fraudulento de datos se pueden evaluar mediante la identificación de repetición de ciertos dígitos en una
variable registrada por un observador en comparación con los demás observadores. La distribución de
respuestas a dicha variable deberá ser similar a la obtenida por los otros observadores.
Para minimizar errores en el proceso de captura de información es necesario emplear programas de captura
validada, en los cuales la información es capturada dos veces para identificar discrepancias. Dos tipos de
verificación son comunes: la verificación por rangos (no debe haber valores no plausibles o fuera de límite de
los valores posibles de esa variable) y la contingencial o lógica (no debe haber valores incoherentes, por
ejemplo, sexo masculino y número de abortos, o profesionistas analfabetas). Actualmente es posible llevarlas
a cabo en los programas computacionales de bases de datos relacionales (DBase, Paradox, Fox-Pro) y en
algunos paquetes estadísticos que contienen rutinas para la elaboración de programas de captura validada de
fácil utilización (Epilnfo, CDC, Atlanta). El uso de tecnologías como lectores ópticos puede agilizar el proceso
de captura, aunque requiere de equipo y formatos de captura de información específicos.
El diseño, métodos y procedimientos del estudio deberán estar debidamente documentados, de tal manera
que exista información disponible en caso de necesidad de replicar y comparar el estudio.
Análisis de encuestas transversales
El análisis de datos de una encuesta transversal depende de los objetivos de la misma y de la escala de
medición de las variables de estudio. Si el fin es caracterizar o describir a la población, se miden las variables
una vez y se presentan los valores de cada una de ellas o por grupos.
El análisis de información de encuestas transversales suele iniciar con la obtención de estadísticas
descriptivas de variables de interés (figura 1). Este análisis permitirá conocer las características generales de
la población bajo estudio y estimar prevalencias de las exposiciones y variables de resultado. Por ejemplo,
una encuesta permitirá conocer la frecuencia y distribución de edades, escolaridad, ingreso económico,
género, uso de servicios de salud, motivos de consulta médica, tabaquismo, cefalea, opinión sobre el estado
de salud, etcétera. Para datos categóricos (presencia o ausencia de enfermedad, número de hijos, nivel
socioeconómico bajo, medio, alto, etc.) la descripción se hace por medio de distribución de frecuencias
(número de sujetos u observaciones dentro de cada categoría de la variable), frecuencias relativas
(distribución porcentual de las observaciones dentro de las categorías de la variable) y proporciones. La
prevalencia de una enfermedad se obtiene dividiendo el número de casos encontrados durante el periodo de
estudio entre el total de la población en riesgo de presentar el evento de estudio.
Si se quiere estimar la prevalencia de una enfermedad, por ejemplo, de diabetes, los datos se presentan
como proporción (número de diabéticos sobre el total de la población) por 100, 1 000, 10 000, etcétera. Si la
medición se realiza en un periodo corto de tiempo se le llama prevalencia puntual; si se mide en un periodo
mayor de tiempo se le llama prevalencia lápsica.
En el caso de variables continuas, como el peso y la talla de niños menores de cinco años, se presentan
medidas de tendencia central (media, mediana, moda) y de dispersión (rangos, desviación estándar, varianza,
percentiles). Este tipo de variables se puede categorizar en escalas de acuerdo con el interés de la
investigación, esto es, convertirse en variables ordinales (por ejemplo, bajo peso, normal y sobrepeso, o talla
baja, normal y alta).
En los estudios transversales analíticos se explora la relación o asociación entre variables de exposición y de
resultado. En el caso de variables dicotómicas, la clasificación se hace en cuatro grupos: enfermos expuestos,
enfermos no expuestos, sanos expuestos y sanos no expuestos (figura 2).
La asociación entre la ocurrencia de una enfermedad (variable de resultado) y algunos factores de riesgo
(variables independientes o de exposición) se hace a través del cálculo de medidas de asociación. La mejor
medida de riesgo de pasar del estado sano al de enfermo en una población es la tasa de incidencia (cuyo
numerador es el número de casos nuevos de enfermedad y el denominador es el tiempo persona en riesgo);
la razón de tasas (tasa de incidencia en expuestos entre la tasa de incidencia en no expuestos) indica el
exceso de riesgo de enfermedad entre expuestos y no expuestos. A falta de este estimador ideal, se puede
obtener la incidencia acumulada (número de casos nuevos de enfermedad, entre la población de riesgo al
inicio del estudio) y la razón de riesgos o riesgo relativo (incidencia acumulada en expuestos entre incidencia
acumulada en no expuestos). En los estudios transversales, como sólo se tiene la prevalencia (casos ya
existentes y casos nuevos, con distintos periodos de duración de enfermedad, entre la población de estudio),
las medidas de asociación que se pueden obtener son la razón de prevalencias (RP) y la razón de momios de
prevalencia (RM).13
Para la interpretación de estas medidas de asociación es necesario considerar la relación entre prevalencia,
incidencia y duración de la enfermedad, la cual se expresa como:
donde:
a+c= número de enfermos en la población
a+c/a+b+c+d= prevalencia de enfermedad en la población a/a+b= prevalencia de enfermedad en los
expuestos c/c+d= prevalencia de enfermedad en los no expuestos (a/a+b)/ (c/c+d)= razón de prevalencias
de enfermedad.
Un valor de uno se interpreta como igual prevalencia de enfermedad entre expuestos y no expuestos. Un
valor mayor de uno significa que la prevalencia es mayor en los expuestos que en los no expuestos. Un valor
menor a uno significa que la prevalencia es menor en los no expuestos que en los expuestos. La dependencia
de la prevalencia respecto a la duración de la enfermedad antes mencionada, hace que estas medidas se
aproximen a la razón de riesgos sólo bajo ciertas condiciones. La razón de prevalencias se aproxima o es
buen estimador de la razón de riesgos o riesgo relativo (RR) cuando la duración de la enfermedad es igual
entre expuestos y no expuestos y cuando no hay migración hacia dentro o fuera de estos grupos.
Así, la razón de prevalencias puede ser un buen estimador del riesgo relativo en función de la razón de
duración de la enfermedad en expuestos y no expuestos y de la razón de los complementos de la prevalencia
en expuestos y no expuestos.
Alternativamente, se puede calcular la razón de momios de prevalencia de enfermedad, con la fórmula:
(a/b)/(c/d), o con la razón de productos cruzados (a*d)/(b*c)
La razón de momios de prevalencia también se relaciona con la incidencia y duración de la enfermedad, ya
que:
Su valor es aproximado al de la razón de prevalencias (y razón de riesgos) cuando la prevalencia de la
enfermedad es baja (menor que 5 a 10%) (los momios [a/b o c/d] son casi iguales a las proporciones [a/a+b
o c/c+d] cuando éstas son pequeñas, como en el caso de una prevalencia menor a 0.1) y su interpretación es
similar; un valor de uno se interpreta como momios iguales o igual posibilidad de enfermar entre expuestos y
no expuestos. Un valor mayor de uno significa que la posibilidad de enfermar es mayor en los expuestos que
en los no expuestos. Un valor menor a uno significa que la posibilidad de enfermar es menor en los no
expuestos que en los expuestos.
Para la interpretación de estas razones deben considerarse los sesgos inherentes a las encuestas
transversales.
Cabe mencionar que, a pesar de la similitud en el análisis estadístico de los estudios transversales y de los de
casos y controles, estos diseños difieren en cuanto a interpretación de medidas, sesgos y aproximación a la
causalidad. Por ejemplo, un estudio transversal sobre el tabaquismo como factor etiológico de cáncer
pulmonar comparando enfermos con no enfermos, equivaldría a un estudio de casos y controles con un grupo
control excesivo (habría pocos casos de cáncer pulmonar en la población), con información sobre tabaquismo
en un periodo inapropiado (la historia previa de tabaquismo sería más apropiada que el hábito tabáquico
actual) y con verificación de casos sesgada (se captarían más casos de larga duración que de corta
duración).3
La significancia estadística de la asociación entre las variables se hace a través del cálculo de intervalos de
confianza y prueba de hipótesis de no asociación (RP o RM= 1). El lector interesado puede encontrar
información complementaria en un artículo de revisión sobre estudios transversales, publicado en 1998, por
García de la Torre y colaboradores.14
Debido a que frecuentemente la selección de sujetos se obtiene de la población general, el control de
variables confusoras suele hacerse en el análisis de los datos (y no por diseño). Para ajustar el efecto de otras
variables confusoras (definidas como variables asociadas con la variable de resultado y de exposición, que no
se encuentran en la cadena causal entre éstas),15 es posible realizar análisis estratificado o emplear técnicas
de análisis multivariado–egresión lineal múltiple, regresión logística– (figura 1). En el caso de análisis
estratificado, el ajuste por variables confusoras se hace con el método de Mantel-Haenszel.9
La razón de momios de prevalencia ajustada se interpreta de manera similar a la razón de momios cruda,
pero se le refiere como ajustada por o controlando el efecto de una tercera o más variables.
En el caso de variables de resultado continuas y variables de exposición categóricas podrá hacerse una
comparación de medias con pruebas como la de t de Student o con análisis de varianza (Andeva). También es
posible analizar con métodos estadísticos no para-métricos, algunos de los cuales se incluyen en la figura 1,
aunque no serán descritos en este trabajo.
En el caso de variables continuas de resultado y de exposición, la relación lineal entre dos variables continuas
puede llevarse a cabo con la estimación de la correlación de Pearson, o bien, mediante análisis de regresión
lineal simple. Este último método permite establecer una relación lineal entre variables de exposición
(predictora, independiente xi) y una de resultado (efecto, dependiente y); así, y= a + b,xi , donde a y b son
las constantes estimadas a partir de los datos.16
Para el ajuste de variables confusoras o para evaluar modificación del efecto o interacción es posible también
emplear técnicas de análisis multivariado, ya sea usando regresión lineal múltiple (para variables de
exposición categóricas y continuas y variables de resultado continuas) o regresión logística (para variables de
resultado dicotómicas) y multinomial (para variables ordinales y nominales con más de dos categorías). Es
importante mencionar que la construcción de modelos multivariados –la selección de variables a incluir en el
modelo– para el análisis de encuestas transversales se debe guiar por la teoría, por el tipo de muestreo y por
análisis cuidadosos de bondad de ajuste y del efecto de cada variable en el modelo. Por esta razón, los
métodos de regresión gradual (stepwise) anterógrada o retrógrada, los cuales se basan únicamente en el
incremento del valor explicativo del modelo, deben utilizarse con sumo cuidado.
La regresión logística permite obtener razones de momios crudas y ajustadas por potenciales confusores.
Para estos estimadores crudos y ajustados es posible hacer pruebas de hipótesis para evaluar si son iguales al
valor nulo (1), calcular intervalos de confianza, así como realizar pruebas de bondad de ajuste.16
El valor p convencionalmente aceptado para rechazar una hipótesis nula es alfa= 0.05 o menor y su
interpretación (frecuentista) es de que, si hiciéramos 100 estudios similares, se obtendrían por azar los
mismos resultados o resultados más extremos en cinco estudios, por lo que la probabilidad de que éstos se
deban al azar sería muy baja. Se debe considerar que el valor de p es función del estimador a obtener y del
tamaño de muestra. Con un valor de confianza generalmente de 95%, los intervalos de confianza (IC) nos
dan valores mínimos y máximos del estimador obtenido (prevalencia, razón de prevalencias, razón de
momios, diferencia de medias, correlación de Pearson, coeficiente beta de la regresión lineal); se interpretan
como un 95% de confianza de obtener cuando menos el límite inferior del estimador, hasta un límite máximo
del mismo. Si el intervalo no incluye el valor nulo del estimador dado, existe asociación estadística y el
valor p será significativo a un alfa de 0.05. La amplitud del intervalo es función del tamaño muestral. La
información que proporciona el valor p y los intervalos de confianza es complementaria, aunque el valor límite
de 0.05 para p es arbitrario y el IC más informativo; una p mayor a 0.05 en presencia de un intervalo de
confianza para una razón de momios de 0.7 a 20 significa que aunque no tenemos estadísticamente
significativa, la razón de momios podría ser hasta de 20 si se tuviera un tamaño de muestra mayor.
Las pruebas de bondad de ajuste evalúan la capacidad probabilística del método estadístico para ajustar o
explicar la relación y variabilidad entre las variables incluidas en el modelo explicativo de exposición y
efectos. Su significancia estadística se evalúa con valores de p.
En ocasiones, una muestra no refleja la composición de la población de la cual fue extraída directamente.
Algunos grupos pueden estar sub o sobrerrepresentados. Una alternativa es emplear ponderadores, o valores
que hacen variar el peso de cada observación en la muestra para que tenga una composición similar a la de la
población base. En estos casos, es indispensable tomar en cuenta los ponderadores antes de proceder a
cualquier análisis de la muestra. Otro problema relacionado con la no representatividad de la muestra es el
conocido como falacia de Berkson (cuadro I).
En el ejemplo mostrado en el cuadro I es notorio que una mayor proporción de pacientes obesos con
cardiopatía coronaria (CC) y de no obesos con CC, participó en el estudio. Esta falta de representatividad de
la muestra produjo una asociación espuria entre la obesidad y la CC, derivada de una selección inadecuada de
los sujetos de estudio. La selección aleatoria hubiera tendido a obtener proporciones de sujetos participantes
en el estudio en cada celda similares a las de la población base, lo cual habría evitado este problema.
Frecuentemente, en las encuestas transversales se exploran múltiples exposiciones y variables, muchas veces
no consideradas a priori; esto implica el análisis de múltiples subgrupos. En las bases de datos de encuestas
transversales frecuentemente se analizan diversas hipótesis que no fueron establecidas al inicio del estudio.
Con cada nueva hipótesis que se analiza aumenta la probabilidad de encontrar asociaciones estadísticamente
significativas por azar. Existen métodos (por ejemplo el de Bonferroni)9 para tratar de corregir dicho
problema, sin embargo, la naturaleza de los estudios transversales de por sí se limita a la exploración y
generación de hipótesis.
El análisis de subgrupos dentro de un estudio transversal puede reducir mucho el número de individuos
analizados, con la consiguiente pérdida de poder, sobre todo si se recuerda que la muestra se obtiene con
base en una hipótesis en el grupo total. Su correcta interpretación deberá ser en el sentido de falta de
significancia estadística al nivel convencional por falta de poder, y no de ausencia de efecto o de asociación,
además de la consideración de sesgos.
En encuestas con grandes muestras (como las encuestas nacionales donde se obtienen datos sobre miles de
sujetos) es fácil encontrar asociaciones estadísticamente significativas; sin embargo, se deberá considerar la
significancia conceptual (etiológica) de efectos pequeños, aunque estadísticamente significativos, y de efectos
grandes, estadísticamente no significativos.
Tipos de encuestas transversales
Existen diversos tipos de encuestas transversales de salud. En México se han llevado a cabo diversos tipos de
éstas, como las encuestas nacionales de salud,17 las de seroprevalencia,18 de adicciones,19 de nutrición y de
enfermedades crónicas.20
Consideraciones éticas y de bioseguridad
El participante en una encuesta deberá estar enterado y de acuerdo con el uso que se le dará a la información
que proporcione. Se deberá garantizar la seguridad, confidencialidad y de ser posible el anonimato de la
persona que proporciona los datos. Se debe evitar el uso de datos para fines diferentes a los que autorizó el
sujeto de estudio. Las muestras biológicas de sangre, material genético, tejidos y otras, deberán ser
utilizadas exclusivamente para los fines autorizados por el sujeto de estudio y los residuos biológicos se
deben manejar de manera adecuada con apego a las normas establecidas para ello. El uso de este material
con objetivos de investigación distintos a los autorizados, aun años después de almacenamiento, requiere del
consentimiento del donador y algunos comités de ética ni siquiera permiten solicitar nuevamente autorización
al sujeto de estudio para usar sus datos con otros fines de investigación.
Por último, es responsabilidad del investigador asegurarse de la calidad de los datos, tanto de aquéllos
obtenidos a través de entrevistas o cuestionarios como de los correspondientes a mediciones de laboratorio,
por medio de sistemas de control de calidad. Una vez recolectados los datos, su manejo, análisis e
interpretación se deben realizar de acuerdo con el protocolo de estudio y se deberá evitar la manipulación de
los mismos hasta obtener resultados "interesantes" o convenientes.
Conclusiones
Las encuestas transversales son un diseño de investigación ampliamente utilizado. Entre sus ventajas
podemos mencionar su bajo costo y rapidez, ya que no requieren del seguimiento de los sujetos de estudio.
Este diseño permite explorar múltiples exposiciones y efectos, generar hipótesis y datos útiles para la
planeación y gerencia de los servicios de salud, así como realizar mediciones de carga de la enfermedad. No
obstante, este diseño también tiene algunas limitaciones como son la imposibilidad de establecer causalidad,
la falta de temporalidad de la asociación exposición-efecto (salvo en algunos casos donde por razones
teóricas es obvio que la exposición antecede a la variable de resultado), la dificultad para establecer valores
basales para su comparación entre poblaciones y periodos de tiempo y su limitada utilidad para estudiar
enfermedades de corta duración o poco frecuentes.
Bibliografía
1. Gordis L. Epidemiology. Filadelfia:WB Saunders Co., 1996.
2. Hennekens CH, Buring JE. Epidemiology in medicine. Boston: Little, Brown and Co., 1987.
3. Rothman KJ, Greenland S. Modern epidemiology. 2a. edición: Lippincott-Raven, 1998.
4. Dos Santos-Silva I. Estudios transversales. En: Dos Santos-Silva I. Epidemiología del cáncer: principios y
métodos. Lyon, (Francia): Agencia Internacional de Investigación sobre el Cáncer/Organización Mundial de la
Salud, 1999:225-244.
5. Walker AM. Observation and inference: An introduction to the methods of epidemiology. Boston (MA):
Epidemiology Resources, Inc., 1991.
6. Gordis L. Epidemiology. Filadelfia:WB Saunders Co., 1996.
7. Campbell D, Stanley J. Diseños experimentales y cuasi-experimentales en la investigación social. Buenos
Aires:Amorrortu, 1982.
8. Altman D. Practical statistics for medical research. Londres (UK): Chapman & Hall Ed., 1997.
9. Pagano M, Gauvreau K. Principles of biostatistics. Wadsworth, Belmont (CA): Duxbury Press, 1993.
10. Babbie E. The practice of social research. 3a. edición. Belmont (CA): Wadsworth, Inc., 1983.
11. Aday L. Designing and conducting health surveys: A comprehensive guide. San Francisco: Jossey Bass,
1989.
12. Fowler FJ. Survey research methods. Applied social research methods series. 2a. edición. Londres: Sage
Publications, 1993;vol. I.
13. Kelsey JL, Whittemore AS, Evans AS, Thompson WD. Methods in observational epidemiology. Monographs
in epidemiology and biostatistics. Nueva York: Oxford University Press, 1996.
14. García de la Torre GS, Huerta-Alvarado SG. Consideraciones metodológicas y análisis simple de los
estudios transversales. Bol Med Hosp Infant Mex 1998;55:348-356.
15. Lilienfeld DE, Stolley PD. Foundations of epidemiology. 3a. edición. Nueva York: Oxford University Press,
1994.
16. Selvin S. Statistical analysis of epidemiologic data. 2a. edición. Nueva York: Oxord University Press, 1996.
17. Instituto Nacional de Salud Pública, Centro de Investigaciones en Salud Pública. Encuesta Nacional De
Salud 11, 1994. Salud Publica Mex 1994;36:562.
18. Tapia-Conyer R, Gutiérrez G, Sepúlveda J. Metodología de la Encuesta Nacional de Salud. Salud Publica
Mex 1992;34:124-135.
19. Tapia-Conyer R, Cravioto P, Borges-Yáñez A, De la Rosa B. Consumo de drogas médicas en población de
60 a 65 años en México. Encuesta Nacional de Adicciones 1993. Salud Publica Mex 1996;38:458-465.
20. Guerrero-Romero JF, Rodríguez-Morán M. Prevalencia de hipertensión arterial y factores asociados en la
población rural marginada. Salud Publica Mex 1998;40:339-346.