0% encontró este documento útil (0 votos)
28 vistas100 páginas

Módulo 4b

El documento aborda la precisión y validez de los estudios epidemiológicos, centrándose en la identificación y control de sesgos, confusión y modificación de efecto. Se describen diferentes tipos de errores, tanto aleatorios como sistemáticos, y se enfatiza la importancia de la validez interna y externa en la investigación. Además, se discuten los efectos de los sesgos en la estimación de medidas epidemiológicas y la necesidad de un diseño cuidadoso para prevenirlos.

Cargado por

angelaaledoruiz
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
28 vistas100 páginas

Módulo 4b

El documento aborda la precisión y validez de los estudios epidemiológicos, centrándose en la identificación y control de sesgos, confusión y modificación de efecto. Se describen diferentes tipos de errores, tanto aleatorios como sistemáticos, y se enfatiza la importancia de la validez interna y externa en la investigación. Además, se discuten los efectos de los sesgos en la estimación de medidas epidemiológicas y la necesidad de un diseño cuidadoso para prevenirlos.

Cargado por

angelaaledoruiz
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Módulo 4b

Precisión y validez de los resultados


de los estudios epidemiológicos

Sesgos. Confusión. Modificación


de efecto.

Ignacio Párraga Martínez


[email protected]
OBJETIVOS
1. Adquirir una capacidad crítica sobre los estudios epidemiológicos a
fin de detectar los sesgos que puedan existir y poder prevenirlos o
controlarlos.

2. Adquirir la capacidad para identificar y diferenciar los fenómenos


de confusión y modificación de efecto en un estudio epidemiológico
y las posibilidades para su prevención y control.

3. Adquirir los elementos de juicio y rigor metodológicos necesarios


para valorar el nivel científico de los estudios publicados en la
literatura médica.
CONTENIDOS (1)
Precisión y validez de un estudio. Validez interna y validez externa.
 Tipos de error: aleatorio y sistemático

Sesgos. Concepto.
1. Sesgo de selección. Concepto. Dirección.
 Tipos:
1. Sesgo del trabajador sano.
2. Sesgo de Berkson.
3. Sesgo de sospecha diagnóstica o de detección.
4. Sesgo del voluntario
5. Sesgo de prevalencia o de Neyman.
6. Sesgo de inclusión/exclusión.
7. Sesgo por pérdida de seguimiento.
8. Sesgo por valores ausentes
2. Sesgo de clasificación o de información. Concepto.
 Tipos
1. Sesgo de clasificación errónea no diferencial.
2. Sesgo de clasificación errónea diferencial.
3. Sesgo de adelanto diagnóstico.
4. Sesgo de migración de estadios.
5. Sesgo de inaceptabilidad. Sesgo de obsequiosidad.
6. Sesgo de atención (Hawthorne).
7. Sesgo de memoria.
8. Sesgo del observador.
CONTENIDOS (2)
3. otros sesgos:
 Falacia ecológica.
 Regresión a la media.
 Sesgo de adelanto diagnóstico.
 Sesgo de duración de la enfermedad
 Sesgo de sobrediagnóstico

 Sesgo de confusión. Concepto.


 Condiciones para que una variable sea confundidora
 Dirección del sesgo de confusión.
 Identificación de la presencia o ausencia de confusión.
 Prevención y control del sesgo de confusión.

 Modificación del efecto o interacción. Concepto.


 Identificación de la interacción.
Precisión y validez de un estudio
 Los estudios epidemiológicos son ejercicios de
medición cuyo objetivo es estimar valores de
frecuencia de enfermedad o medidas de efecto de
una exposición sobre una enfermedad, por tanto
su objetivo fundamental será conseguir la
exactitud en esa medición, es decir, estimar el
valor del parámetro estudiado con el menor error
posible.
 A continuación explicaremos los dos tipos de
errores
Error aleatorio
 Produce una desviación del resultado
obtenido respecto del verdadero valor en un
determinado estudio, pero si el estudio se
repitiera un número infinito de veces con la
misma metodología y no hubiera sesgos, se
obtendría un valor medio igual al valor real.
Error aleatorio
 Se produce por el azar.
 El error aleatorio surge debido a que los estudios se basan en un
número limitado de observaciones.
 Disminuye al aumentar el tamaño del estudio.
 El error aleatorio no es constante en cada medición, ni ocurre
siempre en el mismo sentido.
 De forma aleatoria, se obtienen valores a veces mayores y a
veces menores que el valor real.
 No afecta a la validez del estudio.
Error sistemático
 Se produce consistentemente en cada medición y ocurre siempre
en el mismo sentido (se obtienen valores siempre mayores o
siempre menores que el valor real).
 Por tanto, el error sistemático también produce una desviación del
resultado obtenido respecto del verdadero valor en un determinado
estudio.
 Sin embargo, cuando hay un error sistemático si el estudio se
repitiera un número infinito de veces con la misma metodología, se
obtendría un valor medio distinto del valor real.
Error sistemático
 Se produce de forma sistemática.
 Por ello, el error sistemático, a diferencia del error aleatorio, no
depende del tamaño del estudio, con lo cual no se reduce
aumentando su tamaño. En presencia de error sistemático, el
aumento del tamaño del estudio únicamente conseguiría aumentar
la precisión de la estimación pero no su validez.
 Es decir, para un determinado nivel de seguridad, el aumento del
tamaño del estudio conseguiría disminuir el intervalo de confianza
(aumento de la precisión), pero el valor estimado estaría igual de
alejado del valor real (igual error sistemático).
 Afecta a la validez interna y/o externa.
Precisión y validez de un estudio
 La ausencia de error aleatorio o debido al
azar se denomina precisión o fiabilidad.
 La ausencia de error sistemático se
denomina validez.
Error aleatorio vs sistemático
Precisión y validez
 De modo esquemático se puede decir que la validez
depende exclusivamente del instrumento y tiene que ver
con la cuestión de si el mismo mide lo que debe medir,
mientras que la precisión depende tanto del
instrumento como del proceso de medición y tiene que
ver con cuánto se aproxima la medida al valor real de la
magnitud.
 En ambos casos es siempre cuestión de grado, no
existen instrumentos infinitamente precisos y válidos,
hay sólo instrumentos más precisos y/o válidos que
otros.
Ejemplo
 En un estudio de prevalencia de la hipertensión arterial en una zona
determinada se extrae una muestra A y se obtiene una prevalencia
del 20%. Si se extrajera en esa misma zona una muestra B se
podría obtener una prevalencia del 22%. Suponiendo que no hay
error sistemático, esta diferencia se debería al error aleatorio.
 Esta variabilidad disminuirá si el tamaño del estudio aumenta.
Ejemplo de Error aleatorio y sistemático

Estudio sobre un tamaño de población conocida de 20 sujetos. 10 hombres y 10 mujeres. Se pretende


saber la proporción de hombres.
Selección de 4 en 10 ocasiones y el azar hace que la proporción de hombres y mujeres sea variable
entre 50 y 75%. La media de las 10 veces es 52,5%. La diferencia de la proporción real es 52,5-
50=2,5% ese es el error aleatorio
Para sistemático se parte de la premisa de que hombre con pantalón y mujer no. Peros tres mujeres
visten pantalón, por tanto siempre error y la media de las 10 veces sería 65%, pues el error sistemático
es mantenido y es independiente del nº de veces que se repita. La diferencia con la media es mayor
65%-50=15%.
Diferencias entre error
aleatorio y sistemático
ERROR
ALEATORIO SISTEMÁTICO (SESGO)
Causa - Diseño, ejecución y análisis:
-Muestreo  Selección de los sujetos
del estudio
- Variabilidad del parámetro  Obtención de la
información
 Presencia de variables
externas distorsionadoras

Disminuye al Si No
aumentar el tamaño
del estudio
Afecta a Precisión Validez
Valoración Concepto estadístico unido Intervienen fundamentalmente
a elementos de juicio elementos de juicio informado
informado
Validez
 La validez o ausencia de error sistemático se divide en
dos componentes:
A. Validez interna. Validez de inferencia para las
propias personas del estudio.
B. Validez externa o generalización. Validez de
inferencia a personas que están fuera de la
población de estudio.
Validez
 Para poder valorar la validez externa es necesario
recurrir a criterios e información externos al propio
estudio.
 Para ello se utilizarán los criterios de causalidad
(consistencia, plausibilidad biológica, etc.). En última
instancia, la validez de una generalización es una
cuestión de juicio informado.
Ejemplo
 En el estudio de seguimiento de Doll y Hill (1964) sobre la
relación del consumo de tabaco y el cáncer de pulmón
realizado en los médicos británicos, los resultados obtenidos
tendrán validez externa o podrán ser generalizados si la
relación encontrada en los médicos británicos estudiados es
cierta en el conjunto de toda la población inglesa o de otros
lugares (población diana o general).
 Es decir, si el consumo de tabaco es un factor de riesgo del
cáncer de pulmón en cualquier grupo de personas que fumen.
Validez
 Es muy importante establecer claramente que en
ausencia de validez interna la validez externa de un
estudio carece de sentido.
 La validez interna es un prerrequisito para que
pueda darse la validez externa. Por tanto, lo
prioritario en un estudio epidemiológico es que
tenga validez interna, lógicamente, además también
será necesario tener en cuenta la validez externa.
Ejemplo
 En el estudio de seguimiento de Doll y Hill (1964) sobre
la relación del consumo de tabaco y el cáncer de pulmón
realizado en los médicos británicos, si la relación
encontrada en los médicos británicos estudiados ni
siquiera fuera válida para el conjunto de todos los
médicos británicos de donde proceden, difícilmente va a
ser válida para otras poblaciones más amplias
(población diana o general).
Validez
 Los errores sistemáticos afectan a la validez
interna de un estudio y, por lo tanto,
indirectamente también a la validez externa
del mismo.
SESGOS
Concepto de sesgo
 Diccionario de Epidemiología: “desviación de la
verdad de los resultados o inferencias, o los
procesos que llevan a esa desviación. Cualquier
tendencia en la recogida, análisis, interpretación,
publicación o revisión de los datos que pueden
conducir a conclusiones que son sistemáticamente
diferentes de la verdad”.
Concepto de sesgo
 Se entiende por sesgo cualquier error sistemático que afecte a la validez de
un estudio, es decir, que aleje el valor observado del valor real o verdadero.
Recuérdese que se denomina validez a la ausencia de sesgo sistemático.
 Como habitualmente no se conoce el valor real y únicamente se dispone
del valor observado, en la mayoría de las ocasiones no se tendrá la certeza
de la presencia del sesgo ni de su magnitud. Por ello, sólo será posible
prevenir o minimizar los sesgos en el diseño y ejecución del estudio
mediante una adecuada selección de los sujetos estudiados, una correcta
obtención de la información sobre los mismos, y la prevención en el diseño
o control en el análisis de las variables externas distorsionadoras.
 Además, se podrá argumentar razonadamente acerca de su presencia y
efecto sobre el parámetro estimado. Por tanto, en la valoración de un sesgo
intervienen fundamentalmente elementos de juicio informado
Concepto de sesgo
 Como se ha señalado, el error sistemático, a diferencia
del error aleatorio, no depende del tamaño del estudio,
con lo cual no se reduce aumentando su tamaño.

 En presencia de error sistemático, el aumento del


tamaño del estudio únicamente conseguiría aumentar la
precisión de la estimación, pero no su validez, ya que el
valor estimado seguirá estando igual de alejado del
valor verdadero.
Tipos de sesgos
Agrupar en tres tipos generales:
 Sesgo de selección.

 Se puede producir en las fases de diseño y ejecución del


estudio debido a una inadecuada selección de los sujetos
estudiados.
 Sesgo de información.

 El sesgo de información se puede originar en las fases de


diseño y ejecución del estudio debido a una incorrecta
obtención de la información sobre las personas estudiadas.
 Sesgo de confusión.

 El sesgo de confusión aparecerá cuando no se haya evitado en


el diseño la presencia de variables externas distorsionadoras o
no se haya controlado su efecto en el análisis.

Nota. Aparentemente están claramente diferenciados, aunque en ocasiones es difícil poder


distinguir entre estos tres tipos de sesgos. Hay sesgos de información/selección
combinados, que tienen componentes de información y de selección
Efectos de los sesgos
 Cualquiera de los sesgos (selección, información y confusión), en función
del efecto que producen al distorsionar la estimación de una medida
epidemiológica, pueden clasificarse en positivos o negativos.

 Positivos. Si el parámetro epidemiológico presenta un valor superior al que


realmente tiene (sobrestima o exagera el efecto), es decir, lo aleja de la
hipótesis nula (RR=1).

 Negativos. Si el parámetro presenta un valor inferior al real (subestima o


atenúa el efecto), es decir, lo aproxima a la hipótesis nula.
Efectos de los sesgos

 En función de la magnitud de la distorsión producida por la acción


del sesgo, un efecto que existe en la realidad puede llegar a
anularse por el sesgo o incluso, si la distorsión es aún mayor, puede
llegar a invertirse, cambiando el sentido de la asociación,
produciendo una modificación cualitativa del efecto. De esta forma,
un sesgo sería capaz de hacer que un factor de riesgo apareciera
como factor de protección o al revés.
Efectos de los sesgos
 Habitualmente, no se va a tener la certeza de si un sesgo está presente o no, y sólo
se podrá argumentar sobre su presencia, sentido y magnitud, con la sola excepción
del sesgo de confusión, que a diferencia del resto de los sesgos (selección e
información), sí se puede cuantificar y controlar en el análisis.

 Por tanto, como idea clave en el tema de los sesgos, recordaremos que la presencia
de algún tipo de sesgo es prácticamente inevitable en cualquier estudio
epidemiológico, aunque es cierto que unos tipos de diseño de estudio son más
vulnerables que otros a la presencia de sesgos.

 Los estudios experimentales son poco susceptibles a que se introduzcan en ellos


sesgos de confusión.

 Dentro de los estudios observacionales, es bien conocido que los estudios de casos
y controles son más proclives a la presencia de sesgos que los de cohortes.
Diferencias entre los sesgos de selección
e información y el sesgo de confusión

Sesgos de selección e información La confusión


Los sesgos de selección e información son Es un sesgo, pero está producido por la presencia
un problema de diseño y ejecución del de una variable externa, denominada factor de
estudio que da lugar a una estimación confusión, que da lugar a una mezcla de efectos y,
errónea, distorsionada del efecto. por tanto, a una distorsión en la estimación del
Pueden aumentar, disminuir o anular el efecto que se quiere estudiar.
efecto real. Al igual que los sesgos de selección e información,
Por tanto, afectan a la validez del estudio. el sesgo de confusión puede aumentar o disminuir
el efecto, llegando incluso a anularlo o a invertir su
Habitualmente, no se pueden cuantificar ni sentido.
se pueden controlar en la fase de análisis.
Por tanto, también afecta a la validez del estudio.
deben evitarse mediante un diseño
cuidadoso. El sesgo de confusión se puede cuantificar y, sobre
todo, siendo este el gran hecho diferencial, se
Frecuentemente son el punto débil del puede controlar en el análisis. Es decir, si no se ha
estudio. podido prevenir en el diseño, el sesgo de confusión
se puede controlar en la fase de análisis.
Sesgo de selección
 El sesgo de selección es una distorsión del efecto medido producido por
una selección incorrecta de las personas que forman los grupos del
estudio.

 Por ello, la relación entre exposición y enfermedad es diferente para los


que participan y para aquellos elegibles, pero que no participan en el
estudio.

 Esto lleva a una estimación del efecto en los sujetos incluidos en el estudio
distinta de la que se obtendría en la población entera

Es más frecuente en los estudios de casos y controles que en los


de cohortes, aunque puede existir en cualquier estudio
epidemiológico.
Sesgo de selección
 Numerosos tipos de sesgos de selección, aunque todos tienen en
común que la relación entre exposición y enfermedad es diferente
para los que participan y para aquellos que siendo elegibles no
participan.

 Más que la denominación de cada tipo de sesgo, lo importante es


centrarse en considerar la posibilidad de que esté presente el sesgo,
en qué medida puede estar actuando y en valorar su sentido
(positivo o negativo).
Tipos de sesgos de selección
Las situaciones que pueden conducir a la presencia de sesgos de selección
son:
 Selección inadecuada de personas al comenzar el estudio. Consiste en
seleccionar mal a los casos y controles (en estudios casos y controles) o
las personas expuestas y no expuestas en los de cohortes. Suele ser más
frecuente en los estudios de casos y controles.
Ejemplo: Suponemos un estudio de cohortes en el que para ver el efecto de la
contaminación atmosférica sobre los catarros. Si eligiéramos más fumadores en el
grupo de personas expuestas a la contaminación atmosférica, al obtener el resultado
(RR) no podemos tener la seguridad de que la mayor incidencia de catarros en
expuestos se deba a la contaminación o a la mayor prevalencia de fumadores en
este grupo en comparación con el grupo de personas no expuestas a la
contaminación.
 Seguimiento incompleto de los participantes
Tipos de sesgos de selección
Sesgo del trabajador sano.
 Es un caso de selección inadecuada de participantes propio de estudios de cohortes.
Un ejemplo es el denominado efecto del trabajador sano. Los trabajadores suelen tener mejor
salud que la población general, ya que se habrían autoseleccionado aquellas personas con mejor
salud para obtener un puesto de trabajo y poder mantenerlo, mientras que la población general
también incluye enfermos incapaces de desempeñar un trabajo. Este efecto es tanto mayor
cuanto más difíciles sean las condiciones de trabajo y, por tanto, requiera más capacidades
singulares.

 Se da si el estado de salud previo a entrar en una empresa pueda estar relacionado


con la enfermedad. Se podría evitar mediante una definición más restringida de la
población base, por ejemplo, si se toma como población no expuesta a trabajadores
de la misma empresa o de otra de características similares (restricción de la
población base).
 Este sesgo habitualmente va a producir una infraestimación del efecto estimado.
Tipos de sesgos de selección
Sesgo de Berkson.
 El sesgo o paradoja de Berkson se puede producir cuando los sujetos del estudio se
obtienen del hospital (casos y controles hospitalarios). Las personas hospitalizadas
pueden diferir de manera sistemática de la población general, debido a diversos
factores que influyen en la probabilidad de hospitalización.
 El sesgo de Berkson se produce cuando la probabilidad de hospitalización de los
casos y de los controles, o de los expuestos y no expuestos es distinta.
 Característico de los estudios de casos y controles.

Ejemplo: En el clásico estudio de casos y controles de Doll y Hill (1950) sobre la relación del consumo de tabaco
y el cáncer de pulmón se utilizaron controles hospitalarios. El consumo de tabaco produce numerosas patologías,
algunas de ellas de elevada prevalencia como la EPOC, que pueden precisar ingreso hospitalario. Esto hace que
los controles no sean representativos en cuanto a la exposición al factor de riesgo (consumo de tabaco) de la
población de donde proceden los casos, incumpliéndose la condición central para que un estudio de casos y
controles sea válido, que los controles sean seleccionados independientemente de su estatus de exposición. En
este estudio, dado que la relación entre el consumo de tabaco y el cáncer de pulmón es muy fuerte, a pesar de la
presencia del sesgo de Berkson, que subestima el efecto, se pudo poner de manifiesto una asociación.
Tipos de sesgos de selección
Sesgo de sospecha diagnóstica o de detección

 Se produce cuando el estatus de exposición influye en la selección. En las personas


que por estar expuestas o por presentar una clínica relacionada con la exposición,
tienen una vigilancia mayor, se va a facilitar la detección de la enfermedad

Ejemplo: En los estudios de casos y controles sobre la administración de estrógenos en mujeres


y cáncer de endometrio, dado que los estrógenos pueden producir metrorragias esto llevaría a las
mujeres a solicitar atención sanitaria. Como la metrorragia es un signo del cáncer de endometrio,
se incrementaría su búsqueda en el grupo que toma estrógenos, detectándose más casos de
enfermedad, no tanto porque los estrógenos los produjeran sino porque facilitarían su
diagnóstico. De esta forma se produciría un sesgo de selección, ya que los casos del estudio
estarían más expuestos y se sobreestimaría el efecto. Para paliar el problema se propuso que los
controles fueran mujeres con enfermedades ginecológicas benignas que estuvieran también
sujetas al sesgo de detección.
Tipos de sesgos de selección
Sesgo del voluntario

 La autoselección va a producir un sesgo de selección. Los voluntarios


(autoseleccionados) suelen presentar características particulares que les convierten
en un grupo diferenciado. Algunas de estas características pueden estar asociadas
con la exposición, la enfermedad o con ambas.
Ejemplo: En el estudio sobre la leucemia entre los militares expuestos en la prueba atómica de
Smoky, realizada en 1957 en Nevada (Estados Unidos), se consiguió estudiar al 76% de todos
los expuestos. Los investigadores localizaron al 82% de los estudiados y el 18% restante
contactaron por propia iniciativa (autoderivación). Hubo cuatro casos de leucemia en el 82% de
las personas reclutadas por los investigadores y otros cuatro casos en el 18% que se habían
autoderivado.

 Si las razones de la autoderivación están asociadas con el fenómeno que se estudia,


bien porque su salud sea mala o porque estén particularmente expuestos, la validez
del estudio se va a ver afectada.
Tipos de sesgos de selección
Sesgo de prevalencia o de Neyman

 Descrito por Neyman en 1955, se produce cuando se eligen casos prevalentes en


lugar de casos incidentes, si la exposición es un factor pronóstico de la enfermedad.
Los casos prevalentes no representan la historia natural de la enfermedad, los casos
muy graves (mueren) y los leves (sanan pronto) tienen menor probabilidad de ser
seleccionados. Por tanto, los casos prevalentes son supervivientes de la enfermedad
y no tienen porqué tener una distribución similar de los distintos factores de riesgo de
la enfermedad con respecto al total de casos.

 El sesgo de prevalencia se puede evitar con la utilización exclusiva de casos


incidentes si se trata de estudios de casos y controles.
Tipos de sesgos de selección
Sesgo de inclusión/exclusión

 Este sesgo puede darse cuando se incorporan o excluyen


sistemáticamente otras enfermedades que están relacionadas con la
exposición que se estudia. Este sesgo se produce por la multiefectividad de
la exposición (un factor de riesgo se asocia a varias enfermedades).

 El sesgo por inclusión / exclusión es un sesgo de selección característico


de los estudios de casos y controles.
Tipos de sesgos de selección
Sesgo de inclusión/exclusión

Ejemplo: Los anticonceptivos orales se asocian a numerosos procesos (cáncer de


endometrio, cáncer de ovario, mastopatías benignas, etc.).
En un estudio de casos y controles sobre los anticonceptivos orales y el cáncer de
mama si se seleccionan los controles entre las mujeres atendidas en una consulta de
ginecología que no tengan cáncer de mama, se producirá un sesgo de inclusión que
infraestimará el efecto, ya que los anticonceptivos orales se asocian con numerosas
patologías.
Sin embargo, si del grupo control se excluyen todos los procesos relacionados con
los anticonceptivos orales, se producirá un sesgo de exclusión si esos procesos no
se eliminan también del grupo de los casos. Es decir, si se excluyen todos los casos
de cáncer de mama que padezcan también un proceso relacionado con los
anticonceptivos orales. Si no se procede de esta forma, habrá un sesgo de
exclusión, que será proporcional a la frecuencia con que se asocia el cáncer de
mama con otras patologías derivadas del consumo de anticonceptivos orales.
Tipos de sesgos de selección
Sesgo por pérdida de seguimiento
 Las pérdidas, ausencias o abandonos del estudio constituyen un caso particular de
autoselección.
 Se trata de personas que inicialmente entraron dentro de un estudio de seguimiento, pero que
posteriormente decide no continuar, ha fallecido por un problema no relacionado con la
investigación, ha cambiado de domicilio, o no se le pueda localizar por cualquier otro motivo.
 Este fenómeno es más frecuente cuanto más largo es el periodo de observación y el problema
será tanto mayor cuantas más pérdidas se produzcan.
 La primera consecuencia de la disminución del tamaño del estudio será la disminución de su
potencia o poder (complementario del error beta o probabilidad de detectar como
estadísticamente significativo / rechazar la hipótesis nula cuando realmente existe una asociación
en la población).
 La validez interna del estudio no se verá afectada si las pérdidas ocurren por igual en expuestos y
no expuestos, ya que la tasa de enfermedad de las personas perdidas será la misma que la de
las personas del grupo del que procedían. Sin embargo, cuando los abandonos del estudio no
ocurren al azar en los dos grupos de seguimiento (expuestos y no expuestos) y se relacionan con
la respuesta, es decir, las pérdidas están relacionadas con la exposición y con la enfermedad, la
tasa de enfermedad en las pérdidas será distinta de la que tiene la cohorte donde se encontraban
y, en este caso, la validez interna se verá afectada.
Tipos de sesgos de selección
Sesgo por valores ausentes

 El problema de los que no responden es muy frecuente. La ausencia puede deberse


a que no se haya podido encontrar al sujeto seleccionado o a su negativa a
contestar. En definitiva, se puede producir un sesgo por las diferencias entre los
participantes y los no participantes.

 El sesgo de no respuesta se puede contrarrestar o disminuir realizando varios


intentos de captar a los sujetos elegidos para participar, reduciendo al mínimo el
número de no respuestas.
Control de los sesgos de selección
 En la fase de diseño del estudio
 No seleccionando a los participantes en función de criterios que pudieran estar relacionados
con las variables a estudiar (desenlace en cohortes y exposición en casos/controles).
 Evitando que los controles de estudios de casos y controles conozcan la hipótesis del estudio
para que la participación no dependa de la misma.
 Eligiendo casos incidentes siempre que sea posible en estudios de casos y controles.
 Durante el trascurso del estudio
 Manteniendo contactos frecuentes para evitar el abandono o pérdida en el seguimiento.
Mantener motivación de los participantes.
 En la fase de recogida de datos.
 Evitando los valores ausentes, asegurándose de que toda la información se recoge de
manera exhaustiva.
 En la fase de análisis de datos
 El análisis estadístico puede permitir identificar la presencia de sesgos de selección y valorar
el efecto sobre la media de asociación.
 Si disponemos de la información relativa a las variables responsables de selección, podemos
proceder a controlar la distorsión realizando los ajustes estadísticos pertinentes.
Sesgo de información/clasificación
 El sesgo de información es una distorsión del efecto medido producido por un error
en la obtención de la información, es decir, en la recogida de datos.
 El sesgo de clasificación suele ser el sesgo de información más frecuente. El sesgo
de clasificación se puede producir por un:
 Error en el procedimiento de medida (problemas de calibración del instrumento,
problemas de recuerdo, uso de la historia clínica, etc.).
 Error por usar variables sucedáneas (proxy en inglés) que se aproximan a la
variable de interés. Por ejemplo, usar el peso y la talla autodeclarados para
calcular el índice de masa corporal en lugar del peso y talla medidos.
 Error en la definición de las variables, algunas de ellas por su propia dificultad
intrínseca como la clase social.
 El sesgo de clasificación se va a producir siempre que haya errores en la
clasificación de la enfermedad y/o de la exposición de las personas ya incluidas en el
estudio. Los errores en la valoración de la exposición suelen ser más frecuentes que
los de la enfermedad.
Tipos de sesgos de clasificación
Sesgo de Clasificación errónea no diferencial

 Es más frecuente en estudios de cohortes y en estudios experimentales.

 Se producirá una clasificación errónea no diferencial cuando la clasificación errónea


de los sujetos en las categorías de enfermedad (o de exposición) se realiza de la
misma manera en los expuestos y no expuestos (o enfermos y no enfermos), es
decir, si la sensibilidad y especificidad son iguales entre los grupos a comparar.

 En los estudios de casos y controles, el sesgo de clasificación errónea no diferencial


se debe sobre todo a la medición de la exposición y produce siempre un sesgo hacia
el valor nulo (infraestima el efecto). El sesgo de clasificación errónea no diferencial
del estatus de enfermedad también introduce un sesgo hacia el valor nulo.

 La clasificación errónea no diferencial de la exposición es más frecuente en los


estudios de casos y controles.
Tipos de sesgos de clasificación
Sesgo de Clasificación errónea diferencial

 Se producirá una clasificación errónea diferencial cuando la clasificación errónea de


los sujetos en las categorías de enfermedad (o de exposición) se realiza de manera
diferente según el sujeto esté expuesto o no expuesto (o enfermo o no enfermo), es
decir, si la sensibilidad y especificidad difieren entre los grupos a comparar.

 El sesgo de clasificación errónea diferencial puede producir un sesgo en cualquier


dirección aumentando o disminuyendo la asociación real.
Tipos de sesgos de clasificación
Sesgo de Clasificación errónea
diferencial

Ejemplo hipotético del efecto de la


clasificación errónea diferencial de la
exposición en un estudio de casos y
controles, que bien puede
sobreestimar el efecto aumentando la
OR real de 4 a una OR sesgada de
4,7 o infraestimarlo disminuyendo la
OR de 4 a una OR sesgada de 3.
Tipos de sesgos de clasificación
Sesgo de diagnóstico o de sospecha de diagnóstico

 El sesgo de sospecha de diagnóstico se produce cuando se hace un mayor esfuerzo


diagnóstico para detectar una enfermedad en el grupo expuesto que en el grupo no
expuesto. Esto va a ocasionar una clasificación errónea diferencial, que va a
sobreestimar el efecto.
 El sesgo de sospecha de diagnóstico es característico de los estudios de
seguimiento.
 Presenta similitudes entre este sesgo de clasificación errónea diferencial y el sesgo
de selección. Sin embargo, como ocurre entre sujetos ya incluidos en el estudio, se
considera de clasificación.
 El sesgo de diagnóstico se puede evitar asegurando un seguimiento comparable.
Tipos de sesgos de clasificación
Sesgo de migración de estadios
 El sesgo de migración diagnóstica o de Will Rogers es un tipo de sesgo de información diferencial
de la exposición que suele ocurrir en estudios que se desarrollan durante varios años,
coincidiendo con los cambios de criterios diagnósticos o con cambios de sensibilidad de los
aparatos diagnósticos.
 Suele ocurrir que al diagnosticar mejor a un paciente, se suelen ver mejor ciertas lesiones
(ganglios afectados, por ejemplo) y algunos pacientes suelen acabar clasificándose en un estadio
superior al que estaban.
 Así, estos pacientes tienen una forma de enfermedad más grave que los del grupo en el que
estaban inicialmente (estadio II), aunque menor que los del grupo en el que ahora se encuentran
(estadio III). Ocurre algo aparentemente paradójico, pues la mortalidad es menor en los dos
grupos objeto de la migración diagnóstica. La mortalidad del estadio II bajará porque hay menos
pacientes graves (El RR pasa de 3,75 a 2,85) y la mortalidad de estadio III también baja porque
ahora hay personas con una gravedad menor que la que corresponde al grupo (el RR para de 30
a 23,35).

Antes de migración diagnóstica Después de migración diagnóstica


frecuencia Mortalidad frecuencia Mortalidad
Estadio n (%) n (%) RR n (%) n (%) RR
I 500 (50) 10 (2) 1 (referencia) 500 (50) 10 (2) 1 (referencia)
II 400 (40) 30 (7,5) 3,75 350 (35) 20 (5,7) 2,85
III 100 (10) 60 (60) 30 150 (15) 70 (46,7) 23,35
Tipos de sesgos de clasificación
Sesgo de inaceptabilidad. Sesgo de obsequiosidad

 Inaceptabilidad: Puede suceder que los participantes mientan o se inhiban más


acerca de las exposiciones cuando sospechan que pudieran estar asociadas con una
enfermedad (ejemplo, consumo de tabaco en un paciente con cáncer de pulmón). En
este caso sería más bien diferencial y en estudios de casos y controles porque los
casos infravalorarían su exposición.

 En el sesgo de obsequiosidad, por el contrario, una persona puede sobrevalorar su


exposición a factores considerados socialmente aceptables (ejercicio físico, consumo
de fruta y verdura) o puede orientar sus respuestas en función de lo que cree que el
entrevisador quiere oir.
Tipos de sesgos de clasificación
Sesgo de atención (Hawthorne)

 El sesgo por el efecto vigilancia o Hawthorne se produce por la modificación de la


conducta habitual de una persona cuando se siente observada.

 Este sesgo puede darse, por ejemplo, en los pacientes que participan en un ensayo
clínico. Se puede evitar si se incluye un grupo placebo o control, en el que también
se dé el efecto vigilancia y, por tanto, la comparación no se verá afectada por este
sesgo.
Tipos de sesgos de clasificación
Sesgo de memoria

 El sesgo de memoria, de recuerdo o anamnésico se puede producir siempre que se


utilice una pregunta anamnésica, es decir, cuando la exposición dependa de la
memoria, ya que puede haber un recuerdo inexacto de la exposición.
 Si el error de recuerdo es similar en los casos y en los controles, se producirá una
clasificación errónea no diferencial. Sin embargo, es frecuente que los casos
recuerden mejor la exposición que los controles, ocasionando una clasificación
errónea diferencial, que va a sobreestimar el efecto.
 A veces, puede ocurrir a la inversa, el enfermo puede mostrar tendencia
(inconscientemente o no) a minusvalorar una exposición si se siente responsable de
su enfermedad. Un ejemplo clásico de ello lo constituyen los bebedores de alcohol.
En este caso se va a producir una clasificación errónea diferencial, que va a
infraestimar el efecto.
Tipos de sesgos de clasificación

Sesgo del observador

 Sesgo diferencial debido al entrevistador o a la persona que recoge la


información que aparece cuando existe alguna diferencia sistemática
en la forma en que solicita, recoge o interpreta los datos procedentes
de los participantes en un estudio, en función del grupo al que
pertenecen.
Otros sesgos
Falacia ecológica
 El sesgo ecológico (o sesgo de agregación) es un sesgo de información que se
produce si la estimación del efecto ecológico esperado no representa
necesariamente el efecto que existe a nivel individual. El sesgo ecológico constituye
la principal limitación del análisis ecológico para hacer inferencias causales.
 Una definición de la falacia ecológica fue la indicada por Michael, para quien “la
falacia ecológica es un astuto y sigiloso animal de dos caras, que está al acecho en
las esquinas oscuras de los estudios ecológicos, y engaña a los lectores incautos
haciéndoles aceptar conclusiones injustificadas, ya que presenta conclusiones que
pueden ser válidas o pueden ser falsas, dependiendo de la boca por la que hable”.
Ejemplo: Se encontró una relación entre la proporción de protestantes y la tasa de
suicidio en las provincias de Prusia entre 1883 y 1890. Este hallazgo no puede
interpretarse como que hay una relación entre ser protestante y suicidarse, ya que
podría ser que en las regiones de mayoría protestante fuesen los católicos los que
se suicidasen.
Otros sesgos
Regresión a la media
 Se entiende por regresión a la media la tendencia de los individuos que tienen un valor extremo
de una variable a presentar valores más cercanos a la media de la distribución cuando esta
variable se mide por segunda vez.
 Así puede suceder, por ejemplo, cuando se seleccionan sujetos porque en una visita presentan
un valor elevado de la presión arterial, y sin embargo, en visitas posteriores algunos tienen cifras
más bajas simplemente por la variabilidad de la presión arterial, y no por un efecto del tratamiento
en estudio.
La regresión a la media es una fuente de muchos errores en la interpretación de los resultados de
un estudio. Cuando los individuos se seleccionan según una característica que varía con el
tiempo, el efecto que se halle en las siguientes mediciones puede deberse a la variabilidad de la
medida y no al efecto de la intervención. Cuando se dispone de un grupo de comparación, este
fenómeno no desaparece, pero se controla, ya que es de suponer que sucederá en ambos
grupos por igual.
Otros sesgos
Sesgo de adelanto diagnóstico

 Toda enfermedad tiene un periodo de latencia. Si estudiamos una medida


preventiva y hacemos el diagnóstico durante el periodo de latencia puede
ocurrir que la supervivencia desde el diagnóstico se vea alargada, no
porque el paciente viva más, sino porque le diagnosticamos antes y
empezamos a contar el tiempo antes. Este es el sesgo por adelanto
diagnóstico. Lo que aumenta no es la supervivencia, sino el tiempo
conocido de enfermedad.
Otros sesgos
Sesgo de duración de la enfermedad

 Este error está muy relacionado con la falacia de Neyman. El cribado es en esencia
un estudio transversal y, por ello, tiene mayor probabilidad de seleccionar los casos
de enfermedad con duración más larga (menos letales), que tienen mejor pronóstico
que el resto y, por este motivo, están presentes durante más tiempo en la población.

 Si el pronóstico es mejor, el cribado seleccionará a una población con un pronóstico


por término medio mejor, en la que podría darse el caso de que un tratamiento inútil
pareciera eficaz.
Otros sesgos
Sesgo de sobrediagnóstico

 Si hay variabilidad en los pacientes en la duración de la fase clínica, hay que asumir
que dicha variabilidad también tiene lugar en la fase preclínica. Por lo tanto, es
perfectamente factible que haya casos en los que su evolución sea tan pausada que
nunca lleguen a la fase clínica. Estos casos pueden salir a la luz con el cribado,
dando lugar a dicho efecto de exceso de diagnóstico.

 De hecho, uno de los principales factores de riesgo para ser diagnosticado de cáncer
de próstata es hacerse una determinación del antígeno prostático (PSA). Muchos
pacientes con este cáncer mueren de otra causa sin haberse enterado de que lo
tenían. Si se hubiese determinado el PSA, habrían sido etiquetados de cáncer, pero
esto no hubiese mejorado su pronóstico.
Resumen de
Sesgos de selección y de información más frecuentes
Sesgos Estudios de cohortes o Estudios de casos y
experimentales controles
Sesgos de selección Sesgo del trabajador sano Falacia de Neyman
Seguimiento incompleto de Sesgo de Berkson
participantes Sesgo de sospecha
Sesgo por valores faltantes diagnóstica
Sesgo de valores faltantes
Sesgos de información Efecto Hawthorne Efecto Hawthorne
Sesgo de migración diagnóstica Sesgo del entrevistador
Sesgo amnésico
Sesgo de inaceptabilidad
Sesgo de obsequiosidad
Otros segos Regresión a la media
Sesgo de confusión
Concepto de confusión
 En términos epidemiológicos, se puede definir el sesgo de
confusión como la distorsión del efecto estimado de la exposición
sobre la enfermedad debido a la interposición de un efecto nuevo
producido por un factor extraño (factor de confusión, variable
confusora o confusor), que no se quiere estudiar, y que origina una
mezcla de efectos.

 De otra forma, se puede decir que es la intromisión de una o más


variables en la relación entre una exposición y un efecto.
Confusión
 La confusión no es un error generalmente introducido por el propio
investigador.

 Es un sesgo que se encuentra en la población de referencia producido por la


relaciones que mantienen otras variables con la exposición (factor de riesgo,
pronóstico, tratamiento, etc.) y con el efecto enfermedad, muerte, curación,
etc.) que se investigan.

 Mientras que el sesgo es típicamente un fenómeno ligado a la selección de


los sujetos o a la obtención de la información sobre la exposición o la
enfermedad, el factor de confusión es, con mayor frecuencia, el resultado de
relaciones específicas existentes entre las variables de una base de datos El
factor de confusión está con frecuencia presente a pesar de los esfuerzos
que se hacen para evitarlo. Una misma variable (p. ej., el sexo) puede ser un
factor de confusión en una base de datos (de un estudio determinado) y no
serlo en otra.
Confusión. Ejemplo 1
 Suponga que se quiere estudiar si el consumo de alcohol es un factor de riesgo de
cáncer de pulmón. Para ello se seleccionan una serie de sujetos afectos por cáncer
de pulmón que se comparan con un número similar de sujetos de la misma edad y
sexo que no tienen cáncer de pulmón. A ambos grupos se les investigan sus
antecedentes de consumo de alcohol.
 Sólo con el enunciado podemos anticipar el resultado del estudio, pues conocemos
que el principal factor de riesgo de cáncer de pulmón es el tabaco y que el tabaco se
asocia al consumo de alcohol. Por tanto, la frecuencia de fumadores será mucho
más elevada en el grupo de enfermos de cáncer que en el grupo que se compara, y
por la asociación entre tabaco y alcohol, posiblemente la frecuencia de consumo de
alcohol también será más elevada en los pacientes con cáncer de pulmón que en el
resto.
 Esto puede llevar a la conclusión de que el alcohol sea un factor de riesgo de cáncer
de pulmón, pero, antes de concluir eso, de manera intuitiva se entiende que habrá
que tener en cuenta al tabaco, pues esta variable puede ser la responsable de que
aparezca una asociación falsa entre alcohol y cáncer de pulmón.
Confusión. Ejemplo 2
 Exploramos el fenómeno de confusión con la adaptación de datos clásicos de un
análisis propuesto por Norell en el estudio de la asociación entre el consumo
moderado de alcohol y el infarto de miocardio. En este ejemplo, prescindiremos de
los intervalos de confianza para facilitar la exposición.
 En la tabla 1 se presenta la razón de tasas (RT) asociada al consumo moderado de
alcohol y obtenemos un valor mayor que el valor nulo (valor nulo de la RT = 1), que
indica que el consumo moderado de alcohol estaría asociado a una mayor tasa de
infarto de miocardio.

Tabla 1. Datos adaptados sobre la asociación entre el consumo moderado de alcohol y el


infarto de miocardio
Consumo moderado Infarto de Personas/año Tasas (por 1.000) Razón de tasas
de alcohol miocardio (n)
No 42 20.400 2,1 1 (referencia)

Si 187 39.600 4,7 2,2


Confusión. Ejemplo 2
 Sin embargo, el consumo de alcohol está frecuentemente
asociado al tabaquismo, y es posible que el tabaco pueda Tabla 2. Razones de tasas de infarto de
ejercer un efecto de confusión de la asociación protectora miocardio asociadas al consumo moderado
entre el consumo moderado de alcohol y el infarto de de alcohol, por grupos de tabaquismo
miocardio.
 Si exploramos los datos anteriores, separando a los
fumadores de los no fumadores, obtendríamos las tablas
siguientes (tabla 2). Se deduce que:
 El consumo moderado de alcohol protege del infarto de
miocardio en personas fumadoras (estrato 1: RT = 0,80;
valor inferior al nulo).
 El consumo moderado de alcohol protege del infarto de
miocardio en personas no fumadoras (estrato 2: RT =
0,80; valor inferior al nulo).
 Ambos resultados son idénticos.
 Sin embargo, cuando observamos el efecto global del
consumo moderado de alcohol (combinando los datos
de ambos grupos de hábito tabáquico), nos sorprende
que el efecto protector de este consumo de alcohol no
sólo desaparece, sino que cambia de dirección, y
encontramos una RT mayor que el valor nulo.
Confusión. Ejemplo 2
 Todo esto se debe a que el tabaco actúa como un factor
de confusión. Tabla 2. Razones de tasas de infarto de
 La diferencia entre el valor global y las estimaciones en miocardio asociadas al consumo moderado
cada estrato de hábito tabáquico se debe a la conjunción de alcohol, por grupos de tabaquismo
de los siguientes hechos:
1. En primer lugar, el tabaco está asociado a una
mayor tasa de infarto de miocardio
independientemente del consumo de alcohol o, dicho
de otra forma, tanto en personas con o sin consumo
moderado de alcohol. Efectivamente, se puede
comprobar, al comparar las tasas de infarto de
miocardio entre sujetos fumadores y aquellos que no
fuman, que las razones de tasas son mayores que el
valor nulo en ambos grupos de consumo de alcohol
(RT = 8 ÷ 0,8 = 10 y RT = 10 ÷ 1 = 10 en los grupos
con y sin consumo moderado de alcohol,
respectivamente), y esto constituye la primera
condición para que esta variable pueda distorsionar
el efecto entre consumo de alcohol e infarto de
miocardio; en otras palabras, para que pueda ser una
variable de confusión.
Confusión. Ejemplo 2
2. Por otra parte, el hábito tabáquico no se distribuye de
Tabla 2. Razones de tasas de infarto de
manera homogénea en ambos grupos de consumo de miocardio asociadas al consumo moderado
alcohol, ya que observamos que el 55% (21.600 ÷ 39.600) de alcohol, por grupos de tabaquismo
de las unidades de personas-año corresponden a
personas con un consumo moderado de alcohol que son
fumadores, mientras que solamente el 12% (2.400 ÷
20.400) de las unidades de personas-año de observación
corresponden a personas sin consumo moderado de
alcohol que son fumadores.
 Es la segunda condición para que una variable pueda
considerarse un factor de confusión.
 El resultado de estos dos hechos es que, al estimar la
razón de tasas global del efecto del consumo moderado
de alcohol sobre la incidencia del infarto de miocardio, el
efecto protector de este consumo moderado de alcohol se
ve en cierto modo contrarrestado por el mayor riesgo
asociado al tabaco, ya que existe una mayor prevalencia
del hábito tabáquico en los sujetos que consumen
alcohol.
Confusión. Ejemplo 2
3. La tercera condición que se debe producir para que tenga
lugar el fenómeno de confusión es que la variable de
confusión no sea un eslabón intermedio mediante el cual
actúa una exposición para producir el desenlace.
Ciertamente no es plausible que el consumo moderado de
alcohol ejerza su papel protector del infarto de miocardio a
través de la modificación del hábito tabáquico de los sujetos
del estudio.
Confusión. Ejemplo 2
 El resultado global del primer panel de la tabla 2 es una Tabla 2. Razones de tasas de infarto de
razón de tasas llamada “bruta” o “cruda”, porque no se miocardio asociadas al consumo moderado
de alcohol, por grupos de tabaquismo
tiene en cuenta el hábito tabáquico de los sujetos a la hora
de estimarse y porque no es posible asegurar que su valor
no esté distorsionado por el hábito tabáquico.
 Por el contrario, las estimaciones de las razones de tasas
obtenidas en cada estrato de tabaco se llaman estimaciones
“ajustadas” o “controladas por el hábito tabáquico”. Las
diferencias en las tasas, entre los grupos de exposición, no
pueden ser atribuibles a diferencias en el hábito tabáquico
entre los sujetos expuestos y los no expuestos, porque cada
estimación de razón de tasas se ha realizado en grupos de
sujetos que son todos ellos fumadores o no fumadores. Se
puede afirmar que las medidas de asociación han sido
estimadas “a igualdad de tabaquismo” o eliminando el efecto
distorsionante que pudiera tener el hábito tabáquico.
 El ajuste por una variable de confusión consiste, por tanto,
en la eliminación del efecto distorsionante de dicho factor de
confusión.
Condiciones para que una variable
sea confundidora
 El anterior ejemplo facilita la comprensión de la definición de una variable de
confusión. Para que una variable sea un factor de confusión de la asociación entre
una exposición o factor de riesgo y una respuesta o desenlace, tiene que cumplir las
siguientes condiciones:

 Estar asociada con el desenlace, independientemente de su asociación con la


exposición de interés (es decir, en sujetos no expuestos, estar también asociada
con el desenlace).

 Estar asociada con la exposición, pero no ser un resultado de la misma.

 No ser un eslabón causal intermedio entre la exposición y el desenlace como lo


serían, por ejemplo, los valores de colesterol HDL entre una causa como la
ingestión de alcohol y su efecto correspondiente, la menor incidencia de infarto
de miocardio (el consumo de alcohol produciría un determinado incremento de
colesterol HDL que, a su vez, reduce el riesgo de infarto de miocardio).
Condiciones para que una variable
sea confundidora
En el ejemplo:

 El riesgo de un infarto aumenta con el hábito tabáquico (el tabaco está


asociado con el riesgo de infarto tanto en consumidores moderados de
alcohol como en los que no lo consumen).

 La proporción de fumadores entre quienes consumen alcohol es mayor que


en los no consumidores (asociación entre consumo de alcohol y hábito
tabáquico).

 Por último, no es plausible que el efecto beneficioso del consumo


moderado de alcohol se realice a través del hábito tabáquico.
Condiciones para que una variable
sea confundidora
A) EL FACTOR DE CONFUSIÓN DEBE ESTAR ASOCIADO CON LA
EXPOSICIÓN.

 El factor de confusión debe distribuirse de forma diferente en los


expuestos y los no expuestos. La asociación entre el potencial factor
de confusión y la exposición no debe ser secundaria a una asociación
entre el factor de confusión y la enfermedad. Por ello, se estudiará la
asociación del factor de confusión con la exposición en los no
enfermos.
Condiciones para que una variable
sea confundidora
B) EL FACTOR DE CONFUSIÓN DEBE ESTAR ASOCIADO CON LA
ENFERMEDAD.

 Para que un factor extraño confunda debe producir un efecto, debe ser
predictivo de la ocurrencia de enfermedad, es decir, debe ser un factor
de riesgo de la enfermedad estudiada, pero no es necesario que sea
causal (por ejemplo la edad). La asociación entre el potencial factor de
confusión y la enfermedad no debe ser secundaria a una asociación
entre el factor de confusión y la exposición. Por ello, se estudiará la
asociación del factor de confusión con la enfermedad en los no
expuestos.
Condiciones para que una variable
sea confundidora
C) EL FACTOR DE CONFUSIÓN NO DEBE SER UN PASO
INTERMEDIO EN LA SECUENCIA CAUSAL ENTRE EXPOSICIÓN Y
ENFERMEDAD.

 El hipotético factor de confusión no debe ser un paso intermedio en la


cadena causal entre exposición y enfermedad. Por este motivo se la
llama variable extraña.

 Esto implica que la capacidad predictiva del riesgo de enfermedad


contemple un mecanismo diferente del que se está investigando.
Todo factor que sea un paso intermedio en la secuencia causal no
podrá ser un factor de confusión.

 Determinar este criterio requiere un conocimiento previo de las


causas de la relación estudiada, basándose en el conocimiento
existente sobre la relación estudiada y el juicio experto.
Condiciones para que una variable
sea confundidora
 Para que a una variable extraña se la considere como factor de confusión
debe cumplir los tres requisitos.

 Si la variable extraña sólo está asociada a la exposición o sólo está asociada


a la enfermedad, no será un factor de confusión.

 Los dos primeros criterios se podrán comprobar con los datos del propio
estudio.

 Sin embargo, el tercer criterio requiere información externa a los datos.

 Una de las peculiaridades del sesgo de confusión, que lo diferencia de los


sesgos de selección e información, es que se puede cuantificar. Por ello, lo
importante no es tanto determinar su presencia o ausencia como el poder
cuantificar su efecto.
Dirección del sesgo de confusión
 El sesgo de confusión puede aumentar o disminuir el efecto, llegando incluso a
anularlo o a invertir su sentido.
 Se denomina confusión positiva cuando el parámetro epidemiológico presenta un
valor superior al que realmente tiene (sobreestima o exagera el efecto), es decir, lo
aleja de la hipótesis nula (RR=1).
 Se denomina confusión negativa cuando el parámetro presenta un valor inferior al
real (infraestima o atenúa el efecto), es decir, lo aproxima a la hipótesis nula.
 Se denomina paradoja de Simpson cuando la presencia de una variable de confusión
cambia el sentido de una asociación (confusión cualitativa). De esta forma, la
confusión sería capaz de hacer que un factor de riesgo apareciera como factor de
protección y al revés. Aunque como señala Rothman, este fenómeno no es
realmente una paradoja (hecho o dicho aparentemente contrario a la lógica), ya que
no se contravienen ni la lógica ni ninguna de sus premisas, sino que es la
consecuencia de no reconocer la presencia de variables de confusión.
Confusión
 La confusión afecta a la validez del estudio.
 Pero a diferencia de lo que ocurre con los sesgos de
selección e información, el sesgo de confusión se puede
cuantificar y, sobre todo, siendo este el gran hecho
diferencial, se puede controlar en la fase de análisis.
 Es decir, si no se ha podido evitar en el diseño, el sesgo
de confusión se puede controlar en el análisis.
Prevención y control del sesgo de
confusión. Fase de diseño
 Los factores de confusión pueden prevenirse en la fase de diseño o bien eliminarse en la fase de
análisis de un estudio epidemiológico.
 Se suelen utilizar tres variantes metodológicas para evitar el efecto de confusión de variables que
tradicionalmente se comportan como tales.
1.- Aleatorización. Consiste en asignar al azar a los sujetos de un estudio, a los grupos que se
pretenden comparar de modo que cualquier posible factor de confusión, conocido o desconocido,
se puede considerar homogéneamente distribuido entre dichos grupos, con lo que desaparece
una de las condiciones para que cause confusión (la asociación entre dicha variable y la
exposición estudiada).
Este método es el utilizado en estudios clínicos o de intervención.
La aleatorización consigue eliminar mejor la confusión cuando el tamaño muestral es grande. Sin
embargo, nunca debe considerarse una garantía absoluta de ausencia de confusión, y esta
posible explicación de los resultados debe discutirse pertinentemente a la hora de publicarlos.
Por otra parte, la aleatorización no es siempre posible por problemas éticos o por el diseño
observacional del estudio. Incluso cuando es posible, pueden surgir problemas, como la pérdida
diferencial de individuos entre los grupos o la no adherencia al protocolo, que podrían introducir
diferencias entre los grupos.
Prevención y control del sesgo de
confusión. Fase de diseño
2.- Restricción. Consiste en admitir, en el estudio, sólo a aquellos sujetos que estén en
una de las categorías del factor de confusión (p. ej., todos serán no fumadores para
prevenir la confusión por tabaco), y con ello se consigue romper también la
distribución heterogénea del factor de confusión entre los grupos comparados.
La restricción no permite estudiar el efecto de la variable restringida. Es posible
utilizar la restricción en estudios de cohortes, casos y controles y estudios
experimentales.
La restricción tiene varios inconvenientes desde el punto de vista práctico al reducir
el número de individuos en el estudio, lo que implica una pérdida de potencia.
También puede ser importante la amenaza a la validez externa, ya que puede ser
difícil la generalización de los resultados.
Ejemplo: En el estudio sobre el café y el cáncer de páncreas, donde el consumo de
tabaco pudiera ser un factor de confusión, se podría especificar que sólo se
incluyese en el estudio a los no fumadores. De esta forma, si se observase una
asociación entre el café y el cáncer de páncreas, evidentemente no podría ser
debida al consumo de tabaco.
Prevención y control del sesgo de
confusión. Fase de diseño
3.-Emparejamiento (matching). Es una modalidad de restricción que sólo se utiliza para
ajustar por factores de confusión en estudios experimentales o de cohortes.
Cada sujeto del grupo de expuestos se empareja con uno o más sujetos del grupo de no
expuestos que se encuentran en la misma categoría del factor de confusión.
Por ejemplo, ante un sujeto fumador que consuma alcohol de manera moderada,
buscaremos a otro también fumador pero que no consuma alcohol. Cualquier diferencia
entre los grupos de consumo no podrá, en principio, atribuirse al tabaco, y diremos que
la asociación observada está «ajustada por el tabaco».
El problema, tanto de la restricción como del emparejamiento, es que no pueden
controlarse los factores de confusión desconocidos o no medidos.

Ejemplo: En el estudio sobre el café y el cáncer de páncreas, donde el consumo de


tabaco pudiera ser un factor de confusión, podría compararse el consumo de café de un
caso que fumase un paquete al día con el consumo de café de un control que fumase la
misma o parecida cantidad de cigarrillos al día.
Prevención y control del sesgo de
confusión. En el análisis
En la fase de análisis existen dos metodologías fundamentales de ajuste:
1.- La estratificación. Consiste en realizar estimaciones de las medidas de asociación en
cada subgrupo de la variable de confusión. Es precisamente lo que hemos hecho con el
ejemplo del consumo moderado de alcohol y el infarto de miocardio. Las estimaciones
ajustadas son aquellas que se consiguen dentro de cada estrato (categoría) de la variable
de confusión.
 La estratificación consiste en distribuir a los sujetos en estratos de acuerdo con el nivel del
posible factor de confusión, analizando por separado la relación entre la exposición y la
enfermedad en cada estrato.
 Sin embargo, sólo permite controlar simultáneamente un número limitado de variables, ya
que el tamaño de cada estrato se verá reducido con cada variable por la que se
estratifique. Por ejemplo, para poder realizar una estratificación por cinco variables,
aunque sólo tuviesen dos categorías cada una, se necesitarían 32 (25) estratos. Con
tantos estratos, el número de personas disponibles para el análisis en cada uno puede
resultar demasiado pequeño.
 Además, cuando los estratos son demasiado grandes puede que no se controle
adecuadamente la confusión si se produjese confusión dentro de cada estrato (confusión
residual).
Prevención y control del sesgo de
confusión
 2.- Análisis multivariante. Cualquier estimación que produzca un modelo
multivariante se puede considerar ajustada por las demás variables que
constituyen el modelo. Para ajustar por una variable de confusión utilizando
modelos multivariantes, basta con introducir el factor de confusión en el
modelo.

 En el ajuste multivariante, es preciso llegar a un equilibrio entre la necesidad


de ajustar por muchas variables, introduciendo el máximo número de
variables en el modelo, con la necesidad de obtener estimaciones precisas
(se pierde precisión cuantas más variables se introducen en un modelo
multivariante).
Modificación del efecto o
interacción
Modificación del efecto o
interacción
 La interacción también puede producir una modificación del efecto
estimado, pero, a diferencia de los anteriores, no lo hace de forma errónea.

 Tanto la interacción como el sesgo de confusión, aunque son


conceptualmente muy distintos, comparten la necesidad de valorar
variables externas para poder interpretar correctamente el efecto estudiado.

 La interacción se da cuando el efecto de la exposición sobre la enfermedad


es diferente a distintos niveles de una tercera variable. Se trata de un
fenómeno natural, que existe independientemente del diseño del estudio. El
sesgo de confusión, por contra, es una distorsión errónea del efecto, que
puede estar presente o no, dependiendo del diseño del estudio.
Modificación del efecto o
interacción
 Recibe el nombre de sinergismo cuando la presencia de un factor aumenta
el efecto de otro.
 El opuesto del sinergismo es el antagonismo, es decir, cuando la presencia
de un factor disminuye el efecto de otro.
 Una interacción se considera cuantitativa cuando sólo cambia la magnitud
de los efectos, pero no su sentido.
 Sin embargo, cuando una interacción cambia el sentido de la asociación se
denomina cualitativa. Por ejemplo, cuando el efecto de la exposición sobre
la enfermedad es protector en unos niveles de una tercera variable y en
otros niveles es un factor de riesgo.
 Se habla de interacción biológica entre dos o más factores causales
cuando existe una interdependencia entre sus mecanismos de acción para
causar, prevenir o controlar una enfermedad, de manera que la incidencia
de enfermedad atribuible a este conjunto de factores causales es diferente
de la incidencia esperable de sus efectos individuales..
Modificación del efecto o interacción

Existen dos características importantes del concepto de modificación del


efecto:

1. A partir de una misma base de datos se puede llegar a concluir que hay
modificación del efecto o que no la hay, según la escala escogida (escala
aditiva o multiplicativa) para valorar el fenómeno.
2. Cuando se describe una modificación del efecto, es preciso especificar la
escala en la cual se mide dicho efecto: se hablaría entonces de desviación
de la aditividad (valorando efectos absolutos como diferencias de riesgos) o
multiplicatividad (valorando efectos relativos como razones de tasas o
riesgos relativos).
Modificación del efecto o interacción

 Algunos ejemplos, cada vez mejor estudiados, de modificación del efecto en


epidemiología son los concernientes a interacciones entre el medio ambiente y
los genes. Por ejemplo, se llama la atención sobre una posible interacción entre
el polimorfismo de los genes responsables de las enzimas (N-acetiltransferasas)
que transforman las aminas heterocíclicas, producidas al cocinar las proteínas
animales como la carne roja, en sustancias cancerígenas.
 En un estudio se observó, de hecho, que la asociación entre el consumo de
carne roja y el cáncer de colon en varones de 60 años era mayor en los
acetiladores rápidos que en los lentos. El riesgo relativo de cáncer de colon
asociado al consumo de más de una ración de carne roja al día, en comparación
con el consumo menor que la mitad de una ración al día, se modificaba de 1,6
en acetiladores lentos a 5,8 en acetiladores rápidos.
Identificación de la interacción
Se siguen los siguientes pasos:
 Valorar la existencia de causalidad entre la exposición y el desenlace.

 Excluir la existencia de confusión.

 Realizar un análisis, separado por estratos, para estimar el efecto de la


exposición dentro de cada subgrupo (estrato) de la variable que se piense
que pueda ser modificadora del efecto. Este tipo de análisis se llama
“análisis en subgrupos”.
Identificación de la interacción. Ejemplo
 En un ejemplo descrito por Rothman y Greenland sobre las asociaciones entre el
tabaco, el asbesto y la densidad de incidencia (tasa) del cáncer de pulmón, se puede
valorar la modificación del efecto tanto en la escala aditiva como en la multiplicativa.
En la tabla 1, se presentan las tasas de cáncer de pulmón por 100.000 personas-
años de observación y según el perfil de exposición a cada uno de los dos factores
de riesgo.

Modificación del efecto del tabaco por la exposición al asbesto

Fumador Exposición al asbesto


No Si

No 1 5

Sí 10 50
Densidades de incidencia de cáncer de pulmón: casos por 100.000 personas-año
Identificación de la interacción. Ejemplo

 El efecto absoluto del tabaco (diferencia de tasas de cáncer entre fumadores y no


fumadores) se puede calcular en ambos grupos de exposición al asbesto (análisis
del efecto del tabaco por subgrupos de exposición al asbesto):
 Expuestos al asbesto: (50/100.000 años–1) – (5/100.000 años–1) = 45/100.000
años–1.
 No expuestos: (10/100.000 años–1) – (1/100.000 años–1) = 9/100.000 años–1.

Modificación del efecto del tabaco por la exposición al asbesto

Fumador Exposición al asbesto


No Si

No 1 5

Sí 10 50
Densidades de incidencia de cáncer de pulmón: casos por 100.000 personas-año
Identificación de la interacción. Ejemplo
 En este caso diríamos que existe una desviación de la aditividad de las diferencias
de tasas porque dichas diferencias son heterogéneas en cada estrato de exposición
al asbesto. El efecto absoluto del tabaco es 5 veces mayor en sujetos expuestos al
asbesto.
 El efecto relativo del tabaco (razón entre densidades de incidencia de cáncer en
fumadores y la tasa en no fumadores) también se puede calcular en ambos grupos
de exposición al asbesto.
 Expuestos al asbesto: (50/100.000 años–1)/(5/100.000 años–1) = 10.
 No expuestos: (10/100.000 años–1)/(1/100.000 años–1) = 10.

 Llama la atención que, en este mismo ejemplo, no existe una desviación de la


multiplicatividad de las razones de tasas porque dichas medidas relativas son
homogéneas, tienen el mismo valor, en cada estrato de exposición al asbesto.
 El efecto relativo (en la escala multiplicativa) del tabaco es el mismo en cada grupo
de exposición al asbesto.
Identificación de la interacción. Ejemplo
 Desde el punto de vista del análisis estadístico, las desviaciones del efecto aditivo o
multiplicativo se pueden valorar utilizando modelos que se basan en escalas
multiplicativas, como la regresión logística, que estima odds ratios, o la regresión de
Cox, que estima razones de tasas (hazard ratios). La desviación o no de la
multiplicatividad de los efectos relativos de dos variables se valoraría introduciendo,
en el modelo, una variable que representase el producto entre ellas.
 La significación estadística de dicho término y, sobre todo, la magnitud de la
modificación identificada determinarán que hablemos o no de desviación de la
multiplicatividad del efecto correspondiente a estas variables.
 En el ejemplo que nos ocupa, el término que representa el producto entre las
exposiciones al tabaco y al asbesto no sería, de hecho, significativo en el modelo
multivariable, pero lo más importante es que las razones de tasas del efecto del
tabaco coinciden en los dos estratos de exposición al asbesto. Diríamos que “el
asbesto no modifica las razones de tasas de cáncer atribuible al tabaco”.
Identificación de la interacción.
La búsqueda del fenómeno de interacción puede presentar diversas ventajas:

 Mejora de la predicción del modelo: un análisis que incluye la valoración de la


interacción permite una mejor descripción de la variación de la incidencia en función
de factores de riesgo, en comparación con una estimación media del riesgo para ese
conjunto de factores de riesgo. De no detectar una interacción que en realidad
existe, invariablemente se obtendrían subestimaciones del riesgo en algunos sujetos
y sobrestimaciones en otros.

 Mejora la planificación de intervenciones en salud pública: las intervenciones en


salud pública pueden ser más interesantes, por ejemplo, en sujetos con ambos
factores de riesgo que en aquellos con uno de los dos factores de riesgo. En otras
ocasiones, la eliminación de un factor de riesgo puede ser suficiente. Estas
consideraciones sólo son posibles en presencia de modificación del efecto.
Identificación de la interacción. Ejemplo 2
 Suponga un estudio sobre la relación del consumo de tabaco y el cáncer
boca y faringe.
 El RR del consumo de tabaco con el cáncer oral en los que no beben
alcohol es de 1,53 y en los que beben alcohol el RR es de 5,71.
 Se aprecia que la relación que se quiere estudiar (consumo de tabaco-
cáncer oral) es distinta en los bebedores de alcohol que en los abstemios.
Esto es debido a la presencia de una interacción entre el consumo de
tabaco y el consumo de alcohol en la relación estudiada. Por ello, se
deberá describir separadamente la relación consumo de tabaco-cáncer oral
en los bebedores (RR=5,71) y en los abstemios (RR=1,53).
Identificación de la interacción
 En la estrategia general de análisis de un estudio epidemiológico,
antes de valorar la posible existencia de confusión se debe detectar
la presencia de interacción, ya que en presencia de interacción el
análisis puede concluirse presentando separadamente los
estimadores específicos de cada nivel de interacción o estrato, junto
con sus intervalos de confianza. En caso de que existiera también
confusión, esta sólo se manifestaría en la medida cruda del efecto.
Por tanto, al describir la interacción se estaría controlando la posible
confusión.
Principales diferencias entre el sesgo de confusión y la interacción
SESGO DE CONFUSIÓN INTERACCIÓN
Es un sesgo No es un sesgo
Perturbación errónea del efecto Fenómeno natural
Puede o no estar presente, dependiendo Independiente del diseño del estudio
del diseño del estudio
No se evalúa mediante un test estadístico Se evalúa mediante un test estadístico
Se puede obtener un estimador global del No se puede obtener un estimador global
efecto del efecto

Se debe evitar Se debe describir


BIBLIOGRAFÍA
 Escuela Nacional de Sanidad (ENS) Instituto de Salud Carlos III - Ministerio de
Ciencia e Innovación. Miguel Ángel Royo Bordonada, Javier Damián Moreno,
“Método epidemiológico”. Madrid: ENS - Instituto de Salud Carlos III, Octubre de
2009. Págs. 47-73. (http://www.isciii.es/ISCIII/es/contenidos/fd-publicaciones-isciii/fd-
documentos/2009-0843_Manual_epidemiologico_ultimo_23-01-10.pdf ).
 Jokin Irala Estévez, Miguel Martínez-González, María Seguí-Gómez. Epidemiología
Aplicada. Págs.: 257-296; 347-358.
 Hulley SB y Cummings SR et al. Diseño de investigaciones clínicas. Lippincott
Williams and Wilkins: Barcelona 2008.
 Piédrola Gil y col. Medicina Preventiva y Salud Pública. Elsevier: Barcelona 2008.
Páginas: 160-172.
 Hernández-Aguado I, Gil A, Delgado M y Bolúmar F. Manual de Epidemiología y
Salud Pública. Para licenciaturas y diplomaturas en ciencias de la salud. Ed.
Panamericana: Madrid 2005. Páginas: 73-79.
 http://halweb.uc3m.es/esp/Personal/personas/amalonso/esp/bstat-tema8vc.pdf
 http://halweb.uc3m.es/esp/Personal/personas/amalonso/esp/bstat-tema8vme.pdf
Para cualquier duda contactar a través de ambos correos,
simultáneamente

[email protected]

[email protected]

También podría gustarte