Tamizaje
Tamizaje
ISSN: 1130-5274
Clínica y Salud
Investigación Empírica en Psicología
Subdirectores/Associate Editors
Jorge Barraca Mairal
Ma Isabel Casado Morales
Ma Xesús Froján Parga
Héctor González Ordi
Ma Eugenia Olivares Crespo
Vicente Prieto Cabras
Pablo Santamaría Fernández
Albert Sesé Abad
h t t p : / / j o u r n a l s. c o p m a d r i d. o r g / c l y s a
Clinical and Health
Journal of Empirical Research in Psychology
INFORMACIÓN R E S U M E N
DEL ARTÍCULO
Los trastornos por uso de alcohol son preocupantemente altos en la población universitaria. Contar con instrumentos de
Historia del artículo: tamizaje es fundamental para la medición epidemiológica y la práctica clínica. El objetivo de este trabajo es comparar el
Recibido el 28 de octubre de 2017 desempeño de los instrumentos de tamizaje más usados a nivel internacional (AUDIT, AUDIT-C, TWEAK, RAPS-QF y CAGE)
Aceptado el 4 de diciembre de 2017
en estudiantes universitarios de Argentina. Los instrumentos de tamizaje, junto a la Entrevista Diagnóstica Compuesta
Internacional, que permite obtener diagnósticos compatibles con el DSM 5, fueron administrados a una muestra
Palabras clave: probabilística (N = 2,430) de estudiantes de una universidad pública nacional. Entre otros, se evaluaron los puntos de
Alcohol corte óptimos, la sensibilidad, la especificidad, la consistencia interna y la estabilidad temporal, así como la presencia y
AUDIT
la capacidad de discriminación de los ítems. La apreciación global de los resultados sugiere que tanto el AUDIT como el
Tamizaje
Universidad RAPS-QF serían los instrumentos preferibles para detectar la presencia de trastorno por uso de alcohol en esta población.
Argentina
A B S T R A C T
Keywords:
Alcohol use The prevalence of alcohol use disorders in university students is alarmingly high. Screening instruments are fundamental
AUDIT for both, epidemiological research and clinical practice. The aim of this article is to compare the performance of the most
Screening widely used screening instruments (AUDIT, AUDIT-C, TWEAK, RAPS-QF, and CAGE) in Argentinean university students.
University Screening tests, along with the Alcohol Section of the Composite International Diagnostic Interview that yields DSM 5
Argentina
compatible diagnoses were administered to a probabilistic sample (N = 2,430) of university students from a national public
university. The following characteristics were evaluated among others: optimal cut-off points, sensitivity, specificity,
internal consistency, temporal stability, and item presence and discrimination capacity. The global appraisal of results
suggests that the AUDIT and RAPS-QF would be preferable for evaluating AUD in this population.
Una gran proporción de jóvenes padecen o están en riesgo de pre- A lo largo de las últimas décadas se han construido distintos
sentar trastorno por uso de alcohol, especialmente los universitarios, instrumentos destinados a tal fin. Uno de los más investigados es
que consumen más que otras poblaciones (Slutske, 2005). Sin embar- el Test de Identificación de Trastornos por uso de Alcohol (AUDIT),
go, se estima que la mayoría de las personas que padecen un trastor- creado por la Organización Mundial de la Salud (OMS) para ser
no por uso de alcohol no son identificadas. Una manera de mejorar utilizado en atención primaria (Babor, Higgins-Biddle, Saunders y
la detección, y el tratamiento posterior, es desarrollando y evaluando Monteiro, 2001). Las propiedades psicométricas del AUDIT han sido
instrumentos de tamizaje. El tamizaje se puede definir como el uso estudiadas en diferentes países y poblaciones, mostrándose como
adecuado de procedimientos para detectar y diferenciar aquellos con una herramienta válida para detectar trastornos por uso de alcohol
un posible trastorno por uso de alcohol de aquellos con una baja pro- (Lundin, Hallgren, Balliu y Forsell, 2015). En muestras de estudiantes
babilidad de tenerlo fundamentados en evidencia empírica (Connors universitarios este es el test más estudiado, obteniendo resultados
y Volk, 2003). En la precisión de estos métodos se fundamentarán que indican una buena sensibilidad y especificidad (Fleming, Barry
luego posteriores evaluaciones y decisiones clínicas (Allen, 2003). y MacDonald, 1991), a la vez que presenta una adecuada fiabilidad
Para citar este artículo: Conde, K., Victoria Gimenez, P. y Cremonte, M. (2018). Características de los instrumentos de tamizaje del trastorno por uso de alcohol en jóvenes universitarios
de Argentina. Clínica y Salud, 29, 27-33. [Link]
Financiación: El Consejo Nacional de Investigaciones Científicas y Técnicas y la Universidad Nacional de Mar del Plata han contribuido parcialmente a la financiación de este proyecto.
Correspondencia: kconde@[Link] (K. Conde).
ISSN:1130-5274/© 2018 Colegio Oficial de Psicólogos de Madrid. This is an open access article under the CC BY-NC-ND license ([Link]
28 K. Conde et al. / Clínica y Salud (2018) 29(1) 27-33
(García Carretero, Novalbos Ruiz, Martínez Delgado y O’Ferrall Gon- trumentos (como el TWEAK y el RAPS-QF) no han sido evaluados en
zález, 2016). esta población. Por lo tanto, el objetivo de este estudio será evaluar
Si bien el AUDIT es un cuestionario de corta duración (2-4 minu- las propiedades psicométricas de distintos instrumentos de tamizaje
tos), existe una versión breve, creada con el objetivo de favorecer la (AUDIT, AUDIT-C, TWEAK, RAPS-QF, CAGE) del trastorno por uso de
detección rápida: el AUDIT-C (Bush, Kivlahan, McDonell, Fihn y Brad- alcohol de acuerdo al DSM 5 en estudiantes universitarios de la ciu-
ley, 1998). Incluye sólo 3 preguntas sobre frecuencia de consumo, dad de Mar del Plata. Se espera así contribuir a la detección precoz y
cantidad y frecuencia de consumo excesivo episódico. Aunque cum- a intervenciones efectivas en esta población de riesgo.
ple con el objetivo de ser fácil y rápido de administrar, el riesgo de
detectar falsos positivos es alto (Nordqvist, Johansson y Bendetsen,
Método
2004). El AUDIT-C ha sido poco estudiado en universitarios, pero al-
gunos investigadores sugieren que podría ser una herramienta con Participantes
validez y fiabilidad para esta población, por lo que recomiendan con-
tinuar estudiándolo (García Carretero et al., 2016). Participaron en este estudio 2,430 estudiantes, de una muestra
Otro instrumento de tamizaje en esta área es el TWEAK (acrónimo probabilística de todas las Facultades de una universidad pública de
de Tolerance, Worried, Eye-opener, Amnesia, Kut-down), construido Mar del Plata, institución que cuenta con más de 20,000 estudian-
para ser aplicado a mujeres gestantes (Russell, 1994) y ampliamen- tes de toda la región. El procedimiento de muestreo fue aleatorio
te evaluado en esta población (Moraes, Viellas y Reichenheim, 2005; por conglomerados, seleccionando una asignatura por año, por Fa-
López, Lichtenberger, Conde y Cremonte, 2017). Si bien se ha extendi- cultad, de primer a tercer año, mediante un generador de números
do su estudio a otras poblaciones encontrando resultados favorables aleatorios. Para el retest se seleccionaron aleatoriamente 122 estu-
(Jones, 2011), en ciertos contextos, como por ejemplo en las salas de diantes de la muestra original que fueron reevaluados transcurri-
emergencia, el desempeño de otros instrumentos sería mejor (Cre- da una semana de la evaluación original. Los datos se recolectaron
monte, Ledesma, Cherpitel y Borges, 2010). Un cuestionario que ha
entre los años 2009 y 2014.
sido construido para su uso en salas de emergencias es el Rapid Alco-
hol Problems Screen (Cherpitel, 1995), que en su versión más reciente
(RAPS-QF) agrega preguntas sobre frecuencia de consumo con el ob- Instrumentos
jetivo de aumentar la sensibilidad; detectaría el 90% de los casos de
abuso de alcohol (Cherpitel, 2002). Se utilizó un cuestionario auto-administrado que evaluó:
El CAGE (acrónimo de Cut-down, Annoyed, Guilty, Eye-opener) Trastorno por uso de alcohol. Se estableció la presencia-ausen-
es otro instrumento de tamizaje ampliamente utilizado, construido cia de un trastorno por uso de alcohol según el DSM versión 5 (va-
para detectar personas que han sufrido dependencia a lo largo de su riable dicotómica sí [al menos dos criterios cumplidos]/no [menos
vida (Ewing, 1984). Por lo tanto, no sería adecuado para detectar el de dos criterios cumplidos]), con la Sección de Alcohol de la Entre-
consumo excesivo episódico de alcohol, sino el consumo continuado vista Internacional de Diagnóstico Compuesta (Tacchini, Coppola,
durante largos periodos (Rigler, 2000). Este instrumento presentaría Musazzi, Altamura e Invernizzi, 1994). La Entrevista Internacional
buenas propiedades psicométricas, pero, al igual que otros, su des- de Diagnóstico Compuesta es una evaluación clínica que permite el
empeño varía en función de la población a la que se aplica (Dhalla y diagnóstico de un trastorno por uso de alcohol según los sistemas
Kopec, 2007). de diagnóstico más utilizados. A pesar de su utilidad epidemioló-
Además de las diferencias según la población en la que se utilicen, gica, resulta mucho más extensa que un instrumento de tamizaje,
los instrumentos de tamizaje presentarían variaciones en su funcio- más apropiado para contextos en que se requiere una rápida detec-
namiento en hombres y mujeres. Por ejemplo, el RAPS-QF tendría ción (Kessler y Üstün, 2004).
una sensibilidad adecuada para ambos géneros, mientras que el CAGE Alcohol Use Disorder Identification Test (AUDIT). Este cuestio-
tendría una sensibilidad más baja en mujeres (Cherpitel, 2002). Sin nario consta de 10 ítems que evalúan para los últimos doce meses,
embargo, se podría considerar que, en general, los instrumentos de 1) frecuencia usual de consumo de alcohol y 2) cantidad típica con-
tamizaje presentan una sensibilidad más baja cuando se aplican a sumida (en tragos o unidades estándar, cualquier bebida con 11 g de
mujeres que a hombres, por lo cual sería apropiado utilizar diferentes alcohol puro), junto con la frecuencia de las siguientes conductas: 3)
puntos de corte, siendo inferiores para la población femenina (Cher- consumo de 6 o más tragos por ocasión, 4) no poder parar de consu-
pitel, 1999). mir, 5) que la persona no pudiera realizar lo que se esperaba de ella
Por otro lado, a pesar de que estos instrumentos hayan sido eva- por el consumo, 6) el consumo matutino después de una ocasión de
luados según los criterios del DSM-IV e ICD-10, los estudios sobre consumo en exceso, 7) culpa o remordimiento por el consumo, 8) epi-
su adecuación al sistema diagnóstico del DSM 5 son mucho menos sodios de amnesia anterógrada inducidos por el alcohol, 9) lesiones
abundantes. Se registran pocas investigaciones con instrumentos propias o a terceros mientras estaba intoxicado y 10) preocupación
como el AUDIT-C (Hagman, 2015) y el RAPS-QF (Cherpitel y Ye, 2015), del entorno por su manera de beber. Se puede obtener un puntaje
que informan que la actuación de los instrumentos mejoraría con el de entre 0 y 40, teniendo cada ítem un puntaje de 0 a 4 (Saunders,
nuevo sistema diagnóstico. Aasland, Babor, de la Fuente y Grant, 1993).
En resumen, se han evaluado distintos instrumentos de tamizaje AUDIT-C (AUDIT-Consumption Questions). Este instrumento
del consumo de alcohol y los problemas relacionados en distintas incluye únicamente los primeros 3 ítems del AUDIT (aquellos refe-
poblaciones, con diferencias en el desempeño según el género y el ridos a la conducta de consumo de alcohol) y su puntaje es de 0 a 12
sistema de diagnóstico utilizado. Se ha observado que son escasos (Bush et al., 1998).
los estudios sobre las propiedades psicométricas de los instrumen- Tolerance, Worried, Eye-Opener, Amnesia, Kut-down
tos de tamizaje más utilizados en otras poblaciones (AUDIT, AUDIT-C, (TWEAK). Consta de 5 ítems que evalúan si en el último año la per-
TWEAK, RAPS-QF, CAGE) con muestras de universitarios, una pobla- sona presentó o no: 1) una tolerancia mayor a 5 tragos, 2) quejas
ción de riesgo en lo que a consumo de alcohol se refiere. En esta, por parte de personas cercanas respecto de su consumo, 3) consu-
como en otras poblaciones universitarias, el consumo de alcohol y mo en la mañana o en ayunas, 4) necesidad de reducir la ingesta
los problemas relacionados suelen ser mucho más prevalentes que de alcohol, 5) episodios de amnesia anterógrada inducidos por el
en la población general y se ha buscado implementar estrategias de alcohol en el último año. En esta escala, con un puntaje de entre 0
detección rápida y a gran escala para llevar a cabo intervenciones y 7, una respuesta positiva en los dos primeros ítems equivale a 2
que reduzcan el consumo de alcohol. Adicionalmente, algunos ins- puntos y los restantes 1 (Russell, 1994).
Tamizaje del Uso de Alcohol en Universitarios 29
Rapid Alcohol Problems Screen - Quantity Frequency (RAPS- de valores negativos, índice de probabilidad de diagnóstico positivo
QF). Esta escala de 5 ítems tiene un valor de un punto por respuesta e índice de probabilidad de diagnóstico negativo para el total de la
positiva en el último año a cada uno. Estos son: 1) sentimiento de cul- muestra y luego utilizando el género como covariable. Posteriormente
pa o remordimiento (remorse), 2) episodios de amnesia anterógrada se evaluaron las propiedades psicométricas de los instrumentos, utili-
(amnesia), 3) imposibilidad para realizar lo que se esperaba de ellos zando como indicadores el área bajo la curva ROC [Receiver Operating
(perform), 4) consumo en la mañana o en ayunas (starter), 5) consu- Characteristic] como medida para estimar la capacidad de discrimi-
mo de 5 o más tragos en una ocasión y frecuencia de consumo de al nación entre sanos y enfermos del puntaje total de cada test, el alfa
menos una vez por mes (Cherpitel, 2002). El periodo evaluado fueron de Cronbach (ítems ordinales) o el índice Kuder-Richardson 20 (ítems
los últimos doce meses. dicotómicos) para medir la consistencia interna, el coeficiente K2 de
Cut-down, Annoyed, Guilty, Eye-Opener (CAGE). Este instrumen- Livingston para corregir los coeficientes consistencia interna según el
to tiene 4 ítems y un puntaje positivo por cada uno de ellos. Indaga si punto de corte de cada instrumento, la medida de acuerdo no paramé-
la persona tuvo alguna vez durante los últimos doce meses: 1) nece- trica W de Kendall para evaluar la confiabilidad test-retest y el índice
sidad de reducir la ingesta de alcohol, 2) quejas por parte de personas kappa de Cohen, junto con su valor verdadero según las frecuencias
cercanas respecto de su consumo, 3) sentimiento de culpa o remordi- marginales observadas, para estimar el acuerdo entre un diagnóstico
miento, 4) consumo en la mañana o en ayunas (Ewing, 1984). positivo en cada test y un diagnóstico positivo de trastorno por uso de
alcohol. Por último, se analizó el índice de discriminación de cada ítem
Procedimiento con la correlación ítem-total y punto biserial corregida (según fueran
ítems ordinales o dicotómicos respectivamente) y la proporción de
Los estudiantes presentes en el día de la administración com- cada respuesta positiva en los ítems dicotómicos. Para realizar estos
pletaron un cuestionario de auto-reporte en lápiz y papel de una análisis se utilizaron los paquetes OptimalCutpoint (López-Ratón, Ro-
duración aproximada de 20 minutos. Las respuestas fueron anóni- dríguez-Álvarez, Suarez y Sampedro, 2014), irr (Gamer, Lemons, Ga-
mas y confidenciales y entregadas bajo consentimiento informado. mer, Robinson y Kedall’s, 2012), psych (Revelle y Revelle, 2015) del
Los investigadores con formación en el área, presentes durante la software R y el software ICalfa (Merino, 2015).
administración, entregaron hojas con impresos de contacto e in-
formación general sobre el estudio. Esta investigación contó con el Resultados
aval del Comité de Ética del Instituto Nacional de Epidemiología de
Mar del Plata. Datos Sociodemográficos
Análisis de Datos El porcentaje de mujeres fue 66% [IC 95% 64-68] y de varones 34%
[IC 95% 32-36], de edades entre los 17 y 77 años, M = 22.32 [IC 95%
En primer lugar se realizaron análisis sobre los puntos de corte más 22.07-22.56], DE = 6.13; la prevalencia de trastorno por uso de alcohol
adecuados para cada instrumento según la presencia/ausencia de un según DSM 5 fue del 22% [IC 95% 20-23].
trastorno por uso de alcohol. Se utilizaron dos índices de estimación,
el índice de Youden y el de igualdad entre sensibilidad y especificidad. Puntos de Corte Óptimos
La diferencia entre ambos es que mientras que el primero aspira a un
punto de corte con valores máximos de sensibilidad y especificidad, El índice Youden arrojó valores de punto de corte más bajos para el
a la vez que un acuerdo máximo con el criterio, el segundo busca un AUDIT y AUDIT-C y, dado que la sensibilidad fue más alta, se prefirió
punto de corte que implique la menor distancia entre sensibilidad y este índice al de igualdad entre sensibilidad y especificidad. El punto
especificidad. Para cada uno de los puntos de corte se estimó la sen- de corte para el AUDIT fue de 7 y para el AUDIT-C de 4. Los puntos
sibilidad, especificidad, predicción de valores positivos, predicción de corte óptimos para el TWEAK, RAPS-QF y CAGE fueron de 3, 2, y 1
Tabla 1. Análisis de puntos de corte de instrumentos de tamizaje según trastorno por uso de alcohol, estudiantes universitarios, N = 2,430, Mar del Plata
Índice de Youden Igualdad entre sensibilidad y especificidad
PC Se Sp PPV NPV DLR+ DLR- PC Se Sp PPV NPV DLR+ DLR-
Total
AUDIT 7 .83 .74 .48 .94 3.25 .22 8 .75 .81 .52 .92 3.89 .31
AUDIT-C 4 .87 .57 .36 .94 2.06 .22 5 .72 .72 .41 .90 2.53 .39
TWEAK 3 .64 .85 .55 .89 4.41 .42 3 .64 .85 .55 .89 4.41 .42
RAPS-QF 2 .80 .78 .50 .93 3.64 .26 2 .80 .78 .50 .93 3.64 .26
CAGE 1 .68 .78 .47 .90 3.13 .41 1 .68 .78 .47 .90 3.13 .41
Mujeres
AUDIT 7 .81 .80 .49 .95 4.10 .24 7 .81 .80 .49 .95 4.10 .24
AUDIT-C 4 .84 .64 .35 .94 2.34 .25 5 .65 .78 .41 .91 3.02 .44
TWEAK 1 .92 .62 .36 .97 2.41 .12 2 .77 .69 .36 .93 2.47 .33
RAPS-QF 2 .77 .81 .48 .93 4.06 .28 2 .77 .81 .48 .93 4.06 .28
CAGE 1 .65 .81 .45 .91 3.53 .42 1 .65 .81 .45 .91 3.53 .42
Varones
AUDIT 9 .74 .78 .56 .89 3.36 .33 9 .74 .78 .56 .89 3.36 .33
AUDIT-C 5 .81 .58 .42 .89 1.91 .33 6 .68 .70 .47 .85 2.29 .46
TWEAK 3 .68 .79 .55 .86 3.22 .41 3 .68 .79 .55 .86 3.22 .41
RAPS-QF 2 .82 .72 .53 .91 2.97 .25 2 .82 .72 .53 .91 2.97 .25
CAGE 1 .71 .72 .49 .86 2.49 .40 1 .71 .72 .49 .86 2.49 .40
Nota. PC = punto de corte; Se = sensibilidad; Sp = especificidad; PPV = predicción de valores positivos; NPV = predicción de valores negativos; DLR+ = índice de
probabilidad de diagnóstico positivo; DLR- = índice de probabilidad de diagnóstico negativo.
30 K. Conde et al. / Clínica y Salud (2018) 29(1) 27-33
Tabla 2. Características psicométricas de los instrumentos de tamizaje para trastorno por uso de alcohol, estudiantes universitarios, N = 2,430, Mar del Plata
Fiabilidad según punto Fiabilidad
AUC (IC 95%) PC M (DE) Fiabilidad (IC 95%) Medida de acuerdo5
de corte 3 temporal4
AUDIT .87 (.85-.89) 7 5.88 (5.11) .78 (.77-.79)1
.79 .95** .45 (.73)
AUDIT-C .79 (.77-.81) 4 3.86 (6.28) .64 (.61-.66)1 .64 .94** .30 (.74)
TWEAK .82 (.80-.84) 3 1.60 (1.63) .48 (.45-.51)2 .70 .88** .47 (.51)
RAPS-QF .85 (.83-.86) 2 1.27 (1.36) .66 (.64-.68)2 .74 .86** .48 (.69)
CAGE .75 (.73-.77) 1 1.48 (0.82) .52 (.49-.55)2 .66 .74** .40 (.53)
Nota. IC = intervalo de confianza; AUC = área bajo la curva ROC (Receiver Operating Characteristic).
1
Alfa de Cronbach.
2
Índice Kuder-Richardson 20.
3
Coeficiente K2 de Livingston.
4
W de Kendall.
5
Kappa de Cohen (valor observado según las frecuencias marginales) para trastorno por uso de alcohol.
** p < .001
Tabla 3. Índice de discriminación de los ítems1 para el Test de Identificación de Trastornos por Uso de Alcohol (AUDIT) y el AUDIT-Consumption Questions (AUDIT-C),
estudiantes universitarios, N = 2,430, Mar del Plata
Ítem 1 Ítem 2 Ítem 3 Ítem 4 Ítem 5 Ítem 6 Ítem 7 Ítem 8 Ítem 9 Ítem 10
AUDIT .44 .39 .67 .48 .56 .30 .40 .65 .41 .40
AUDIT C .41 .41 .60
Nota. 1Correlación ítem-total corregida.
Tabla 4. Índice de discriminación de los ítems para instrumentos breves de tamizaje de trastornos por uso de alcohol, estudiantes universitarios, N = 2,430, Mar
del Plata
Proporción de la presencia del indicador Índice de Discriminación1
Ítem 1 Ítem 2 Ítem 3 Ítem 4 Ítem 5 Ítem 1 Ítem 2 Ítem 3 Ítem 4 Ítem 5
TWEAK .50 .07 .07 .26 .11 .32 .31 .24 .39 .29
RAPS-QF .22 .26 .25 .07 .48 .42 .49 .51 .27 .40
CAGE .11 .07 .22 .07 --- .37 .34 .37 .19 ---
Nota. Correlación ítem-total punto-biserial corregida.
1
respectivamente. La sensibilidad fue alta para el AUDIT, AUDIT-C y el En el TWEAK, RASPS-QF y CAGE el ítem sobre consumo matuti-
RAPS-QF y menor para el TWEAK y el CAGE que, en cambio, tuvieron no tuvo una discriminación baja y también una prevalencia baja. En
una alta especificidad. El instrumento con mejor sensibilidad/especi- cambio, el ítem sobre amnesia anterógrada pareció tener un buen
ficidad fue el AUDIT. La predicción de valores positivos fue menor en funcionamiento en el TWEAK y RAPS-QF (Tabla 4).
el AUDIT-C y la predicción de valores negativos fue similar en todos
los instrumentos (Tabla 1). Discusión
Se hallaron diferencias en los puntos de corte para mujeres y va-
rones en el AUDIT, AUDIT –C y TWEAK (Tabla 1). El desempeño del El objetivo de este estudio fue evaluar las propiedades psicomé-
TWEAK fue mejor en mujeres que en varones en torno a la sensibili- tricas de instrumentos de tamizaje de trastorno por uso de alcohol
dad y la predicción de valores negativos. en estudiantes universitarios. Algunos de estos instrumentos fueron
Con algunas diferencias, cualquier positivo en los instrumentos evaluados en otros contextos en poblaciones similares, pero con cri-
incrementó la probabilidad de tener un trastorno por uso de alco- terios distintos al DSM 5. Para el AUDIT los puntos de corte estableci-
hol, mientras que un negativo la disminuyó. dos en la literatura son de entre 5 y 11 (Adewuya, 2005; Fleming et al.,
1991; García Carretero et al., 2016; Kokotailo et al., 2004), mientras
Características Psicométricas que el más apropiado en la población estudiada fue 7. Los puntos de
corte del AUDIT-C, TWEAK y RAPS-QF obtenidos aquí fueron más al-
El área bajo la curva ROC fue satisfactoria en todos los casos, pero tos que los propuestos inicialmente por quienes los diseñaron (Bush
baja en el instrumento CAGE. La fiabilidad fue buena para el AUDIT, et al., 1998; Cherpitel, 2002; Russell, 1994), probablemente debido a
pero baja en el resto de los instrumentos. Corregida por el punto de las características de consumo de esta población (consumo alto con
corte, la fiabilidad fue buena para AUDIT, TWEAK y RAPS-QF. La esta- consecuencias negativas, e.g., amnesia) pero sin cumplir criterios de
bilidad test-retest fue alta en todos los instrumentos, mientras que el trastorno por uso de alcohol. Similarmente a lo hallado en una inves-
acuerdo con el trastorno por uso de alcohol según el DSM 5 fue mode- tigación en estudiantes universitarios para el AUDIT-C y para otras
rado. Aun así, controlando por sesgos de distribución, fue alto para el poblaciones en general, los puntos de corte del AUDIT, AUDIT-C y
AUDIT, AUDIT-C y RAPS-QF y moderado para TWEAK y CAGE (Tabla 2). TWEAK fueron menores para las mujeres (DeMartini y Carey, 2012).
Si bien hay indicadores de que el consumo de alcohol y problemas
Análisis a Nivel del Ítem asociados están aumentando entre las mujeres argentinas, siguen
siendo menores que los de los varones, lo que podría explicar este
Para el AUDIT y AUDIT-C la discriminación de los ítems fue satis- resultado.
factoria, aunque bastante menor para el ítem 6 del AUDIT, que evalúa Considerados globalmente, los instrumentos con mejor desempe-
consumo matutino, y particularmente alta para los ítems de consumo ño respecto de sensibilidad/especificidad, propiedades psicométricas
de 6 o más tragos por ocasión, y de episodios de amnesia anterógrada y desempeño de ítems fueron el AUDIT y el RAPS-QF. El AUDIT-C fue el
inducidos por el alcohol (Tabla 3). instrumento más sensible, pero el menos específico, y su consistencia
Tamizaje del Uso de Alcohol en Universitarios 31
interna no fue alta; lo anterior podría deberse a que evalúa sólo el To improve detection, evaluation, and clinical decisions, we need well
consumo en una población con un consumo alto. El TWEAK tuvo un developed and assessed screening instruments (procedures to detect
desempeño global bajo, pero fue muy sensible en mujeres, lo que no those with a high probability of having an alcohol use disorder, and
resulta sorprendente ya que este instrumento fue desarrollado para to differentiate them from those with a low probability of having it,
su uso en mujeres (Russell, 1994). El CAGE tuvo el desempeño más based on empirical evidence).
pobre para discriminar personas con un trastorno por uso de alcohol. Throughout the last decades, researchers have developed different
Otros estudios en universitarios también notaron que el desempeño instruments for this purpose. One of the most studied is the Alco-
del AUDIT sería mejor que el del CAGE (Fleming et al., 1991). Para me- hol Use Disorders Identification Test (AUDIT), created by the World
jorar sus características psicométricas se han propuesto modificacio- Health Organization to be used in primary care. The AUDIT was as-
nes como cambiar la pregunta sobre las discusiones con familiares sessed in its psychometric properties in different countries and po-
por una pregunta sobre la conducción bajo los efectos del alcohol pulations. In university students’ samples, this test obtained results
(Aertgeerts et al., 2000) o incluso añadirle otras como la influencia del that indicated a good sensitivity and specificity. At the same time, it
alcohol en los afectos, en la pérdida de recursos y oportunidades y el has adequate reliability. Although the AUDIT is a short questionnaire,
vandalismo (Taylor, El-Sabawi y Cangin, 2016). a shorter version was created to favor rapid detection: the AUDIT-C. It
Un posible indicio del motivo del menor desempeño del CAGE includes three questions about usual frequency and quantity of con-
en esta población puede encontrarse en el análisis a nivel del ítem. sumption and binge drinking. This AUDIT version has been limitedly
En primer lugar, se trata del único instrumento que no incluye pre- studied in university students. Other screening tests in the field are
guntas sobre la conducta de consumo de alcohol en ninguna de sus the TWEAK (Tolerance, Worried, Eye-Opener, Amnesia, Kut-down),
formas. Otros estudios han encontrado que los patrones de consumo aimed to pregnant women and later to other populations, the Rapid
de alcohol tienen un importante valor para predecir los problemas Alcohol Problems Screen (RAPS-QF), which detects 90% of cases of
por consumo de alcohol (Cremonte, Cherpitel Borges, Peltzer y San- alcohol abuse in primary care, and the CAGE (Cut-down, Annoyed,
tangelo, 2010). Aquí, los ítems con mejores índices de discriminación Guilty, Eye-Opener), developed to detect people who have suffered
tuvieron contenido referido a estas preguntas. Asimismo, tampoco dependence some time in their lives. These tests’ performance varies
incluye preguntas sobre los episodios de amnesia anterógrada. Esta according to the population where they are used and when applied
consecuencia del consumo de alcohol también ha demostrado una to men or women. For example, RAPS-QF has adequate sensitivity for
estrecha relación con el trastorno por uso de alcohol en los jóvenes both genders, whereas CAGE has lower sensitivity in women. Althou-
universitarios argentinos (Conde, Remaggi y Cremonte, 2014) y altos gh these instruments were evaluated according to DSM-IV and ICD-
índices de discriminación. Por otro lado, sí incluye preguntas como 10 criteria, the studies on their suitability to the DSM 5 system of
si la persona se sintió culpable por el consumo, tuvo la necesidad de diagnostic are much less common.
reducir el consumo o si las personas de su entorno se preocuparon The aim of this study is, therefore, to evaluate the psychometric
por su consumo, en un contexto donde el consumo de alcohol es properties of alcohol use disorders screening tests (AUDIT, AUDIT-C,
ampliamente tolerado y en una población donde la intoxicación es TWEAK, RAPS-QF, and CAGE), according to DSM 5 criteria and by
aceptada (Ministerio de Salud de la Nación, 2011). Además, incluye gender, in university students in the city of Mar del Plata, Argentina.
una pregunta sobre el consumo matutino, ítem que tuvo una de las
menores prevalencias y capacidad de discriminación, probablemente
Method
debido a que evalúa una de las conductas relacionadas con el espectro
más severo del trastorno por uso de alcohol, que no es frecuente en
A total of 2,430 students participated in this study, from a
esta población de jóvenes.
probabilistic sample of all the Faculties of a public university in Mar
Entre otras limitaciones generales (por ejemplo las que afectan a
del Plata. For re-test, we randomly selected 122 students from the
los estudios basados en autoinformes), la principal que presenta este
original sample and re-evaluated them after one week of the original
estudio se relaciona con el orden de administración de los reactivos
evaluation. We collected data between 2009 and 2014.
de los instrumentos (preguntas de consumo y preguntas evaluan-
The students present on the day of administration completed
do consecuencias), ya que algunos estudios han mostrado sesgos en
the questionnaire. The answers were anonymous and confidential.
las respuestas según se administren primero unas u otras (Harford,
We delivered the questions only when informed consent was
1994); sin embargo este tema no ha sido suficientemente explorado
given. This study was authorized by the Ethics Committee of the
como para que haya recomendaciones en uno u otro sentido.
National Institute of Epidemiology of Mar del Plata. We used a self-
administered questionnaire to examine: a) the presence-absence of
Conclusiones an alcohol use disorder according to DSM 5, using the Alcohol Section
of the Composite International Diagnostic Interview; b) AUDIT,
Hasta donde sabemos este es el primer estudio que compara with ten items about the usual frequency and quantity of alcohol
el desempeño de los instrumentos de tamizaje más usados a nivel consumption, and the frequency of several problematic behaviors
internacional en estudiantes universitarios de un país hispanoha- (consumption of six or more drinks per occasion, not being able to
blante del Cono Sur. Los resultados sugieren que tanto el AUDIT stop consuming, not performing as expected, morning consumption,
como el RAPS-QF serían los instrumentos preferibles para detectar guilt or remorse, blackouts, injuries while intoxicated, and concern
la presencia de trastorno por uso de alcohol en esta población. De- of significant others) in the last year; c) AUDIT-C, which has the three
tectar a aquellos estudiantes con trastorno por uso de alcohol es AUDIT’s questions about alcohol consumption; d) TWEAK, a five-item
fundamental para orientar las intervenciones que se realicen, tanto test that evaluates if the person presented tolerance, complaints of
a nivel de la clínica individual como de las políticas sanitarias, sin significant others, morning consumption, the need to reduce alcohol
desestimar la necesidad de medidas orientadas a reducir el consu- intake and blackouts in the past year; e) RAPS-QF, a test with five
mo en esta población. questions about feelings of guilt or remorse, blackouts, inability to
perform as expected, morning consumption, and binge drinking in
Extended Summary the last 12 months; f) CAGE, an instrument which asks if the person
ever had the need to reduce alcohol intake, received complaints from
Most people who suffer from an alcohol use disorder are misiden- people about their consumption, had feelings of guilt or remorse, and
tified, even in at-risk populations such as young university students. the presence of morning consumption.
32 K. Conde et al. / Clínica y Salud (2018) 29(1) 27-33
We performed analyses to estimate the most appropriate characteristics of the population, namely, a high consumption with
cutoff points for each instrument, based on the presence/ many negative consequences, but without meeting criteria for an
absence of an alcohol use disorder (Youden index and equality alcohol use disorder. Similar to what was found in university students
between sensitivity and specificity). Sensitivity, specificity, and other populations, the AUDIT, AUDIT-C, and TWEAK cutoff points
prediction of positive and negative values, and index of the were lower for women, probably due to differences in drinking
probability of positive and negative diagnosis, were estimated for practices and their consequences.
each of the cut-off points for the total of the sample, and later Considered globally, the instruments with the best performance
using the gender as a covariate. Psychometric properties of the were AUDIT and RAPS-QF. The AUDIT-C was the most sensitive
instruments were evaluated, using as indicators the area under instrument, but the least specific. This could be due to the fact that
the ROC for discrimination capacity, the Cronbach’s alpha or the it only evaluates consumption, and alcohol intake is high in this
Kuder-Richardson index 20 for internal consistency, Livingston population. The TWEAK had a low overall performance but was
coefficient K2 to correct the internal consistency coefficients very sensitive to detect alcohol use disorders in women, which is
by the cutoff point, Kendall’s non-parametric agreement W for not surprising since this instrument was developed to be used in
test-retest reliability, Cohen’s Kappa to estimate the agreement women. The CAGE had the poorest performance to discriminate
between a positive diagnosis in each test and a positive diagnosis people with an alcohol use disorder. Other studies in universities also
of an alcohol use disorder, and item-total correlation and point- noted that the AUDIT’s performance may be better than that of the
biserial corrected as discrimination index of each item. Analyses CAGE. We can find some possible reasons of the lower performance
were performed with R and the ICalfa software. of the CAGE in this population at the item level analysis. The CAGE
is the only instrument that does not include questions about alcohol
consumption and blackouts. Drinking patterns are important
Results
predictors of alcohol-related problems, and alcohol blackouts have
shown to be related to alcohol use disorders in university students. On
The percentage of women was 66% and men 34%, and the mean
the other hand, it does include questions about feelings of guilt, the
age was 22.32. The prevalence of alcohol use disorders according to
need to reduce alcohol consumption and the concern of significant
DSM 5 was 22%.
others, in a context where alcohol consumption is tolerated, and in a
According to the Youden index (the one with the higher sensitivity),
population where intoxication is accepted. In addition, the CAGE has
the cut-off point for the AUDIT was 7, and for the AUDIT-C 4. The
an item on morning consumption, which is not frequent in youth.
optimal cutoff points for the TWEAK, RAPS-QF, and CAGE were 3, 2,
and 1 respectively. Sensitivity was high for the AUDIT, AUDIT-C and
RAPS-QF (>.80), and lower for the TWEAK and CAGE (< .70), which, Conclusion
on the other hand, had a high specificity (.78). The instrument with
the best sensitivity/specificity was the AUDIT (.83/.74). The prediction To our knowledge, this is the first study to compare the
of positive values was lower in the AUDIT-C (.36), and the prediction performance of internationally used screening instruments in
of negative values was similar in all instruments. Differences were university students from a Spanish-speaking country of South
found in cut-off points for women and men in the AUDIT (7 versus America. The results suggest that the AUDIT and the RAPS-QF
9), AUDIT -C (4 versus 5), and TWEAK (1 versus 3). When considering would be the preferred instruments for detecting the presence
sensitivity and prediction of negative values, the performance of the of an alcohol use disorder in this population and for guiding
TWEAK was better in females than males. Any positive outcome in interventions at an individual level, without underemphasizing the
all the instruments increased the probability of having an alcohol use need for comprehensive health policies.
disorder, while a negative one decreased it.
The area under the ROC curve was satisfactory in most cases, but low Conflicto de Intereses
in the CAGE (.75). The reliability was good for the AUDIT and, as expected,
lower in the rest of the instruments (which are shorter). Reliability for Los autores de este artículo declaran que no tienen ningún con-
the cutoff point of each instrument was highest for the AUDIT (.79) and flicto de intereses.
RAPS-QF (.74). The test-retest stability was high on all instruments (>
.70), whereas the agreement with an alcohol use disorder diagnosis
Referencias
according to DSM 5 was high for the AUDIT, AUDIT-C, and RAPS-QF (>
.70), and moderate for the TWEAK and CAGE (> .50), when considering Adewuya, A. O. (2005). Validation of the alcohol use disorders identification
the observed values adjusting by the sample’s distribution. test (audit) as a screening tool for alcohol-related problems among
Nigerian university students. Alcohol and Alcoholism, 40, 575-577.
Regarding item level analysis, for the AUDIT and AUDIT-C, the item [Link]
discrimination was mostly satisfactory, yet very low for the morning Aertgeerts, B., Buntinx, F., Bande-Knops, J., Vanderrneulen, C., Roelants, M.,
consumption item (.30), and particularly high for consumption of six Ansoms, S. y Fevery, J. (2000). The value of CAGE, CUGE, and AUDIT in
screening for alcohol abuse and dependence among college freshmen.
or more drinks per occasion (.67) and blackouts (.65) items.
Alcoholism: Clinical and Experimental Research, 24, 53-57. [Link]
In the TWEAK, RASPS-QF, and CAGE, the morning consumption org/10.1111/j.1530-0277.2000.tb04553.x
item also had low discrimination (< .30), and a low prevalence (7%). Allen, J. P. (2003). Assessment of alcohol problems: An overview. En J.
In contrast, the item about blackouts appeared to work well in the P. Allen & V. B. Wilson (Eds.), Assessing Alcohol Problems: A Guide
for Clinicians and Researchers, 2 (pp. 1-11). Bethesda, MD: National
TWEAK and RAPS-QF (> .30). Institute on Alcohol Abuse and Alcoholism.
Babor, T. F., Higgins-Biddle, J. C., Saunders, J. B. y Monteiro, M. G. (2001).
Cuestionario de Identificación de los Transtornos debidos al Consumo
Discussion de Alcohol. Pautas para su utilización en atención primaria. Ginebra:
Organización Mundial de la Salud. Recuperado de [Link]
Some of the instruments evaluated here were assessed in other int/substance_abuse/activities/en/[Link]
Bush, K., Kivlahan, D. R., McDonell, M. B., Fihn, S. D. y Bradley, K. A. (1998).
contexts and in similar populations, but with criteria other than The AUDIT alcohol consumption questions (AUDIT-C): an effective brief
DSM 5. For the AUDIT, the cutoff points found in the literature were screening test for problem drinking. Archives of internal medicine,
between 5 and 11, while the most appropriate in this study was 7. The 158, 1789-1795. [Link]
Cherpitel, C. J. (1995). Screening for alcohol problems in the emergency
cutoff points of the AUDIT-C, TWEAK, and RAPS-QF found here were room: a rapid alcohol problems screen. Drug and alcohol dependence,
higher than those initially proposed, probably due to the consumption 40, 133-137. [Link]
Tamizaje del Uso de Alcohol en Universitarios 33
Cherpitel, C. J. (1999). Gender, injury status and acculturation differences in Methods in Psychiatric Research, 13, 93-121. [Link]
performance of screening instruments for alcohol problems among US mpr.168
Hispanic emergency department patients. Drug and alcohol dependence, Kokotailo, P. K., Egan, J., Gangnon, R., Brown, D., Mundt, M. y Fleming,
53, 147-157. [Link] M. (2004). Validity of the alcohol use disorders identification test in
Cherpitel, C. J. (2002). Screening for Alcohol Problems in the US General college students. Alcoholism: Clinical and Experimental Research, 28,
Population: Comparison of the CAGE, RAPS4, and RAPS4-QF by Gender, 914-920. [Link]
Ethnicity, and Service Utilization. Alcoholism: Clinical and Experimental López, M. B., Lichtenberger, A., Conde, K. y Cremonte, M. (2017). Psychometric
Research, 26, 1686-1691. [Link] properties of brief screening tests for alcohol use disorders during
Cherpitel, C. J. y Ye, Y. (2015). Performance of the RAPS4/RAPS4-QF for pregnancy in Argentina. Revista Brasilera de Ginecología y Obstetricia,
DSM-5 compared to DSM-IV alcohol use disorders in the general
39, 322-329.
population: Data from the 2000–2010 National Alcohol Surveys.
López-Ratón, M., Rodríguez-Álvarez, M. X., Suarez, C. C. y Sampedro, F. G.
Drug and alcohol dependence, 151, 258-261. [Link]
drugalcdep.2015.02.025 (2014). OptimalCutpoints: an R package for selecting optimal cutpoints
Conde, K., Remaggi, M. L. y Cremonte, M. (2014). Alcohol y amnesia en in diagnostic tests. Journal of Statistical Software, 61(8), 1-36. https://
universitarios de Argentina y España: prevalencia y predicción. Salud [Link]/10.18637/jss.v061.i08
y drogas, 14, 37-46. Lundin, A., Hallgren, M., Balliu, N. y Forsell, Y. (2015). The use of alcohol
Connors, G. J. y Volk, R. J. (2003). Self-report screening for alcohol problems use disorders identification test (AUDIT) in detecting alcohol use
among adults. Assessing alcohol problems: A guide for clinicians and disorder and risk drinking in the general population: validation of
researchers, 2 (pp. 21-35). Bethesda, MD: National Institute on Alcohol AUDIT using schedules for clinical assessment in neuropsychiatry.
Abuse and Alcoholism. Recuperado de [Link] Alcoholism: Clinical and Experimental Research, 39, 158-165. https://
publications/arh28-1/[Link] [Link]/10.1111/acer.12593
Cremonte, M., Cherpitel, C. J., Borges, G., Peltzer, R. I. y Santángelo, P. R. Merino, C. (2015). ICalfa: módulo Excel para estimar intervalos de confianza
(2010).Drinking Patterns and DSM-IV Alcohol Use Disorders’ Criteria in para alfa de Cronbach. Programa no publicado.
Argentinean Emergency Department Patients. En J. Maars (Ed.), Alcohol Ministerio de Salud de la Nación. (2011). Algunos datos sobre el consumo
Dependence and Addiction. Hauppauge, NY: Nova Publishers. de Alcohol en Argentina. Recuperado de [Link]
Cremonte, M., Ledesma, R. D., Cherpitel, C. J. y Borges, G. (2010). Psychometric saludmental/images/stories/info-equipos/pdf/4-algunos-datos-sobre-
properties of alcohol screening tests in the emergency department in [Link]
Argentina, Mexico and the United States. Addictive Behaviors, 35, 818-825. Moraes, C. L., Viellas, E. F. y Reichenheim, M. E. (2005). Assessing alcohol
DeMartini, K. S. y Carey, K. B. (2012). Optimizing the use of the AUDIT for misuse during pregnancy: evaluating psychometric properties of the
alcohol screening in college students. Psychological assessment, 24,
CAGE, T-ACE and TWEAK in a Brazilian setting. Journal of Studies on
954-963. [Link]
Alcohol, 66, 165-173. [Link]
Dhalla, S. y Kopec, J. A. (2007). The CAGE questionnaire for alcohol misuse:
a review of reliability and validity studies. Clinical & Investigative Nordqvist, C., Johansson, K. y Bendtsen, P. (2004). Routine screening for
Medicine, 30, 33-41. Recuperado de [Link] risky alcohol consumption at an emergency department using the
cim/article/viewFile/447/554 AUDIT-C questionnaire. Drug and Alcohol Dependence, 74, 71-75.
Ewing, J. A. (1984). Detecting alcoholism: the CAGE questionnaire. Jama, [Link]
252, 1905-1907. [Link] Revelle, W. y Revelle, M. W. (2015). Package ‘psych’. The Comprehensive R
Fleming, M. F., Barry, K. L. y MacDonald, R. (1991). The alcohol Archive Network.
use disorders identification test (AUDIT) in a college sample. Rigler, S. K. (2000). Alcoholism in the elderly. American Family Physician,
International Journal of the Addictions, 26, 1173-1185. [Link] 61, 1710-1716. [Link]
org/10.3109/10826089109062153 Russell, M. (1994). New assessment tools for risk drinking during
Gamer, M., Lemon, J., Gamer, M. M., Robinson, A. y Kendall’s, W. (2012). pregnancy: T-ACE, TWEAK, and others. Alcohol Research and Health,
Package ‘irr’. Various coefficients of interrater reliability and agreement. 18, 55-61. Recuperado de [Link]
Recuperado de [Link] ahrw18-1/[Link]
García Carretero, M. Á., Novalbos Ruiz, J. P., Martínez Delgado, J. M. y Saunders, J. B., Aasland, O. G., Babor, T. F., De la Fuente, J. R. y Grant, M.
O’Ferrall González, C. (2016). Validación del test para la identificación (1993). Development of the alcohol use disorders identification test
de trastornos por uso de alcohol en población universitaria: AUDIT (AUDIT): WHO collaborative project on early detection of persons with
y AUDIT-C. Adicciones, 28, 194-204. [Link] harmful alcohol consumption-II. Addiction, 88, 791-804. [Link]
adicciones.28.4 org/10.1111/j.1360-0443.1993.tb02093.x
Hagman, B. T. (2015). Toward efficient screening for DSM-5 alcohol use disorders
Slutske, W. S. (2005). Alcohol use disorders among US college students and
in college students: performance of the AUDIT-C. Addictive Disorders &
their non-college-attending peers. Archives of General Psychiatry, 62,
Their Treatment, 14, 1-15. [Link]
Harford, T. C. (1994). The effects of order of questions on reported 321-327. [Link]
alcohol consumption. Addiction, 89, 421-424. [Link] Tacchini, G., Coppola, M., Musazzi, A., Altamura, A. y Invernizzi, G. (1994).
org/10.1111/j.1360-0443.1994.tb00916.x [Multinational validation of the composite international diagnostic
Jones, L. A. (2011). Systematic review of alcohol screening tools for use in interview (CIDI)]. Minerva Psichiatrica, 35, 63-80.
the emergency department. Emergency Medicine Journal, 28, 182-191. Taylor Jr, P., El-Sabawi, T. y Cangin, C. (2016). Improving alcohol screening
[Link] for college students: screening for alcohol misuse amongst college
Kessler, R. C. y Üstün, T. B. (2004). The world mental health (WMH) survey students with a simple modification to the CAGE questionnaire.
initiative version of the world health organization (WHO) composite Journal of American college health, 64, 397-403. [Link]
international diagnostic interview (CIDI). International Journal of 80/07448481.2016.1168429