CTC-R Informe COP
CTC-R Informe COP
Evaluación de
CTC-R
Descripción general
Característica Descripción
Psicología forense
Clínicas de fertilidad
Informatizado
en el CET-R
2
Valoración general
Adaptación -- --
Fiabilidad: equivalencia -- --
Fiabilidad: TRI -- --
Fiabilidad inter-jueces -- --
Baremos e interpretación de
Excelente 5
puntuaciones
3
Comentarios generales
El CTC-R ofrece la opción de administrarse tanto mediante lápiz y papel como mediante internet, lo
que se considera positivo desde el punto de vista de la accesibilidad. La información del manual
sobre las instrucciones de aplicación de la prueba es muy detallada y clara. Los materiales resultan
atractivos y bien estructurados para quien responde el test, aunque en soporte lápiz y papel el
cuadernillo de preguntas y la hoja de respuestas se presentan de forma separada. El manual
también aporta información muy detallada para ayudar a la interpretación de los resultados,
incluyendo la posibilidad de disponer de un informe narrativo automatizado. La administración y
corrección a través de la plataforma informática permite reducir los potenciales errores de
corrección.
El manual aporta diferentes fuentes de evidencias de validez. En cuanto a las evidencias referidas
al contenido, la experiencia de los autores, junto con el minucioso proceso de creación y
depuración de los ítems, constituye una valiosa fuente de validez. Respecto a las evidencias
basadas en la relación con variables externas, se muestran dos tipos de estudios. Primero, en cuanto
a las evidencias convergente y discriminante, se valora positivamente que se aporten datos de siete
estudios con diferentes instrumentos que evalúan personalidad, competencias o psicopatología, en
muestras de diferente tamaño, aunque sería recomendable aportar algún dato sobre su calidad
psicométrica en la muestra de cada estudio ([Link]., coeficiente de consistencia interna) e hipótesis
claras sobre la dirección y magnitud de la correlación con las puntuaciones del CTC-R. Segundo,
en los estudios de diferencias entre grupos, se utilizan muestras en las que “a priori” se ha asumido
que el grado de deseabilidad social de los diferentes grupos en contextos competitivos o que
pueden suponer un beneficio personal es superior al nivel estándar del grupo de población general.
Convendría ampliar esta sección con la realización de estudios que relacionen las puntuaciones del
CTC-R con criterios externos relevantes a nivel organizacional, clínico y/o forense ([Link]., rendimiento,
diagnóstico, idoneidad, etc.). Las evidencias de validez basadas en la estructura interna del CTC-R
dan soporte empírico al uso tanto de las puntuaciones de las 10 escalas clínicas como de la
puntuación total (Índice de Patología General), y los resultados del análisis del funcionamiento
diferencial de los ítems garantizan que la evaluación de hombres y mujeres está libre de sesgo, lo
que es especialmente relevante en un proceso de selección de personal.
4
a la premisa de que el diferente contexto de evaluación comporta diferentes grados de
deseabilidad social en las respuestas, los 5 baremos se han establecido a partir de las diferencias
observadas entre la población general y los cuatro restantes. Un punto fuerte es que las muestras
de tipificación van actualizándose y, en consecuencia, se dispone de los datos vigentes
correspondientes a cada momento de actualización (consultables a través del sistema informático
TEAcorrige).
En definitiva, las propiedades psicométricas del CTC-R son satisfactorias y avalan el uso previsto de
sus puntuaciones.
5
ANÁLISIS DETALLADO DE LA PRUEBA
--
--
--
2010 (CTC)
--
2022 (CTC-R)
6
1.11. Breve descripción de la/s variable/s que pretende medir el test:
El CTC-R es un test que persigue evaluar la gravedad de distintos síntomas clínicos y características de
personalidad que generan malestar, incapacidad o una respuesta desadaptativa en distintas esferas
de la vida, como la personal o la laboral. Está destinado a población adulta. Puede utilizarse en diversos
contextos, como son la práctica clínica y sanitaria, el peritaje forense y la selección de personal.
Consta de 10 escalas clínicas o de contenido, dos escalas para el control del sesgo de respuesta y un
indicador general de patología.
Las escalas clínicas ofrecen un perfil detallado de la presencia e intensidad de la sintomatología clínica
subyacente a determinadas afectaciones psicopatológicas. Estas escalas son: Preocupación por la
salud (SAL), Ideación paranoide (PAR), Psicoticismo (PSI), Depresión (DEP), Límite (LIM), Hostilidad (HOS),
Consumo de alcohol y sustancias (ALC), Impulsividad (IMP), Ansiedad (ANS) y Vulnerabilidad (VUL).
Por su lado, las escalas de control permiten valorar la validez del protocolo de evaluación, indicando,
por un lado, si la persona ha prestado la suficiente atención a la hora de contestar o lo ha hecho de
forma aleatoria (inconsistencia, INC) y, por otro lado, si ha tratado de ofrecer consciente o
inconscientemente una imagen positiva o negativa sobre sí misma (deseabilidad social, DS).
Finalmente, el índice de patología general (IPG) ofrece un resumen de las escalas clínicas y proporciona
una visión general sobre el grado de patología y afectación del individuo.
Psicología clínica, Psicología forense, Psicología del trabajo y las organizaciones, Psicología del tráfico
(EP), Clínicas de fertilidad.
Índice de patología general (IPG): 96 ítems de las 10 escalas clínicas, asumiendo que cada ítem
contribuye a la puntuación de una única escala clínica.
1.15. Soporte:
1.16. Cualificación requerida para el uso del test de acuerdo con la documentación aportada:
Nivel B
7
Aunque no existen requisitos específicos sobre el nivel educativo, en la descripción de la muestra de
validación en población general española, se establece el siguiente criterio de inclusión: poseer el
suficiente nivel de comprensión lectora y de competencia en español para comprender las instrucciones
y el contenido de los ítems.
1.20. Puntuaciones:
El CTC-R ofrece un total de 13 puntuaciones: una puntuación para cada una de las 10 escalas clínicas,
una para el índice de patología general (IPG) y una puntuación para cada una de las 2 escalas de
control. En cuanto a las escalas clínicas y el IPG, puntuaciones más elevadas son indicativas de mayor
gravedad sintomatológica. En las escalas de control, puntuaciones más elevadas en la escala de
inconsistencia (INC) indican mayor nivel de inconsistencia en las respuestas que ha dado la persona. Del
mismo modo, en la escala de deseabilidad social (DS), puntuaciones más altas representan niveles más
elevados de deseabilidad social.
La corrección de la prueba puede llevarse a cabo (a) mediante la plataforma de corrección de test por
internet de Hogrefe TEA Ediciones (TEAcorrige) o (b) de forma mecanizada, en el que la persona a cargo
de la evaluación envía las hojas de respuesta a Hogrefe TEA Ediciones. En ambos casos, es el propio
sistema el que, según el baremo escogido, calcula automáticamente las puntuaciones (puntuaciones
directas y puntuaciones T), ofrece el perfil de resultados y, opcionalmente, un informe narrativo. En este
sentido, se desconoce la dirección de los ítems (directos o inversos), a qué escala pertenece cada ítem
y cómo se obtiene la puntuación de cada escala (suma directa, suma ponderada, promedio, etc.).
Se ofrecen directrices precisas sobre el procedimiento a seguir cuando la persona ha anotado más de
una respuesta a un mismo ítem (se anula el ítem) o ante la presencia de omisiones (para una omisión en
una escala concreta, se reemplaza la omisión por el valor promedio de esa persona en la escala, y para
más de una omisión en una escala concreta o más de 10 en el conjunto del test, se anula la escala o el
test, respectivamente).
También se puede disponer de un informe narrativo automatizado. Al inicio del informe se presentan
8
unas consideraciones previas que hay que tener en cuenta cuando se interpretan las puntuaciones del
CTC-R de un individuo particular. Seguidamente, se presenta una interpretación cualitativa de los
resultados de la persona evaluada divididos en tres secciones diferenciadas: (1) validez de la prueba,
centrada en las escalas de control (INC y DS); (2) índice de patología general (IPG); y (3) perfil general
en las escalas clínicas, donde la puntuación de cada escala se sitúa en una zona (estándar, alta o muy
alta) según umbrales o criterios estadísticos prestablecidos.
Manual. Cuadernillo, hoja de respuestas y clave de acceso para la aplicación y corrección por internet.
100,72€ (IVA incluido) por un juego completo (manual, 10 cuadernillos y kit de corrección de 25 usos).
Fecha de consulta: 16/01/2023.
43,55€ (IVA incluido) por el kit de corrección con 25 hojas de respuestas y 25 PINs de corrección. Fecha
de consulta: 16/01/2023.
1.28. Precio de la administración y/o corrección, y/o elaboración de informes por parte del editor:
6,41€ (IVA incluido) por una aplicación y corrección online; 7,71€ IVA incluido) por el informe (que no
incluye ni aplicación ni corrección del test); y 14,40€ IVA incluido) por una aplicación, corrección e
informe online. Fecha de consulta: 16/01/2023.
9
2. VALORACIÓN DE LAS CARACTERÍSTICAS DEL TEST
10
2.11. Validez:
2.11.2. Evidencias de validez basadas en la relación entre las puntuaciones del test y otras variables:
[Link]. Evidencias de validez basadas en la relación entre las puntuaciones del test y otras variables:
11
[Link].8. Resultados de las diferencias
Buena 4
intergrupo
[Link]. Evidencias de validez basadas en la relación entre las puntuaciones del test y un criterio:
12
2.11.5. Comentarios generales sobre evidencias de validez:
A efectos de la validación del CTC-R, en el manual se describen detalladamente las
características de las muestras provenientes de cada uno de los 5 contextos de evaluación:
población general (n= 1008), selección de personal (n= 15214), cuerpos de seguridad (n =
11653), contexto forense (n= 454) y donantes de gametos (n= 1340).
El CTC-R es una versión revisada del CTC original. En el manual del CTC-R se presenta una
descripción del proceso de construcción del CTC, que incluye (1) la delimitación de las
facetas a incluir a partir de la revisión de diversos instrumentos ya existentes y de los manuales
de trastornos mentales de referencia; (2) la redacción y depuración inicial de los ítems
atendiendo a su relevancia, representatividad y claridad por parte de los autores del CTC; y
(3) dos depuraciones sucesivas, ambas en base a criterios estadísticos ([Link]., índice de
homogeneidad corregido), a partir de los datos recogidos en un primer estudio piloto con una
muestra pequeña y otro estudio posterior con una muestra muy amplia de la población diana.
La revisión del CTC que dio lugar al nuevo CTC-R se fundamentó en los siguientes aspectos:
(1) se refinó el redactado de algunos ítems en base a la consulta a personas usuarias del CTC,
para resolver problemas de vocabulario, comprensión, redacción, modismos, lenguaje
ofensivo o elementos redundantes, llegando a eliminar algunos ítems problemáticos; (2) se
eliminaron algunos ítems por presentar valores bajos de correlación ítem-total corregido; (3)
se eliminó la escala de Neuroticismo por su solapamiento con las escalas de Depresión (DEP)
y Ansiedad (ANS); (4) se renombraron algunas escalas para ajustarse mejor al contenido
específico de sus ítems; (5) se modificaron las escalas de control, manteniendo una única
escala de deseabilidad social (resultante de fusionar ítems de dos escalas anteriores) y
creando una nueva escala de inconsistencia. Aunque no se ha consultado a especialistas
externos acerca de la representación del contenido del CTC-R, la experiencia de los autores,
junto con el minucioso proceso de creación y depuración de ítems, constituye una evidencia
de validez referida al contenido.
Además de las correlaciones del CTC-R con otros instrumentos, en el manual se aportan los
resultados del análisis de las diferencias en el CTC-R en función del contexto de evaluación.
Concretamente, se compara las puntuaciones de la población general con cuatro grupos
provenientes de contextos competitivos y/o que implican un beneficio personal (selección de
personal, cuerpos de seguridad, contexto forense y donación de gametos). Cada una de las
submuestras utilizadas tiene un tamaño moderado (328 participantes por grupo), cuyos casos
se seleccionaron aleatoriamente de las 5 muestras de validación equilibrando el porcentaje
de casos de cada sexo dentro de cada muestra. Con tamaños del efecto entre medianos y
grandes (g de Hedges entre 0.65 y 1.16), los resultados muestran que existen niveles más
elevados de sintomatología en la población general en comparación con los demás
contextos. Los autores del CTC-R atribuyen estas diferencias al hecho de que, en contextos
competitivos y/o que suponen un beneficio personal, las personas tienden a infraestimar su
13
sintomatología clínica al pensar en las posibles consecuencias que puedan tener ([Link].,
conseguir o no un puesto de trabajo). Esta explicación concuerda con las puntuaciones
obtenidas en la escala de deseabilidad social (DS), donde la población general es la muestra
con puntuaciones más bajas. Estos resultados, en conjunto, apoyan la utilización de 5 baremos
diferenciados en función del contexto de evaluación y aportan evidencias de validez a favor
del uso del CTC-R. Finalmente, también se muestra la comparación entre las puntuaciones T
que resultan de aplicar cada uno de los 5 baremos en una muestra de conveniencia de 100
personas en un contexto de tramitación del permiso de conducir, que lleva a plantear que el
baremo más conveniente para este grupo es el del contexto forense.
Por último, en el caso de las dos escalas de control, se aportan algunas evidencias de validez.
Para la escala de inconsistencia (INC), se establece un punto de corte a partir de la
sensibilidad y la especificidad obtenidas al comparar las puntuaciones T observadas en los
grupos de población general y de selección de personal con puntuaciones generadas
aleatoriamente. Y para la escala de deseabilidad social (DS), se evalúa si la puntuación
discrimina entre los diferentes grupos según el contexto de evaluación y, aunque no son
variables externas al test, se obtiene la correlación con cada escala clínica y con el índice de
psicopatología general (IPG).
Sobre las evidencias basadas en las relaciones entre las puntuaciones del CTC-R y una
variable criterio, sería interesante diseñar estudios con criterios externos relevantes a nivel
organizacional, clínico y/o forense ([Link]., rendimiento, diagnóstico, idoneidad, etc.).
Se aportan evidencias de la estructura interna del test a través de la aplicación del análisis
factorial exploratorio (AFE) con dos aproximaciones diferentes. Por un lado, además de la
obtención del índice de discriminación mediante la correlación ítem-total corregido, el
análisis de ítems plantea un AFE unidimensional de cada una de las 10 escalas clínicas en las
5 muestras según el contexto de aplicación. Se utiliza el estimador WLSMV, acorde con el
formato de respuesta de los ítems. Los resultados a nivel de magnitud de las saturaciones
factoriales e índices de ajuste son satisfactorios prácticamente en la totalidad de los casos.
Por otro lado, se presentan los resultados de varios AFEs, uno por cada muestra de validación,
con el método de estimación ULS acorde con la falta de normalidad de la distribución de las
medidas, usando las puntaciones de las 10 escalas clínicas como variables observadas.
Aunque no se menciona que se hayan verificado las condiciones de aplicación (medida KMO
y/o prueba de esfericidad de Bartlett), la matriz de intercorrelaciones entre escalas que se
proporciona para dos de las muestras, con valores mayormente altos, parece indicar que es
pertinente realizar el análisis factorial. Como criterio para determinar el número de
dimensiones se ha usado una variante del análisis paralelo. Todos los análisis aconsejaron una
dimensión general a extraer. El porcentaje de varianza explicada por la solución
unidimensional (53-73%), junto con las elevadas cargas factoriales, apoyaría la existencia de
un único factor de segundo orden: el índice de patología general (IPG). Adicionalmente, se
estudia el funcionamiento diferencial de los ítems (DIF, de sus siglas en inglés) (comunicación
personal, 2023) tomando el sexo como variable de agrupación (varones vs. mujeres). El DIF se
estudia separadamente en la muestra de población general y la muestra de selección de
personal, ambas de tamaño muestral elevado. Se aplican los procedimientos POLYSIBTEST,
regresión logística ordinal y Mantel, y se obtienen las correspondientes medidas del tamaño
del efecto. Los resultados son muy satisfactorios, encontrándose un porcentaje muy bajo de
ítems con DIF en ambas muestras (4.5% y 0.9%, respectivamente, para la muestra de
población general y de selección de personal).
14
2.12. Fiabilidad:
15
2.12.5. Cuantificación de la precisión mediante TRI:
16
2.13. Baremación e interpretación de las puntuaciones:
Amplio rango de
baremos en función de
la edad, el sexo, el nivel
[Link]. Calidad de las normas 5
cultural y otras
características
relevantes
17
características sociodemográficas de la muestra
(Media edad= 37.2, DT = 7.9; 91% hombres).
Muestra del contexto forense (n= 454): Para
recopilar la muestra evaluada en un contexto
forense, se contó con la colaboración de 61
profesionales que incluyeron durante unos meses el
CTC entre sus herramientas de peritaje. A pesar de
que no se especifica el procedimiento de
selección de la muestra, se indica que se
descartaron los casos en los que la evaluación
tuviera la finalidad de determinar una lesión o
secuela psíquica. Se describen las principales
características sociodemográficas de la muestra
(Media edad= 40.0, DT= 7.9; 64% hombres; 49% sin
estudios).
Muestra de donantes de gametos (n= 1340): No se
especifica el procedimiento de selección de la
muestra. Se describen las principales
características demográficas (Media edad= 24.6,
DT= 4.5; 86% mujeres).
Excelente (menos de 10
[Link]. Actualización de baremos 5
años)
18
donación de gametos), como no competitivos (población general). Las muestras utilizadas
oscilan entre 454 y 11653 participantes y, en promedio, son muy grandes (promedio por
baremo de casi 3600 participantes). Si bien el muestreo no ha sido aleatorio, en la composición
de la mayoría de las muestras se ha procurado que queden representadas diferentes
características sociodemográficas relevantes (edad, nivel educativo, sexo y, para la muestra
de población general, también la zona geográfica a partir de datos censales). Los autores
justifican los diferentes baremos en base a las diferencias de las puntuaciones entre los grupos
considerados según la finalidad de la evaluación.
19