La teoría clásica de los test (TCT) aparece por primera vez en el siglo XX a
partir del trabajo de Spearman. Puede, de alguna manera, considerarse como el
inicio de la psicometría. La palabra test es una palabra inglesa aceptada por la
Real Academia Española (RAE) y hace referencia a las pruebas destinadas a
evaluar conocimientos, aptitudes o funciones.
En psicología, los test son pruebas de carácter psicológico o psicotécnico para
estudiar o evaluar una función. Así, los test psicológicos son herramientas
diseñadas para evaluar o medir las características psicológicas de un sujeto.
¿Para qué se necesitan teorías de los test?
Los test son instrumentos sofisticados de medida que, en muchos casos,
constituyen una ayuda de incalculable valor en el contexto de una
evaluación psicológica. Para que esto sea así el test debe cumplir unos mínimos
psicométricos y el especialista que lo pasa debe conocer el protocolo de
administración y respetarlo.
Por otro lado, las teorías de los test nos hablan de cómo podemos evaluar la
calidad de un test y también, en muchos casos, de cómo podemos depurar el
instrumento para reducir el error al mínimo. En este sentido, quizás los dos
conceptos más importantes dentro de la teoría clásica de los test son los de
fiabilidad y validez.
La fiabilidad se entiende como la consistencia o estabilidad de las medidas
cuando el proceso de medición se repite. En el fondo hablamos de una utopía
porque en la práctica es imposible replicar las mismas condiciones en dos
mediciones distintas. Será relativamente sencillo actuar sobre variables externas,
como controlar que exista una temperatura parecida o un nivel de ruido similar; sin
embargo, controlar las variables internas de la persona que hace el test será más
complicado. Pensemos en el estado de ánimo, por ejemplo.
La validez se refiere al grado en que la evidencia empírica y la teoría apoyan
la interpretación de las puntuaciones de los test. (2) De otra manera,
podríamos decir que la validez es la capacidad que tiene un instrumento de
medida para cuantificar de forma significativa y adecuada el rasgo para cuya
medición ha sido diseñado.
Así, existen dos grandes teorías a la hora de construir y analizar los test. La
primera, de la que hablamos es la teoría clásica de los test (TCT). La segunda es
la teoría de respuesta a los ítems (TRI). A continuación presentamos los aspectos
clave de la TCT.
La teoría clásica de los test
Este enfoque tiende a ser el más utilizado en el análisis y construcción de los test.
Las respuestas dadas por una persona en un test son comparadas a través
de métodos estadísticos o cualitativos con las respuestas de otros individuos
que complementaron el mismo test. Ello permite realizar una clasificación.
Sin embargo, realizar esta clasificación no es tan sencillo. El psicólogo, como
cualquier otro profesional, tiene que asegurarse de que el instrumento que utiliza
mide con precisión, con poco error. (1)
Así, cuando un psicólogo aplica un test a una o varias personas, lo que obtiene
son las puntuaciones empíricas que esa persona o personas obtienen en el test.
Sin embargo, ello no nos informa sobre el grado de precisión de esas
puntuaciones: No sabemos si esas puntuaciones empíricas se corresponden o
no con las puntuaciones que verdaderamente le corresponden a esa persona en la
prueba.
Por ejemplo, podría ocurrir que las puntuaciones estuviesen rebajadas debido a
que ese día la persona examinada no se encontraba bien. O incluso porque las
condiciones físicas en las que se desarrolló la aplicación de la prueba no eran las
mejores.
«Los psicólogos, como les ocurre a los que construyen aparatos dispensadores de
gasolina, estamos obligados a garantizar que las puntuaciones de nuestros test
sean precisas, tengan poco error…».
-José Muñiz, 2010-
El modelo lineal clásico
Es a principios de siglo XX, como bien hemos comentado, cuando Spearman
propone esta teoría clásica de los test. El investigador propone un modelo muy
simple para las puntuaciones de las personas en los test: El modelo lineal
clásico.
Este modelo consiste en asumir que la puntuación que una persona obtiene
en un test, que denominamos su puntuación empírica,y que suele designarse
con la letra X, está formada por dos componentes. El primero, es la puntuación
verdadera (V) y el segundo el error (e). Este último puede ser debido a muchas
causas que no podemos controlar. Es por eso que la TCT se ocupa de determinar
precisamente el error de medición.
Esto podría expresarse de la siguiente manera: X = V + e
Así, tras esto, Spearman añade tres supuestos al modelo.
Los tres supuestos del modelo clásico
La puntuación verdadera (V) es la esperanza matemática de la puntuación
empírica. Se escribiría así: V = E(X).
o Así, se define la puntuación verdadera de una persona en un test como aquella
puntuación que obtendría como media si se le pasase infinitas veces el mismo
test.
No existe relación entre la cuantía de puntuaciones verdaderas y el tamaño
de los errores que afectan a estas puntuaciones. Puede expresarse: r(v, e) = 0
o El valor de la puntuación verdadera es independiente del error de medición.
Los errores de medida en un test concreto no están relacionados con los
errores de medida en otro test diferente. Esto se expresa: r(ej, ek)=0
o Los errores cometidos en una ocasión no covarían con los cometidos en otra
ocasión.
La teoría clásica de los test es sencilla, no se necesita un conocimiento
matemático avanzado para ponerla en práctica y se puede aplicar en cualquier
contexto. El problema es que los resultados que nos aporta siempre van a estar
ligados a la población en la que el test ha sido validado. Además, en muchos
casos los mínimos que exige a los test para ser considerados como
aceptables en realidad no son suficientes.