Introducción de la Psicometría
TEMA 1. INTRODUCCIÓN A LA PSICOMETRÍA
1.1. El proceso de inferencia psicométrica
Los tests se encuentran en nuestro entorno habitual, todos hemos respondido a alguno
en un momento dado de nuestra vida. Y desde el punto de vista de la especialización de
un psicólogo o psicóloga, sea cual sea ésta (clínica, organizaciones, educativa…) se
hará uso de instrumentos que permitan obtener medidas de las características
psicológicas de su interés (inteligencia, rasgos de personalidad, actitudes…). Debemos
comprender cómo se obtienen las puntuaciones de los tests, dado que sus resultados se
aplican a decisiones importantes en nuestra vida (clasificaciones escolares, admisión a
centros académicos y laborales, promociones…). La psicometría es la disciplina que se
Gran importancia
para el avance de ocupa de la medición de las variables psicológicas y el estudiantado de Psicología debe
la Psicología
tener un dominio de la misma. Así, el psicólogo o psicóloga podrá elegir
adecuadamente entre los instrumentos disponibles teniendo en cuenta lo bueno que es
un instrumento para el propósito que se pretende que cumpla; hará un uso correcto de
las pruebas, podrá interpretar adecuadamente las puntuaciones obtenidas con ellas al
conocer los modelos y supuestos en los que se basan, conocerá las limitaciones que
presentan, etc.
El término Psicometría, neologismo griego que hace referencia a la medida de la
psique, fue utilizado en un principio más como un adjetivo que como un sustantivo. Se
han dado muchas definiciones a lo largo de los años, y recogemos aquí la de Martínez
Arias (1995):
La denominación Psicometría aglutina todo el conjunto de modelos
TEÓRICA: Fundamenta formales que posibilitan la medición de variables psicológicas,
la medición
APLICADA: Permite el centrándose en las condiciones que permiten llevar a cabo el proceso de
desarrollo de
instrumentos
medición en psicología y en establecer las bases para que estos procesos
se realicen de forma adecuada.
El conjunto de enunciados que constituyen el cuerpo teórico de fundamentación,
explicación y desarrollo de la medición en psicología, es a lo que se refiere la teoría
psicométrica. Esta expresión, teoría psicométrica, adquirió importancia a partir de 1967
cuando Nunnally la utilizó como título de su libro. Y otro autor, Campbell (1976, pag.
1
Introducción de la Psicometría
185), cuando se pregunta qué es la teoría psicométrica, explica: podría incluir tópicos
como teoría de la fiabilidad, modelos de validez, estrategias de predicción, teoría de la
utilidad, teoría escalamiento, construcción de tests, modelos de respuesta al ítem y de
rasgo latente, conjuntos de respuesta y estilos de respuesta. Para cubrir todo esto
saldríamos de los límites enseguida, y por ello hay que seleccionar. La razón de la
existencia de la teoría psicométrica es el hecho obvio de que las medidas de muchas
características humanas importantes no están libres de error y las relaciones de estas
características con otras variables importantes no son perfectas. Para tratar con estos
problemas, se necesita alguna teoría o modelo para ayudar a especificar la cantidad o
clase de incertidumbre que está presente y el nivel de explicación y predicción que es
La parte instrumental de la teoría psicométrica se llama APLICACIÓN PSICOMÉTRICA, que se basa en
posible. la elaboración y evaluación de instrumentos; y adecua el uso y la interpretación de estos instrumentos
La teoría psicométrica se basa en una fundamentación matemática y estadística.
Esto es, las teorías psicométricas y los métodos psicométricos están escritos en un
lenguaje matemático y estadístico. Este lenguaje es importante, porque la estatura de
una ciencia se mide habitualmente por el grado en que hace uso de las matemáticas.
El objetivo de la psicometría es desarrollar modelos, principalmente de índole
cuantitativa, para la transformación de los hechos en datos y, fundamentalmente,
proporcionar métodos idóneos para la aplicación de esos modelos, con objeto de asignar
valores numéricos generalmente a los sujetos, sobre la base de sus respuestas, y/o a los
estímulos presentes en la situación (Cliff, 1973).
La diferenciación que acabamos de mencionar entre sujetos y/o estímulos
sustenta la doble óptica desde la que se puede contemplar la psicometría, según su
objetivo sea:
a) la cuantificación de las diferencias individuales de los sujetos en atributos y/o
conductas
b) la cuantificación de las propiedades de los estímulos
Durante mucho tiempo, lo que se ha conocido propiamente como psicometría,
corresponde a la primera óptica, es decir, la construcción de instrumentos que sirvieran
para la asignación de números a atributos o conductas de las personas. La segunda
óptica, la construcción de procedimientos para la medición de estímulos, se ha conocido
como Escalamiento. y generan normas para la interpretación
2
Introducción de la Psicometría
Los constructos que intenta medir un test pueden ser muy variados: actitudes,
personalidad, aptitudes… pero no son directamente observables, tenemos que
acercarnos a ellos mediante indicadores: las conductas observables recogidas en
instrumentos estandarizados (los tests). La idea es resumir esas conductas observables
en algún tipo de puntuación. Suponemos que las cantidades observadas reflejan de
alguna manera la cantidad en la que el individuo posee la propiedad medida, pero no
podemos asumir que dicha cantidad refleje la “verdadera” cantidad. El azar, en forma de
errores aleatorios, juega un papel importante en estas asignaciones numéricas y el
proceso de medición se convierte en un proceso inferencial.
MODELO
PSICOLÓGICO
TEORÍA DE
TESTS
MODELO
PSICOMÉTRICO
MEDICIÓN
MODELO DE
MEDIDA
ESCALAMIENTO
Las personas responden a una serie de tareas (tests, observaciones,
entrevistas…). Estas respuestas reciben una puntuación numérica por medio de un Módelos de medida
proceso de escalamiento. El grado en que la puntuación observada represente a la
Modelos
psicométricos
verdadera será la fiabilidad del instrumento. Pero el test se ha construido con un
objetivo, hemos de comprobar que las inferencias que hagamos con las puntuaciones Validez de las
inferencias
son acordes con él; es el terreno de la validez.
Para hacer adecuadamente la cadena de inferencias de la figura anterior, hay que
apoyarse en la teoría psicométrica. El modelo psicométrico es el que nos permite
3
Introducción de la Psicometría
conectar las puntuaciones con el constructo. Este modelo es el que establece una serie
de principios que garantizarán que las inferencias sean adecuadas. Para relacionar las
conductas observadas o respuestas con los constructos, usamos modelos, modelos de
medida. Son modelos matemáticos en los que los constructos se combinan
numéricamente para predecir de manera adecuada la respuesta de los individuos. Los
modelos de medida proporcionan reglas formales explícitas de cómo integrar las
distintas piezas de información que pueden ser relevantes para una inferencia particular.
La Teoría Clásica de los Tests ha sido el modelo utilizado durante muchos años, aunque
Un CONSTRUCTO es una característica
existen otros. Los veremos en temas posteriores. que no es directamente observable que
esta representado por variables latentes en
los modelos de media
¿Existen realmente los constructos? Pues tienen la misma precisión o falta de
precisión que algunos fenómenos que tienen algo en común. El constructo identifica qué
cosa o cosas tienen en común. Las variables latentes son las representaciones de los
constructos en los modelos de medida. Cuando se selecciona o diseña un constructo,
hay que seguir cuatro pasos:
1. Obtener el significado del constructo
2. Identificar las dimensiones y variables latentes para representarlo
3. Establecer medidas
4. Especificar la relación entre las medidas y las variables latentes
El primero se lleva a cabo desarrollando una definición teórica. Una definición teórica
explica en términos tan simples y precisos como sea posible el significado de un
constructo. Realiza varias funciones útiles: una es que una definición teórica asocia un
término y un constructo detallando la denotación específica asignada a un término; otra
es que clarifica las dimensiones de un constructo, que son los distintos aspectos del
constructo. Hay componentes que no se pueden dividir con facilidad en componentes
adicionales. Como muchos constructos tienen muchas posibles dimensiones, es
especialmente importante una definición para reunir el límite sobre las dimensiones que
selecciona el investigador. Una tercera función útil es que una definición teórica
proporciona guías en la selección de medidas. Si diseñamos cuestionarios, exámenes,
etc., necesitamos conocer los fenómenos que están recogidos o excluidos por un
constructo. Esto puede ayudarnos a evaluar si una medida es válida.
El siguiente paso es establecer medidas dependiendo de la definición teórica. A
veces nos referimos a este paso como la definición operacional: describe los
4
Introducción de la Psicometría
procedimientos a seguir para establecer medidas de la(s) variable latente que representa
un constructo. En algunas situaciones, las variables latentes se operacionalizan como
respuestas a cuestionarios, otras, están basadas en estadísticos (por ejemplo, censos).
Virtualmente todas las medidas que empleamos contienen errores. Es tarea del
último paso en la medición formalizar esos tipos de error construyendo el modelo de
medida. Un modelo de medida especifica un modelo estructural que conecta las
variables latentes con una o más medidas o variables observadas. La variable latente es
la representación formal de un constructo. El modelo de medida describe la relación
entre la medida y las variables latentes, relación que se puede escribir en forma de
ecuación.
La siguiente figura, adaptada por Martínez Arias de Torgerson, lo representa:
Constructos teóricos
C1 C’1
C5
C’2
C2
Conductas C’3
C3
observables C6
C4
C’4
Los constructos
Los constructos están relacionados entre sí de forma teórica. Lord y Novick nombraron teóricos, a su vez,
están conectados
las relaciones que se observan: los constructos se relacionan entre sí por medio de sistemáticamente
con fenómenos
directamente
definiciones sintácticas, y con los fenómenos observables por medio de definiciones observables
semánticas. Las primeras constituyen el sistema lógico de la teoría, permiten deducir las
propiedades de los constructos.
La medida comienza con un procedimiento para identificar los elementos del
mundo real con elementos del sistema lógico por medio de una definición semántica
precisa. Después, se procede a la medición, para lo cual:
5
Introducción de la Psicometría
1. Identificar el objeto a medir
2. Identificar la propiedad a medir y el instrumento
3. Aplicar una regla de asignación numérica por la que se asigna un número a la
propiedad de lo que se está midiendo
Principios del modelo psicométrico.
Los principios del modelo psicométrico que garantizan la calidad de las medidas son
(Mislevy et al. 2003): fiabilidad, validez, comparabilidad y equidad o ausencia de
sesgos discriminatorios. Lo vamos a ver en temas posteriores, pero avanzamos:
Fiabilidad. Este principio tiene que ver con los errores cometidos en el proceso de
medición e intenta responder al problema de hasta qué punto las cantidades observadas
reflejan con precisión la puntuación verdadera.
Validez. Es el más importante, y se centra en el grado en que el uso de las puntuaciones
que pretendemos hacer está justificado.
Comparabilidad. Muchas veces la recogida de datos se hace sobre distintas personas o
sobre las mismas pero en diferentes momentos. Esto hace que distintas condiciones de
medida puedan hacer surgir distintas hipótesis a la hora de comparar. Se trata de
eliminar explicaciones alternativas.
Equidad. Se trata de comprobar explicaciones alternativas de los resultados que puedan
estar relacionados con factores como diferencias sociodemográficas, historia personal,
lenguaje, etc. Dado que un mismo instrumento de aplica a muchas personas, hay que
examinar estos factores. Realmente es un aspecto más de la validez.
1.2. Contextualización histórica
Podemos encontrar antecedente anecdóticos muy tempranamente. Se atribuye a
los chinos la invención de los tests, cuando en el año 2200 a.C. un emperador decidió
evaluar la competencia de sus oficiales públicos: los puestos destacados del gobierno se
asignaban a personas que destacaban en exámenes de temas como música, equitación,
leyes civiles y escritura, los principios de Confucio y los ritos o ceremonias. Estos
exámenes se implantaron hacia el año 1370 d.C. como parte del examen para el ingreso
6
Introducción de la Psicometría
en los servicios civiles y fueron eliminados en 1905 y reemplazados por requisitos
educativos. Entre los antiguos griegos, se usaron procedimientos similares a los tests
para la evaluación del rendimiento educativo, en los dominios de destrezas físicas e
intelectuales. Francia (1791) e Inglaterra (1833) introdujeron pruebas similares a las del
sistema chino para la selección de aspirantes a los servicios civiles. EEUU también lo
hizo en 1883. Los estudiantes de las escuelas europeas eran evaluados en exámenes
orales hasta finales del siglo XII. En el XVI los jesuitas empezaron a usar tests para la
evaluación y clasificación de sus estudiantes.
De todos modos, estos es anecdótico. El uso de tests en psicología empezó a
desarrollarse en distintos frentes desde los orígenes de esta disciplina como ciencia
(1860):
- Los primeros psicólogos experimentales. Psicofísica
- Contribuciones de Galton
- Interés por la clasificación en educación. Binet
- Tests colectivos. USA alpha y beta
Historia de la Medición
1. Orígenes de la medición: Del idealismo platónico a la aproximación de
Stevens
Los orígenes de la medición se sitúan en la denominada etapa del idealismo
platónico (Jáñez, 1989) o concepción conservadora de la medición (Savage y Ehrlich,
1992) que se remonta a los filósofos griegos. Ya Pitágoras y Platón promulgaban que
todas las cosas pueden reducirse a números, es decir pueden ser cuantificadas. La idea
que subyace a esta concepción es que los objetos tienen una cierta cantidad verdadera
de la propiedad a medir (una magnitud), que puede ser representada mediante un
número (una cantidad). Aristóteles, en cambio, consideraba que no todo podía
cuantificarse, existiendo también las llamadas cualidades. Precisamente, según
Aristóteles, lo que distinguía las cualidades de las cantidades es que estas últimas se
descomponían aditivamente en partes (Michell, 1990). El criterio diferenciador era
claro: eran propiedades cuantitativas aquellas cuyas magnitudes pudieran ser 1)
ordenadas, y 2) descompuestas en partes, es decir, aquellas que presentaran una
estructura aditiva. Desde esta aproximación medir es establecer la razón entre dos
magnitudes, la que se quiere medir y la que se toma como unidad de medida.
7
Introducción de la Psicometría
Las leyes sobre la estructura aditiva de las cantidades fueron formalizadas en el
campo de la física por Hölder (1901) basándose en las ideas originales de Helmholtz
(1887). El punto de partida, al igual que en Aristóteles, fue la observación de que ciertos
atributos físicos, como la longitud, tenían la misma estructura matemática que los
números reales positivos, a saber, orden natural y adición. Puesto que los elementos a
medir poseen una cantidad del atributo de interés podemos encontrar una operación
natural empírica, °, que combine cualquier par de objetos que muestren el atributo en un
objeto compuesto que también muestre el atributo (Narens y Luce, 1986, p. 166). Si a y
b muestran cierta cantidad de atributo, el resultado de la operación a ° b también lo
mostrará. Partiendo de aquí, Hölder (1901) formula los axiomas de la cantidad. Dichos
axiomas requieren el cumplimiento de orden débil entre los elementos, una relación
monotónica, conmutativa, asociativa, positiva, arquimediana y de solubilidad limitada
(Michell, 1990; Narens y Luce, 1986) Campbell (1928) mostró cómo estos axiomas se
cumplen cuando la operación a ° b es una operación empírica de concatenación,
equivalente a la operación aritmética de la adición. El ejemplo más evidente es el de la
medida de la longitud. Si comparáramos dos varillas metálicas a de 5 cms. y b de 2,
podríamos fácilmente determinar si ambas varillas son equivalentes en su longitud
(a=b) o si una es más larga que la otra (a>b). Asimismo también podríamos poner una
varilla a continuación de la otra de manera que la operación de concatenación a ° b
daría lugar a un objeto compuesto de 7 cms de longitud. A este tipo de medidas se le ha
denominado medidas extensivas y se correspondería con lo que actualmente conocemos
como escalas de razón.
Una vez se ha demostrado la naturaleza cuantitativa de la variable de que se trate
(en el ejemplo la longitud) sólo queda determinar cual va a ser la unidad de medida que
se va a emplear y determinar la razón entre la longitud de cada objeto y esa unidad de
medida. Es decir, solo quedaría dar a la varilla más pequeña el valor de 1 y determinar
el número de veces que esa varilla “cabe” en cada una de las restantes. Una vez hecho
esto tengo dos tipos de información de la longitud de cada varilla: la que obtengo
directamente por los sentidos y la información numérica que me proporciona el proceso
de medición. ¿Y para qué he aplicado el proceso de medición? Para facilitar la
manipulación de los objetos. Si quiero saber cual será el resultados de unir la longitud
de la varilla A con la longitud de la varilla B ahora dispongo de dos procedimientos:
puedo unir empíricamente la longitud de esas dos varillas, poniendo una a continuación
de la otra, pero también puedo sumar simplemente el resultado de la medida de la
longitud de cada una de ellas. Obviamente el segundo procedimiento es más rápido, y
no implica manipulación empírica, sino operaciones aritméticas. En palabras de
Coombs la medición permite aplicar el arsenal de las matemáticas al modelado de la
realidad, yendo mucho más allá de lo que permitiría la mera manipulación de los
8
Introducción de la Psicometría
objetos.
Los primeros intentos de medición en Psicología, aunque previos al desarrollo de
los axiomas de Hölder, se basaron en esta idea de medición, según los criterios de la
física. Dichos intentos quedan personificados en la figura de Fechner y sus aportaciones
a la Psicofísica con la medida de la sensación. En 1860, Fechner, en Elementer der
Psychophysik, presentó un método para la medida de la sensación que consistía en
contar el número de diferencias apenas perceptibles que separan un determinado
estímulo de su umbral absoluto. Fechner entiende que la sensación, y la psicofísica en
general, es cuantitativa porque, al igual que la física, tiene una unidad de medida -
aunque las unidades se cuenten indirectamente a partir de la intensidad de la
estimulación-. Esta misma concepción de medición basada en los criterios de la física
guió la medidas del tiempo de reacción para cronometraje de actos mentales (Donders,
1868), la medida del aprendizaje operacionalizada como el número de ensayos
necesarios para aprender una tarea (Ebbinghauss, 1885), y la medida de las diferencias
individuales iniciada por Galton (1822-1911), para quien la discriminación sensorial
podía considerarse un signo de la capacidad para realizar juicios inteligentes.
Sin embargo, el hecho de poder contar con una “supuesta” unidad de medida no
implicaba que se cumplieran los axiomas de la cantidad necesarios para poder hablar de
medición, ya que no se podía demostrar la estructura aditiva de las sensaciones, el
aprendizaje, la inteligencia, etc. Usando una analogía ciertamente burda pero muy
explícita el miedo a volar en avión y el miedo a lo desconocido no se suman o unen
cuando voy a coger un avión para ir a un sitio nuevo, y la inteligencia del sujeto A y la
del sujeto B tampoco se suman cuando los dos juntos tratan de responder a un test de
aptitudes.
Esta problemática, no obstante, no era exclusiva de la Psicología. La física también
trataba con variables cuantitativas no extensivas, como la densidad, la velocidad o la
temperatura, las cuales fueron denominadas por Campbell (1928) propiedades
intensivas. Por ejemplo, la combinación de los líquidos de distintas temperaturas no
daría lugar a un nuevo líquido cuya temperatura fuera la suma de las temperaturas de los
dos líquidos originales. Sin embargo, no por ello se rechazó la posibilidad de medir
estas propiedades. En su lugar, Campbell amplió las posibilidades de la medición en
física al diferenciar entre la medición fundamental o directa (que requería la existencia
de una propiedad extensiva) y la medida derivada (aplicable a las propiedades
intensivas). Para él, mientras que la medida fundamental permitiría una operación física
de concatenación análoga a la adición aritmética, la segunda sería mensurable gracias a
su relación con ciertas medidas fundamentales. Por ejemplo, en el caso de la
temperatura, a través del volumen de expansión de un liquido como el mercurio.
9
Introducción de la Psicometría
Campbell (1928) amplía así el concepto de medición a la “asignación de números para
representar propiedades de sistemas materiales no numéricos en virtud de las leyes que
gobiernan esas propiedades”.
Para aclarar hasta qué punto era posible cuantificar los atributos psicológicos y la
medida en Psicología era comparable a la medida en física, en 1932 y bajo el auspicio
de la Asociación Británica para el Avance de la Ciencia (Britanic Association for the
Advancement of Science -BAAS) se constituyó un comité. Dicho comité, entre cuyos
miembros se encontraba Campbell, se centró en la posibilidad de medir las sensaciones,
en particular las sensaciones auditivas. La conclusión del comité en su informe final
(Fergurson et al., 1940) fue desesperanzadora. La medición de la sensación, y por
extensión, de los atributos psicológicos, no podía considerarse una medición científica,
ya que los atributos psicológicos no eran susceptibles de medición fundamental ni de
medición derivada. No podía establecerse una unidad de medida en ningún caso.
Tomad como ejemplo lo que sucede cuando contestáis a un examen. Un examen
puede considerarse como un test de aprovechamiento, ya que se utiliza para “medir” el
aprovechamiento que alcanzáis tras el periodo de clases. Evidentemente el
aprovechamiento es una variable cuantitativa, y puede medirse a través del número de
aciertos en el examen. Desde esta perspectiva la suma del número de aciertos será un
indicador de ese aprovechamiento. Los alumnos con mayor aprovechamiento tendrán
mayor número de aciertos que los alumnos con menor aprovechamiento. Esto es una
relación de orden. El número de aciertos permite establecer un orden entre los alumnos
en función de su nivel de aprovechamiento. ¿Permite también establecer una unidad de
medida? No. No hay ninguna garantía de que cada uno de los aciertos requiera la misma
cantidad de aprovechamiento. Algunas preguntas serán más fáciles y otras más difíciles.
Podemos puntuar el acierto a cada una de ellas con la puntuación 1, y calcular la suma
de aciertos correspondiente, pero no podemos mantener que cada acierto contiene la
misma cantidad de aprovechamiento. La asignación del valor 1 a cada una de las
respuestas correctas se realiza de forma racional, sin ninguna garantía, más bien al
contrario, con la certeza de que cada unidad que sumamos al total de aciertos contiene
diferente cantidad de aprovechamiento. Este es el problema que plantea el realizar la
asignación de puntuaciones desde criterios racionales: sumamos unidades que
algebraicamente son iguales (todas valen 1) pero que representan diferentes cantidades
del rasgo que estamos midiendo. En sentido estricto, esto no es posible porque no es
posible sumar nada que no este expresado en las mismas unidades. Pero funciona. Esta
utilidad, como veremos luego se ha tomado para justificar la medición de lo
psicológico, sin necesidad de demostrar que las variables de interés son cuantificables.
10
Introducción de la Psicometría
2. Aproximación clásica a la medición en Psicología. Las escalas de Stevens
Tras el informe final de la BAAS, el énfasis de la medición en Psicología no se puso
en intentar demostrar el carácter cuantitativo de los atributos psicológicos, sino que,
influenciado por el operacionalismo del momento, Stevens (1946, 1951, 1959) presentó
una nueva concepción de la medida. Precisamente con Stevens se inicia la que se ha
denominado aproximación clásica a la medición en Psicología.
Stevens cambia el concepto de medición, de manera que para poder medir ya no es
necesario que se cumplan los axiomas de la cantidad. Medir ya no es buscar un número
que represente una cantidad o magnitud. “Medida es la asignación de números a objetos
o sucesos según ciertas reglas” (Stevens, 1951, p. 1). Dichas reglas deben “establecer
una aplicación de las propiedades o relaciones empíricas en un modelo formal”
(Stevens, 1959, p.20).
Para medir no es necesario que los objetos reproduzcan todas las propiedades de los
números, no es necesario que se dé la concatenación empírica directa o indirectamente.
Por ejemplo, los números pueden representar la igualdad o diferencia de dos objetos
respecto de un atributo, o pueden representar relaciones de orden entre distintos objetos
u entidades. Así pues, en vez atribuir a los objetos las propiedades de los números,
podemos hacer que los números representen las relaciones que se observen entre los
objetos.
La teoría de Stevens cambió el concepto de medida. Pasó de un concepto en que la
regla de asignación de números a objetos consistía en identificar el número de veces que
la unidad de medida “cabía” en ese objeto, a un concepto liberal y flexible, en el que
medir es simplemente asignar numerales a objetos o eventos de acuerdo con una regla
(Stevens, 1946). Ahora bien, para que las inferencias realizadas a partir de los números
sean válidas, es necesario que las relaciones entre las entidades empíricas queden
adecuadamente reflejadas en las relaciones numéricas que las simbolizan. Es necesario
encontrar una regla adecuada de asignación. Stevens propuso 4 reglas que se
corresponden con las famosas 4 escalas de medida (nominal, ordinal, de intervalo y de
razón).
1.3. Tipos de medida. Niveles de medición. Estadísticos
admisibles. Criterio de utilidad.
Desde el punto de vista del procedimiento, el resultado de la aplicación de un
test a una persona es la asignación de un número, una categoría o un perfil que resume
11
Introducción de la Psicometría
el comportamiento de esa persona frente al test. Por ejemplo, un examen académico,
nos permite resumir los conocimiento de una persona en:
- Un número entre 0 y 10 (habitualmente). Dato cuantitativo.
- Un calificador (suspenso, aprobado…). Es grado o nivel. También
cuantitativo, pero sólo con característica de orden.
- Un perfil (apto/no apto). Dato cualitativo. Nominal.
Como usuarios de tests, utilizaremos los ya construidos, pero debemos
asegurarnos que se trata de tests bien calibrados para lo que queremos medir, no solo el
constructo (inteligencia, ansiedad, etc.) sino también su rango de variación. Por
ejemplo, un peso de cocina será adecuado para las cantidades para hacer un pastel
casero, pero no podemos pretender medir con él las cantidades para hacer un pastel de
un gran banquete. Bien, pues esto que parece tan sencillo, no lo es, dado que tratamos
con inobservables y medirlos no es tan sencillo. Veamos cómo ha resuelto la
psicometría este asunto.
“Hasta que un fenómeno de cualquier rama del conocimiento no ha sido sometido a
la medición y cuantificado no puede asumir el estatus y dignidad de una ciencia”
(Galton, 1879. Citado en Michell, 1990, p. 7).
“Sólo cuando se puede medir y expresar mediante números aquello de lo que se
habla, puede decirse que se conoce algo sobre ello; si no se puede medir y no se puede
expresar numéricamente, el conocimiento adquirido es pobre e insatisfactorio” (Lord
Kelvin, citado en Padilla et al., 1996, p. 36).
“El conocimiento deviene científico en la medida en que es capaz de emplear
números y mediciones” (Nietzsche, 1968, p. 378)
De éstas y otras afirmaciones análogas se desprende la importancia que tanto
científicos como filósofos han dado a la medición en la ciencia. Sólo podremos
contrastar las teorías cuando podamos medir las variables implicadas. De este modo se
pone de manifiesto la importancia que la Psicometría, como disciplina que se ocupa de
la medición de las características psicológicas, ha tenido para el desarrollo de la
Psicología como ciencia.
Que la psicología solo puede ser científica si se apoya en la medición de las
variables que investiga es algo que ya sabéis. Lo que no sabéis es por qué el tema de la
medición en psicología ha sido y sigue siendo un tema controvertido. Sabemos que la
12
Introducción de la Psicometría
forma más habitual de medir las variables psicológicas, habitualmente constructos no
observables, es mediante el uso de tests. Todos estamos habituados a oír hablar de tests:
los test psicotécnicos son actualmente de aplicación universal en las oposiciones, en la
selección de personal, etc.; los tests de inteligencia son de uso generalizado en
diferentes etapas de la educación obligatoria, así que... ¿dónde está el problema con la
medición en psicología?
Medir implica crear un modelo que permita representar las relaciones entre una
propiedad de los objetos empíricos a través de números que son asignados según ciertas
reglas. Desde la moderna teoría de la medición, dicho modelo, que se concreta en una
escala de medida, debe garantizar que las relaciones observadas en los objetos
basándose en alguna propiedad de los mismos, se representan adecuadamente a través
de las relaciones entre los números asignados a dichos objetos. Si las relaciones entre
los números representan adecuadamente las relaciones entre los objetos empíricos, las
operaciones realizadas a partir de los números nos permitirán realizar nuevas inferencias
sobre las relaciones de dichos objetos empíricos. A fin de cuentas éste es el objetivo de
la medición, contribuir al progreso en el conocimiento del mundo empírico (Jáñez,
1989). Este proceso queda representado en la figura 3.
Elaboración
Números matemática Números
Interpretación:
Medición: Codificación
Decodificación de la nueva
numérica de la información
información numérica
Información sobre la realidad Más información sobre la
realidad
Figura 3. Tomada de Jáñez, 1989
Cabe señalar que, a pesar de estar ampliamente aceptada, la definición de medición
presentada no ha estado libre de críticas ni ha permanecido invariable a lo largo de la
historia. Incluso se ha puesto en tela de juicio la utilidad y la posibilidad de medir las
variables psicológicas. Así por ejemplo, tal y como advierten Coombs et al., (1981), hay
quienes opinan que representar con números las variables psicológicas es un
13
Introducción de la Psicometría
impedimento para conocerlas, argumentando que la realidad psicológica es mucho más
rica y compleja que el conjunto de los números reales. Asimismo, de acuerdo con Jáñez
(1989), hay quienes, aun considerando posible la medición de variables como el tiempo
de reacción o número de respuestas correctas en un test, cuestionan la posibilidad de
medir variables más intangibles como la inteligencia, el neuroticismo o el dogmatismo.
¿Hasta qué punto representar relaciones es medir o cuantificar? ¿Se pueden medir
variables que no se ajustan a las leyes de las cantidades? ¿Hasta qué punto la
puntuación del test permite establecer una unidad de medida?
Definición de constructo. Un constructo es una característica que no es
directamente observable, y que por lo tanto debe ser estudiada a partir de sus
manifestaciones observables. Un ejemplo paradigmático de lo que se entiende por
constructo en psicología es la inteligencia, la introversión-extroversión, etc. Otros
términos muy utilizados para designar un constructo son los de “rasgo” y “variable
latente”.
Definición de escala o test psicométrico. Una escala o test psicométrico puede ser
definido apelando a sus características básicas: conjunto estandarizado de pruebas o
ítems, de carácter objetivo, en que la interpretación de las respuestas de los sujetos se
realiza generalmente por comparación con otras respuestas, y cuya finalidad es la de
realizar inferencias acerca de otras variables no directamente observables (rasgos o
constructos), que se supone son las responsables de las diferencias que aparecen entre
las respuestas de los sujetos. En muchos aspectos un test trata de ser un experimento
que se repite para cada sujeto al que se aplica, y como tal, cualquier aspecto ajeno que
pueda hacer variar las respuestas de los sujetos, como por ejemplo el tiempo en que
debe ser completado, debe estar adecuadamente controlado y ser el mismo para todos.
Características de la medida mediante tests o escalas. La medida mediante tests
se caracteriza por ser una medida dirigida a medir constructos psicológicos o rasgos
inobservables a través de las respuestas de los sujetos a un conjunto estandarizado de
ítems, siempre bajo el supuesto de que lo que produce las diferencias entre las
respuestas de los sujetos son precisamente esos constructos psicológicos o rasgos.
Así que comenzamos con un conjunto de respuestas (las de cada sujeto a los ítems
del test), y acabamos (si todo sale bien) con un conjunto de “medidas” (las de los
sujetos en el rasgo de interés). Pero ¿qué quiere decir eso de “si todo sale bien”? Pues
que para que esas respuestas puedan transformarse en algún tipo de medida del rasgo de
interés han de resolver tres grandes cuestiones:
1. cómo transformar las respuestas de los sujetos en puntuaciones. Estas
puntuaciones se denominan puntuaciones observadas.
14
Introducción de la Psicometría
2. cómo relacionar la puntuación observada con el rasgo correspondiente.
3. cómo comprobar que las respuestas son, efectivamente, manifestaciones de
ese rasgo.
De resolver la primera cuestión se ocupan los modelos de medida y las diferentes
teorías de la medición de las que surgen estos modelos, así como los modelos de
escalamiento (íntimamente ligados con los primeros). La segunda cuestión la resuelven
los diferentes modelos psicométricos. (De la tercera nos ocuparemos mas adelante.)
Modelos Psicométricos y Modelos de Medida. El punto de partida de cualquier
tests o escala es la cuestión de cómo transformar las respuestas de los sujetos en
puntuaciones observadas. En dicha transformación, los modelos de escalamiento y los
modelos de medida (que en muchas ocasiones se han considerado conjuntamente),
juegan un papel crucial. Los modelos de medida, a su vez, establecen las condiciones
que han de satisfacer las respuestas de los sujetos para poder representarlas
numéricamente. Los modelos de escalamiento son procedimientos operativos (basados
en un modelo matemático) que permitirán realizar la transformación de las respuestas
en números.
En este tema nos centramos en los modelos que proponen las diferentes teorías de
la medición: los modelos de medida. Son los modelos que establecen cuándo y cómo es
posible transformar las respuestas de los sujetos en puntuaciones. Los diferentes
modelos de medida proponen diferentes requisitos a la hora de determinar si una
variable puede o no expresarse numéricamente (algo que trataremos más adelante). Pero
cuando lo que se pretende es realizar operaciones aritméticas con la expresión numérica
asignada a esas respuestas, entonces hay unanimidad: la estructura de la variable que se
desee expresar numéricamente ha de ser necesariamente cuantitativa. Y esa estructura
no puede ser afirmada, debe ser comprobada empíricamente. Los modelos de medida
proporcionan el tipo de evidencia empírica que debe contrastarse para poder
comprobar la estructura cuantitativa1 de una variable.
Por su parte, los modelos psicométricos expresan matemáticamente teorías
psicométricas que establecen la relación entre la puntuación observada y el rasgo que se
pretende medir, es decir, la segunda de las tres cuestiones anteriormente expuestas.
En concreto, un modelo psicométrico expresa matemáticamente la relación entre la
puntuación observada del sujeto, que expresaremos con la letra x, y la cantidad de rasgo
que posee ese sujeto, que designaremos con la letra R (o q). Pero está claro que la
puntuación observada de un sujeto en un test no sólo depende de la cantidad de rasgo
del sujeto. También dependerá de las características del test, como lo fácil o difícil que
1
O de otra índole, según la teoría.
15
Introducción de la Psicometría
resulta (en el caso de un test de aptitudes), o el número de ítems que incluye.
Representaremos todas esas características bajo la letra c. Y también dependerá del
error de medida, que designaremos por la letra e, y que es omnipresente cualquiera que
sea la medición de la que estemos hablando. Podemos expresar todo ello de la siguiente
manera:
X=f (Rs, Cr, Em)
Pues bien, la finalidad de un modelo psicométrico es utilizar la puntuación
observada (x) para estimar la cantidad de rasgo (R) que poseen los sujetos, averiguando
también cuán precisa es esa estimación, es decir, cual es el error de medida aproximado
que afecta a esa estimación. Y todo eso únicamente partiendo de la puntuación
observada.
Resulta evidente que los modelos psicométricos aplican operaciones aritméticas
sobre las puntuaciones asignadas a las respuestas de los sujetos. Generalmente el
primer paso en la aplicación de estos modelos es el cálculo de la puntuación total en el
test como la suma de las puntuaciones a cada ítem. Y de acuerdo con lo que hemos visto
antes, esto es licito solo cuando se ha demostrado que la propiedad, rasgo o constructo
que se desea medir es de carácter cuantitativo. La conclusión lógica es que los modelos
psicométricos solo se aplican tras haber contrastado un modelo de medida que garantice
la estructura cuantitativa y que proporcione el modo de transformar las respuestas en
puntuaciones. Sin embargo esto no es así.
La mayor parte de los modelos psicométricos simplemente asumen que la variable
latente o rasgo que se pretende medir es de carácter cuantitativo, y que las respuestas de
los sujetos a los elementos del test ponen de manifiesto la cantidad de rasgo que éstos
poseen. En estos casos la forma de convertir las respuestas de los sujetos en
puntuaciones es puramente racional, asignando el valor 1 a cada uno de los aciertos en
el caso de test de aptitudes, o en el caso de tests de personalidad o actitudes, asignando
diferentes valores a los grados de acuerdo que los sujetos expresan en relación con
diferentes afirmaciones.
Esto es un contrasentido. Como Michell expone claramente: “La estructura de una
variable no puede ser determinada a priori. El único procedimiento para decidir si un
constructo/variable/atributo posee o no una estructura cuantitativa es el contraste de esa
hipótesis. Este paso esencial está ausente en el desarrollo de la Psicología moderna y
este hecho ha colocado a la medida psicológica a la defensiva” (Michell, 1990, p. 8).
¿Cómo llegamos aquí? Toda una serie de razones históricas, filosóficas y
pragmáticas explican, en el sentido que Kuhn (1957) daría a este término, que la
16
Introducción de la Psicometría
psicometría haya carecido de apoyo teórico que justifique su objetivo principal, que es
precisamente la medida de atributos psicológicos, rasgos o constructos. No podemos
entrar aquí en la exposición de todas esas razones, pero si vamos a ver la evolución que
ha experimentado la teoría de la medición, y con ella, la aproximación de la psicometría
a este problema.
Escalas de medida y operaciones empíricas
Para Stevens hay distintos tipos de relaciones u operaciones empíricas que pueden
ser representadas mediante números. En función del tipo de operaciones empíricas
distingue cuatro tipos de escalas: nominal, ordinal, de intervalo y de razón (Stevens,
1946, 1951).
La tabla 1 presentada a continuación muestra el tipo de operaciones empíricas que
caracteriza cada tipo de escala, las transformaciones que resultan admisibles en cada
una de ellas, y algunos ejemplos tanto de las propiedades características de las distintas
escalas como de los estadísticos permitidos en cada una de ellas.
Tabla 1. Las escalas de medida de Stevens
Operaciones Transformaciones Estadísticos
Ejemplos
empíricas admisibles permitidos*
Determinación
de Transformacion Género
Nominal Moda
igualdad/desigua es inyectivas Diagnóstico clínico
ldad (ej. y=-bx)
Determinación Monotónicas Dureza de los minerales
Ordinal de mayor o crecientes Grado de satisfacción Mediana
menor (ej. y=xb) laboral
Temperatura en grados
Determinación Media
y = a + bx, Celsius
Intervalo de igualdad de aritmética,
con b>0 y a¹ 0 Puntuaciones típicas de
intervalos Varianza
un test
Media
Determinación
y = bx, Altura geométrica,
Razón de igualdad de
con b>0 Tiempo de reacción Coeficiente
razones
de variación
* Los estadísticos permitidos para un determinado tipo de escala, también lo son para las
escalas superiores.
Cuando las relaciones que se pueden establecer entre los objetos empíricos son
relaciones de igualdad-desigualdad (por ejemplo el género) los números atribuidos a
17
Introducción de la Psicometría
cada objeto han de ser tales que representen o indiquen si los objetos son iguales o
diferentes. En tal caso se trataría de una escala nominal. Si además de igualdad-
desigualdad, se puede decir que un objeto posee en mayor o menor grado el atributo
medido, se tratara de una escala ordinal. En este caso, los números atribuidos a cada
objeto habrán de ser tales que representen dicha gradación u ordenación entre los
objetos. Si al comparar de dos en dos los objetos empíricos en la propiedad medida las
relaciones son tales que se puede determinar en cuántas unidades de medida un objeto
posee más o menos el atributo en cuestión, de manera que se puede determinar si la
distancia entre dos objetos es igual o no a la de otros dos objetos, se tratará de una
escala de intervalo. Un ejemplo lo encontramos en la temperatura medida en grados
Celsius o Fahrenheit. Además de decir si una temperatura es mayor o menor que otra,
podremos determinar en cuántas unidades lo es. Supongamos que aumentamos en el
mismo número de grados las temperaturas A y C de dos líquidos hasta que alcancen dos
nuevas temperaturas B y D. Podemos asignar números a las temperaturas, nA, nB, nC y
nD, de manera que nA-nB = nC-nD, es decir, de manera que se establezca una unidad de
medida al establecer la igualdad de los intervalos. Finalmente si además de existir una
unidad de medida que cuantifique las diferencias entre intervalos, podemos establecer la
igualdad o diferencia de las razones entre las cantidades de atributo presentadas por los
objetos, se tratará de una escala de razón. Esto es posible porque, a diferencia de la
escala de intervalo, existe un valor cero que implica la ausencia del atributo a medir (el
cero absoluto). En este caso, los números asignados a los objetos permitirán establecer
cuántas veces la magnitud de un objeto está contenida en el otro. Un ejemplo de este
tipo de escala es el caso de la longitud que vimos en el apartado anterior, donde la
adición aritmética de los números equivaldría a una operación empírica de
concatenación.
Junto con el tipo operaciones empíricas que crean y definen cada escala, hay otros
dos puntos importantes en la doctrina de Stevens. Por un parte, el tipo de
transformaciones que resultan admisibles en cada escala por dejarla invariante, ya que
esto daría lugar a distintas representaciones numéricas adecuadas de una misma
propiedad. Por otra, el tipo de estadísticos permitidos en cada escala que, según Stevens,
permitirán hacer inferencias válidas sobre los objetos empíricos. Veamos estas
cuestiones.
Transformaciones admisibles
El conjunto de transformaciones que dejan invariante la escala nominal es el de las
aplicaciones inyectivas o transformaciones “uno a uno” de los números asignados a los
objetos. Es decir, aquéllas que hagan corresponder a los números que eran iguales
números también iguales, y a los números que eran distintos números diferentes. Por
18
Introducción de la Psicometría
ejemplo, si para la variable “género” asignamos 0 a los varones y 1 a las mujeres,
cualquier otro par de números dejaría invariante las propiedades de la escala, con tal de
que fueran diferentes entre ellos (en este caso podríamos transformar los valores
asignados multiplicándolos por un número negativo, sumándoles un valor, elevando los
números asignados a una potencia, etc.). Por su parte, la escala ordinal queda invariante
con cualquier trasformación monotónica creciente de los números asignados a los
objetos, esto es, cualquier transformación que haga corresponder a una sucesión
ordenada de números (p.e. 1, 2, 3) otra sucesión de números cualquiera, que esté
ordenada del mismo modo (p.e. 1, 4, 9) (esta última, por ejemplo, se ha obtenido
elevando al cuadrado las puntuaciones originales). La escala de intervalo admite
cualquier transformación lineal del tipo y = a + bx (siendo b>0 y a¹0). Esta
transformación supone un cambio en el origen de la escala y en la unidad de medida.
Por ejemplo, dadas tres medidas de temperatura en grados centígrados: 0, 5 y 15, la
aplicación de la transformación lineal y=32+(9/5)x, nos permitirá obtener las
temperaturas correspondientes en grados Fahrenheit: 32, 41 y 59. En ambos casos, se
observa que la distancia entre la primera y la segunda temperatura es la mitad que la
distancia observada entre las temperaturas dos y tres. No cambian las relaciones
observadas. Finalmente por lo que se refiere a la escala de razón, ésta admite cualquier
transformación del tipo y = bx . En este caso, la escala tiene un origen natural y no
puede cambiarse. Por ejemplo, supongamos que los tiempos de reacción de tres
personas ante la presentación de un estímulo son 10, 15 y 30 milisegundos, y aplicamos
la transformación admisible y = 2 x , de manera que las nuevas puntuaciones sean 20,
30 y 60 respectivamente. En ambos casos se observa que la distancia entre el segundo y
tercer sujeto es el triple que las distancia entre el primero y el segundo. Pero además, la
puntuación asignada al sujeto tres es el doble de la asignada al sujeto dos y el triple de
la asignada al sujeto uno. Asimismo el sujeto dos tiene una puntuación 1.5 veces mayor
que la del sujeto uno. Esto se mantiene tanto con las puntuaciones originales como con
las transformadas. Esto no sucedería si se aplicara cualquier tipo de transformación
diferente de y = bx
Estadísticos permitidos
Como ya se señaló anteriormente, el propósito de realizar mediciones es hacer
inferencias acerca del mundo empírico a partir de las operaciones realizadas con los
números asignados al medir. Según Stevens, la validez de las inferencias derivadas de
las operaciones realizadas con los números depende del tipo de escala, ya que depende
del tipo de operaciones empíricas que se representan. Por ejemplo, si se trata de
representar una relación ordinal, no sería adecuado calcular una media y a partir de ella
establecer conclusiones sobre relaciones empíricas de carácter ordinal.
19
Introducción de la Psicometría
La cuestión de los estadísticos permisibles en función del tipo de escala ha
generado un gran debate y confusión en el marco de la Psicología. Mientras que algunos
autores critican la aproximación de Stevens y defienden la libertad de operar con los
números sin las constricciones del tipo de escala, otros sí conceden importancia al tipo
de escalas de medida para determinar qué tipo de operaciones estadísticas se pueden
realizar.
Críticas
La principal es que a pesar de diferenciar claramente entre el sistema empírico y el
sistema formal, Stevens no se preocupó de comprobar la existencia de las relaciones del
sistema empírico de manera independiente a la asignación de los números (Michell,
1999). Por ejemplo, una escala nominal requiere una relación que posea las propiedades
de transitividad, simetría y reflexividad. Sin embargo, Stevens nunca comprobó que los
objetos empíricos medidos a través de una escala nominal cumplieran dichas
propiedades Parafraseando a Michell (1999), asumir simplemente que una regla
consistente para asignar números a objetos permitirá representar unas determinadas
relaciones empíricas, no implica que lo haga. Se debe comprobar por observación o
experimentación que se satisfacen las propiedades requeridas, independientemente de
las asignaciones numéricas. Únicamente así los números asignados podrán representar
la relación requerida. De esto se ocupará la Teoría representacional de la medición.
Otra crítica está relacionada con los estadísticos permitidos en función de las
escalas de medida. Según esta aproximación clásica de las escalas de medida, las
relaciones que se pueden verificar en Psicología, generalmente no alcanzan el nivel de
complejidad de las escalas de razón, ni siquiera en muchas ocasiones alcanzan el nivel
de intervalo. Estas ideas propiciaron una proliferación del uso de técnicas no
paramétricas en Psicología. De hecho, no son pocos los manuales estadísticos que
abogan por el uso de procedimientos no paramétricos si las escalas son nominales u
ordinales, quedando los procedimientos paramétricos justificados únicamente si las
escalas son de intervalo o de razón (p.e. Blalock, 1979; Senders, 1958; Sharp, 1979;
Siegel, 1956; Schmidt, 1979). Sin embargo, como ya se ha señalado, estas ideas fueron
criticadas por distintos autores. Dichos autores defienden que el tipo de estadísticos
aplicables no depende del tipo de escala. Según Amón (1987, p. 34) “la experiencia
parece confirmar que podemos llegar a resultados empíricos interpretables
psicológicamente, aunque las técnicas estadísticas utilizadas no hayan sido las más
oportunas, teniendo en cuenta el nivel o escala de medida requeridos por los datos”. En
este sentido, y centrándose en la estadística inferencial, diversos estudios (e.g. Gaito,
1969; Anderson, 1961) han puesto de manifiesto que lo que importa es que se cumplan
los supuestos distribucionales de los estadísticos en cuestión, independientemente del
20
Introducción de la Psicometría
tipo de escala empleado. El debate generado y la dificultad de trabajar con escalas
superiores a la ordinal, llevaron al mismo Stevens (1968) a justificar el uso de
procedimientos de análisis propios de las escalas de intervalo o razón en escalas
inferiores, en virtud de la utilidad de los resultados obtenidos con dichos
procedimientos.
Las principales críticas a la aproximación de Stevens son superadas con el enfoque
axiomático que presentamos a continuación en forma de la teoría representacional.
Teoría Representacional de la medición
La teoría representacional de la medición está enmarcada dentro del llamado
enfoque axiomático de la medición (Krantz, et al., 1971; Suppes, Krantz, Luce y
Tversky, 1989 y Luce, Krantz, Suppes y Tversky, 1990). La lógica que subyace es la
siguiente. Entre los números se dan ciertas relaciones que son válidas aritméticamente.
Entre las propiedades de los objetos también se dan ciertas relaciones que son
verificables empíricamente. Medir requiere poner en relación ambos mundos, el
numérico y el empírico a través de un homomorfismo, de manera que las relaciones
observadas entre los objetos empíricos queden preservadas por las relaciones que se dan
entre los números. Y sólo serán válidas aquellas relaciones numéricas que sean
verificables empíricamente (Santisteban, 1990)
Si bien esta concepción de medición guarda cierta similitud con la propuesta desde
la aproximación clásica de Stevens, es más estricta, ya que asume la independencia de
los dos sistemas relacionales. Por ello, el homomorfismo que relaciona ambos sistemas
no puede obtenerse de manera automática simplemente por el hecho de tener una regla
que permita hacer asignaciones numéricas. Desde esta teoría, tener una regla de
asignación numérica no es suficiente para poder hablar de modelo de medida, es
necesario que esa regla garantice que una vez establecida la correspondencia entre
objetos y números, las manipulaciones que realicemos sobre los números representarán
adecuadamente las manipulaciones que podríamos haber realizado sobre los objetos.
Esto sólo es posible si se demuestra que existe un homomorfismo que permite
representar las relaciones observadas en el sistema empírico a partir del sistema
numérico. No es suficiente con asumir que las relaciones asumidas en el sistema
empírico se cumplen y asignar números que representen las relaciones asumidas. Hay
que comprobarlo empíricamente.
La teoría representacional se caracteriza por desarrollar una serie de axiomas que
determinan las condiciones bajo las cuales es posible encontrar el homomorfismo
buscado. Estas condiciones se ponen de manifiesto al tratar con uno de los problemas a
21
Introducción de la Psicometría
los que se enfrenta toda medición: el problema de la representación. Junto a éste, la
teoría representacional se ocupa de otros dos problemas: el de la unicidad y el de la
significación. De todos estos problemas nos ocuparemos con más profundidad en el
siguiente punto.
Problemas en la teoría representacional de la medición: representación,
unicidad y significación
1. El problema de la REPRESENTACIÓN
Sólo cuando el sistema relacional numérico y el empírico sean del mismo tipo será
posible encontrar un homomorfismo, es decir, una aplicación que conserve todas las
relaciones observadas en el sistema empírico a partir de las relaciones del sistema
numérico. Y sólo cuando exista un homomorfismo será posible la medición. La terna
formada por ambos sistemas relacionales y dicho homomorfismo constituye una escala
de medida. Sólo siguiendo la regla que marca el homomorfismo de la escala se podrá
asegurar que los números guardan entre sí relaciones análogas a las existentes entre los
objetos del sistema empírico. Así pues, el problema de la representación hace referencia
a las condiciones que deben darse en el sistema empírico para poder encontrar un
homomorfismo y poder así realizar mediciones. Estas condiciones se organizan en una
serie de axiomas. Por ejemplo, la condición de transitividad, entre otras, para medidas
ordinales es un ejemplo de estos axiomas (si A>B y B>C, entonces A>C). Sólo si esto
se comprueba empíricamente de manera independiente a los números que se pudieran
asignar con la medición, las relaciones del sistema empírico podrán representarse
mediante números. En este caso, mediante números que reflejen el orden observado.
2. El problema de la UNICIDAD.
El teorema de la representación garantiza una representación numérica del sistema
relacional empírico; sin embargo puede existir más de un conjunto de números que
permita representar adecuadamente dicho sistema. Ello implicaría encontrar una nueva
aplicación que también constituya un homomorfismo entre ambos sistemas. ¿Cómo
determinar si una nueva aplicación es un homomorfismo entre los sistemas? La
respuesta la brinda el conjunto de transformaciones que resultan admisibles para que
una nueva aplicación sea también homomorfismo entre los sistemas. Estas
transformaciones, ya consideradas por Stevens aunque sin hacer referencia explícita a la
invarianza del sistema empírico, son axiomatizadas mediante el teorema de la unicidad..
Los tipos de transformaciones que resultan admisibles para que una aplicación
constituya un homomorfismo permiten clasificar las escalas de medida.
22
Introducción de la Psicometría
Los tipos de escalas considerados son esencialmente los cuatro tipos de escalas
básicos postulados desde la aproximación clásica de Stevens. La diferencia radica en
que mientras que Stevens diferencia las escalas poniendo el énfasis en el tipo de
relaciones empíricas que representan, la teoría representacional de la medición pone el
énfasis en el tipo de transformaciones que resultan admisibles porque preservan las
relaciones empíricas establecidas. No se habla de una escala en sentido absoluto, sino de
un conjunto de escalas que son equivalentes en virtud de las transformaciones
admisibles.
Los dos problemas vistos hasta ahora, representación y unicidad, se relacionan con
el primer paso representado al principio del tema en la figura 1. Es decir, con el proceso
de asignación de un conjunto de números concretos a los objetos para representar el
sistema relacional empírico. Desde la teoría representacional de la medición, el criterio
de Stevens acerca de qué tipo de estadísticos resultan adecuados según las distintas
escalas, es sustituido por el criterio de significación (Schwager, 1991).
3. El problema de la SIGNIFICACIÓN
Este problema está ligado al tercer paso representado en la figura 1. Es decir, al
proceso de inferencia sobre el sistema relacional empírico, basándose en las
propiedades descubiertas a partir de las operaciones realizadas con el sistema relacional
numérico empleado.
Se trata de determinar si las inferencias realizadas sobre el sistema relacional
empírico a partir del numérico tienen validez. En general la teoría representacional pone
el énfasis en la validez empírica o formal de los enunciados. Para decir que un
enunciado es “significativo” o formalmente válido, su valor de verdad (es decir, que sea
verdadero o falso) no debe cambiar cuando se aplique cualquier transformación
admisible según el tipo de escala de que se trate. Es decir, cualquiera de los conjuntos
de números empleados debería llevar a los mismos resultados en la medición, a las
mismas conclusiones sobre el sistema relacional empírico (Suppes y Zinnes, 1963).
Sin embargo, la significación es un término técnico que no implica necesariamente
la utilidad teórica o práctica de un procedimiento de medida. De acuerdo con Michell
(1986, 1990), y como se desprende de las nuevas consideraciones a la cuestión de la
significación (Luce et al., 1990), el problema esencial es el de la validez de las
inferencias. En ciencias sociales, enunciados que pueden no ser formalmente
significativos, son considerados útiles e informativos. El ejemplo más obvio lo
encontramos en el tratamiento de las puntuaciones de los tests como escalas de
intervalo, a pesar de ser ordinales. Se nuevo la utilidad de la medidas toma un papel
prevalente. Sin embargo esto no es óbice para que los psicólogos deban cuidar el tipo de
23
Introducción de la Psicometría
afirmaciones que realizan al comparar sujetos, en función del tipo de escala formado al
realizar las mediciones.
Críticas a la Teoría Representacional y avances
La teoría representacional de la medición ha recibido diversas críticas. Por una
parte, los problemas para aplicar la teoría. Son numerosas las ocasiones en las que la
teoría representacional no puede aplicarse en la práctica psicométrica porque el
sistema relacional empírico no satisface los axiomas requeridos según el teorema de
la representación.
Y es que, el resultado habitual al que se llega cuando se contrasta si un
determinado sistema relacional empírico, como las respuestas de los sujetos a un test
de inteligencia, reúne las condiciones necesarias para establecer una determinada
representación numérica, suele ser que el sistema relacional empírico no satisface
esas condiciones. Algo que Michell ejemplifica claramente para el caso de la medida
mediante tests, con un ejemplo en el que el nivel de esta medida queda incluso por
debajo del nivel ordinal (Michell, 1986, p. 403): para poder establecer una relación
de orden entre los sujetos que contestan a un test en función de su nivel de aptitud
debería poder verificarse que cada sujeto con un número de aciertos mayor que otro
dado ha respondido correctamente a las mismas preguntas que ese sujeto con un
numero de aciertos inferior y a algunas mas, pero no es así. Los sujetos con mayor
numero de aciertos fallan algunas de las preguntas que los sujetos con menos aciertos
han acertado (preguntas fáciles) y los sujetos con menos aciertos pueden acertar
algunas preguntas que los sujetos con mas aciertos han fallado (preguntas difíciles).
El hecho es que el teorema de representación no pueda resolverse adecuadamente
respecto de un gran número de atributos psicológicos, entre los que destacan
aquellos de los que se ocupa la Teoría de los Tests.
Por otra parte, como critica Berka (1992), una prueba formal sobre la posibilidad
de medir una magnitud no es suficiente para hacerla mensurable en la práctica. En
esta línea Schwager (1991) señala que la teoría representacional, hasta la fecha, no
ha ofrecido ventajas especiales para la medición, ni el marco de la teoría psicológica
ni en el de la práctica profesional. Además esta teoría siempre necesita ser
complementada con procedimientos de validación de constructo. En qué medida las
entidades están adecuadamente representadas debe ser puesto a prueba,
especialmente cuando se trata de variables latentes, inobservables..
En tercer lugar está el problema de cómo tratar los errores de medida. De
manera simplificada, para evaluar si un determinado conjunto de datos satisface unos
determinados axiomas se requieren datos. Sin embargo estos datos son recogidos a
24
Introducción de la Psicometría
partir de observaciones o medidas que aún no han sido axiomatizadas. Por ello si el
cumplimiento de un determinado axioma no se demuestra podría atribuirse o bien a
que el axioma no se cumple, o bien a que los datos no son de calidad.
Finalmente Michell (1990, 1997) critica tanto la aproximación clásica a la medición
como la teoría representacional tal y como ha sido expuesta porque no demuestra la
naturaleza cuantitativa de las variables. El hecho de que un sistema relacional empírico
quede representado por un sistema relacional numérico a través de un homomorfismo,
no garantiza que las variables medidas sean cuantitativas. Una forma de garantizarlo,
como ya se vio con Campbell, es demostrando la existencia de un homomorfismo entre
las relaciones empíricas de los objetos y la adición numérica, bien directamente en las
medidas extensivas (como en la concatenación), bien indirectamente en el caso de las
medidas intensivas. Esta es una forma de demostrar la estructura cuantitativa de una
propiedad en el caso de las variables medidas en escala de intervalo o de razón. Pero no
es la única; la teoría de la medición aditiva conjunta desarrollada a partir de la teoría
representacional es otra forma de demostrar dicha estructura cuantitativa.
Nuevos enfoques: Teoría representacional y Teoría de la medición aditiva
conjunta
La teoría de la medición aditiva conjunta (TMAC), como la teoría
representacional, es una aproximación axiomática. La TMAC hace explícitas las
condiciones bajo las cuales estructuras empíricas aparentemente no-aditivas son
realmente aditivas a un nivel más profundo. La medida conjunta demuestra que la
cuantificación en la ciencia puede realizarse indirectamente, pero no sólo como
proponía Campbell con la medidas derivadas (aplicables a las propiedades
intensivas) -como era el caso de la temperatura o la densidad, que serían mensurables
gracias a su relación con ciertas medidas fundamentales como el volumen-, sino a
partir de la combinación de dos variables para las que puede establecerse orden. Es
decir, la TMAC demuestra que, si se satisfacen ciertas condiciones, es posible
fundamentar la obtención de medidas cuantitativas a partir de dos variables ordinales
que pueden combinarse para dar un resultado.
Rasch (1960), expone la aplicación de esta teoría a partir de atributos físicos
como la densidad, para después generalizarla al caso de los tests psicológicos.
Como Rasch (1960) explica, así como la aceleración de diferentes objetos puede
expresarse en función de la relación entre la masa del objeto y la fuerza aplicada
sobre él, la respuesta de un sujeto a un ítem puede expresarse en función de la aptitud
del sujeto y de la dificultad del ítem. En el ejemplo de la aceleración, podemos
25
Introducción de la Psicometría
comparar las masas de los objetos simplemente manteniendo constante la fuerza
aplicada sobre ellos y observando las diferentes aceleraciones producidas por esa
fuerza. Las diferentes aceleraciones resultantes nos indicarán la masa de los objetos,
ya que al ser constante la fuerza, mayor aceleración indicará menor masa, y
viceversa. No es necesario conocer la cantidad de fuerza aplicada a los objetos para
poder ordenar las aceleraciones e inferir el orden en las masas de los objetos. Y a la
inversa sucede lo mismo, aplicando diferentes fuerzas a un mismo objeto también es
posible inferir el orden de las fuerzas aplicadas, sin necesidad de conocer la masa del
objeto empleado (Rasch, 1960, pp. 111-114). Con ello tendríamos resuelto cómo
verificar la primera ley de la cantidad: la ley del orden. La segunda ley o ley de la
aditividad requiere una pequeña transformación. Para continuar con el proceso de
verificación simplemente hay que dar el valor 1 a la aceleración más pequeña y
emplearla para medir todas las demás. Ahora las relaciones entre aceleraciones
pueden cuantificarse y también nos permitirán cuantificar las relaciones entre masas
y entre fuerzas. Si mantenemos constante un objeto, aplicamos sobre él dos fuerzas y
observamos que la aceleración resultante con la fuerza 1 es el doble que la obtenida
con la fuerza 2, entonces podremos deducir que la fuerza 1 es el doble que la fuerza
2. Y si verificamos esa relación a través de los diferentes objetos (con sus diferentes
masas), entonces podremos tener confianza en esa relación. Para medir las diferentes
fuerzas bastará con ver lo que sucede con las aceleraciones cuando mantenemos la
masa (el objeto) constante, y si esas relaciones permanecen al cambiar de objeto.
Luego damos el valor 1 a la fuerza más pequeña y la usamos para medir las fuerzas
restantes. Y lo mismo con las masas, damos el valor 1 a la masa del objeto más
pesado y la usamos para medir el resto de masas. Una vez hemos cuantificado todas
las fuerzas y masas, ya podemos verificar la segunda ley, la de la estructura aditiva.
En efecto, este ejemplo implica una estructura multiplicativa (ya sé que la operación
de más abajo es una división, pero la relación es multiplicativa) que puede fácilmente
ser transformada en una estructura aditiva simplemente aplicando una
transformación logarítmica:
a= f/m, log(a)= log(f)+ (-log(m))
Como la aceleración es igual al cociente de la fuerza por la masa, el logaritmo de
la aceleración debe ser igual al logaritmo de la fuerza más el logaritmo de la masa
cambiado de signo. La verificación de la segunda ley se realiza verificando esta
igualdad. Una vez verificadas las dos leyes, podemos dar por buena la tercera ley o
ley de la arbitrariedad de la unidad de medida, tal y como la hemos obtenido
previamente. De este modo habríamos medido con una unidad de medida constante
la masa, la fuerza y la aceleración de cada uno de los objetos del sistema relacional
26
Introducción de la Psicometría
empírico sin necesidad de verificar ninguna clase de concatenación empírica.
Cuando se utilizan tests para medir atributos psicológicos, la medida del atributo
en cuestión (resultado) es función de los ítems y de los sujetos que responden a ellos.
Se requiere que los ítems mantengan un determinado orden en el continuo
subyacente (en función del grado en que representan el atributo),
independientemente de las personas concretas que estén siendo evaluadas. Del
mismo modo, las personas deberían poder ordenarse del mismo modo,
independientemente de los ítems concretos usados para medir el atributo en cuestión.
Si se satisfacen estas condiciones, las respuestas de los sujetos a los ítems permitirán
ordenar a los sujetos y a los ítems en un continuo que refleje el atributo en una
escala de intervalo. Si esto es así se puede establecer un paralelismo con el ejemplo
de la aceleración, de manera que basta sustituir el concepto de aceleración por una
transformación numérica de las respuestas de los sujetos (de la que más adelante nos
ocuparemos), y los conceptos de masa y fuerza por los de dificultad del ítem y
aptitud del grupo de sujetos para aplicar el mismo razonamiento
R* = A/D log(R*) = log(A)+ (-log(D))
Algunos ejemplos de posibles aplicaciones de esta teoría en Psicología son
presentados por Michell (1990). Concretamente, Michell pone a prueba y ejemplifica
la posibilidad de obtener variables de intervalo o razón a partir de variables ordinales
cuando se emplea la ley del juicio comparativo de Thurstone, en su método de
escalamiento, que veremos posteriormente, o cuando se aplica un modelo de TRI de
un parámetro (un modelo de Rasch). Aquí se pone de manifiesto el solapamiento que
existe entre las tres grandes áreas de la teoría psicométrica al que aludíamos en el
tema 1 (entre la teoría de la medición, el escalamiento y la teoría de los tests)
La definición de medida a la que se llega con la teoría de la medida aditiva
conjunta sería congruente con la de medición científica que según Michell (1997, p.
358) debería ser común a todas las ciencias; a saber, “la estimación o descubrimiento
de la razón de un atributo cuantitativo respecto de una unidad del mismo atributo”.
La medida aditiva conjunta y el modelo de Rasch (1960) proporcionan los axiomas o
condiciones empíricas que debe satisfacer un sistema relacional empírico formado
por las respuestas de un conjunto de sujetos a un conjunto de ítems para verificar las
leyes de la cantidad, algo completamente imposible hasta ese momento. La
verificación de esas leyes permite afirmar que la variable que se pretende medir es de
naturaleza cuantitativa, y que es posible transformar esas respuestas en puntuaciones
con la seguridad de que esas puntuaciones están expresadas en una métrica con una
unidad de medida constante. Las puntuaciones así obtenidas sí pueden someterse a
operaciones aritméticas con el rigor de haber superado los requisitos que establece un
27
Introducción de la Psicometría
modelo de medida en toda regla.
Tal y como señalan Adams (1979) y Muñiz (1998b), la moderna teoría de la
medición -iniciada con la teoría representacional de la medición y continuada desde
la teoría de la medición aditiva conjunta y otras aproximaciones, es la que domina
entre los teóricos y los filósofos de la ciencia. Sin embargo, su influencia en la
Psicología aplicada ha sido más bien escasa. Una excepción la encontramos en los
llamados modelos de Rasch aplicados desde la Teoría de la Respuesta a los Ítems. La
importancia dada a este tipo de modelos (que permite obtener medidas cuantitativas)
se ha traducido en una proliferación de su aplicación, y aunque si bien le modelo de
Rasch todavía está ligado principalmente al contexto académico, también está siendo
cada vez más aplicado en contextos aplicados. De hecho ya se han desarrollado tests
bajo el modelo de Rasch, aunque todavía no se encuentran difundidos en el mercado.
Como se acaba de mencionar, a pesar de que la importancia de la teoría
representacional, en general, y la teoría de la medida aditiva conjunta, en particular,
está siendo cada vez más reconocida, la práctica más común en Psicología continúa
siendo la de emplear procedimientos de medida para los cuales no existen axiomas
sobre la asignación numérica. Sin embargo, incluso los autores de la teoría
representacional, a pesar de poner énfasis en que las medidas no representacionales
son menos adecuadas, reconocen que tienen una serie de ventajas practicas. Por
ejemplo Suppes y Zinnes (1963) y Luce et al. (1990) admiten que este tipo de
medidas, a pesar de que podría pensarse que son inútiles y carentes de significado,
pueden ser usadas gracias a su utilidad práctica y su capacidad predictiva.
Lógicamente, no es necesario decir que las mediadas axiomatizadas en la medida en
que sean útiles y tengan capacidad predictiva serán preferibles, pues permitirá entre
otras cosas, hacer comparaciones más finas entre individuos, compararlos
independientemente de qué test se ha aplicado, o realizar operaciones aritméticas
justificadas sólo para variables cuantitativas.
Las puntuaciones de los tests y las escalas de medida
La imposibilidad de establecer las relaciones entre los objetos empíricos en base a
una variable psicológica que no es observable, impide encontrar un homomorfismo que
relacione el sistema numérico con dichos objetos empíricos. A pesar de que la TMAC
supone una oportunidad para demostrar la naturaleza cuantitativa de las puntuaciones
obtenidas mediante tests, a través del modelo de Rasch, en la práctica diaria se emplean
medidas no axiomatizadas, es decir medidas no representacionales. Son las llamadas
medidas por índices (Sawes, 1972), por definición (Torgerson, 1958) o por mandato
(Pfzangal, 1969) que tienen su base en la simplicidad y directa aplicación. Este tipo de
28
Introducción de la Psicometría
medidas se basan en criterios racionales, a partir de las hipotéticas relaciones entre el
constructo que se quiere medir y sus manifestaciones observables, y entre el constructo
y otras variables relevantes. Pero no se cuenta con un modelo explícito de medida. Se
trata de una definición arbitraria que permite asignar números a los constructos teóricos
mediante un conjunto de indicadores empíricos, que normalmente quedan plasmados en
los items de un test (Meliá, 1990a; Torgerson, 1958). A partir de dichos ítems se
obtienen las puntuaciones de los sujetos en el test, que se asume forman una escala de
intervalo, con propiedades de orden y unidades iguales (aunque como hemos visto esto
sea muy cuestionable desde la teoría de la medición). Al asumir que la puntuación en el
test forma una escala de intervalo, con una unidad de medida constante, operamos
algebraicamente (estadísticamente) con las puntuaciones para realizar inferencias sobre
la cantidad de rasgo que presenten los sujetos. El criterio fundamental por el que se
puede defender el uso de las puntuaciones de los tests así calculadas en la utilidad que
presenten. Como señalan Lord y Novick (1968), si las puntuaciones totales de los tests,
tratadas como escalas de intervalo, proporcionan información para clasificar a los
sujetos y realizar predicciones adecuadas, podrán usarse como tales.
Según Nunnally y Bernstein (1994) para medir siempre hemos de relacionar
números con el mundo físico, y la legitimidad de cualquier medida debe ser apoyada
empíricamente. Una medida puede intentar ajustarse a una serie de axiomas de medida
(un modelo), pero el ajuste de dicho modelo sólo puede determinarse considerando cuán
bien los datos empíricos se ajustan a las predicciones realizadas desde el modelo.
Incluso si no existe un modelo formal que legitime la medida, la prueba crucial de
cualquier medida es cuán bien explica las relaciones entre variables. En ello están
implicadas tanto la fiabilidad (es decir, que contengan un error razonable) como la
validez de las medidas (es decir, que midan aquello para lo que son diseñadas, que
permitan hacer inferencias sobre aquello para lo que se construyeron). A esta última
cuestión alude el tercer punto implicado en la medición mediante tests, presentado al
principio del tema: cómo comprobar que las respuestas son, efectivamente,
manifestaciones de ese rasgo, lo que alude a la validez de las medidas.
En esta misma línea, Nunnally y Bernstein (1994, 1995) defienden que en las
medidas por índice, que supuestamente se relacionan monotónicamente con el atributo a
medir, a pesar de no existir una unidad de medida bien fundamentada, los resultados de
análisis correlacionales y de comparaciones de medias no se verán seriamente
afectados. Sin embargo estos autores reconocen que el uso de estas medidas sí pueden
tener consecuencias importantes cuando se emplean pruebas más refinadas o modelos
muy sensibles a las propiedades de intervalo de la escala.
29
Introducción de la Psicometría
Clasificaciones de las escalas de medida.
Hemos visto que en general, se asume que las puntuaciones de los tests forman una
escala de intervalo, según la clasificación de Stevens, y que el test está formado por
ítems graduados o categóricos, que se corresponderían con una escalas ordinal y
nominal, respectivamente, según esta misma clasificación. Sin embargo no es la única
forma de diferenciar el tipo de escala o medida que se obtiene en cada caso. En este
punto vamos a profundizar algo más en la clasificación de las escalas de medida de
Stevens y presentaremos la propuesta de Torgerson y otras clasificaciones.
A) CLASIFICACON DE STEVENS
Propone la ya conocida clasificación en escalas nominales, ordinales, de intervalo y de
razón.
B) CLASIFICACIÓN DE TORGERSON
Parte de la siguiente base: las características importantes de las series de números reales
se pueden enumerar desde varias operaciones que podemos desarrollar sobre los
números:
1. Los números se ordenan.
2. Las diferencias entre los números se ordenan.
3. Las series tienen un único origen indicado por el número 0.
Estas 3 características se denominan orden, distancia y origen y forman la base para
diferenciar entre:
Tipos de escalas: Si los números reflejan una, dos o las tres características
Clases de medida: Significado de las características.
De las 3 características, la de orden está siempre implicada en la medida. Además,
puede poseer una o ambas de las otras dos, distinguiendo así 4 escalas
Comparación Stevens/Torgerson
La clasificación de Torgerson difiere de la de Stevens en dos aspectos:
1. Distingue el origen natural o no en las ordinales.
2. No reconoce las escalas nominales como escalas de medida, sino como clasificación:
“El número asignado se refiere al grado relativo de una propiedad poseída por el objeto,
y no al objeto mismo. En las escalas nominales, los números se refieren a los objetos o
30
Introducción de la Psicometría
clases de objetos: es el objeto el que es nombrado o clasificado. (...). En clasificación, el
constructo de interés es el objeto o clases de objetos; en medida, es la propiedad”.
“Es verdad que cuando los objetos son clasificados, siempre es con respecto a alguna
propiedad y entonces la noción de propiedad también es importante en clasificación. Sin
embargo, el rol jugado por el concepto de propiedad es distinto en los dos procesos: en
el primer caso, los objetos son clasificados de acuerdo con la presencia o ausencia de
una o más propiedades; en el segundo, es determinante ella misma, el grado o la
cantidad de propiedad”.
CLASES DE MEDIDA
La clasificación en tipos de escalas está basada en cuánta información acerca de
la propiedad representan los números.
Ahora nos centramos en qué clase de información representan los números: qué
clases de significado atribuimos en una escala particular a las características de orden,
distancia y origen que son representadas.
Hay tres vías por las esas características pueden obtener significado y que dan
lugar a tres clases de medida:
1. En función de leyes que relacionen varias cantidades del constructo con otros. Son las
medidas de magnitud A o medidas fundamentales.
–La obtención de la medición no está mediada por ninguna otra medición y es
independiente de las teorías que la ponen en relación con otras mediciones.
–Un constructo así medido posee significado operacional y constitutivo por él mismo:
SIGNIFICADO OPERACIONAL: hay disponibles reglas definidas para asignar
números que representen cantidades particulares.
SIGNIFICADO CONSTITUTIVO: los números reflejan leyes naturales que relacionan
distintas cantidades de la propiedad. (ejemplo, la longitud)
2. A través de leyes que relacionen la propiedad con otras propiedades. Son las medidas
de magnitud B o derivadas.
–Se definen a partir de mediciones fundamentales.
–Normalmente implican algún tipo de relación bien establecida entre las magnitudes
objeto de medición fundamental que participan en ella.
31
Introducción de la Psicometría
–Ejemplo: la densidad (la ley se refiere al hecho de que la razón de la masa al volumen
para cualquier cantidad de una sustancia dada es una constante).
3. Por definición arbitraria. Se puede llaman a esta clase de medida “por definición”
(Torgerson, 1958), “medida por indicadores” (Suppes y Zinnes, 1963).
–Dependen de la relaciones que se presumen entre las observaciones y el concepto de
interés.
–No depende de leyes bien establecidas entre otras mediciones (como la fundamental),
pero sí depende de un cuerpo teórico de relaciones entre variables (como la derivada).
–Ejemplo: clase social.
Cualquier escala particular puede ser una mezcla de distintas clases de medida.
Por ejemplo, la característica ordinal puede estar determinada fundamentalmente y las
características de intervalo derivadas de leyes que relacionen el constructo con otras
variables. En ciencias sociales y conductuales es habitual que el orden se determine
fundamentalmente y los intervalos por definición.
Consideraciones finales
En este tema se han visto algunas de las principales concepciones de medición que se
han propuesto y asumido desde la Psicología; las principales aportaciones realizadas
desde cada una de ellas, así como sus puntos débiles. En resumen, actualmente la
polémica principal se daría entre el ideal defendido desde la teoría de la medición (la
medición axiomatizada y bien fundamentada lógicamente), y lo que se hace en el día a
día en la medición psicológica (medición por índices). Esto tiene su equivalente en la
polémica que siempre ha existido entre los psicólogos más “cientifistas” y los más
aplicados o prácticos (Meier, 1994). Sin embargo, no hay que olvidar que unos
necesitan de los otros para avanzar (Danzinger, 1990), y tanto para los teóricos de la
medición como para los psicómetras más aplicados, el objetivo de la medición ha de ser
hacer inferencias válidas acerca de los objetos que están siendo medidos.
Así, Michell (1990, 1999) enfatiza que se ha de seguir trabajando en obtener pruebas
formales de que las variables psicológicas son, al menos bajo ciertas condiciones,
cuantitativas y, por ello, mensurables. Además, la hipótesis de que una variable
psicológica es mensurable ha de ser puesta a prueba mediante experimentación. Esta es
la línea de trabajo seguida en los últimos años por ciertos teóricos de la medición. Sin
embargo, no debemos olvidar que para que una medida sea útil y válida no es requisito
32
Introducción de la Psicometría
imprescindible que haya sido axiomatizada y que se demuestre su naturaleza
cuantitativa. Un ejemplo aplicable al campo de la física lo encontramos en la escala
Mohs de dureza. En Psicología, hay un gran número de variables que se encuentran en
esta tesitura. Asimismo, el hecho de que una medida haya sido axiomatizada no
garantiza que resulte útil y válida. El resultado de una medición depende también de la
magnitud del error implícito en el proceso de medición y de su validez (teoría de tests),
y de las condiciones de bondad de construcción y uso del instrumento concreto
(aplicación psicométrica). De todo ello nos ocuparemos en sucesivos temas
1.4. La psicometría en el contexto de la psicología como ciencia,
en la investigación psicológica y en la práctica profesional de la
psicología.
Como en otras ciencias empíricas, la finalidad de la psicología es describir,
predecir y explicar los fenómenos empíricos de su interés. Se pretende establecer
principios generales para explicar y predecir dichos fenómenos. Para lograrlo, las
ciencias deben recoger y comparar datos, para establecer relaciones que permitan
fundamentar teorías (Martínez Arias, 1995). La medida es un componente fundamental
de este proceso y es la que permite que los instrumentos de las matemáticas puedan
aplicarse a la ciencia (Torgerson 1958). Una teoría psicológica sólo podrá ser probada
empíricamente si los atributos implicados pueden medirse adecuadamente. De ahí la
importancia de la Psicometría para el avance del conocimiento en Psicología. Una teoría
psicológica es un sistema de proposiciones referidas a un conjunto de constructos, que
sirven para describir, explicar y predecir algunos aspectos limitados de su dominio.
Ejemplos de estos constructos son la ansiedad, la aptitud numérica, etc.
La medición es el proceso por el cual un constructo se vincula con una o más
variables latentes y éstas se vinculan con variables observadas (Bollen, 1989). El
proceso de medición empieza con el constructo. Un constructo es una idea que une
fenómenos (actitudes, conductas, rasgos) bajo un único término. Por ejemplo, la cólera,
es un constructo que actúa como dispositivo resumen para reemplazar una lista de
rasgos específicos que puede mostrar una persona.
Podemos encontrarnos con personas que opinan que la mente humana es muy
compleja y que al reducirla a números se está perdiendo la mayor parte del contenido de
33
Introducción de la Psicometría
los estados psicológicos que se pretenden medir. La medida de las variables
psicológicas es controvertida, porque incluso los que le otorgan alguna utilidad, dudan o
niegan su viabilidad en algunos ámbitos. Ambas posturas ponen en tela de juicio la
utilidad de los métodos cuantitativos en psicología, atacando precisamente la base de los
mismos: la medición.
Cabe señalar que, si bien la Psicología claramente se beneficia de la parte más
aplicada y metodológica de la Psicometría, también resulta favorecida por los avances
en la teoría psicométrica, ya que para medir una variable psicológica no sólo hace falta
una teoría sobre la variable sino también una teoría sobre cómo se mide dicha variable.
Esto permitirá, por una parte, determinar qué error se comete en su medida, y hasta qué
punto las predicciones o explicaciones que impliquen esa variable presentan un grado
de incertidumbre razonable, y por otra, llegar a una mejor conceptualización y
comprensión de la variable. Sin embargo, si bien es cierto que tanto teoría como
práctica psicométrica son piezas claves para el desarrollo de la Psicología como ciencia,
no hay que olvidar que las necesidades de la Psicología también han estimulado el
desarrollo de la Psicometría. Por lo tanto, se puede considerar que la relación entre
Psicología y Psicometría es bidireccional, siendo beneficiosa para el desarrollo de
ambas disciplinas.
Un ejemplo típico de cómo la Psicometría ha promovido cambios en la concepción
de ciertos constructos psicológicos es el caso de la inteligencia. Cuando en 1904 el
consejo del ministerio francés de educación encomendó a Alfred Binet la tarea de crear
un método que permitiera diferenciar entre los niños que presentaran retraso mental y
necesitaran una instrucción más sencilla de aquéllos que, aunque no estuvieran
rindiendo adecuadamente, sí fueran capaces de aprender normalmente, Binet no sólo se
enfrentó a la tarea de medir la inteligencia sino también a la de definirla. Binet rompió
con la línea iniciada por Cattell, para quien ciertas medidas sensorio-motoras, como las
diferencias perceptivas y el tiempo de reacción, eran indicadores adecuados de la
inteligencia, y defendió que la inteligencia estaba constituida no por un conjunto de
procesos elementales, sino por un proceso mental unitario de carácter superior. Basado
en esta idea Binet, en 1905, creó el primer test de inteligencia junto con Simon (Binet y
Simon, 1905). La inteligencia quedó así definida como aquello que mide el test de
inteligencia (Boring, 1945, p.244) refiriéndose a las tareas contenidas en el test que
implicaban funciones mentales superiores. Por otra parte, podemos encontrar ejemplos
34
Introducción de la Psicometría
de cómo la teoría psicológica influye sobre los desarrollos psicométricos si prestamos
atención a la influencia de las teorías cognitivas. Estas han contribuido al desarrollo de
modelos psicométricos específicos como el modelo logístico lineal (Fischer, 1973,
1995, 1997) y los modelos multicomponenciales (Embretson, 1984; Whitley 1980a,
1980b).
Los tests psicológicos y educativos se construyen y utilizan para evaluar
determinadas características de las personas. Como hemos dicho, están formados por
listas de tareas a realizar (ítems) cuyas respuestas se combinan para obtener un resultado
que nos facilita una elaboración de inferencias a partir de esta muestra limitada de la
conducta de las personas. Para centrarnos en el uso profesional de los tests, comparemos
con un test de entretenimiento como puede haber en las revistas. En estos, muchas de
las preguntas y respuestas posibles son más bien chistes. Probablemente no haya un
argumento muy sólido o ni siquiera un argumento para decidir medir por ejemplo la
curiosidad a partir del número de libros que se tiene en casa y no hacerlo a partir de la
cantidad de películas que se han visto. Vosotros mismos, sin ser expertos, es fácil que
dudéis de la credibilidad de los resultados y conclusiones de estos tests de las revistas.
Como se trata de un “test” publicado en una revista, las condiciones de administración
son desconocidas: puede contestarlo una persona en solitario, varias a la vez, puede
empezarse por leer las conclusiones, dejarlo a medias… Y las consecuencias a partir de
los resultados son más bien humorísticas, aunque adoptan un tono de calificación y
sugerencia. En otras palabras, es un pasatiempo imitando los aspectos más anecdóticos
de los tests.
Las diferencias con un test profesional son muy profundas. Los profesionales:
- Se preparan con el apoyo de sólidos argumentos lógicos, teóricos y empíricos.
- Su adecuación a la finalidad con la que se pretenden utilizar se comprueba
mediante estudios diseñados con una rigurosa metodología científica.
- Se administran en condiciones controladas.
- Las deducciones a partir de los datos las hacen expertos que se basan en
información comprobada.
Es decir, el uso profesional de los tests exige que todas las deducciones que se hacen a
partir de ellos sean científicamente sostenibles. Aunque no están exentos de problemas:
35
Introducción de la Psicometría
1. No existe una única aproximación a la medición de un constructo que sea
universalmente aceptada: distintos procedimientos de medición que se
derivan de distintas definiciones del marco, pueden llevar a distintas
conclusiones sobre la caracterización de las personas en el rasgo.
2. Todos los tests están basados en muestras limitadas de conductas del dominio
que se pretende medir. Determinar el número de ítems y su variedad es un
problema.
3. Las medidas obtenidas siempre tienen error. Como se basan en muestras
limitadas de contenidos, se ven afectadas por todos los errores de muestreo.
4. Falta de escalas de medida con origen y unidades de escala definidas, lo que da
lugar a una indeterminación de la medida.
5. Los constructos no pueden definirse aisladamente, simplemente en términos de
definiciones operativas, sino que deben establecerse sus relaciones con otros
constructos y con las conductas observables.
Por ello, necesitamos conocer los procedimientos en los que se basan las
puntuaciones de los tests, la información que proporcionan y las limitaciones que tienen
para hacer un buen uso de ellos. El uso de tests en el ejercicio profesional está sujeto a
un código deontológico. El Colegio Oficial de Psicológicos (COP) y la American
Psychological Association (APA) dan las directrices periódicamente.
36