REPASO PSICOMETRÍA
TEMA 1
Método hipotético-deductivo: pretende establecer principios generales para explicar y
predecir dichos fenómenos. Medición o cuantificación de las variables psicológicas tanto
teóricas como prácticas. “Medida de la mente”.
1. Definición y/o identificación del problema
2. Elaboración de preguntas y/o deducción de hipótesis contrastables
3. Establecimiento de un procedimiento de recogida de datos
4. Análisis de los resultados obtenidos
5. Discusión de dichos resultados y búsqueda de conclusiones
6. Elaboración de un informe de investigación
Teoría psicométrica: conjunto de enunciados que constituyen el cuerpo teórico de
fundamentación, explicación y desarrollo de la medición en Psicología, que ayudan a
especificar la cantidad o el tipo de incertidumbre presente y el nivel de explicación y
predicción posible.
Medida: es la asignación de números a atributos de los sujetos. Proceso mediante el cual
se enlazan conceptos abstractos con indicadores empíricos observables directamente.
Proceso inferencial
Cadena de inferencia:
1. Contrucción de tareas
2. Las respuestas a esas tareas son la única parte observable
3. Las respuestas reciben una puntuación numérica. Proceso de escalamiento
4. Fiabilidad del instrumento
Unidad de medida referida a la norma (TRN): Consiste en comparar los resultados
obtenidos por un grupo de personas y compararlos con otro grupo llamada grupo normativo
con las mismas características que el otro grupo
Unidad de medida referida al criterio (TRC): Previamente establecemos un punto crítico
(criterio) y la superación o no de ese punto es lo que nos dará significado a las
puntuaciones obtenidas
TRN TRC
El objetivo es poner de manifiesto las El objetivo es estimar el rendimiento o
diferencias individuales conducta del sujeto en los objetivos que
mide el test
Se suele recurrir a las teorías existentes Especificar de una manera clara el dominio
respecto al rasgo o conducta que se quiere de contenidos o conductas que se quieren
medir evaluar y el uso que se pretende hacer del
test
Los ítems deben poner de relieve las Los ítems se selecciona en función de los
diferencias individuales maximizando la objetivos y del uso que se vaya a hacer del
varianza del test y seleccionando ítems de test
dificultad media y alto poder discriminativo
Puntuación verdadera en un rasgo latente La puntuación es el rendimiento del sujeto
en el dominio
La puntuación tiene significado únicamente La puntuación tiene significado en términos
con relación a los resultados del grupo absolutos
normativo
Psicometría en la práctica profesional
1. No hay una única aproximación a la medición de un constructo que sea
universalmente aceptada
2. Todos los test están basados en muestras limitadas de conductas del dominio que
se pretende medir
3. Las medidas obtenidas siempre contienen error
4. Los constructos no pueden definirse aisladamente, deben establecerse sus
relaciones con otros constructos y con conductas observables
TEMA 2
Escalamiento psicológico: Procedimientos ideados para medir objetos que no tienen un
referente físico: personalidad, actitudes, intereses, valores, opiniones, etc.
Método unidimensional: los objetos son escalados en función de una única dimensión
Thurstone: escalamiento centrado en los ítems. Mide actitudes, opiniones o preferencias en
una escala cuantitativa. Este enfoque permite clasificar objetos (como productos, ideas, o
incluso personas) en función de sus características y cómo son percibidos por un grupo de
personas. Medir las diferencias individuales respecto a una actitud. La escala se construye
a partir de una prueba de jueces (cada ítem tiene asignado un valor escalar que representa
el grado de atributo). Los ítems son afirmaciones con las que el sujeto está o no de acuerdo
y en qué grado. Desarrolla dos modelos matemáticos:
Ley del juicio comparativo: La tarea de los sujetos consiste en comparar directamente
cada uno de los ítems que se presentan con todos los demás y decir, ante cada uno de los
pares formados, cual es el estímulo preferido o dominante en la dirección del atributo que se
está midiendo. Se produce un proceso discriminante. Los resultados de los juicios se
ordenan en una matriz de frecuencia y se mira su media.
Ley del juicio categórico: Asignar cada uno de los ítems que se le presenta a una
categoría en función del grado de atributo que considere que tiene el ítem. Las categorías
están igualmente espaciadas y cada juez tiene que asignar cada uno de los ítems a una
categoría. Se calcula la distribución de frecuencias de los juicios emitidos y se observa su
mediana. La escala debe incluir ítems que cubran todo el continuo de actitud, desde el
extremo más favorable al menos favorable. La respuesta de los sujetos es dicotómica,
emiten un juicio de valor. La puntuación de cada sujeto se obtiene calculando la media de
los valores escalares con los que estuvo de acuerdo.
La técnica de Likert: Método sumatorio para la medida de las diferencias individuales de
los rasgos psicológicos. Es fácil de construir y aplicar y muy fiables. Los sujetos pueden
situarse en la variable de actitud desde un punto más desfavorable al más favorable. La
variación de las respuestas será debida a diferencias individuales de los sujetos. Asume un
nivel de medida ordinal. Los sujetos emiten juicios de valor. La más utilizada es la que
ofrece 5 categorías. La suma de todos los valores de cada ítem será la puntuación total de
cada sujeto en la escala.
La técnica de Guttman: Pueden ordenarse sujetos e ítems. Permite evaluar la relación
entre diferentes elementos o conceptos al considerar cómo están vinculados o
“entrelazados” en la mente de los individuos. Se basa en la idea de que es posible ordenar
los ítems de manera que si un sujeto responde correcta o favorablemente a un estímulo
concreto, lo hará también a todos los que estén situados por debajo de dicho ítem en la
escala. Y cuando no responde correcta o favorablemente ante otro, tampoco lo hará al
contestar a los que estén situados por encima de él en la escala (escala de
entrelazamiento). Se realiza la escala eligiendo ítems que miden determinada actitud de
manera que su grado de extremosidad respecto a la variable medida vaya en aumento.
TEMA 3
Test: Mide variables de tipo cognitivo: conocimientos, aptitudes, rendimiento… Respuestas
son correctas o incorrectas y la puntuación total es la suma de todas las respuestas
correctas.
Escalas: Mide variables no cognitivas: actitudes, opiniones, intereses… Los sujetos deben
responder aquella categoría que representa su posición respecto a aquello que se está
midiendo. La puntuación total es la suma de las puntuaciones asignadas a las categorías
elegidas por los sujetos.
Cuestionarios: Las opciones de respuesta no están ordenadas ni graduadas. Son
puntuadas e interpretadas individualmente, no existen respuestas correctas e incorrectas.
Objetivo obtener la mayor información posible sobre el sujeto y el entorno.
Inventarios: Mide variables de personalidad. Las respuestas no son correctas ni incorrectas
sino que demuestran su conformidad o no con el enunciado del ítem.
Etapas para construir un test
1. Prueba piloto
2. Evaluación de características psicométricas de la prueba
3. Aplicación del test definitivo
Prueba piloto
1. Definición de la finalidad del test: que constructo se va a medir, a qué población y
cuál va a ser la utilización
2. Especificación de las características del test: contenido, formato de los ítems (ítems
de elección → dos alternativas, elección múltiple, emparejamiento, formato
incompleto, escalas de clasificación o ítems de construcción), longitud del test,
características psicométricas de los ítems (nivel de dificultad, nivel de
homogeneidad, nivel de discriminación de los ítems)
3. Redacción de los ítems: respuestas sesgadas (aquiescencia, deseabilidad social,
indecisión, respuesta extrema)
4. Revisión por un grupo de expertos
5. Confección de la prueba piloto: instrucciones de administración, formato de
presentación, registro de las respuestas
6. Aplicación de la prueba piloto: evaluación psicométrica, forma de administración
7. Corrección de la prueba piloto y asignación de puntuaciones a los sujetos: test con
ítems de elección → pruebas cognitivas (penalizando los errores, bonificación de las
omisiones) y pruebas no cognitivas / test con ítems de construcción (método de
puntuación analítica o holística)
TEMA 4A. FIABILIDAD
Fiabilidad: se refiere a la consistencia y estabilidad de una prueba o instrumento de
medición. Que el test está libre de error.
Error de medida: es la diferencia entre la puntuación empírica y la puntuación verdadera.
Error aleatorio: Este tipo de error se produce por fluctuaciones impredecibles que pueden
afectar los resultados de una prueba. Puede surgir por factores contextuales (ruido),
factores personales (estado de ánimo del sujeto) o incluso sesgos del propio investigador
(no ha explicado correctamente cómo hacer el test).
Error sistemático: Cuando el instrumento está mal creado. Es predecible y consistente.
Ocurre cuando hay un sesgo en la medición que afecta a todos los resultados de manera
similar. Ejemplo: si una prueba está mal calibrada, si las preguntas están formuladas de
manera que favorezcan ciertos grupos..etc.
Modelo lineal de Spearman: la puntuación empírica obtenida en un test es igual a la
puntuación verdadera y el error de medida.
Supuestos:
1. La puntuación verdadera es la esperanza matemática de la puntuación empírica
2. La correlación entre puntuación verdadera y error de medida es cero / La puntuación
verdadera y el error de medida son independientes entre sí
3. El error de medida de dos cuestionarios separados es independiente
Deducciones:
1. El error de medida se define como la diferencia entre la puntuación empírica
obtenida por un sujeto y su puntuación verdadera
2. Si aplicamos infinitamente el test el error de medida no existiría
3. La media de las puntuaciones empíricas es igual a la media de las puntuaciones
verdaderas
4. La correlación entre las puntuaciones verdaderas y los errores es igual a cero
5. La varianza de las puntuaciones empíricas es igual a la suma de la varianza de las
puntuaciones verdaderas más la varianza de los errores
6. El movimiento en común que tienen la puntuación empírica y la verdadera viene
dado por el grado de dispersión que tengan las puntuaciones verdaderas
7. Cuanta más heterogénea la muestra más precisa es
8. Cuanto más se acerque la puntuación verdadera de un test y de otro, más se
acercará la relación entre las puntuaciones empíricas
Test paralelos: ambos miden lo mismo, su puntuación verdadera tiene que ser la misma en
ambos, la varianza de los errores de medida son iguales en ambos.
Deducciones:
1. La media de las puntuaciones empíricas de un test es la misma en su forma paralela
2. Las varianzas de las puntuaciones empíricas de un test es la misma en su forma
paralela
3. La relación entre una puntuación empírica y otra viene dada por el grado de relación
entre la empírica y la verdadera
4. Si tenemos más de dos test paralelos la relación entre todos ellos siempre va a ser
la misma
Coeficiente de fiabilidad de un test: El grado en el que se parezcan las dos puntuaciones
es el grado en el que el test está libre de error. Si la relación es perfecta es porque no existe
el error de medida.
0 = no hay correlación
1 = correlación perfecta
-1 = correlación alta pero negativa
Tipos de errores de medida
error típico de medida = desviación típica del error de medida
Error de estimación: es la diferencia entre la puntuación observada y la puntuación
verdadera
Error de sustitución: es la diferencia entre las puntuaciones obtenidas por un sujeto en un
test y las obtenidas en otro test paralelo
Error de predicción: es la diferencia entre las puntuaciones obtenidas por un sujeto en un
test y las puntuaciones pronosticadas en ese mismo test a partir de una forma paralela.
Factores que afectan a la fiabilidad
- La longitud del test (más largo más fiable)
- La variabilidad del grupo (más heterogénea la muestra más fiable)
- Las características de los ítems (bien hechos)
Procedimientos empíricos para estimar la fiabilidad
- Método de las formas paralelas → se relacionan p. empíricas de dos test paralelos
- Método test-retest → aplicamos un mismo cuestionario en dos momentos distintos.
Ver evolución del sujeto
- Consistencia interna → evalua si las diferentes preguntas o ítems que componen la
prueba están alineados y miden el mismo concepto. ítems correlacionados entre si =
buena consistencia interna
> método basado en la división del test en dos mitades = spearman-brown
> método basado en la covariación entre los ítems = coeficiente alfa de cronbach
KR cuando los ítems son dicotómicos → KR20 ítems con diferente dificultad, KR21 ítems
con misma dificultad
Estimación de la puntuación verdadera de los sujetos
Intervalo confidencial dentro del cual se encontrará dicha puntuación con un determinado
nivel de confianza. 3 formas de menos precisa a más precisa
1. La desigualdad de Chebychev → no hay supuesto
2. Estimación basada en la distribución normal de los errores
3. Estimación basada en el modelo de regresión
TEMA 4B. VALIDEZ
Validez: que el test mida lo mida lo que pretende medir. Que mida aquello para lo que ha
sido creado.
Validez de contenido: los ítems de mi cuestionario son una buena representación del
modelo teórico en el que me enmarco (Juicio de expertos). (relevancia, representatividad)
Validez de constructo: los ítems miden única y exclusivamente aquello que deberían medir
(Análisis factorial).
Validez de criterio: el cuestionario tiene que medir lo mismo que un criterio objetivo externo
(correlación o regresión). (concurrente, predictiva)
- Los indicadores del criterio deben ser: relevantes, libre de sesgos, fiables,
accesibles
- Intervalos de confianza: que se utiliza para estimar el rango en el que es probable
que se encuentre un parámetro poblacional basándose en una muestra. Se expresa
generalmente con un nivel de confianza, como el 95% o el 99%. Lo que determina
que sea un intervalo más grande o no es el grado de seguridad y el error de medida.
- Coeficiente de validez: grado de relación entre el test y criterio
- Coeficiente de determinación: La varianza en común entre el test y el criterio
- Coeficiente de alineación: porcentaje de la varianza que no puedo predecir
- Coeficiente de valor predictivo: porcentaje de la varianza que sí puedo predecir
- Correlación parcial: aislamos la variable para evitar que el segundo test tenga
efecto sobre el total de la relación
- Correlación semiparcial: el efecto que tendría ese segundo test sobre el primero
Factores que afectan a la validez del test
- La variabilidad de la muestra
- Validez y longitud
- Fiabilidad de las puntuaciones del test y del criterio
TEMA 5
TRI: permite resolver ciertos problemas de medición psicológica inabordables desde la TCT.
Hace asunciones adicionales. Se basa en las propiedades de los ítems. Permite crear
escalas más precisas y ajustar los ítems según las capacidades del evaluado.
Parámetros
- a = índice de discriminación
- b = índice de dificultad
- c = azar
Módelo
- modelo logístico de un parámetro → b
- modelo logístico de dos parámetros → b, a
- modelo logístico de tres parámetros → a. b, c