100% encontró este documento útil (1 voto)
397 vistas87 páginas

Psicometría

La psicometría se ocupa de la medición de variables psicológicas. Tiene dos objetivos principales: 1) justificar y validar modelos de medición psicológica y 2) proporcionar métodos para llevar a cabo dicha medición de manera práctica a través de la construcción de instrumentos. La psicometría surgió en el siglo XIX para cuantificar las diferencias individuales y las relaciones entre estímulos y sensaciones, dando lugar al desarrollo de escalas y modelos de medición.

Cargado por

Javier Carrizosa
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
100% encontró este documento útil (1 voto)
397 vistas87 páginas

Psicometría

La psicometría se ocupa de la medición de variables psicológicas. Tiene dos objetivos principales: 1) justificar y validar modelos de medición psicológica y 2) proporcionar métodos para llevar a cabo dicha medición de manera práctica a través de la construcción de instrumentos. La psicometría surgió en el siglo XIX para cuantificar las diferencias individuales y las relaciones entre estímulos y sensaciones, dando lugar al desarrollo de escalas y modelos de medición.

Cargado por

Javier Carrizosa
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

PSICOMETRA ORIENTACIONES TEMA N 1 (INTRODUCCIN)

TEMA N 1 INTRODUCCIN A LA PSICOMETRA

1.- APROXIMACIN AL CONCEPTO DE PSICOMETRA

La Psicometra es una disciplina metodolgica, dentro del rea de


la Psicologa, cuya tarea fundamental es la medicin o cuantificacin
de las variables psicolgicas con todas las implicaciones que ello
conlleva, tanto tericas (posibilidades y criterios de medicin) como
prcticas (cmo y con qu se mide)

Por tanto, la psicometra debe ocuparse de:


La justificacin y legitimacin de la medicin psicolgica, para ello: a) desarrolla modelos
formales que permiten representar los fenmenos que se quieren estudiar y posibilitan la
transformacin de los hechos en datos; b) valida los modelos desarrollados para determinar en
qu medida representan la realidad que pretenden y c) establece las condiciones que permiten
llevar a cabo el proceso de medicin.
Las implicaciones prcticas y aplicadas que dicha medicin conlleva: proporciona los
mtodos necesarios que indican, en cada caso concreto, cmo se debe llevar a cabo la
cuantificacin, y cmo construir los instrumentos necesarios y adecuados para poder efectuarla.

La Psicometra no tiene un campo de actuacin especfico, abarca todos los campos de la Psicologa y
se ubica en el rea denominada Metodologa de las Ciencias del Comportamiento. La Metodologa
estudia las estrategias y procedimientos que, de una forma ms o menos estructurada, se utilizan para
la obtencin de los conocimientos que configuran una disciplina cientfica. Por otra parte, las Ciencias
del Comportamiento son aquellas que estudian la conducta mediante la utilizacin del mtodo
cientfico, con el fin de encontrar estructuras generales o leyes. Dentro del marco de la Metodologa de
las Ciencias del Comportamiento se pueden considerar tres bloques:
Los Diseos de Investigacin se refieren fundamentalmente a la operativizacin de las variables
incluidas en la hiptesis y la elaboracin de un plan de trabajo, o procedimiento para la recogida
de datos, que sea coherente con la mencionada hiptesis.
El Anlisis de datos, se refiere a las tcnicas necesarias para llevar a cabo el tratamiento
estadstico de los mismos; el anlisis abarca desde la simple descripcin o representacin grfica,
a procedimientos ms complejos de ajuste de modelos o contrastes de hiptesis.
La Psicometra, incluye todo lo referente a la medicin. Proporciona las reglas que van a permitir
llevar a cabo el proceso de operativizacin de las variables que se quieren medir. Una vez
obtenidas las medidas mediante la asignacin de nmeros, los modelos psicomtricos facilitarn
un anlisis del error que les afecta (fiabilidad de las medidas) y, a su vez, los estudios de
validacin permitirn hacer inferencias acerca de las relaciones entre los datos empricos
obtenidos (medidas) y el constructo o variable psicolgica que se quiere medir.

2.- LA MEDICIN EN PSICOLOGA

De acuerdo con Coombs, Dawes y Tversky (1981) se considera que uno de los papeles
fundamentales asignados a la Ciencia es la descripcin, explicacin y prediccin de los fenmenos
observables por medio de unas cuantas leyes generales que expresen las relaciones entre las
propiedades de los objetos investigados. En las ciencias ms avanzadas las leyes expresan relaciones
cuantitativas, lo cual indica que las propiedades de los objetos se pueden representar por medio de
nmeros mediante un proceso de medicin.
Actualmente la medicin se considera como la asignacin de nmeros a entidades o eventos con
el fin de representar sus propiedades y sus relaciones. La medicin de las caractersticas psicolgicas
es difcil, se trata de conceptos abstractos, constructos tericos (o variables latentes) cuya medida no
puede llevarse a cabo de forma directa sino que debe inferirse a travs de una serie de conductas
representativas de dicho constructo. As, para Zeller y Carmines el proceso de medir enlaza
conceptos abstractos (los constructos inobservables directamente) con indicadores empricos
observables directamente (las conductas). Este tipo de medicin se llama medicin por indicadores.

R. MEDRANO (TUTOR) Pgina 1


PSICOMETRA ORIENTACIONES TEMA N 1 (INTRODUCCIN)

A la hora de interpretar las puntuaciones obtenidas por los sujetos hay dos formas de afrontar el
problema de las unidades de medida::
La Norma (forma ms habitual): consiste en comparar los resultados obtenidos por el sujeto con
los obtenidos por un grupo de sujetos que forman el grupo normativo de la misma poblacin.
El Criterio (se interpreta en relacin a un criterio establecido previamente). Los resultados
obtenidos se comparan con dicho criterio (un punto crtico) y la superacin o no del mismo es lo
que va a dar significado a las puntuaciones obtenidas.
La medicin psicolgica tiene una serie de objetivos comunes sea cual sea el campo de estudio:
Estimar los errores aleatorios que conlleva toda medicin (fiabilidad de las medidas)
Garantizar que la medida no es algo intil, sino que sirve para explicar y predecir los fenmenos
de inters (validez de las medidas)

3.- ORGENES Y DESARROLLO DE LA PSICOMETRA

Existieron dos motivos fundamentales para introducir la medicin en Psicologa: La tendencia a


formular los problemas cientficos en trminos matemticos y el enfrentamiento de la Psicologa,
mitad del siglo XIX, con dos problemas fundamentales:
El problema psicofsico: estudio cuantitativo de las relaciones entre las caractersticas fsicas de
los estmulos y las sensaciones que suscitan en los sujetos, en funcin de las cuales se asignan
valores numricos a los estmulos. Los estudios de Psicofsica dieron lugar al desarrollo de
modelos que permitieron asignar valores numricos a los estmulos y, por tanto, permitieron el
escalamiento de estmulos.
El problema de la cuantificacin de las diferencias individuales: mediante la asignacin de
nmeros a los sujetos en funcin del grado en que manifiesten un atributo o conducta. Los
estudios acerca de las diferencias individuales dieron lugar al desarrollo de las distintas Teoras de
los Tests (modelos) que posibilitaron la asignacin de valores numricos a los sujetos y, por tanto,
permitieron el escalamiento de los sujetos.

Wundt marc el comienzo de la Psicologa Experimental

4.- MTODOS DE ESCALAMIENTO

Escalamiento: Campo de la Psicometra cuyo objetivo fundamental es la construccin de escalas de


medida; es decir, la construccin de instrumentos que permitan llevar a cabo mediciones para
representar las propiedades de los objetos (estmulos, sujetos o respuestas) por medio de nmeros, de
acuerdo a unas normas o reglas. Desde la perspectiva de la Psicometra hay dos supuestos bsicos
en todos los mtodos de escalamiento:
La existencia de un continuo latente o subyacente, a lo largo del cual varan los objetos
psicolgicos que se van a escalar (estmulos, sujetos o respuestas) y no puede ser observado de
forma directa.
Que los objetos psicolgicos (estmulos, sujetos o respuestas) pueden situarse de forma
ordenada a lo largo de ese continuo.

El propsito del escalamiento de estmulos es determinar las caractersticas que los sujetos perciben
en ellos y, por tanto, la respuesta del sujeto (o sujetos) es una respuesta subjetiva que nos va a
permitir diferenciarlos y escalarlos; es decir, asignar un valor numrico a cada uno de los estmulos.
En este caso los estmulos se sitan a lo largo del continuo y los sujetos, que han emitido juicios sobre
los estmulos, actan como instrumento de medida.

Cuando el objeto a escalar son los sujetos se utiliza una muestra extrada de forma aleatoria de la
poblacin y todos los sujetos responden al mismo conjunto de estmulos (un test). Las respuestas
emitidas por los sujetos proporcionan una puntuacin numrica para cada sujeto de la muestra (las
diferencias entre puntuaciones reflejan la diferencia entre sujetos respecto al atributo o caracterstica
que se est midiendo).
En este caso los sujetos se sitan a lo largo del continuo y los estmulos actan como instrumento de
medida.

R. MEDRANO (TUTOR) Pgina 2


PSICOMETRA ORIENTACIONES TEMA N 1 (INTRODUCCIN)

Hay casos que interesa situar en el continuo sobre el que vara el atributo que se est estudiando tanto
a los estmulos como a los sujetos. La posicin de cada sujeto respecto del atributo que se est
analizando (su actitud, aptitud, sentimientos, etc.) es un factor que determina su respuesta
(Torgerson: aproximacin centrada en la respuesta)

En sus orgenes el escalamiento estuvo asociado a las escalas de estmulos (proceso de construccin
de escalas para la cuantificacin de estmulos). Todo lo referente a la cuantificacin de los sujetos para
apreciar de forma sistemtica las diferencias individuales (escalar a los sujetos) lo estudiaremos en el
marco de la Teora de los Test.
En la actualidad esta distincin est superada (se mantiene por cuestiones didcticas)

MTODOS DE ESCALAMIENTO PSICOFSICO

Constante de WEBER A partir del trmino acuado por Herbart umbral mnimo que alude a la
mnima intensidad que debe tener un estmulo para que se pueda percibir; Weber comienza a
desarrollar los mtodos psicofsicos, que le iban a permitir el clculo de los umbrales y enunciar su ley.

E = incremento mnimo que ha de experimentar la magnitud de un


estmulo (magnitud fsica) respecto a su magnitud inicial (E) para
K = E/E que se perciba un cambio en la sensacin (magnitud psicolgica)
E = magnitud inicial de estmulo // K = constante de Weber
A este cambio mnimo de sensacin Weber lo denomin (dap)
diferencia apenas perceptible

Funcin de FECHNER Desarroll mtodos psicofsicos indirectos que le permitieron elaborar


escalas psicofsicas. El escalamiento psicofsico se refiere a dos continuos (uno fsico en el que varan
los estmulos y uno psicolgico en el que varan las sensaciones que producen en los sujetos). La
funcin que mejor representa la relacin entre los dos continuos es:

S = valor en la escala de sensacin.


S = C ln E + A E = valor del estmulo.
C y A = pendiente y ordenada en el origen de la funcin logartmica.

Para medir la relacin entre estmulos y sensaciones Fechner introdujo los conceptos de Umbral
Absoluto (magnitud fsica del estmulo que se requiere para que se produzca una sensacin) y
Umbral Diferencial (incremento mnimo, en la magnitud fsica del estmulo, que se requiere para que
el sujeto perciba un cambio de sensacin). La ley de Fechner establece que cuando la magnitud fsica
del estmulo est en el umbral absoluto la sensacin es nula, y que si se aumenta la estimulacin en
proporcin geomtrica las sensaciones aumentarn aritmticamente. Es decir, que cada vez se
necesitar un mayor incremento en la estimulacin fsica para que se perciba un cambio en la
sensacin.
A la ley se le critica que los estmulos de muy alta intensidad o muy baja intensidad no se ajustan bien
a ella y que tampoco lo hacen todos los sistemas sensoriales (Fechner inicia la Psicologa cuantitativa)

Mtodos de Fechner para obtener los umbrales:

Mtodo de los lmites (cambios mnimos): el experimentador va modificando la intensidad del


estmulo (la aumenta o la disminuye para averiguar el umbral absoluto o bien compara
intensidades en relacin con estmulos estndar, para averiguar los umbrales diferenciales)
Mtodo de ajuste (error promedio): el propio sujeto modifica la intensidad de los estmulos hasta
encontrar el valor de sus umbrales.
Mtodo de los estmulos constantes: se asume que cuando un estmulo se presenta a un mismo
sujeto en repetidas ocasiones, no siempre es percibido, o no siempre se percibe de la misma
forma. El umbral absoluto es la magnitud percibida el 50% de las ocasiones en las que se
presenta el estmulo.

R. MEDRANO (TUTOR) Pgina 3


PSICOMETRA ORIENTACIONES TEMA N 1 (INTRODUCCIN)

Funcin potencial de STEVENS Desarroll los mtodos directos de escalamiento. Stevens trata
de encontrar una funcin que relacione estmulos y respuestas. Esta funcin es una funcin potencial.

R = respuesta de los sujetos // E = valor del estmulo.


R = q En q = constante que depende de las unidades de medida.
n = exponente de la funcin que depende del atributo sensorial.

Mtodos de escalamiento utilizados por Stevens:

Emparejamiento de magnitudes: por modalidad cruzada (dos continuos fsicos diferentes que
el sujeto debe emparejar segn su magnitud); por estimacin de magnitudes (a partir de un
estmulo estndar, que se toma como referencia, el sujeto va asignando valores al resto de los
estmulos); por produccin de magnitudes (se presentan al sujeto una serie de nmeros, de uno
en uno y de forma aleatoria, la tarea consiste en modificar la magnitud de los estmulos en funcin
de los nmeros presentados)
Emparejamiento de razones: se presentan dos estmulos que guardan una determinada
proporcin y se pide al sujeto que ajuste otros dos segn esa proporcin (modalidad cruzada); se
asignan razones numricas a las razones entre las magnitudes de los estmulos (estimacin de
razones) y producir otro estmulo que guarde con un estndar una proporcin igual a la que se
sugiere (produccin de magnitudes)
Emparejamiento de intervalos: emparejar intervalos entre los estmulos de dos continuos
(modalidad cruzada); mediante nmeros estimar las diferencias (estimacin de razones) y
encontrar estmulos intermedios entre otros dados (produccin de magnitudes)
Escalas de categoras o clasificacin: asignar estmulos a categoras predeterminadas y
averiguar sus valores escalares.

Los mtodos desarrollados por Stevens estn centrados en medir la capacidad de los sujetos para
hacer estimaciones subjetivas acerca de la magnitud de los estmulos y comprobar hasta qu punto
los juicios emitidos se ajustan a los datos reales (magnitud real de los estmulos)

MTODOS DE ESCALAMIENTO PSICOLGICO

A partir de las ideas de Fechner (sin recurrir a medidas de tipo fsico) se desarrollan las escalas
psicolgicas o subjetivas. Thurstone ha sido la figura que ms contribuy a su desarrollo, aportando
un modelo basado en la variabilidad perceptual de los sujetos, e incluso de un mismo sujeto cuando se
le presentan los mismos estmulos en distintas ocasiones, y en la limitacin que tienen los sujetos para
percibir las diferencias de magnitud entre dos estmulos cuando estas son muy pequeas. Las
ecuaciones de su modelo matemtico se denominan:
Ley de juicio comparativo (mtodo de las comparaciones binarias)
Ley de juicio categrico (mtodo de intervalos sucesivos, aparentemente iguales y de
ordenacin de rangos)

Nuevas formas de escalamiento psicolgico

Guttman: desarroll un nuevo modelo para el escalamiento conjunto de sujetos y estmulos


(escalamiento de respuestas). Para la obtencin de la escala utiliza el escalograma. La escala
resultante se denomina escala de entrelazamiento (los sujetos y los estmulos se sitan a lo
largo del mismo continuo psicolgico de forma entrelazada)
Coombs: desarrollo una teora conocida como teora del despliegue y propuso un modelo que
permite escalar sujetos y estmulos conjuntamente.

Estos modelos y sus mtodos asociados se desarrollaron, en principio, para la construccin de escalas
unidimensionales (permitieran ordenar un conjunto de estmulos y/o sujetos respecto a un nico
atributo o caracterstica). Ms tarde, se desarrollaron mtodos de escalamiento multidimensional

R. MEDRANO (TUTOR) Pgina 4


PSICOMETRA ORIENTACIONES TEMA N 1 (INTRODUCCIN)

(atienden, simultneamente, a ms de un atributo o caracterstica)

5.- ORGENES Y DESARROLLO DE LOS TEST

El intento por apreciar de forma sistemtica las diferencias individuales (escalar a los sujetos) llev al
desarrollo del Mtodo de los Tests y de las distintas Teoras de los Tests.
Un Test es un instrumento de medicin diseado especialmente para estudiar de un modo objetivo y
sistemtico el nivel de los sujetos respecto a algn atributo, caracterstica o dominio de conocimientos
(a partir de las puntuaciones de los sujetos en el test, se analizan las diferencias existentes entre ellos)

Hay tres factores que se pueden considerar decisivos en el desarrollo de los test:
La apertura del laboratorio antropomtrico de Galton en Londres (recurri a la correlacin como
medida de asociacin y fue el primero en aplicar el concepto estadstico de distribucin normal, de
media, de mediana, varianza y correlacin a datos psicolgicos)
El desarrollo de la correlacin de Pearson
La interpretacin de Spearman (considerando que la correlacin entre dos variables indica que
ambas tienen un factor comn)

Los primeros Tests mentales: Para Cattell (primer autor en utilizar el trmino), los test constituan un
sistema uniforme que permita comparar y combinar, en lugares y momentos diferentes, la medida de
las funciones mentales. Comparta con Galton la creencia de que se poda medir el funcionamiento
intelectual de las personas mediante test de discriminacin sensorial y midiendo el tiempo de reaccin
(no medan inteligencia)

Los primeros Test de inteligencia: el primero en destacar la importancia de los procesos mentales
superiores para estudiar las diferencias individuales fue Binet. Binet y Simon (1905) publicaron la
primera escala de inteligencia (ya no se ocupaba de las funciones sensoriales o motoras, se centraba
en la capacidad de razonamiento y comprensin de los nios). Terman adapt el test (Stanford-Binet),
introdujo el concepto de edad mental (equivale a la edad cronolgica de los nios intelectualmente
normales) y defini la inteligencia como la habilidad para llevar a cabo razonamientos abstractos. Para
medir la inteligencia utiliza el concepto, acuado por Stern:
Cociente intelectual CI = (Edad Mental / Edad Cronolgica) x 100

Los test colectivos: comienzan a utilizarse con la entrada de EEUU en la Primera Guerra Mundial
(seleccionar y clasificar a las personas disponibles para el ejrcito segn sus posibilidades). Yerkes
sera el encargado de investigar nuevos procedimientos que posibilitaran la administracin de Tests en
el ejrcito. As, se crearon:
Test Alpha: diseado para la poblacin general.
Test Beta: para los reclutas analfabetos o aquellos que no dominaban el ingls.

Una vez finalizada la guerra el uso de test se extendi a la industria y al resto de instituciones. En 1922
Cattell fund la primera empresa dedicada a la publicacin masiva de test, y a partir de ah empezaron
a utilizarse como instrumento de seleccin en la administracin americana. En 1938 apareci el Test
de Weschler-Bellevue para la medicin de la inteligencia en adultos y en 1949 una versin para nios
conocida como WISC. En 1955 apareci una revisin de la escala anterior conocida como Weschler
Adult Intelligence Scale (WAIS). La aparicin de estas escalas supuso un avance en el desarrollo de
los Test (debido a la falta de efectividad que tena el test de Stanford-Binet aplicado a adultos)

Se desarroll el Coeficiente de Correlacin de Pearson y el Anlisis factorial (representar un


conjunto de variables observables mediante un nmero ms pequeo de variables, no observables,
latentes, llamadas factores, de las que las primeras son indicadores). Surgen los primeros test
destinados a la medida de aptitudes y del rendimiento.

La influencia del anlisis factorial respecto a los test de inteligencia fue doble:
Facilit una fundamentacin terica, mostrando que en la mayor parte de las funciones
cognoscitivas interviene un factor general g comn a todas ellas.
Los resultados del anlisis factorial subrayan la importancia de estudiar otras aptitudes ms
especficas en el campo de la inteligencia.

R. MEDRANO (TUTOR) Pgina 5


PSICOMETRA ORIENTACIONES TEMA N 1 (INTRODUCCIN)

Las bateras de aptitud mltiple: facilitan una medida de posicin de cada sujeto en un cierto nmero
de rasgos (en lugar de un CI, se obtiene una puntuacin por separado de cada rasgo). Un ejemplo
destacado es la Batera de Aptitudes Mentales Primarias (Thurstone) que incluye pruebas para la
medida de los componentes fundamentales del comportamiento inteligente (comprensin verbal,
fluidez verbal, aptitud numrica, aptitud espacial, memoria, rapidez perceptiva y razonamiento general)

Los Tests de personalidad: se puede considerar a Kraepelin su precursor al utilizar el Test de


Asociacin Libre, con pacientes normales, para estudiar los efectos psicolgicos de la fatiga, el
hambre y las drogas. El prototipo de cuestionario de personalidad con carcter psicomtrico es la Hoja
de Datos Personales de Woodworth, utilizada en la Primera Guerra Mundial (deteccin de sujetos
con trastornos neurticos graves, no aptos para el servicio militar)

De los primeros test objetivos han sobrevivido en la actualidad:


Los de Guilford y Catell (se usan en poblaciones normales, estn orientados hacia el
anlisis de rasgos y estn basados en el anlisis factorial)
El Inventario Multifsico de Personalidad de Minnesota (MMPI) de Hathaway y McKinley
(se usa en poblaciones clnicas y no utiliza escalas derivadas del anlisis factorial)

Durante la primera mitad siglo XX aparecen los Test Proyectivos (Rorschach dise el primer test que
pretenda dar una visin global y comprensiva de la personalidad, se conocido como el Test de las
manchas de tinta). La mayora se asocian con la psicologa clnica y, en especial, con el Psicoanlisis.
En 1926 aparece el test de Dibujo de la Figura Humana de Machover y en 1938 el Test de Apercepcin
Temtica (TAT). En general son de escasa utilizacin.

Medicin de intereses y actitudes: Entre los instrumentos clsicos para la medida de los intereses
destacan el Cuestionario de Intereses Vocacionales de Strong (SVIB) y la Escala de Preferencias de
Kuder en 1934. En cuanto a la medida de las actitudes, creencias y opiniones destaca Thurstone y
sus dos leyes ya mencionadas (Ley del Juicio Comparativo y Ley del Juicio Categrico).

Ms tarde se desarroll la Tcnica de Likert (basada en los mismos principios que los test de
aptitudes) intentaba paliar alguno de los inconvenientes de las escalas de Thurstone (entre otros, la
prueba de jueces). Con el fin de medir el significado connotativo, afectivo o subjetivo, que
determinados estmulos tienen para los sujetos, Osgood cre una escala de clasificacin, el
Diferencial Semntico.

LOS TESTS REFERIDOS A CRITERIO (TRC) FRENTE LOS REFERIDOS A NORMAS (TRN)

Glaser distingui dos aproximaciones a la medicin del rendimiento (referida al criterio y referida a la
norma). Las diferencias entre TRC y TRN aluden a cinco aspectos fundamentales:

Tests Referidos a las Normas Tests Referidos al Criterio


Finalidad de la Mostrar las diferencias individuales en la Estimar el rendimiento o conducta del
evaluacin conducta o rasgo que mide el test. sujeto en los objetivos que mide el test.
Construccin del Recurrir a las teoras existentes respecto
Especificar claramente el dominio de
test y la al rasgo o constructo que se quiere medir,
contenidos o conductas que se quiere
especificacin de sin partir de una delimitacin clara de los
evaluar y el uso que se hace del test.
los contenidos contenidos a evaluar.
Los tems ponen de relieve las diferencias
Forma de Los tems se seleccionan en funcin de
individuales maximizando la varianza del
seleccionar los los objetivos y del uso que se vaya a
test y seleccionando tems de dificultad
tems hacer del test.
media y alto poder discriminativo.
Puntuacin: se considera un indicador de
Significado de las Puntuacin: estimador de la conducta o
la puntuacin verdadera en un rasgo
puntuaciones rendimiento del sujeto en el dominio.
latente.
Interpretacin de Puntuacin: tiene significado nicamente Puntuacin: tiene significado en trminos

R. MEDRANO (TUTOR) Pgina 6


PSICOMETRA ORIENTACIONES TEMA N 1 (INTRODUCCIN)

con relacin a los resultados del grupo


las puntuaciones absolutos.
normativo.

Glaser Los TRC son aquellos en los que los resultados dependen del estatus absoluto de calidad
del estudiante, frente a los TRN que dependen del estatus del grupo. Permiten a psiclogos y
educadores la evaluacin de los estudiantes en funcin de su conocimiento o no de una materia
determinada (TRC) en lugar de hacerlo slo en relacin a otros estudiantes (TRN)

Los Test Adaptativos Informatizados (TAIs): se denominan as porque la seleccin de los tems se
va haciendo a lo largo del proceso de administracin (se utiliza el ordenador para hacer la seleccin),
de manera que los tems se pueden adaptar al nivel de cada sujeto para que no le resulten ni
demasiado fciles ni demasiado difciles.

6.- DESARROLLO DE LA TEORA DE LOS TEST

Es necesaria para desarrollar un marco terico que sirva de fundamento a las puntuaciones
obtenidas por los sujetos, que posibilite la validacin de las interpretaciones e inferencias realizadas a
partir de ellas y que permita la estimacin de los errores de medida. En definitiva, medir hasta qu
punto las puntuaciones obtenidas por los sujetos en un test (variable observable) equivalen a sus
puntuaciones verdaderas o habilidades que se estn midiendo (variable inobservable) y cul es la
cuanta del error de medida que les afecta (fiabilidad de las puntuaciones) y la validez de las
inferencias o conclusiones que se pueden sacar a partir de las mismas (Validez)

Teora Clsica de los Tests (TCT) Se desarrolla, fundamentalmente, a partir de las aportaciones
de Galton, Pearson y Spearman, y gira en torno a tres conceptos bsicos:

(X) Puntuaciones empricas y observadas (obtenidas por los sujetos cuando se les aplica un test)
(V) Puntuaciones verdaderas (las que realmente tienen los sujetos en el rasgo o constructo
medido y coinciden con las empricas cuando no existen errores de medida)
(E) Puntuaciones debidas al error: asociado al sujeto (fatiga, estado emocional, etc.), al propio test
(formato) a las condiciones ambientales, a los aplicadores, etc.

Para establecer la relacin funcional entre estos conceptos Modelo lineal (Spearman)

X = variable dependiente (puntuacin observable)


X=V+E V = variable independiente (puntuacin verdadera)
E = errores.

La ejecucin de un sujeto al responder a un test en un momento determinado estar afectada por


mltiples factores difcilmente controlables, lo que implicar que la puntuacin obtenida (emprica) no
coincida con su puntuacin verdadera. Ante la imposibilidad de saber con exactitud cul es esta
puntuacin verdadera ser necesario hacer estimaciones en base a los supuestos del modelo.
El ms ambicioso y global de los intentos realizados para estimar la fiabilidad de un instrumento de
medida, analizando de forma sistemtica las posibles fuentes de error, es el proporcionado por la
Teora de la Generalizabilidad (TG) propuesta por Cronbach que tiene en cuenta todas posibles
fuentes de error e intenta diferenciarlas mediante la aplicacin de los procedimientos clsicos de
anlisis de varianza (ANOVA)

Teora de Respuesta al tem (TRI) surge de la crtica a la TCT (las puntuaciones de los sujetos
estaban en funcin de que los tems fueran ms fciles o difciles y las estadsticas de los tems,
ndices de dificultad y discriminacin, dependan de la muestra de sujetos utilizada para su clculo)
Gulliksen y Lord se interesaron en el desarrollo de teoras y modelos que permitieran describir los
niveles de habilidad de los sujetos con independencia de la muestra de tems o de tareas utilizados
para su evaluacin, y el clculo de los estadsticos de los tems con independencia de la muestra de
sujetos utilizada La solucin TRI.
Curva Caracterstica del tem se deriva de la relacin funcional entre los valores de la variable que
miden los tems (nivel de habilidad de los sujetos) y la probabilidad de que los sujetos, en funcin de

R. MEDRANO (TUTOR) Pgina 7


PSICOMETRA ORIENTACIONES TEMA N 1 (INTRODUCCIN)

su nivel de habilidad, acierten cada tem.

R. MEDRANO (TUTOR) Pgina 8


PSICOMETRA ORIENTACIONES 1 PARTE (INSTRUMENTOS MEDICIN)

1 PARTE: CONSTRUCCIN DE INSTRUMENTOS DE MEDICIN PSICOLGICA

TEMA N 2 PRINCIPIOS BSICOS PARA LA CONSTRUCCIN DE INSTRUMENTOS DE


MEDICIN PSICOLGICA.

DIFERENCIACIN TERMINOLGICA

TEST: trmino que se refiere a los instrumentos de medicin de


variables de tipo cognitivo (aptitudes, conocimientos, rendimiento,
habilidades, etc.) en las que las respuestas de los sujetos son
correctas o incorrectas y la puntuacin total en el test es la suma
(directa o ponderada) de todas las respuestas correctas, dando lugar
a una escala jerrquica o acumulativa.

Ej. Test de conocimientos: La capital de Espaa es: a) Pars; b) Londres; c) Madrid

ESCALA: hace referencia a los instrumentos elaborados para medir variables no cognitivas
(preferencias, opiniones, etc.) y se caracteriza porque los sujetos han de responder eligiendo, sobre
una escala de categoras graduada y ordenada, aquella categora que mejor represente su posicin;
no hay respuestas correctas o incorrectas, y la puntuacin total en la escala ser la suma de las
puntuaciones asignadas a las categoras elegidas por los sujetos.

Ej. Escala: Debera estar prohibido fumar en todos los restaurantes?: a) Completamente de acuerdo;
b) De acuerdo; c) Indiferente; d) En desacuerdo; e) Completamente en desacuerdo.

CUESTIONARIOS: formados por tems o elementos que no estn necesariamente relacionados unos
con otros, cuyas opciones de respuesta no estn ordenadas ni graduadas, que pueden ser puntuados
e interpretados individualmente y en los que tampoco hay respuestas correctas e incorrectas. Se
utilizan para obtener una mayor informacin del sujeto y de su entorno (edad, profesin, estudios, etc.).
Son tpicos en las investigaciones mediante encuestas.

Ej. Cuestionario: Qu parte de la asignatura de Psicometra le resulta ms fcil de estudiar? a)


Fiabilidad; b) Validez; c) Anlisis de elementos; d) La construccin de test.

INVENTARIO: vinculado a los instrumentos elaborados para medir variables de personalidad. Las
respuestas no son correctas o incorrectas, lo nico que demuestran es la conformidad o no con los
enunciados de los tems.

Ej. Inventario: A menudo me siento como si los dems me ignoraran (V F) // El problema de mucha
gente es que no toma las cosas en serio (V F)

Instrumentos utilizados para medir variables de tipo psicolgico

Test Escalas / Cuestionarios / Inventarios

Instrumentos de medicin del mbito Variables de tipo orctico (emocionales)


cognitivo (aptitudes, conocimientos) No existen respuestas correctas e incorrectas
Puntuacin total sumativa Escalas (actitudes)
Existen respuestas correctas e incorrectas Cuestionarios (opinin, valoraciones)
Inventario (personalidad)

R. MEDRANO (TUTOR) Pgina 1


PSICOMETRA ORIENTACIONES 1 PARTE (INSTRUMENTOS MEDICIN)

1.- PROCESO DE CONSTRUCCIN DE UN TEST

El objetivo del test es el paso previo que va a condicionar las siguientes etapas

ETAPAS DECISIONES A TOMAR ACERCA DE


1.- Determinar la finalidad del test Qu se va a medir, a quin y para qu
2.- Especificar las caractersticas del test Cul va a ser el contenido. Tipo y nmero de
tems. Caractersticas psicomtricas
3.- Redaccin de los tems tems de eleccin e tems de construccin
4.- Revisin crtica de los tems por expertos Qu tems van a seleccionarse
5.- Confeccin de la prueba piloto Instrucciones de administracin. Formato de
presentacin y registro de respuestas
6.- Aplicacin de la prueba piloto Individual / colectiva; Papel y lpiz / informatizada;
Por correo, entrevista personal, por telfono, etc.
7.- Correccin de la prueba piloto y asignacin de En los tests formados por tems de eleccin
puntuaciones a los sujetos En los test formados por tems de construccin

2.- FINALIDAD DEL TEST:

Como paso previo para la construccin del test, es necesario tener claro su objetivo (lo que se quiere
medir, a quien se quiere medir y para qu se quiere medir):
Constructo (variable objeto de estudio) Variable psicolgica no observable de forma directa
(se manifiesta a travs de conductas que s son observables de forma directa y son las que se
miden). Es decir, que para construir un test, lo primero que hay que hacer es definir el/los
constructo/s que lo forman y as determinar mejor las conductas que los representan.
Poblacin a la que va dirigido Segn el tipo de poblacin al que va dirigido (infantil, adultos,
etc.), variar el contenido de los tems, su redaccin, la longitud del test, las instrucciones, etc.
Utilizacin prevista: Decisiones que se van a tomar (para qu se va a utilizar)

Si tenemos en cuenta que un test es una herramienta que permite obtener datos para la medicin y
evaluacin de alguna caracterstica o atributo psicolgico (constructo), la medicin no ser vlida a
menos que el test se adecue a su objetivo.

Usos ms frecuentes y decisiones que se suelen tomar a partir de las puntuaciones obtenidas
mbito educativo: alumnos aptos / no aptos.
Seleccin mbito profesional: seleccin de aspirantes.
Clasificacin / Colocacin En cualquier mbito
Diagnstico En cualquier mbito, para detectar problemas de aprendizaje, etc.
Certificacin Para acreditar diversas cualificaciones o competencias, tanto en el
mbito profesional como acadmico.
Orientacin / Consejo Detectar las capacidades e intereses de las personas para, examinando
las distintas opciones, elegir aquella/s que mejor se adecuen a su perfil.
Descripcin / Informacin Describir el rendimiento acadmico tanto a nivel individual como
colectivo. Obtener informacin acerca de la opinin pblica.

3.- ESPECIFICACIN DE LAS CARACTERSTICAS DEL TEST:

Para desarrollar las especificaciones del test hay que tener en cuenta cuatro aspectos fundamentales:

A.- Contenido: Comienza al determinar cul es su dominio de conductas (conjunto de conductas a


travs de las que se manifiesta el constructo). Definir un constructo y determinar su dominio de
conductas, no son procesos distintos, sino que estn fuertemente relacionados. A medida que tiene
una mayor informacin acerca del constructo que se quiere medir se ir modificando el contenido de la
prueba y viceversa. En los test de rendimiento y conocimientos y, sobre todo, en los test referidos a
criterio (TRC) en lugar de dominio de conductas se habla de dominio de contenidos a evaluar. Para
contemplar todos los procesos y todos los contenidos, se suele utilizar una tabla de doble entrada. A
modo de ejemplo:

R. MEDRANO (TUTOR) Pgina 2


PSICOMETRA ORIENTACIONES 1 PARTE (INSTRUMENTOS MEDICIN)

Matriz de especificaciones del contenido para un test de psicometra


Procesos reas de Contenido
Medicin 20% Fiabilidad 35% Validez 35 % A. de tems 10 %
Conocimiento 25 % 4 7 7 2
Comprensin 25% 4 7 7 2
Aplicacin 25% 4 7 7 2
Anlisis 25% 4 7 7 2
Total 16 28 28 8

Cada casilla de la matriz representa la interaccin entre un rea de contenido y un proceso, esto
facilita la redaccin de tems que cubran todos los aspectos que se consideran relevantes. El nmero
de tems y los porcentajes reflejan la ponderacin de la importancia que se les conceden. Una vez
asignadas las ponderaciones, la versin piloto debe contar como mnimo con el doble o el triple de los
tems de la versin final del test.
Es importante que estn representadas todas las reas de la Psicometra para que tenga validez y que
en cada una de ellas haya nmero suficiente de tems para asegurar la fiabilidad.

B.- Formato de los tems:

tems de eleccin: Son tems de respuesta cerrada, donde el sujeto elige una o varias alternativas de
entre las propuestas. Entre los formatos ms comunes destacan:

Dos alternativas (se elige entre V F; Si No; Correcto Incorrecto). Se utilizan para medir
variables de tipo cognitivo (habilidades, aptitudes y sobre todo para la construccin de test de
conocimiento y rendimiento). Ventaja: es rpido y fcil de usar. Inconveniente: los sujetos que
responden al azar tienen un 50% de posibilidad de elegir la respuesta correcta.
Eleccin mltiple (se elige entre alternativas u opciones de respuesta de las cuales una es la
correcta y las otras son incorrectas (distractores). Se utiliza para medir variables cognitivas y sobre
todo en test de conocimiento y rendimiento. Ventaja: son fciles de administrar, corregir y puntuar.
Inconveniente: son ms difciles de construir que los de dos alternativas.
Emparejamiento (el sujeto debe emparejar los elementos de dos columnas de acuerdo a las
instrucciones dadas en el enunciado). Se utilizan para medir variables de tipo cognitivo.
Formato Cloze o incompleto (frase con espacio en blanco para rellenar con palabra de una lista)

Los formatos anteriores se utilizan para la medida de habilidades, aptitudes y conocimientos (de
antemano se decide la respuesta correcta). Los test con este tipo de tems Tests objetivos.

Escalas de clasificacin (rating scales): Las alternativas de respuesta estn ordenadas de forma
gradual en una serie de categoras a lo largo de un continuo (totalmente de acuerdo; de acuerdo;
indiferente; etc.). Tambin se las denomina escalas valorativas (los sujetos tienen que emitir
juicios de valor). Ventaja: los sujetos expresan su postura de una manera ms precisa.
Inconveniente: el significado de las opciones de respuesta no es el mismo para todos los sujetos,
aparecen sesgos en las respuestas (opciones extremas, categoras centrales, etc.)

Opciones: Likert (5 alternativas) el ms utilizado // Osgood (7 categoras)


Acuerdo Totalmente en desacuerdo. Totalmente de acuerdo
Frecuencia Siempre. Nunca // Cantidad Mucho.Nada
Sentimientos Completamente satisfecho. Completamente insatisfecho
Valoracin Excelente. Muy mala

Listados (checklists): Tambin es una escala valorativa en la que los sujetos han de mostrar su
opinin sobre algn hecho. Las opciones son independientes entre s ( escalas clasificacin); y
no hay respuestas correctas o incorrectas. El nmero de respuestas suele ser grande y es posible
elegir varias opciones. Es un formato tpico de los cuestionarios.

Las escalas de clasificacin y los listados se utilizan para la medida de variables de personalidad,
actitudes, opiniones, etc. Variables no cognitivas. No hay respuestas correctas o incorrectas.

R. MEDRANO (TUTOR) Pgina 3


PSICOMETRA ORIENTACIONES 1 PARTE (INSTRUMENTOS MEDICIN)

tems de construccin: El sujeto elabora su propia respuesta. Tambin se denominan de respuesta


abierta. Los hay de dos tipos:

De respuesta corta (el sujeto elige una palabra o frase sin que se le presente en ninguna lista)
De respuesta extensa o de ensayo (se pide a los sujetos que desarrollen un tema): se da la
oportunidad de expresarse con sus propias palabras (se puede evaluar el nivel de conocimientos,
la forma de estructurarlos, las habilidades cognitivas de orden superior, los procesos cognitivos
que ponen en marcha a la hora de solucionar un problema, opiniones, afectos, etc.)

Inconvenientes: las respuestas son difciles de analizar y valorar pues el investigador tiene que
codificarlas en una serie de categoras antes de comenzar el anlisis. Cuando la poblacin es pequea
se utilizan tests con tems de respuesta corta.

C.- Longitud del test: no hay un nmero de tems adecuado, depende de cada caso. Son muchos los
factores que hay que tener en cuenta (la poblacin a la que va dirigido, el tiempo del que se dispone,
los objetivos del test, etc.). En todos los casos se recomienda que el nmero de tems de la prueba
piloto sea mayor que el de la versin final.

D.- Caractersticas psicomtricas de los tems:

Nivel de dificultad Un tem es fcil o difcil, para una determinada poblacin, en funcin de la
probabilidad que tengan de responder a l correctamente. Podemos distinguir tres tipos de tests:

Test de velocidad: los tems deben ser fciles de resolver. La dificultad est en el tiempo limitado
de ejecucin.
Test de ejecucin mxima (Test de potencia): se utiliza para la evaluacin del rendimiento
acadmico y para la medida de las aptitudes y destrezas. Aqu los tems tienen diferentes grados
de dificultad (de muy fciles a muy difciles); y el tiempo de ejecucin no es un factor importante.
Test de ejecucin tpica: son los test de personalidad, actitudes, intereses, etc. Como no hay
respuestas correctas e incorrectas, no se puede hablar de dificultad de los tems

Homogeneidad En relacin con los dems tems (un tem tendr un alto grado de homogeneidad
con el resto de tems que forman el test cuando mida lo mismo que ellos). Si el constructo a medir es
unidimensional, los tems han de ser ms homogneos que si el constructo es multidimensional.

Capacidad de discriminacin Un tem tendr poder discriminativo en la medida en que sirva para
diferenciar entre sujetos que han obtenido en el test puntuaciones extremas. Depende de la poblacin
a la que va dirigida el test.

4.- REDACCIN DE LOS ITEMS:

Consideraciones para la tarea:


Debe existir un alto grado de congruencia entre el tem y el constructo psicolgico que se quiere
medir (validez del constructo).
Los constructos deben estar claramente definidos para poder valorar el grado de congruencia
tem-constructo.
Hay que minimizar los errores de medida cometidos al medir el constructo con cada tem.
El formato de los tems debe ha de ser adecuado para los objetivos del test.
Los tems deben reunir las caractersticas psicomtricas ms adecuadas en cada caso.
Los tems deben estar bien redactados.
Los tems deben satisfacer las consideraciones legales y tcnicas pertinentes. (Por ejemplo se
deben evitar plagios).

R. MEDRANO (TUTOR) Pgina 4


PSICOMETRA ORIENTACIONES 1 PARTE (INSTRUMENTOS MEDICIN)

Recomendaciones generales:
Evitar la ambigedad de los enunciados (enunciados cortos y directos)
Evitar enunciados que provoquen respuestas sesgadas (aquella que es ms probable que elijan
los sujetos independientemente de su opinin)
Expresar una nica idea en el enunciado.
Evitar las dobles negaciones en los enunciados (hacen que los sujetos no sepan cul es la
respuesta que representa su opinin)

Recomendaciones para tems de eleccin:

Dos alternativas: Verdadero-Falso: (1.- Estar completamente seguro de que el tem es verdadero o
falso. 2.- No utilizar frases que sean universalmente verdaderas o falsas. 3.- Evitar poner en el
enunciado palabras que puedan inducir la respuestas correcta (como siempre, todo, nada, nunca, a
veces, en general, etc.). 4.- Evitar patrones de respuesta, colocando a lo largo del test, de forma
aleatoria, los tems cuyo enunciado sea correcto.

Eleccin mltiple: 1.- Asegurarse de que el enunciado del tem formula el problema con claridad. 2.-
Incluir la mayor parte del texto en el enunciado para evitar repeticiones innecesarias en las opciones
de respuesta. 3.- Incluir distintas opciones de respuesta al final del enunciado. 4.- Asegurarse de que
los distractores, son plausibles. 5.- Evitar opciones de respuesta como: ninguna de las anteriores o
todas las anteriores. 6.- Que slo haya una opcin correcta, a no ser que se indique lo contrario
claramente en las instrucciones. 7.- Tratar de que todas las alternativas de respuesta tengan una
longitud aproximada igual y con una construccin gramatical parecida. 8.- Aleatorizar la ubicacin de la
alternativa correcta. 9.- Hacer que todas las alternativas le parezcan igualmente atractivas a una
persona no informada del problema al que alude el enunciado. 10.- Asegurarse de que cada alternativa
concuerda gramaticalmente con el enunciado del tem. Si el enunciado est en singular, asegurarse de
que cada alternativa est en singular.

Emparejamiento: 1.- Asegurarse de que tanto las premisas como las opciones de respuesta que hay
que emparejar son homogneas. 2.- Utilizar el formato adecuado (las premisas se deben presentar de
forma aleatoria en una columna a la izquierda y en una columna paralela, situada a la derecha, se
deben presentar las distintas alternativas de respuesta) 3.- El enunciado del tem debe reflejar
claramente la tarea que se espera del sujeto y la forma en que hay que llevar a cabo el
emparejamiento.

Formato Cloze o incompleto: Necesario que en el enunciado del tem haya tantos espacios en blanco
como alternativas de respuesta; si no es as, debe constar en las instrucciones.

Escalas de Clasificacin: 1.- Evitar expresiones coloquiales, por si alguien no las conoce. 2.- Incluir
en el test completo aproximadamente el mismo nmero de tems formulados de manera positiva y
negativa. 3.- Asignar las etiquetas lingsticas (al menos en los extremos de la escala deben aparecer
las etiquetas lingsticas para facilitar la respuesta de los sujetos). Tambin es conveniente introducir
una categora central que represente el punto medio o neutral (no s, indiferente, ni de acuerdo ni en
desacuerdo) pues refleja la actitud u opinin de muchas personas.

Listados: son fciles de construir.

Recomendaciones para tems de construccin:

tems de respuesta corta: 1.- Asegurarse de que el enunciado puede ser contestado con una nica
frase o palabra y que hay una nica respuesta correcta. 2.- Los espacios en blanco para las respuestas
han de ser de la misma longitud. 3.- Evitar dar pistas de la respuesta correcta, (por ejemplo con el
artculo de antes de la palabra etc.). 4.- Indicar el grado de precisin exigido, (por ejemplo el nmero de
decimales). 5.- Evitar determinantes especficos como Todo o Nada y ambiguos como Frecuentemente
o Algunas veces.

R. MEDRANO (TUTOR) Pgina 5


PSICOMETRA ORIENTACIONES 1 PARTE (INSTRUMENTOS MEDICIN)

tems de respuesta extensa o de ensayo: 1.- Asegurarse de que el problema est bien enfocado,
con palabras que definan claramente la tarea (Compare, Contraste, etc.). 2.- No permitir a los sujetos
que elijan entre varias preguntas de ensayo. 3.- Decidir de antemano cmo se van a puntuar las
preguntas de ensayo. 4.- Redactar las preguntas referidas a cuestiones controvertidas de manera que
los sujetos que las deben responder sean evaluados en relacin a la evidencia que presentan, no a su
posicin personal respecto al tema.

Los sesgos de respuesta: Este tipo de respuestas suelen aparecer en tests construidos para la
medida de aspectos afectivos. Principales sesgos:
Aquiescencia: tendencia a responder sistemticamente que se est de acuerdo (o en
desacuerdo) con el enunciado del tem, con independencia de su contenido.
Deseabilidad social: responder de manera socialmente aceptada.
Indecisin o tendencia a seleccionar la alternativa central o neutra: no se, ni acuerdo ni
desacuerdo, indiferencia.
Respuesta extrema o tendencia a elegir como respuesta las categoras de los extremos con
independencia del contenido del tem.

5.- REVISIN CRTICA DE LOS ITEMS POR EXPERTOS:

Una vez redactados los tems y antes de dar forma a la prueba piloto, es conveniente que sean
revisados por un grupo de personas que no hayan intervenido en su elaboracin (expertos que
analicen todos aquellos aspectos que contribuyen a la calidad del tem). Una vez revisados, se
puede construir la versin preliminar del test (prueba piloto), con aquellos tems que han pasado este
primer control de calidad.

6.- CONFECCIN DE LA PRUEBA PILOTO:

Instrucciones de administracin:
Evitar un leguaje ampuloso y/o amenazante.
En los test de ejecucin mxima se debe explicar que hay algunos tems que resultarn muy
difciles para todos los sujetos (la prueba est pensada para que haya ejercicios que no puedan
resolver). Si se incluye esta observacin se reducir la ansiedad de los sujetos.
En los test de velocidad, avisar que el tiempo est limitado y muy pocos llegarn al final; tambin,
hay que explicitarlo en las instrucciones.
Las instrucciones deben proporcionar uno o ms tems de ejemplo.
Las instrucciones deben informar acerca de cmo distribuir el tiempo y qu hacer cuando no se
conoce la respuesta de un tem.
Las instrucciones deben animar al sujeto a responder a todas las preguntas y favorecer as su
rendimiento (tiende a bajar considerablemente cuando se dejan muchas respuestas en blanco)
Las instrucciones deben explicitar claramente la forma de responder.

Formato de presentacin y de registro de las respuestas: Una vez elaboradas las instrucciones hay
que organizar y ordenar los tems seleccionados para su posterior presentacin a los sujetos y decidir
el formato de registro de respuesta.
El formato debe ser claro y perfectamente legible.
Debe solicitar al comienzo la identificacin del sujeto.
Presentar las instrucciones
Presentar los tems (para medir variables cognitivas es importante que se coloquen ordenados en
funcin del nivel de dificultad, de menos a ms para evitar desmotivar al sujeto y que deje de
responder. En pruebas no cognitivas las preguntas embarazosas deben aparecer al final de lo
contrario el sujeto podra dejar de contestar)
Los formatos diferentes deben aparecer agrupados para evitar el desconcierto.
Hay que tratar de que los tems sigan una ordenacin lgica.

R. MEDRANO (TUTOR) Pgina 6


PSICOMETRA ORIENTACIONES 1 PARTE (INSTRUMENTOS MEDICIN)

7.- APLICACIN DE LA PRUEBA PILOTO:

Una vez construida la prueba es necesario hacer un estudio piloto para su evaluacin psicomtrica (ver
si cumple los requisitos necesarios para considerarla un instrumento cientfico de medicin).

Formas de administracin de la prueba:


Colectiva individual: preferible la colectiva (aunque WAIS, WISC son individuales)
Oral (las instrucciones y las respuestas se dan de forma oral)
Papel y lpiz (la presentacin y el registro de las respuestas se hace de forma impresa)
Mediante ordenador (aparecen los tems en pantalla y se responde a travs del teclado)
A travs del correo (alta tasa no responde y falta de seguridad responde a quin iba dirigido?)

8.- CORRECCIN PRUEBA PILOTO / ASIGNACIN DE PUNTUACIONES A LOS SUJETOS:

Formas de controlar la subjetividad: Siempre que se emite un juicio de algo es inevitable un cierto
grado de subjetividad que hay que tratar de eliminar o, al menos, controlar.

En los test formados por tems de eleccin (respuesta cerrada): el examinador no debe realizar
ninguna valoracin de las respuestas emitidas por los sujetos, eliminndose la posibilidad de introducir
subjetividad en las puntuaciones asignadas.

A.- Pruebas cognitivas: Se conoce de antemano cual es la respuesta correcta, solo hay que
comprobar si coincide. Un inconveniente grave es la posibilidad de que un sujeto, desconociendo la
respuesta, elija por azar la correcta (la puntuacin final no se corresponde con su verdadero nivel).
Para evitarlo se utiliza una frmula de correccin (penalizando errores o bonificando las omisiones)

Xi Puntuacin Total
i= 1

E X c Puntuacin corregida // A = n de aciertos.


X c = A Aa = A
K1 Aa Aciertos obtenidos al responder al azar.
E = n errores // K = n alternativas de los tems
1 k 1 Si llamamos Ra al n de respuestas aleatorias que emite el sujeto en el
E = Ra 1 = Ra
k k total del test, se puede establecer que el n de errores ser igual al n
de respuestas aleatorias por la probabilidad del error.
K 1 E
Aa = E = Probabilidad de acertar por azar
K 1 k k1

Cuando se bonifican las omisiones, aunque se pueden comparar las


O puntuaciones, estn sobrevaloradas. No corresponden al verdadero
X c A + Aa = A + nivel de los sujetos; por tanto, es ms adecuado utilizar el primer
K
procedimiento (penalizar errores)

Problemas ejemplo: Supongamos un test de 50 tems, 25 con dos alternativas de respuesta


(Verdadero / Falso) y 25 con cuatro alternativas de respuesta. Cul ser la puntuacin corregida de
un sujeto que contestando a todos los tems, acert 15 de V/F y 19 de las de cuatro alternativas?
_
X1 = 15 (10 / 2-1) 5
_ _
X2 = 19 (6 / 4-1) 17 XTOTAL = 17 + 5 = 22

Si no se corrigiera el azar, el sujeto hubiera obtenido 34 puntos, despus de corregirlo 22.

R. MEDRANO (TUTOR) Pgina 7


PSICOMETRA ORIENTACIONES 1 PARTE (INSTRUMENTOS MEDICIN)

La puntuacin en un test con cuatro alternativas de respuesta , corrigiendo los efectos del azar, que
le corresponde a un sujeto que ha contestado 150 elementos y de esos ha acertado 120:

P = A [E / (K 1)] 120 (30 / 3) = 110

En el caso de los exmenes de la asignatura Psicometra, el examen consta de 25 preguntas o


ejercicios, con tres alternativas de respuesta de las que slo una es correcta. La calificacin se expresa
en una escala de 0 a 10 puntos y viene dada por la frmula:

Calificacin = (04 x Aciertos) (02 x Errores)

B.- Pruebas no cognitivas: No hay respuestas correctas ni incorrectas, los tems llevan asignado un
valor para cada alternativa de respuesta, lo que implica un escalamiento previo de los tems en
funcin del grado de atributos que manifiesten. La forma de corregir es sumando los valores
numricos asignados a las alternativas o categoras de repuesta elegidas por el sujeto.
Cuando se utiliza un formato de escalas de categoras o clasificaciones hay que tener muy claro cul
es la direccin del continuo de la variable que se est midiendo.

En los test formados por tems de construccin: Cuando se trata de que el sujeto construya la
respuesta correcta con una palabra o frase corta (tems de respuesta corta) es fcil la asignar una
puntuacin. El problema aparece en las respuestas ms abiertas y extensas, en las que es ms difcil
corregir eliminando la subjetividad.

Mtodo de la puntuacin Analtica (Requiere): Definir de forma inequvoca y aislar las dimensiones
que se consideran importantes para la realizacin de la tarea a evaluar. Establecer las formas de
evaluarlas, definiendo claramente lo que se considera una respuesta adecuada o correcta en cada
dimensin y estableciendo el nmero de respuestas correctas que se necesitan, en cada una de ellas,
para poder decir que la tarea ha sido correctamente realizada. Las pruebas pueden ser corregidas por
personas que no sean expertas en la materia a evaluar, ya que no habr dificultad en decidir si la
respuesta es correcta o no. La puntuacin final viene expresada por dos nicos valores: correcta /
incorrecta, apto / no apto; pero se obtiene informacin de cada una de las dimensiones.

Mtodo de la puntuacin Holstica: Evala de una manera global u holstica la forma en que los
sujetos han realizado la prueba (la puntuacin asignada podr tomar distintos valores dentro de los
lmites establecidos). Requiere que la correccin de las pruebas sea hecha por expertos, entrenados
para alcanzar un acuerdo entre ellos y eliminar la subjetividad.

R. MEDRANO (TUTOR) Pgina 8


PSICOMETRA ORIENTACIONES PARTE I (INSTRUMENTOS MEDICIN)

1 PARTE: CONSTRUCCIN DE INSTRUMENTOS DE MEDICIN PSICOLGICA

TEMA N 3 TCNICAS PARA LA CONSTRUCCIN DE ESCALAS DE ACTITUDES.

INTRODUCCIN

Las tcnicas que se van a exponer, aunque se centran en la construccin de escalas para la
medicin de actitudes, se pueden adaptar para su utilizacin en la medicin de intereses y valores.

Nunnally (1978) distingue entre:


Intereses (preferencias por actividades particulares). Los tems
hacen referencia a numerosas actividades especficas.
Valores (preferencias sobre objetivos y formas de vida, ms que
sobre actividades concretas). Los tems hacen referencia a
numerosas y amplias categoras de actividades.
Actitudes: sentimientos acerca de un determinado objeto social
(objetos fsicos, tipos de personas, etc.) En las escalas de
actitudes todos los tems que forman la escala deben hacer
referencia a un mismo objeto social (una misma variable)

1.- EL MODELO ESCALAR DE THURSTONE

Thurstone desarroll los procedimientos necesarios para la elaboracin de escalas psicolgicas;


es decir, para la elaboracin de escalas en un continuo psicolgico que permitiera situar en ellas
los estmulos sin necesidad de recurrir a ninguna operacin en continuos fsicos.

Hay que diferenciar lo que es el proceso de construccin de la escala, de su posterior aplicacin:


En la fase de construccin de la escala (se escalan los estmulos a lo largo de un continuo
psicolgico, asignando un valor en la escala a cada uno de ellos). Incluye la prueba de
jueces (asignan valores escalares o puntuaciones a cada uno de los tems o estmulos que
componen la prueba)
El trmino de esta fase constituye la prueba piloto que puede ser aplicada a una muestra de
sujetos para estudiar sus propiedades psicomtricas y elaborar la escala definitiva.

El modelo de Thurstone se basa en

La variabilidad perceptual de los sujetos (en las diferencias que hay entre los sujetos a la hora
de percibir los estmulos, e incluso en las diferencias perceptivas producidas en un mismo sujeto
cuando se le presentan los estmulos en distintas ocasiones)
La limitacin que tienen los sujetos para percibir la diferencia de magnitud entre dos
estmulos (ya que dada una serie de estmulos, ordenados respecto a un determinado atributo o
caracterstica psicolgica a lo largo de un continuo, siempre es posible encontrar dos de ellos
cuya diferencia sea tan pequea que no pueda ser percibida por el observador)

Supuestos bsicos del modelo


A. Existe un continuo psicolgico (subjetivo) a lo largo del que vara el atributo o caracterstica
que se est estudiando.
B. Cada uno de los estmulos que se van a estudiar, al ser presentado a un sujeto para su
evaluacin, origina en l un proceso subjetivo (proceso discriminante) a travs del cual les
asignar un valor tambin subjetivo en el continuo psicolgico.
C. Cuando un estmulo es presentado en repetidas ocasiones al mismo sujeto, no siempre
origina en l el mismo proceso discriminativo y, por tanto, el valor subjetivo asignado en cada
ocasin al estmulo a travs de los distintos procesos discriminantes puede variar.
D. Si el nmero de veces que se presenta cada uno de los estmulos es muy grande, se puede
hacer una distribucin de los valores subjetivos asignados a cada uno de ellos y se asume
que esta distribucin se ajusta a una distribucin normal.

R. MEDRANO (TUTOR) Pgina 1


PSICOMETRA ORIENTACIONES PARTE I (INSTRUMENTOS MEDICIN)

E. Distribucin discriminante (media de la distribucin), es el valor del estmulo en el continuo


psicolgico y se denomina valor escalar del estmulo. La dispersin discriminante (desviacin
tpica), aporta una idea de la ambigedad suscitada por el estmulo en el sujeto (si es cero, el
estmulo no ha producido ambigedad y el sujeto le habr asignado el mismo valor)
F. Si se presentan varios estmulos, en repetidas ocasiones, a un mismo sujeto, cada uno de
ellos dar lugar a una distribucin discriminante distinta que vendr definida por su media
y su desviacin tpica.
G. El modelo se cumple tanto si es un solo sujeto el que emite numerosos juicios, como si es
una muestra grande de sujetos donde cada uno emite un nico juicio.

A la muestra de los sujetos utilizada para asignar valores escalares a los estmulos se le conoce
como muestra de jueces o expertos.

Tanto en la Ley del Juicio Comparativo como del Categrico, los sujetos que evalan los tems
deben emitir un juicio objetivo acerca del grado de atributo que consideran que contiene cada
uno de ellos, y no mostrar su actitud personal; es decir, se les pide juicios de hecho y no
juicios de valor (Prueba de los Jueces)

Ley del Juicio Comparativo (mtodo de las comparaciones binarias)

Utiliza como mtodo experimental para obtener los datos las comparaciones binarias. La tarea
de los sujetos consiste en comparar directamente cada uno de los estmulos que se presentan con
todos los dems y decir, ante cada uno de los pares formados, cual es el estmulo preferido o el
dominante en la direccin del atributo que se est midiendo. Ej: medir la actitud de los espaoles
ante la poltica. Se realizan combinaciones binarias entre los tems disponibles y se presentan a un
grupo de jueces o expertos. Ante cada par sealan qu tem es, a su juicio, el que indica una
actitud ms positiva hacia la poltica.

Diferencia discriminante (al comparar dos estmulos y tener que emitir un juicio acerca de cul
es el dominante, se produce en cada uno de los jueces un proceso discriminante mediante el cual
asignan un valor subjetivo a cada uno de los estmulos y, al compararlos, se produce una
diferencia entre los valores subjetivos asignados a cada uno de ellos a travs de los
correspondientes procesos discriminantes. Esta diferencia discriminante no siempre ser la misma
para los distintos jueces. Los resultados de los juicios se ordenan en una serie de matrices, de
frecuencias, de proporciones y de puntuaciones tpicas.

LEY DE JUICIO COMPARATIVO (COMPARACIONES BINARIAS)


N (N 1)
C.B. = ------------ Nmero de Combinaciones Binarias // N = Nmero de estmulos
2
Matriz de frecuencias empricas (f)
Matrices para Matriz ordenada de proporciones (P)
Anlisis de Datos Matriz de puntuaciones tpicas (Z)

Clculo valores escalares de los estmulos


V.E.(I) = ( Zij / n) I = un estmulo cualquiera // n = nmero de estmulos
Zij = suma de las puntuaciones tpicas de la columna
correspondiente al estmulo.
Transformaciones de Punto cero: estmulo cuyo valor escalar es ms bajo. Los
la escala valores escalares del resto de los estmulos se calculan
Punto cero sumando, a los valores originales, el valor del estmulo ms
pequeo.

La media de las puntuaciones tpicas asignadas por los jueces a cada estmulo, a travs de los
procesos discriminantes, es la mejor estimacin de su valor escalar.

R. MEDRANO (TUTOR) Pgina 2


PSICOMETRA ORIENTACIONES PARTE I (INSTRUMENTOS MEDICIN)

Problema ejemplo: Se quiso saber la preferencia de los universitarios espaoles por los seis
siguientes deportes: ftbol, baloncesto, balonmano, tenis, natacin y artes marciales. Para ello se
eligi aleatoriamente una muestra de 5000 estudiantes a los que se les aplic una escala
construida segn el modelo de la ley del juicio comparativo. Las respuestas de los
universitarios se recogen en la matriz adjunta. Cada casilla indica el nmero de sujetos que prefiri
el deporte de la fila al de la columna. Escalar las preferencias respecto a estos deportes en este
grupo.

Frecuencias Judo BC BM Ftbol Nataci Teni Total


Empricas
n s
Judo 0 500 700 250 300 350 2100
Baloncesto (BC) 4500 0 3500 1000 2000 3000 14000
Balonmano (BM) 4300 150 0 550 800 900 8050
0
Ftbol 4750 400 4450 0 3285 2740 19225
0
Natacin 4700 300 4200 1715 0 1890 15505
0
Tenis 4650 200 4100 2260 3110 0 16120
0

Cuntos pares de estmulos habra que hacer para construir una escala utilizando el mtodo de
las combinaciones binarias? C.B. = 6 (6 1) / 2 30 / 2 = 15

Solucin: Teniendo en cuenta los totales, se aprecia que el judo es el menos preferido por los
jueces y el ftbol el ms preferido. Ordenamos los deportes (de a + preferencia) y obtenemos la
matriz de proporciones Ejemplo: Balonmano en la 1 columna tenemos 4300 (estudiantes que
prefirieron Balonmano a Judo) que dividido entre 5000 (total de estudiantes) = 086 y (1 086 = 0
14) que se colocan en la diagonal. Ftbol en la 1 columna tenemos 4750 / 5000 = 095. Etc.

Proporciones Jud BM BC Nataci Teni Ftbo


o n s l
Judo 050 086 0 094 093 095
90
Balonmano (BM) 014 050 0 084 082 089
70
Baloncesto (BC) 010 030 0 060 040 080
50
Natacin 006 016 0 050 062 066
40
Tenis 007 018 0 038 050 055
60
Ftbol 005 011 0 034 045 050
20

A partir de la matriz de proporciones se obtiene la matriz de puntuaciones tpicas y se utilizan


las tablas de la curva normal para averiguar la z que corresponde a cada proporcin Ejemplo:
Balonmano en la 1 columna proporcin 014 (Z = -108); por tanto su simtrica 086 (Z = 108)

Puntuaciones Jud BM BC Nataci Tenis Ftbol


Tpicas
o n
Judo 0 108 128 156 148 164
Balonman -1 0 052 099 092 123
o 08
Baloncest -1 -052 0 025 -025 084
o 28
Natacin -1 -099 -025 0 031 041
56
Tenis -1 -092 025 -031 0 012
48
Ftbol -1 -123 -084 -041 -012 0
64

R. MEDRANO (TUTOR) Pgina 3


PSICOMETRA ORIENTACIONES PARTE I (INSTRUMENTOS MEDICIN)

-7 -258 096 208 234 424


04
Z MEDIAS = -1 -043 016 035 039 071
17
K = 117 0 074 133 152 156 188
Valores S1 S2 S3 S4 S5 S6

Las Z (medias) se obtienen dividiendo los sumatorios por seis (n de estmulos) Permiten
obtener los valores escalares de los seis estmulos considerados. Para evitar n negativos, se da
el valor cero al menor y para averiguar el resto se suma una constante (k = 117) a los valores
escalares que tenan (-043 + 117 = 074 // 016 + 117 = 133; etc.)

Judo Balonmano Baloncesto Natacin Tenis Ftbol


|-----------|----------------|---------|-------|----------------------------------------|----------------|
0 074 133 152 156 188 2

Ley del Juicio Categrico

En este modelo, adems de los supuestos generales, tambin hay que asumir que el continuo
psicolgico de cada sujeto, puede ser dividido en una serie de categoras ordenadas (la tarea del
sujeto consiste en asignar cada uno de los estmulos que se presentan a una categora en funcin
del grado de atributo que considere que tiene el estmulo). Ej: actitud ante el matrimonio (el sujeto
evala cada uno de los tems y los asigna a una determinada categora en funcin de la actitud
ms o menos favorable que, a su juicio, presenten)

Para la obtencin de los datos utiliza el mtodo de los intervalos aparentemente iguales (el
ms utilizado en la elaboracin de escalas de actitudes)
Procedimiento: Despus de la redaccin de un conjunto de tems, es necesario que sean
juzgados por un grupo de personas (100 ms). Cada juez es instruido para que imagine un
espacio dividido en, por ejemplo, 11 categoras ordenadas, una escala imaginaria dividida en 11
categoras o intervalos aparentemente iguales (de negativa a positiva, pasando por un punto
neutral). Los jueces, que no tienen por qu ser expertos, deben clasificar cada uno de los
estmulos en una de las categoras en funcin del grado y la direccin del atributo que manifiesten.
Dado que se conocen los valores escalares asociados a cada categora (del 1 al 11), as como los
correspondientes a sus lmites (de 0,5 hasta 11,5), slo necesitaremos calcular los valores
escalares de los estmulos; para ello se calcula la mediana de la distribucin de frecuencias de
los juicios emitidos por los jueces y se ordenan los resultados en una matriz (en las columnas las
categoras de la escala y en las filas los tems que han sido evaluados por los jueces; cada uno de
los elementos de la matriz indica el nmero de veces que cada estmulo ha sido asignado a cada
categora)

Para averiguar el valor escalar de los estmulos, hemos de calcular la mediana de sus
distribuciones. Para ello se calculan las frecuencias acumuladas para cada tem.

LEY DEL JUICIO CATEGRICO (INTERVALOS APARENTEMENTE IGUALES)

Matrices para Matriz de frecuencias // Matriz de frecuencias acumuladas


Anlisis de Datos Valor escalar de cada estmulo = Mediana

Li = lm. Inf. Intervalo asociado a la categora de la mediana.


I = amplitud del intervalo (en este procedimiento es igual a 1)
I N f d = n de jueces que clasificaron el elemento o tem en la
Mdna = Li + fb categora correspondiente a la mediana.
fd 2 N / 2 = 50 % de los sujetos de la muestra de jueces.
f b = n de sujetos de la muestra de jueces que clasific al
elemento en categoras inferiores a la de la mediana.
I Coeficiente de Ambigedad C.A. = Q3 Q1
P75 = Li + ( 3N / 4 f b ) f d = n de jueces que clasificaron el elemento o tem en la
fd
categora correspondiente al cuartil (Q)

R. MEDRANO (TUTOR) Pgina 4


PSICOMETRA ORIENTACIONES PARTE I (INSTRUMENTOS MEDICIN)

I f b = n de sujetos de la muestra de jueces que clasific al


P25 = Li + ( N / 4 fb ) elemento en categoras inferiores a la del cuartil (Q)
fd
Cuando el C.A. > 2 = El tem es ambiguo y se elimina de la
escala definitiva
Valor escalar del sujeto = Puntuacin del sujeto
V.E.A. = valores escalares de los estmulos con los que el
V .E.S = V .E. A / n sujeto est de acuerdo o ha contestado favorablemente.
n = n de estmulos a los que el sujeto ha contestado
favorablemente

Las escalas de actitudes de Thurstone tienen la ventaja de que permiten la interpretacin


directa de la actitud de un sujeto sin necesidad de hacer referencia al grupo, o la actitud media de
un grupo sin recurrir a normas generales. Actualmente, el modelo Likert (sumativo) es ms til
para medir actitudes.

Problema ejemplo: Se quiere construir una escala de tipo Thurstone para medir una determinada
actitud. La escala utilizada ha sido de 7 puntos. De entre todos los elementos empleados en la
prueba de jueces, hemos elegido uno de ellos para analizar. El resultado de la evaluacin de 100
jueces al elemento fue el siguiente:
Escala del elemento 1 2 3 4 5 6 7
N de jueces 2 5 8 1 2 4 10
0 5 0
Frecuencias acumuladas 2 7 1 2 5 9 10
5 5 0 0 0

A.- Averiguar el valor escalar del elemento utilizando para ello la mediana.
Solucin: La mediana est en el intervalo (5-6) P50 = 45 + (50 -25 / 25) 1 P50 = 55

B.- Determinar el coeficiente de ambigedad (dispersin discriminante) del elemento utilizando la


distancia intercuartlica. Se debera aceptar el elemento para formar la escala definitiva?

NK/4 = 100 3/4 = 75 Lmites I. Crtico (5,5 6,5)


NK / 4 f b 75 50
Q3 = Li + A = 5,5 + 1 = 6,125
fd 40
NK/4 = 100/4 = 25 Lmites I. Crtico (3,5 4,5)
NK / 4 f b 25 15
Q1 = Li + A = 3,5 + 1 = 4,5
fd 10
Tambin El primer cuartil coincide con la Fa, nos quedaremos con el lmite superior y no es
necesario aplicar la formula = 4,5
Solucin C.A. = = Q3 Q1 C.A. = 6125 45 = 1625
Como el coeficiente de ambigedad es < 2, el tem debera ser aceptado

2.- LA TCNICA DE LIKERT


Likert consideraba que el mtodo Thurstone era muy laborioso y propone la tcnica del modelo
sumativo, utilizado para la medida de las diferencias individuales respecto a los rasgos
psicolgicos. La tcnica asume que los tems estn monotnicamente relacionados con el rasgo
subyacente que se quiere medir y que la suma de las puntuaciones de los tems est relacionada
linealmente con el rasgo. La puntuacin total sera la suma de todas las puntuaciones de los
sujetos a cada uno de los tems. Ventajas: fciles de construir; muy fiables; se pueden adaptar
para medir cualquier tipo de actitud.

Fundamentos de la tcnica (supuesto) Las actitudes pueden medirse a travs de las


manifestaciones verbales de los sujetos que emiten juicios de valor. La tcnica de medida de las
actitudes se basa en los siguientes principios y postulados:
Es posible estudiar dimensiones de actitud a partir de un conjunto de enunciados que operen
como reactivos para los sujetos.
Los individuos pueden situarse en la variable de actitud desde el punto ms favorable al ms

R. MEDRANO (TUTOR) Pgina 5


PSICOMETRA ORIENTACIONES PARTE I (INSTRUMENTOS MEDICIN)

desfavorable. La variacin de las respuestas ser debida a diferencias individuales.


La valoracin de los sujetos en la variable de actitud no supone una distribucin uniforme
sobre el continuo de actitud, sino su posicin favorable o desfavorable sobre el objeto
estudiado.

Las actitudes sociales se agrupan en pautas. Partiendo de la actitud de un sujeto frente a algn
aspecto de un problema planteado, se podra predecir la actitud que manifestara dicho sujeto
respecto a otros aspectos del mismo problema.
Desde el punto de vista de la medicin, los sujetos son ordenados en la escala en funcin de su
posicin respecto a la actitud medida (en un nivel de medida ordinal). La escala es sumativa; es
decir, est en funcin de las puntuaciones obtenidas en cada uno de los tems que la componen.
Esto implica dos supuestos adicionales:
Que la suma de las curvas caractersticas de los tems sea una funcin monotnica y
aproximadamente lineal respecto a la actitud medida.
Que todos los elementos que componen la escala estn midiendo una nica dimensin
(escala unidimensional)

La asignacin de valores numricos a los tems y puntuaciones de los sujetos se deja al arbitrio del
investigador. Debe hacerse de forma que se mantenga la coherencia interna en el sentido de la
actitud medida (valor + alto indica actitud ms +, y al revs).

Ejemplo escala tipo Likert Los perros deben llevar bozal


Completamente de acuerdo
De acuerdo
Indiferente
En desacuerdo
Completamente en desacuerdo
Se trata de hacer juicios de valor y tomar partido por una de las categoras

3.- EL DIFERENCIAL SEMANTICO DE OSGOOD (DS)

Es una escala de clasificacin para medir el significado connotativo (tambin afectivo o


subjetivo) que determinados estmulos tienen para los sujetos. Osgood estaba interesado por las
reacciones emocionales que las palabras o conceptos producen en las personas. Al
aproximarse al problema del significado, Osgood revis mltiples teoras y encontr el marco
terico que le permiti desarrollar un instrumento para medirlo: el Diferencial Semntico.

Punto de partida: la actitud que muestra una persona hacia un objeto depende del significado
evaluativo que dicho objeto tienen para la persona. Para Visauta (1989) el Diferencial Semntico
se basa en que la gran diversidad de significados es reducible a unas determinadas variaciones en
un nmero limitado de dimensiones.

El formato de la escala consiste en la presentacin a los sujetos de un concepto seguido de una


serie de escalas cuyos extremos estn marcados por adjetivos bipolares.

Los conceptos: estmulos u objetos que ha de evaluar el sujeto. Pueden ser conceptos
verbales (Dios, madre, etc.) o no verbales (cuadros, esculturas, etc.); por lo que primero hay
que definir claramente el problema a investigar, y luego elegir los conceptos ms adecuados.
Los conceptos tienen que aparecer encabezando el formulario, seguidos del conjunto de
escalas bipolares que se utilizarn. Como no se puede cubrir a base de conceptos toda el
rea a investigar, es necesario hacer un muestreo de todo el universo de conceptos que la
definen, para extraer los ms relevantes. A veces el investigador tiende a elegir aquellos
conceptos: que discriminen bien entre los sujetos, ya que de esta manera se obtiene una
mayor informacin; que tengan un significado claro y nico para el sujeto, de manera que
cuando se le presenten sepa lo que est juzgando y que sean familiares a todos los sujetos
para que la respuesta sea real y no est sesgada (Osgood: cuando los sujetos no estn
familiarizados con el concepto, se produce una regresin hacia el punto medio en la escala de
evaluacin)

R. MEDRANO (TUTOR) Pgina 6


PSICOMETRA ORIENTACIONES PARTE I (INSTRUMENTOS MEDICIN)

Las escalas bipolares: Se utilizan para evaluar el significado de los conceptos. Estas escalas
bipolares representan una reaccin de tipo afectivo hacia el objeto, con el fin de poder obtener
una media del significado afectivo que cada objeto (estmulo) tiene para los sujetos. Estas
escalas estn ancladas en sus extremos por dos adjetivos antnimos, que describen un
aspecto del continuo semntico (fuerte-dbil; etc.) a lo largo del cual se situar el concepto
evaluado. El continuo est dividido en categoras (normalmente 7)

Mala ...1.. P..2... P..... P..... P..... P..... P..7... Buena

Cuando un sujeto clasifica un concepto en la categora media de la escala, diremos que


considera que no hay asociacin ni relacin semntica entre el concepto y la escala bipolar
utilizada. La forma de presentacin del DS es muy variada; en general, se utiliza como una
prueba de papel y lpiz (la aplicacin puede ser colectiva)

El espacio semntico: criterios de seleccin de las escalas El nmero de escalas que


pueden utilizarse para evaluar un concepto determinado es ilimitado, de ah que debamos optar
por las escalas ms representativas que seran las que mejor miden las dimensiones subyacentes
al significado semntico del concepto a evaluar.
Los resultados de las primeras investigaciones factoriales, aportaron que, con independencia del
concepto evaluado, haba una serie de escalas que definan tres factores o dimensiones
subyacentes al espacio semntico: Valorativa (bueno-malo), de Potencia (fuerte-dbil) y de
Actividad (activo-pasivo).

Factor Valorativo o Evaluativo (Bueno Malo; Bonito Feo; Sincero Falso; etc.)
Factor de Potencia (Fuerte Dbil; Duro Blando; Masculino Femenino; etc.)
Factor de Actividad (Activo Pasivo; Rpido Lento; Dinmico Esttico; etc.)

El factor valorativo o evaluativo es el que explica un mayor porcentaje de varianza.

Bueno ---7---6---5---4---3---2---1--- Malo

Dbil ---1---2---3---4---5---6---7--- Fuerte

Activo ---3---2---1---0---(-1)---(-2)---(-3) Pasiv


o

No hay un criterio estricto sobre el nmero de escalas a utilizar para valorar de forma adecuada
cada una de las dimensiones del espacio semntico, aunque se estima que seis son suficientes.

Criterios de seleccin de las escalas: a) criterio de la composicin factorial de las escalas


(hay que tratar de que cada una de las dimensiones o factores est representada, al menos, por 4
6 escalas bipolares; estas escalas han de tener saturaciones muy altas en el factor que
representan y bajas o nulas en el resto de los factores); b) criterio del grado de relevancia para
la evaluacin del concepto (la inclusin de escalas poco relevantes conlleva a la prdida de
informacin (las respuestas se sitan en el punto neutral); c) criterio de Estabilidad semntica
de la escala respecto a los conceptos y a los sujetos.

Elaboracin de la prueba piloto y aplicacin

Procedimiento: elaborada la lista de conceptos a evaluar, se pide a una muestra de sujetos que
califique cada uno de los conceptos por medio de un adjetivo. Se seleccionan los adjetivos ms
utilizados (criterio de mxima frecuencia). Se buscan palabras con significado opuesto al de los
adjetivos para formar las escalas bipolares. Por ltimo, se organizar los conceptos y las escalas

R. MEDRANO (TUTOR) Pgina 7


PSICOMETRA ORIENTACIONES PARTE I (INSTRUMENTOS MEDICIN)

bipolares para su aplicacin.


Normas para presentar el DS que facilitan la recogida de datos y su posterior anlisis:

Para una muestra alfabetizada, se suele presentar el DS en forma de cuadernillo. La


primera pgina se dedica a las instrucciones de cumplimentacin, y en las siguientes se
recogen los distintos conceptos con sus escalas bipolares (una hoja para cada concepto).
El nmero de conceptos y escalas debe ser suficientes para cubrir los objetivos de
investigacin (nunca tantos que produzcan cansancio, las respuestas no seran fiables)
Los valores numricos asignados a las categoras de cada escala bipolar tienen que
mantener la direccin del continuo (el ms pequeo en la valoracin negativa y el ms
grande en la positiva)

De un sujeto X ai (sujeto a en la escala bipolar i)


Puntuacin Escalar _
De un grupo X = X ai / N
De un sujeto Faj = X ai / n (n escalas bipolares de la dimensin j)
Puntuacin factorial _ _ _
De un grupo Faj = Faj / N o bien Faj = X j / n

Problema ejemplo: el concepto de amistad fue valorado mediante un diferencial semntico de


Osgood. A continuacin se presenta el nmero de sujetos que respondi a cada una de las
categoras utilizadas en las escalas bipolares para medir la dimensin de potencia (Total 200)

DS 1 2 3 4 5 6 7
Dbil - Fuerte 8 9 0 32 51 65 35
Frgil - Ptreo 6 9 1 33 51 60 40
Duro - Blando 8 1 14 34 43 40 60

A.- Calcular la puntuacin factorial de la dimensin potencia. Indicar si es potente, neutra o


ligeramente potente. _
Solucin: Averiguamos la media de cada dimensin X = X ai / N (para averiguar las medias se
multiplica el n de sujetos que hay en cada categora por el valor numrico de la categora.

Media D-F = [(8x1)+(9x2)+(0x3)++ (35x7)] / 200 = 522


Media F-P = [(6x1)+(9x2)+(1x3)++ (40x7)] / 200 = 527
Media D-B = [(8x1)+(1x2)+(14x3)++ (60x7)] / 200 = 531
_
Averiguamos la puntuacin factorial PF = X j / n PF = (522 + 527 + 531) / 3 = 527

Conclusin: La muestra considera el concepto amistad (ligeramente potente), 527 se sita en


la escala bipolar iniciando la zona media alta.

B.- Indicar la actitud ante la amistad en la dimensin potencia de un sujeto que respondi 4, 3 y 2
respectivamente a cada una de las escalas bipolares.

Solucin: (4 + 3 + 2) / 3 = 3 (el sujeto mostrara una actitud prcticamente neutra)

4.- LA TCNICA DE GUTTMAN

R. MEDRANO (TUTOR) Pgina 8


PSICOMETRA ORIENTACIONES PARTE I (INSTRUMENTOS MEDICIN)

Conocida como Escalograma de Guttman, est diseada de tal forma que se puede conseguir la
ordenacin de los sujetos y de los estmulos en un continuo respecto a una dimensin
determinada. Se incluye en los mtodos centrados en las respuestas; tanto los sujetos como los
estmulos pueden representarse, a lo largo de un continuo, formando una escala tambin
denominada de entrelazamiento. En esta escala, cada sujeto estar situado entre dos estmulos,
el sujeto habr contestado correctamente a todas las preguntas que quedan representadas en la
escala por debajo de l, pero habr fallado todas las que estn representadas por encima). Si
consideramos la matriz triangular (Sujetos: 1, 2, 3, 4 y 5 // Estmulos: A, B, C, D):
:
5 A 4 B 3 C 2 D 1
Escala de entrelazamiento |------------------------------------------------------|

El inters de esta tcnica de escalamiento es que permite establecer la unidimensionalidad de


un conjunto de datos al tratar de eliminar todos los factores que son ajenos a la dimensin que se
quiere medir. La unidimensionalidad se consigue con las escalas acumulativas perfectas.

Evaluacin del error en el modelo Este modelo no lleva implcita ninguna teora del error. Se
define el error como la desviacin del patrn de respuestas observadas respecto al patrn de
respuestas ideal requerido por el modelo (procedimiento de Goodenough y Edwards). Ejemplo de
patrn correspondiente a una escala perfecta (Sujetos: 1, 2, 3, 4 y 5 // Estmulos: A, B, C, D):

A B C D Puntos MATRIZ TRIANGULAR


1 + + + + 4 Responde favorable o correctamente a todos los estmulos.
2 + + + - 3 Responde favorablemente a los estmulos A, B y C.
3 + + - - 2 Responde favorablemente a los estmulos A y B.
4 + - - - 1 Responde favorablemente al estmulo A.
5 - - - - 0 Responde desfavorable o negativamente a todos los estmulos..

Problema ejemplo: A un grupo de cinco sujetos le hemos aplicado un cuestionario para evaluar
su actitud ante el racismo. Las respuestas dadas por los sujetos, que aparecen a continuacin,
podan representar una actitud favorable (1) o desfavorable (0). Construir el escalograma
correspondiente y hallar el coeficiente de reproductividad.

Pasos para la elaboracin de la escala:

1.- Se averigua para cada sujeto y para cada tem el n de respuestas correctas:

Matriz inicial tems


Sujetos 1 2 3 4 5 Punt. Sujetos
A 1 1 1 0 1 4
B 1 0 0 0 1 2
C 1 1 0 1 1 4
D 0 0 0 1 1 2
E 1 1 1 1 1 5
4 3 2 3 5

2.- Se reordenan las columnas correspondientes a los estmulos de manera que queden
ordenados desde el estmulo mayor al menor (ordenacin de columnas):

Orden tems tems


Sujetos 5 1 2 4 3 Punt. Sujetos
A 1 1 1 0 1 4
B 1 1 0 0 0 2
C 1 1 1 1 0 4
D 1 0 0 1 0 2
E 1 1 1 1 1 5
5 4 3 3 2

3.- Se reordenan las filas correspondientes a los sujetos de manera que queden ordenados desde

R. MEDRANO (TUTOR) Pgina 9


PSICOMETRA ORIENTACIONES PARTE I (INSTRUMENTOS MEDICIN)

el que obtuvo una mayor puntuacin hasta el que la tuvo ms baja (ordenacin de filas):

Orden Sujetos tems


Sujetos 5 1 2 4 3 Punt. Sujetos Errores
E 1 1 1 1 1 5
A 1 1 1 0 1 4 2
C 1 1 1 1 0 4
B 1 1 0 0 0 2
D 1 0 0 1 0 2 2
5 4 3 3 2 4

Si la matriz de datos obtenida se ajustara a una escala acumulativa perfecta, el resultado habra
sido una matriz triangular (la diagonal hubiera quedado marcada de forma correcta). Como no ha
sido nuestro caso, se debe hacer el recuento de los errores para comprobar el grado de ajuste de
los datos obtenidos al modelo de Guttman. Como en la prctica es muy difcil encontrar este tipo
de escalas, debemos optar por la tcnica denominada coeficiente de reproductividad (grado de
ajuste entre los datos obtenidos empricamente y el modelo terico)
CR es un ndice numrico que seala el grado en el que una escala, obtenida a partir de unos
datos empricos, se ajusta al modelo ideal del Escalograma de Guttman o escala acumulativa
perfecta. Los datos empricos se ajustan al modelo de Guttman si el coeficiente de reproductividad
es igual o mayor que 0,90.

Coeficiente de reproductividad CR = 1 (E / I x S) CR = 1 (4 / 5 x 5) = 084

Conclusin El CR < 090, luego nuestros datos no se ajustan al modelo de Guttman.

5.- DIFERENCIAS ENTRE LAS DISTINTAS TCNICAS

El Diferencial Semntico se distingue en el formato de los tems, ya que estos consisten en una
serie de conceptos a evaluar mediante respuestas a una serie de escalas ancladas por adjetivos
bipolares. (En las otras tcnicas, los tems estn formados por enunciados, no por adjetivos)

Para ver las diferencias en las escalas de Thurstone, Likert y Guttman, hay que considerar
que: a) la actitud existe a lo largo de un continuo subyacente; b) que el punto medio del continuo
indica un cambio en la direccin de la actitud y c) que la distancia desde el punto medio en una u
otra direccin indica la intensidad de la misma:

En la escala de Likert, los enunciados de los tems se sitan en los dos extremos del
continuo (actitud + o -) y se excluyen los tems cuyos enunciados puedan ser interpretados
como representantes de los puntos del continuo situados alrededor del punto medio. (En la de
Thurstone y Guttman, se deben incluir tems que cubran todo el continuo de la actitud)
La escala de Guttman es acumulativa ( Thurstone). Una respuesta + a un tem implica
una respuesta + a todos los tems que estn situados a la izquierda del tem. El supuesto que
asume es que las respuestas + a los tems deben estar reunidas todas alrededor de un punto
concreto del continuo.
La escala de Thurstone asume un nivel de medida de intervalos (las otras dan lugar a
escalas ordinales). La seleccin de los tems definitivos se basa en los valores asignados por
los jueces a cada uno de los tems (en las otras tcnicas se aplica la escala a un muestra
representativa)

De estas tcnicas, la de Likert es la ms utilizada.


Ventajas: rpidas de administrar y puntuar; se pueden medir la mayora de las actitudes; dan
informacin fiable.
Inconvenientes: facilidad para dar respuestas falsas, socialmente deseables; los intervalos entre
los puntos de la escala no representan cambios iguales en la actitud medida en todos los sujetos.

R. MEDRANO (TUTOR) Pgina 10


PSICOMETRA ORIENTACIONES PARTE I (INSTRUMENTOS MEDICIN)

R. MEDRANO (TUTOR) Pgina 11


PSICOMETRA ORIENTACIONES PARTE II (PROPIEDADES MTRICAS)

2 PARTE: EVALUACIN DE LA PROPIEDADES MTRICAS DE LOS


INSTRUMENTOS DE MEDICIN PSICOLGICA

TEMA N 4 LA FIABILIDAD DE LAS PUNTUACIONES.

1.- INTRODUCCIN

La Evaluacin de la calidad global del test incluye: la


evaluacin de la precisin y estabilidad de las medidas
(fiabilidad) y la pertinencia de las inferencias realizadas a
partir de las puntuaciones obtenidas (validez)

Fiabilidad y precisin de la medida se analiza hasta qu


punto las puntuaciones obtenidas por los sujetos, en la
prueba que se les ha aplicado, estn afectadas por errores
de medida y en qu cuanta. Un requisito bsico de cualquier
teora de la medicin es la fiabilidad y precisin de los
instrumentos utilizados para medir una determinada
caracterstica.

2.- EL MODELO LINEAL DE SPEARMAN:


La puntuacin emprica obtenida por un sujeto en un test (X), es una combinacin lineal de la
puntuacin verdadera (V) y el error de medida (E) X = V + E

Supuestos del modelo lineal (Spearman)

1 Supuesto La puntuacin verdadera (V) es la esperanza matemtica (media) de las


V = E (X) puntuaciones empricas

2 Supuesto La correlacin entre las puntuaciones verdaderas de n sujetos en un test y los


r ve = 0 errores de medida = 0 (no hay relacin entre ellas)

3 Supuesto La correlacin entre los errores de medida (re1 re2) que afectan a las puntuaciones
re1 re2 = 0 de los sujetos en dos test diferentes (X1 y X2) es = 0

De estos supuestos se obtienen las siguientes deducciones

E = X V Error de medida = diferencia entre Punt. Emprica y Punt. Verdadera

E(e) = 0 La esperanza (media) de los errores de medida es = 0

X = V La media de las Punt. Empricas = la media de las Punt. Verdaderas

Cov (V, E) = 0 La covarianza entre las Punt. Verdaderas y los Errores = 0

S2X = S2V + S2e


La Var de las Punt. Empricas = Suma de la Var de Punt. Verdaderas y de los errores

Cov (X,V) = Sv
La covarianza entre las Punt. Empricas y Verdaderas = La Var de las Punt. Verdaderas

r xe = Se / Sx
La correlacin entre las Punt. Empricas y los errores = cociente entre la Desv. Tpica de los errores
y la Desv. Tpica de las Punt. Empricas.

Cov (X1, X2)= Cov (V1,V2)


Covarianza entre las Punt. Empricas de dos test = Covarianza entre las Punt. Verdaderas

R. MEDRANO (TUTOR) Pgina 1


PSICOMETRA ORIENTACIONES PARTE II (PROPIEDADES MTRICAS)

3.- TEST PARALELOS (CONDICIONES DE PARALELISMO)

Si a una misma muestra se aplican dos test (X y X) podemos considerar que son paralelos s adems
de los supuestos anteriores se cumplen las (condiciones de paralelismo):

1 Supuesto
X = V + E // X= V + E Las puntuaciones verdaderas de los sujetos son iguales en ambos test

2 Supuesto
S2e = S2e La varianza de los errores de medida es la misma en ambos test
De estas dos condiciones de paralelismo se obtienen las siguientes deducciones:

X =V+ E=V X =V X = V+ E= V X =V
La media de las puntuaciones de dos test paralelos es la misma

S x2 = S x2 ; S x2 = Sv2 + S e2 ; S x2 = Sv2 + Se2


Las varianzas de las puntuaciones de dos test paralelos son iguales
2 SV2
rXX = rXV = La correlacin entre las Puntuaciones Empricas obtenidas en dos test paralelos
S X2
es igual al cuadrado de la correlacin entre Punt. Empricas y Punt. Verdaderas

rX1 X 2 = rX1 X 3 = rX 2 X 3 = .... = rX j X k En dos o ms test paralelos las intercorrelaciones entre cada dos
de ellos son iguales.

4.- INTERPRETACIN TERICA DEL COEFICIENTE DE FIABILIDAD

El coeficiente de fiabilidad de un test rXX es la correlacin entre las puntuaciones empricas


obtenidas por una muestra de sujetos en dos formas paralelas:

S2 Coeficiente de fiabilidad del test rXX = (S2V / S2X)


rXX = V2 Si rxx = 1 el error de medida es 0, fiabilidad perfecta.
SX Si rxx = 0 varianza de errores igual a varianza de puntuaciones empricas.
___
ndice de fiabilidad del test rXV = SV / SX = rXX
rXV = correlacin entre las puntuaciones empricas y las puntuaciones verdaderas

ndice de fiabilidad del test Se2


rXX = r2
rXV = rXX rXX = 1 2 = 1 rxe2
XV SX

S e2 Se
rXX = 1 = 1 rxe2 rxe = rxe = 1 rxx
SX2
SX
Es decir, la correlacin entre las puntuaciones empricas y los errores de medida (r XE) se puede
obtener a partir de la correlacin entre las puntuaciones obtenidas por los sujetos en las dos
formas paralelas del test.

1 rxx Es la proporcin de la desviacin tpica de las puntuaciones que se debe a la


desviacin tpica de los errores. El coeficiente de fiabilidad (definido segn el modelo clsico
de Spearman) nos da informacin para estimar la cuanta del error de medida.

R. MEDRANO (TUTOR) Pgina 2


PSICOMETRA ORIENTACIONES PARTE II (PROPIEDADES MTRICAS)

EL PROBLEMA DEL ERROR DE MEDIDA:

En Psicometra el error de medida se define como la diferencia entre la puntuacin emprica obtenida
por un sujeto en un test y su puntuacin verdadera (entendiendo por test cualquier instrumento de
medicin psicolgica). Al aplicar n veces un test a un sujeto sus puntuaciones sern muy parecidas
pero no iguales (es conveniente construir pruebas que den lugar al mnimo error de medida posible)

No siempre los errores son debidos al instrumento de medicin, tambin se deben a cambios que se
producen en el sujeto y que pueden atribuirse a diversas razones: motivacin, condiciones fsicas o el
mero azar; se trata de errores aleatorios e impredecibles con los que hay que contar y que hay que
tratar de controlar para que no interfieran en las predicciones que podemos hacer sobre la capacidad
del sujeto.

5.- TIPOS DE ERRORES DE MEDIDA

Error de medida (E = X V) diferencia entre las puntuaciones empricas y las puntuaciones


verdaderas. El error de medida nos da una medida individual del error que se comete (una medida
individual de la precisin del test). Nos indica la diferencia entre la puntuacin de un sujeto en un test y
el nivel real de dicho sujeto en la variable que medimos.

Error Tpico de medida (medida grupal)


_______
Se = Sx 1 rXX (En puntuaciones directas y diferenciales)
______
SZe = 1 rXX (En puntuaciones Tpicas)

ERROR TPICO DE ESTIMACIN DE LA PUNTUACIN


ERROR DE ESTIMACIN VERDADERA (Desviacin tpica de los errores de
DE LA PUNTUACIN VERDADERA estimacin)

E = V V Punt. Directas y Diferenciales


______ ___ ___
Diferencia entre la puntuacin SVX = Sx 1 rXX rXX = Se rXX
verdadera y la pronosticada por la ______ ____ ____
regresin. Punt. Tpicas SZV, ZX = 1 rXX rXX = SZe rXX

ERROR TPICO DE SUSTITUCIN O DE LA DIFERENCIA


ERROR DE SUSTITUCIN ENTRE LOS DOS TEST PARALELOS (Desviacin tpica
de los errores de sustitucin)
E = X1 X2
Punt. Directas y Diferenciales
Error que se comete al sustituir las ______ __ __
puntuaciones del test X1 por las SX1-X2 = Sx 1 rXX 2 = Se 2
obtenidas en un test paralelo X2 _______ __ __
Punt. Tpicas SZ1-Z2 = 1 rXX 2 = SZe 2

ERROR DE PREDICCIN ERROR TPICO DE PREDICCIN (Desviacin tpica de


los errores de prediccin)
E = X1 X1
SX1 _ _ Punt. Directas y Diferenciales
X1 = r12 ------ (X2 X2 ) + X1 ______ ______ _______
SX2 SEP = Sx 1 rXX 1 + rXX = Se 1 + rXX

Diferencia entre puntuaciones _______ _______ ____


obtenidas en un test (X1) y las Punt. Tpicas SZEP = 1 rXX 1 + rXX = SZe rXX
pronosticadas en ese mismo test (X
1) a partir de una forma paralela X2

FACTORES QUE AFECTAN A LA FIABILIDAD

R. MEDRANO (TUTOR) Pgina 3


PSICOMETRA ORIENTACIONES PARTE II (PROPIEDADES MTRICAS)

La fiabilidad depende de:


La variabilidad del grupo
La longitud del test
Las caractersticas de los tems

Longitud del test (Ecuacin de Spearman-Brown) Cuanto ms tems representativos se utilicen,


habr mayor informacin del atributo que estudiamos, menor error y mayor fiabilidad (al aumentar la
longitud del test, aumenta su fiabilidad)

Ecuacin de Spearman-Brown (se refiere al caso en que se quiere aumentar la longitud del test
inicial n veces):

CASO GENERAL
Relaciona la fiabilidad y la longitud cuando RXX = coeficiente de fiabilidad del test alargado
los tems a aadir son paralelos o acortado.
n rXX n rXX n = nmero de veces que se aumenta o
RXX = ---------------------- = --------------------- disminuye la longitud del test.
1+ n rXX - rXX 1 + (n 1) rXX rXX = coeficiente de fiabilidad del test inicial.

CASO DE LONGITUD DOBLE CLCULO N DE VECES QUE AUMENTA O


DISMINUYE LA LONGITUD DE UN TEST
2 rXX
RXX = ---------------- RXX (1-rXX) n elementos finales
1+ rXX n = -------------------- n=
-------------------------------
rXX (1- RXX) n elementos iniciales

RELACIN ENTRE VARIANZAS EMPRICA Y VERDADERA (TEST MODIFICADO Y TEST INICIAL)

S2V = n2s2V S2X = ns2X [1 + (n 1) rXX]

S2V = Varianza de las puntuaciones verdaderas en el test modificado.


n = n de veces que se aumenta o disminuye la longitud del test inicial.
s2V = Varianza de las puntuaciones verdaderas en el test inicial.
S2X = Varianza de las puntuaciones empricas en el test modificado.
s2X = Varianza de las puntuaciones empricas en el test inicial.
rXX = coeficiente de fiabilidad del test inicial.

Variabilidad de la muestra Cuanto ms homogneo sea el grupo, menor es el coeficiente de


fiabilidad y la desviacin tpica de las puntuaciones empricas.

El error tpico de medida es constante


Se1 = error tpico de medida en el grupo 1
S2e1 = S2e2 = S2e Se2 = error tpico de medida en el grupo 2
S21 (1 r11) = S22 (1 r22) Se = error tpico de medida del test
S21 = varianza emprica puntuaciones en el grupo 1
S21 S2e S22 = varianza emprica puntuaciones en el grupo 2
r22 = 1 - ------- (1 r11) = 1 - ------- r11 = coeficiente fiabilidad grupo 1
S22 S2X r22 = coeficiente fiabilidad grupo 2

LA FIABILIDAD COMO EQUIVALENCIA Y COMO ESTABILIDAD DE LAS MEDIDAS

R. MEDRANO (TUTOR) Pgina 4


PSICOMETRA ORIENTACIONES PARTE II (PROPIEDADES MTRICAS)

Un test debe cumplir dos premisas:

Medir el rasgo que pretende (ser vlido)


Las puntuaciones obtenidas deben ser estables y precisas.

La precisin consiste en estar libre de errores; la estabilidad en que en distintas ocasiones y en


condiciones parecidas el rasgo no cambie. La fiabilidad del test es la estabilidad de las medidas. Se
pueden considerar dos mtodos basados en la estabilidad para calcular el coeficiente de fiabilidad:

Mtodo de las formas paralelas.


Mtodo test-retest.

MTODO DE LAS FORMAS PARALELAS

Se construyen dos formas paralelas de un test X y X y se aplican a una muestra de sujetos


representativa de la poblacin. Por ltimo, se calcula el coeficiente de correlacin de Pearson
entre las dos formas paralelas del test.

N X1 X 2 X1 X 2 X1 y X2: Puntuaciones
rxx ' = rx1x2 = obtenidas en cada una
2 2
N X2 ( X 1 ) N X 22 ( X 2 )
1
de las formas.

El coeficiente de fiabilidad tambin se llama coeficiente de equivalencia.

Ventaja: Si las pruebas se presentan a la vez hay mayor control.


Inconveniente: Dificultades que conlleva construir dos formas paralelas.

MTODO TEST-RETEST

Se aplica el mismo test en dos momentos diferentes:

N X1 X 2 X X 1 2 X1 y X2: Puntuaciones
rX X = rx1x2 = obtenidas en cada
1 1 2 2
N X2 ( X ) N X (
2
X 2 )
1
aplicacin.
1 2

El coeficiente de fiabilidad as obtenido se llama coeficiente de estabilidad.

Ventaja: No necesita dos o ms formas distintas del miso test.


Inconvenientes:
Posible memorizacin de tems que puede interferir la 2 aplicacin.
Intervalo de tiempo entre aplicaciones (sera deseable incrementar el tiempo entre
aplicaciones para minimizar el efecto aprendizaje o memoria; si ste es muy elevado
pueden variar factores sociales, afectivos o evolutivos que inciden en la fiabilidad)
La actitud del sujeto (si cambia el grado de cooperacin, puede obtener una
puntuacin ms alta o ms baja que afecta al coeficiente de fiabilidad hacindolo ms
bajo o ms alto)

El clculo es idntico en las dos formas. La nica diferencia es que en lugar de aplicar dos formas, en
el test retest emplea la misma en dos momentos diferentes.

R. MEDRANO (TUTOR) Pgina 5


PSICOMETRA ORIENTACIONES PARTE II (PROPIEDADES MTRICAS)

LA FIABILIDAD COMO CONSISTENCIA INTERNA

A veces slo se puede aplicar una vez el test, por lo que no es posible utilizar los mtodos anteriores.
Los siguientes mtodos se utilizan para estimar la fiabilidad de un test (slo requieren una aplicacin y
aportan un ndice de la consistencia interna de las respuestas de los sujetos):

Mtodos basados en la divisin del test en dos mitades


Mtodos basados en la covariacin de los tems
Coeficientes basados en el anlisis factorial de los tems
Coeficiente Beta () de Raju

MTODOS BASADOS EN LA DIVISIN DEL TEST EN DOS MITADES


La ventaja respecto a los anteriores es que al considerar slo las puntuaciones de un test, la fiabilidad
no se ve afectada por otros factores como el intervalo de tiempo, aprendizaje, memoria, etc. Y,
adems, se consigue ahorro de tiempo y esfuerzo.

Procedimiento: Se aplica el test a una muestra y se divide el test en dos mitades, calculando la
correlacin entre ellas y aplicando una frmula de correccin. Las divisiones deben ser similares en
dificultad y contenido para que la correlacin se aproxime al valor mximo posible.

Hay varias formas de hacer la divisin:


Se realiza n/2 (primeros tems una mitad y los ltimos n/2 tems como la segunda). El
inconveniente deriva de que en algunos tests la complejidad de los tems se va incrementando y
las partes no seran equivalentes.
Los pares por un lado y los impares por otro (la ms utilizada)
Ordenar segn el grado de dificultad y dividirlos en pares e impares.
Asignacin de tems al azar a ambas mitades.

Cuando se utiliza el mtodo de la divisin del test en dos mitades, la fiabilidad se puede estimar
mediante las siguientes frmulas: Spearman-Brown, Rulon, Guttman-Flanagan.

Ecuacin de Spearman-Brown (dos mitades paralelas): se basa en la relacin entre longitud


de un test y coeficiente de fiabilidad. Se aplica el test, se divide en dos mitades paralelas y se
calcula la correlacin entre ambas partes (sera el coeficiente de fiabilidad de cada mitad); para
calcular la fiabilidad des test completo:
2rXX
RXX = RXX = coeficiente de fiabilidad del test total (cuando se duplica su longitud)
1 + rXX rXX = r12 = coeficiente de fiabilidad de cada una de las mitades.

Frmula de Rulon: Se usa cuando, no siendo las dos mitades estrictamente paralelas, podemos
considerarlas -equivalentes (segn Lord y Novick son los test en los que las puntuaciones
verdaderas son iguales para un grupo de sujetos en ambas formas, pero las varianzas de error
no tienen por qu ser iguales). Asimismo, los test esencialmente -equivalentes son aquellos
en los que la puntuacin verdadera de cada sujeto en uno de los tests es igual a la del otro ms
una constante. En ambos casos se supone la igualdad de las varianzas verdaderas de ambas
mitades.

S2d S2p-i
rXX = 1 - ------- = 1 - -------- d = diferencias entre puntuaciones pares e impares de cada
S2X S2 X sujeto.
S2d = S2p-I = varianza de la diferencia entre las puntuaciones pares
2 2 2
S d = [d / N (d / N) ] e impares.
S2X = varianza de las puntuaciones empricas de los sujetos.
S2d = S2p-I = S2p + S2i 2rpi Sp Si rpi = correlacin entre las puntuaciones de las dos mitades.

R. MEDRANO (TUTOR) Pgina 6


PSICOMETRA ORIENTACIONES PARTE II (PROPIEDADES MTRICAS)

Frmula de Guttman-Flanagan: equivalente a Rulon pero ms sencilla. Rulon y Guttman-


Flanagan proporcionan el mismo valor de fiabilidad por ser expresiones equivalentes.

S p2 + Si2 S2p y S2i = varianza de las puntuaciones en los tems pares e impares.
Rxx = 2 1
S 2 S2X = varianza emprica del test total.
x rpi = correlacin entre las puntuaciones

rXX = (4 rpi Sp Si) / S2X

MTODOS BASADOS EN LA COVARIACIN DE LOS TEMS


Requiere anlisis de la varianza y la covarianza de las respuestas de los sujetos a los tems
(proporciona una estimacin de la consistencia interna de los tems de un test). Los mtodos ms
frecuentes bajo estas condiciones son: el coeficiente alfa de Cronbach y los coeficientes KR 20 y
KR21 de Kuder-Richardson (se consideran casos particulares del coeficiente alfa de Cronbach cuando
los tems que forman el test son dicotmicos)

Coeficiente de Cronbach: Es un indicador de la consistencia interna. Expresa la fiabilidad en


funcin del n de tems y de la proporcin de la varianza total del test debida a la covariacin
entre los tems. A mayor covariacin mayor fiabilidad.

n

cov ( jk ) 2 2
n j k n n ( r1 ) n Sx S j n S 2j
= = = = 1
n 1 2
Sx n 1 1 + ( n 1) r1
n 1 2
Sx n 1 S x2


n = n de elementos del test.


2
S = Suma de las varianzas de los elementos.
j
n S2j
cov( jk ) = Suma de las covarianzas de los tems = ------- [ 1 - -------- ]
S x2 = Varianza de las puntuaciones en el test. n-1 S2 X
r1 = Cociente entre la covarianza media de los tems y su varianza media

Estimador insesgado de Alfa como lmite inferior del coeficiente de


fiabilidad es una estimacin del lmite inferior
(N 3) + 2 del coeficiente de fiabilidad siendo menor o igual
= ----------------------- que el coeficiente de correlacin ( rXX)
N1 = rxx Cuando los tems son paralelos.
= Valor de alpha de Cronbach. Otro estimador del lmite inferior del coeficiente de
= Estimador insesgado. fiabilidad es el coeficiente delta propuesto por
N = n de sujetos de la muestra. Guttman (3):
n
Aumentando el nmero de sujetos alpha y Cov ( j, k )
n S 2j n 1
su estimador insesgado se aproximan. Son 3 = 1 2 +
iguales cuando N tiende a infinito (a partir j= 1 S x S x2
de 100)

R. MEDRANO (TUTOR) Pgina 7


PSICOMETRA ORIENTACIONES PARTE II (PROPIEDADES MTRICAS)

Inferencias sobre De los problemas de las inferencias de alpha se desarroll la teora muestral
para el coeficiente alpha. Kristof y Feldt derivaron un estadstico de contraste del coeficiente alpha que
se distribuye segn una F de Snedecor, para determinar el intervalo confidencial de en la poblacin.

Inferencias para un solo valor de Para F se distribuye son N-1 y (n-1) (N-1) gl.
saber si toma un determinado valor en la = valor propuesto en la hiptesis para la poblacin.
poblacin o para saber entre que valores se

= Valor alfa obtenido en la muestra.
encuentra en la poblacin usamos: N = n de sujetos // n =n de tems.
1 Se trata de comprobar si F emprica se encuentra
F=
1 entre los valores F tericos obtenidos con los gl
y el nivel de confianza.
Inferencias (muestras independientes)
W se distribuye segn la F con (N1 - 1) y (N2 -1) g.l.
Dos muestras: W (comprueba H0: 1 = 2)
1 y 2 = valores del coeficiente en cada muestra.
N1 y N2 = n de sujetos de cada muestra.
1 1
W =
1 2
UX1= distribucin 2 con n-1 gl.
K = n muestras.
K Muestras: UX1 )
2
i = Valor del coeficiente para cada muestra.
n
) 1
( 1 i ) 3 u u = Media de los coeficientes transformados.
1 i
1/ 3

UX 1 =
S 2
u=
n ( )
i= 1 n
S = Media aritmtica de las varianzas de cada
n
S2 ~ N (n )
2
muestra. S = i Ni = i i 1
i= 1 n ni + 1
2 2 Ni = n de sujetos en cada muestra
Siendo Si = ~ ni = n de tems en cada test.
9( N 1)(1 i ) 2 / 3
Inferencias (muestras dependientes) En
algunos diseos se pueden administrar distintas t = Distribucin t de Student (N-2) gl.
pruebas a la misma muestra, con lo que los
coeficientes son dependientes y debemos emplear
1 y 2 = valores del coeficiente alfa
otro tipo de contrastes: N = nmero de sujetos de la muestra.
rx21x2 = Correlacin de puntuaciones en los 2 test.
Dos muestras: (N n 1000)
2
( 1 2 ) ( N 2) UX2 = Distribucin con (k-1) gl.
t= K = n de tests // N = n sujetos.
[4(1 )(1 )(1 rx21x 2 ) ]
1 2 i = Valor de los coeficientes .
S2 y u = Medias de los coeficientes transformados y
K Muestras:
las varianzas de cada muestra

u =
n
[1] n
Si2
k
) 13
2
n(1 ) 1/ 3 S2 =
( 1 i ) u i=1 i
i= 1 n
i= 1
UX 2 =
S2 C 2 2
Donde Si = ~
9( N 1)(1 i ) 2 / 3
Donde C = Media de las covarianza Sij. n
~ N (n~ 1 ) =
2rij2 N = y
n
1
C= ~ n~ + 1
( )
9 N 1 (1 i ) (1 j )
1/ 3 1/ 3
i= 1 ni
ni = n de tems de cada test.

R. MEDRANO (TUTOR) Pgina 8


PSICOMETRA ORIENTACIONES PARTE II (PROPIEDADES MTRICAS)

Casos particulares del coeficiente (KR20 y KR21) ecuaciones de Kuder-Richardson (se


consideran casos particulares del coeficiente alfa de Cronbach cuando los tems que forman el
test son dicotmicos; es decir, se punta 1 acierto y 0 fallo). A mayor n de tems y mayor
covariacin, mayor consistencia interna y mayor fiabilidad.
X2
p h qh X
KR20 =
n
1
KR21 =
n
(1 n )
n 1 S x2 n 1 S x2
n = n elementos del test.
Ph = proporcin de aciertos en el elemento h. n = n de elementos del test
qh = proporcin de errores en el elemento h. S x2 = varianza del test
ph qh = varianza del elemento h.
2
S x = varianza total del test.
X = media de las puntuaciones empricas

COEFICIENTES BASADOS EN EL ANLISIS FACTORIAL DE LOS TEMS


Los coeficientes Theta () y Omega () son dos indicadores de la consistencia interna de los tems
de un test y una aproximacin al coeficiente . (En general )

n 1 Coeficientes Omega
Coeficientes Theta = (1 ) n n
n 1 1 S 2j S 2j h 2j
2
= 1 j= 1 j= 1 n h j
n = n de tems del test. n n = 1
n + 2 r h
1 = primer auto valor de la matriz factorial cov( X j , X h ) j

(varianza explicada por el primer factor antes de j = 1 h= 1


j h
la rotacin).
El coeficiente indica la S 2j = Suma de las varianzas de los tems.
unidimensionalidad de los tems. Cuanto h2j = Comunalidad estimada del tem j.
mayor sea la varianza que explica el primer Cov ( X j , X h ) = Suma de las covarianzas entre
factor, mayor ser el valor y la
intercorrelacin de los tems (implica que se los tems j y h.
distribuyen en torno a una sola dimensin) rjh = Correlacin entre j y h.

Cuando los datos son paralelos se verifica = =

COEFICIENTE BETA () DE RAJU Facilita una estimacin de la fiabilidad de un test compuesto de


varios subtest con distinto n de tems (con el alfa de Cronbach no es posible). Se aplica cuando no
conocemos las puntuaciones de los sujetos en los tems de los distintos subtest; en caso de
conocerlos, es preferible emplear el coeficiente .

k k = n de subtests.
S x2 S 2j S x2 = Varianza del test.
j= 1
=
2 S 2j = Varianza de cada subtest.
k
nj
S x2 1 j = 1 n nj = n de tems de cada subtest.
n = n de tems del test.

ESTIMACIN PUNTUACIN VERDADERA DE LOS SUJETOS EN EL ATRIBUTO DE INTERS

R. MEDRANO (TUTOR) Pgina 9


PSICOMETRA ORIENTACIONES PARTE II (PROPIEDADES MTRICAS)

No se puede calcular el valor exacto de la puntuacin verdadera de un sujeto, pero si podemos


establecer un intervalo confidencial, con un determinado nivel de confianza, dentro del cual se
encontrar dicha puntuacin. La estimacin se puede realizar de tres formas:

1.- Estimacin mediante la desigualdad de Chebychev (cuando no se hace ningn supuesto sobre la
distribucin de las puntuaciones empricas o de los errores)

1
1 = Nivel de confianza utilizado
K2
1
K {
P XV }
K ( Se ) 1 K2
Se = error tpico de medida.

X (K Se) (LINF y LSUP)

2.- Estimacin basada en la distribucin normal de los errores: Asume una distribucin normal de
los errores de medida (con media 0 y varianza S 2e) y de las puntuaciones empricas condicionadas a un
determinado valor de V. Pasos para determinar el intervalo:

Se fija un nivel de confianza y se determina Zc (buscar en tablas)


Se calcula el error tpico de medida Se.
Se = S x 1 rxx Para puntuaciones directas o diferenciales.
S ze = 1 rxx Para puntuaciones tpicas.
Calcular el error de medida mximo (est afectado por el nivel de confianza) Emax = Zc Se
Calcular el intervalo confidencial IC = X Emax

3.- Estimacin basada en el modelo de regresin: mientras que la correlacin entre las puntuaciones
verdaderas y los errores de medida es igual a cero (rVE = 0); la correlacin entre las puntuaciones
empricas y los errores de medida se ve afectada por los errores rxe = 1 rxx 0
Valor mximo cuando la fiabilidad del test es nula (rXX = 0) Puntuaciones empricas = Errores
Valor mnimo cuando la fiabilidad del test es perfecta (rXX = 1) Punt. Empricas = Punt. Verdaderas
El intervalo de confianza se hace sobre la puntuacin verdadera estimada por regresin lineal:

Ecuaciones de regresin de V sobre X


Puntuaciones directas: V = rxx X + ( X rxx X ) V = rxx ( X X ) + X

Puntuaciones diferenciales: v' = rxx x v' = rxx ( X X )

Puntuaciones tpicas: Z v ' = rvx Z x

FIABILIDAD DE UNA BATERA DE TESTS


Se trata de calcular la fiabilidad de la batera en funcin de los coeficientes de fiabilidad, varianzas y
covarianzas de los subtest que la forman.

S2J - S2J rJJ


rtt = 1 - ------------------------
S2T
S2J = Varianza del subtest j // rJJ = coeficiente de fiabilidad del subtest j
S2T = Varianza de la batera total

R. MEDRANO (TUTOR) Pgina 10


PSICOMETRA ORIENTACIONES PARTE II (PROPIEDADES MTRICAS)

2 PARTE: EVALUACIN DE LA PROPIEDADES MTRICAS DE LOS INSTRUMENTOS DE


MEDICIN PSICOLGICA

TEMA N 5 LA FIABILIDAD EN LOS TEST REFERIDOS AL CRITERIO.

1.- DEFINICIN Y OBJETIVOS DE LOS TESTS REFERIDOS A CRITERIO (TRC)

Tests referidos a normas (TRN): Su finalidad es describir al sujeto


en el continuo de algn rasgo, haciendo hincapi en las diferencias
individuales y expresando su posicin relativa respecto al grupo
(denominado grupo normativo)

Test referidos a criterio (TRC): Su finalidad es construir y evaluar


test que permitan interpretar las puntuaciones en sentido absoluto,
sin referencia a ningn grupo, y describir con mayor precisin los conocimientos, habilidades y
destrezas de los sujetos en un dominio concreto de contenidos. Los test referidos a criterio se
pueden utilizar para dos tipos de objetivos:

Estimar la puntuacin de dominio de los sujetos


Establecer estndares mediante puntos de corte (test de maestra)

Considerando el mbito de los tests de maestra, un test se considera fiable, si tras su aplicacin
a los mismos sujetos en distintas ocasiones, o la aplicacin de dos formas paralelas, siempre se
clasifica a los sujetos en la misma categora. Por esto, los mtodos para calcular la fiabilidad de
los tests referidos a criterio (TRC) se pueden dividir en dos grupos:

A. Los que requieren dos aplicaciones del test (Coeficiente de Hambleton y Novick,
Coeficiente Kappa de Cohen e ndice de Crocker y Algina)
B. Los que requieren una sola aplicacin del test (Mtodo de Huynh, Mtodo de Subkoviak y
Coeficiente de Livingston)

Los distintos mtodos para el clculo de la fiabilidad de los TRC se utilizan para establecer un
punto de corte que nos permite clasificar al sujeto en dos categoras: la de los sujetos que dominan
el criterio evaluado y la de aquellos que no lo dominan (el criterio es el punto de corte para
evaluar a los sujetos) Las decisiones que se toman en funcin del punto de corte son muy
importantes para los sujetos aprobar o suspender, acceder a unos u otros estudios, etc. La
determinacin del punto de corte es subjetiva (lo establecen los expertos)

Apunte histrico

Los TRC tienen su origen en los trabajos de Flanagan y Nedelsky (introdujeron el concepto de
estndar absoluto y relativo respecto a las puntuaciones). La denominacin TRC se debe a Ebel y
Glaser fue quien estableci la diferencia con los tests normativos. Segn Hambleton, las
principales causas que generan su aparicin son: conocer la eficacia de los programas educativos,
evaluar habilidades bsicas, etc.

En los aos 60, se intenta establecer el estatus de un sujeto respecto al dominio definido. En los
aos 80, aparecen nuevos enfoques (medicin autntica o evaluacin de la ejecucin son
trminos alternativos de la medicin referida a criterio)

La definicin ms consensuada sobre los TRC se debe a Popham Un test referido a criterio se
utiliza para evaluar el status absoluto del sujeto con respecto a algn dominio de conductas bien
definido.

R. MEDRANO (TUTOR) Pgina 1


PSICOMETRA ORIENTACIONES PARTE II (PROPIEDADES MTRICAS)

2.- DIFERENCIAS ENTRE LOS TESTS REFERIDOS NORMAS (TRN) Y CRITERIO (TRC)

DIFERENCIAS TEST REFERIDOS A NORMAS TEST REFERIDOS AL CRITERIO


(TRN) (TRC)

Sita al sujeto en el continuo de Permiten interpretar las puntuaciones


algn rasgo, haciendo hincapi en sentido absoluto (sin referencia), y
FINALIDAD en las diferencias individuales y describir mejor los conocimientos,
expresando su posicin relativa habilidades y destrezas de los sujetos
respecto al grupo normativo. en un dominio concreto de contenidos.

Se delimitan al contenido o conductas


Los tems suelen derivarse de y el uso pretendido del test.
alguna teora de rasgos (no se Se especifica el dominio de contenido
CONSTRUCCI hace tanto hincapi en los y la elaboracin y anlisis cualitativo
N DEL TEST contenidos) de los tems.
Validez de contenido: se centra en la
relevancia y representatividad de los
tems respecto al dominio especfico.

Segn objetivos del test y el propsito


tems de dificultad media y alto y finalidad del mismo. 2 objetivos:
CRITERIOS DE ndice de discriminacin para Test referido a dominio: estimacin
SELECCIN DE incrementar las posibilidades del de la puntuacin dominio de los
TEMS test para discriminar. sujetos describe lo que una
persona puede hacer en un rea de
Estimacin de fiabilidad: contenido especfico.
No permiten describir la Test referido de maestra:
precisin de las puntuaciones establecer estndares mediante
individuales (los estndares puntos de corte clasifica a los
determinan los puntos de corte) sujetos en las posibles categoras
excluyentes entre s: xito-fracaso,
trastorno-no trastorno.

EVALUACIN La puntuacin del sujeto es un La puntuacin es un estimador del


DE LOS indicador de su verdadera rendimiento del sujeto en el dominio.
SUJETOS puntuacin en un rasgo latente. Tiene significado en trminos
Slo tiene significado en funcin absolutos.
del grupo normativo.

3.- LONGITUD DEL TEST

Nmero de tems pequeos Nmero de tems elevados

Las puntuaciones tienen un valor limitado. Se aseguran valores de probabilidad de


La estimacin de dominio ser imprecisa. clasificacin incorrecta mnimos.
Clasificaciones inconsistentes y poco No debe tener excesiva longitud
fiables, no indicativas de la maestra. (economa, limitaciones de tiempo, etc.)

Se pueden considerar dos maneras de reducir el nmero de errores sin aumentar la longitud del
test: Modelos bayesianos y tests computarizados.

Modelo de MIllman Modelo binomial. Considera la proporcin esperada de tems que un sujeto
puede contestar correctamente para ser considerado apto y el error mximo a tolerar.

n n n x n x Pr ob( x p) = Probabilidad de que un sujeto con


Pr ob( x p) = p x q n x = p q una puntuacin p, conteste de forma correcta X
x x x ( n x ) tems de un test con n tems.

R. MEDRANO (TUTOR) Pgina 2


PSICOMETRA ORIENTACIONES PARTE II (PROPIEDADES MTRICAS)

Supuestos del modelo: Muestra aleatoria de tems dicotmicos // La probabilidad de una


respuesta correcta por parte de un sujeto es constante para todos los tems del test // Las
respuestas a los tems son independientes unas de otras // Los errores se ajustan al modelo
binomial.

pc ( 1 pc ) n = n de tems del test.


n= Pc = proporcin de aciertos para ser considerado apto.
e2 e = error mximo admisible.

Ecuacin para averiguar la longitud del test supuesta una proporcin de aciertos

4.- FIABILIDAD EN LAS CLASIFICACIONES EN LOS TESTS REFERIDOS AL CRITERIO

NDICES DE ACUERDO CON DOS APLICACIONES DEL TEST (CLCULO FIABILIDAD):

Coeficiente pc de Hambleton y Novick

Supone la utilizacin de la proporcin de El valor mximo de pC = 1, que se obtiene


sujetos que consistentemente son cuando los sujetos son clasificados de la
clasificados dentro del grupo de maestra o misma forma con los dos tests.
no maestra como un ndice de fiabilidad de
un test. El valor mnimo: es igual a la proporcin
La proporcin de sujetos consistentemente de clasificaciones consistentes que se
clasificados en ambos tests se expresa: espera por azar p a , valor que viene dado
n
n11 n 22 n en funcin de las frecuencias marginales
pc = pi = + + ...... + mm
i= 1 N N N de la tabla N j
p i = proporcin de sujetos clasificados en
ambas formas m NjNj
N = nmero de sujetos pa =
n11 , n22 ,.......nmm = nmero de sujetos en j= 1 N2
cada casilla en los que ambos tests
coinciden al clasificarlos.

Coeficiente Kappa de Cohen


Este coeficiente puede expresarse en
Este coeficiente elimina del valor de la funcin de las frecuencias absolutas:
proporcin de sujetos clasificados F Fa
consistentemente el valor de la proporcin de k = c
N Fa
clasificacin consistente esperada por azar
p pa Fc : frecuencia observada clasificaciones
k = c coincidentes
1 pa
Fa : frecuencia de coincidentes esperadas
Este coeficiente proporciona una medida por azar
de la consistencia de clasificacin de los N : nmero total de sujetos
sujetos independientemente del posible valor
esperado por azar. Error tpico de medida de K
Fa
Este valor oscila: Entre 1 (fiabilidad Se =
perfecta) y 0 (atribuida al azar) N ( N Fa )
Despus calcula el intervalo confidencial:
k Z x * Se

R. MEDRANO (TUTOR) Pgina 3


PSICOMETRA ORIENTACIONES PARTE II (PROPIEDADES MTRICAS)

ndice de Crocker y Algina

El ndice p* es una alternativa al coeficiente p = 1 cuando las decisiones son


Kappa.
totalmente consistentes.
Se basa en que la probabilidad mnima de
una decisin consistente es 0.50
Tiene lugar si las puntuaciones del test son p = 0 cuando las decisiones no son ms
estadsticamente independientes y el punto consistentes que las que resultaran al usar
de corte est en la mediana de la tests estadsticamente independientes,
distribucin conjunta de las puntuaciones cuyas puntuaciones presentan la misma
obtenidas en las dos aplicaciones. distribucin y un punto de corte igual a la
p c 0.50 mediana de la distribucin comn.
p = = 2 pc 1
1 0.50

NDICES DE ACUERDO CON UNA SOLA APLICACIN DEL TEST (CLCULO FIABILIDAD):

Mtodo de Huynh
PASOS
Un solo test y una sola aplicacin: Calcular la media, la varianza, el
procedimiento matemtico sofisticado para coeficiente de correlacin KR21 y
estimar la consistencia de clasificacin. especificar el valor del punto de corte (c).

Mtodo para pronosticar las puntuaciones de Calcular la puntuacin tpica Zx que


en un test B conocidas las puntuaciones de corresponde al valor del punto de corte,
una muestra de sujetos en una aplicacin con una correccin de 0,5, y se acudir a las
(test A) tablas de curva normal para buscar el valor
P que deja por debajo la Z obtenida
Este mtodo presupone que la distribucin (C 0.5 X )
de puntuaciones es aproximadamente Zx =
Sx
normal y es adecuado cuando el nmero
de tems es superior a 8 y la razn entre A partir de las tablas de Gupta se obtiene
la media de las puntuaciones de los la probabilidad PZZ de que dos variables
sujetos en el test y el nmero de tems distribuidas normalmente con una
oscila entre 0,15 0,85. correlacin KR21 sean menor que Z.
Por ltimo, se calculan los valores p c y k
Nota: para utilizar KR21 los tems del test p zz p z2
deben tener la misma dificultad. p c = 1 + 2( p zz p z ) k=
p z p z2

Mtodo de Subkoviak
PASOS

Procedimiento con una sola aplicacin Se obtiene la distribucin de frecuencias.


cuando no es posible establecer una Se calcula la media y el coeficiente alfa del
forma paralela de un test, por lo que test.
simulan las puntuaciones de una segunda Se estima la probabilidad de que una
forma paralela al test. persona con una determinada puntuacin
Estima bien los valores p c y k X responda correctamente a cada tem:
X X
px = + ( 1 )
n n

R. MEDRANO (TUTOR) Pgina 4


PSICOMETRA ORIENTACIONES PARTE II (PROPIEDADES MTRICAS)

Coeficiente de Livingston

A diferencia de los anteriores, considera los S x2 + ( X C ) 2


errores cometidos al clasificar a un sujeto K xv2 =
en el grupo que no le corresponde
S x2 + ( X C ) 2
estima ms importantes los errores de = coeficiente alfa // S x2 = varianza test
clasificacin de los sujetos ms distanciados C = punto de corte // X = media del test
del punto de corte de aquellos que estn
ms cerca del punto de corte.
A medida que el punto de corte se
distancia del valor de la medida del test,
Es ms fcil cometer errores de clasificacin 2
cuando un sujeto se encuentra muy cercano aumenta el valor de K xv .
al punto de corte. Cuando X ( media del test) = C ( punto de
2
corte) K xv =
2
Cuando =1 K xv =1

5.- MTODOS PARA ESTIMAR EL PUNTO DE CORTE EN TESTS REFERIDOS A CRITERIO

Se suelen considerar dos tipos de puntos de corte (Muiz, 1998): Puntos de corte relativos (se
establecen en funcin del grupo de sujetos evaluados) y Puntos de corte absolutos (se establecen
en funcin del constructo o materia objeto de estudio)

Los mtodos utilizados para establecer el punto de corte son:


Los mtodos valorativos (evaluacin que un grupo de expertos en los contenidos a evaluar,
con cierto entrenamiento y en nmero suficiente, llevan a cabo sobre los tems de un test)
Los mtodos combinados (juicios que los expertos llevan a cabo sobre la competencia de
los sujetos en la materia que se evala, adems de reunir los requisitos anteriores)
Los mtodos de compromiso (no slo se basan en los conocimientos mnimos que el sujeto
tiene para superar el criterio, tambin incorpora la informacin relativa a la posicin del sujeto
con relacin a su grupo)

Mtodos valorativos: Nedelsky, Angoff, Ebel y Jaeger

Mtodo Nedelsky: se utiliza para fijar el punto de corte en los test de competencia mnima. Se
utiliza en el mbito acadmico con test compuestos por tems de eleccin mltiple. Los jueces
determinan las alternativas que un sujeto competente considerara errneas (ejemplo: 2 de 5) y
para ese tem La unidad dividida por el n de alternativas que supone que el sujeto no ha
rechazado como errneas, en nuestro caso, 1/3 = 033 (la media de todos los valores esperados
en cada tem = Punto de corte)

Para eliminar los efectos del azar


Pc = puntuacin corregida
N-A N = nmero de tems
Pc = A - -------------- A = media de los valores esperados
n1 n = n de alternativas de cada tem.

Mtodo Angoff: variante del mtodo Nedelsky, se puede aplicar a toda clase de tems (no slo a
los de eleccin mltiple). Los jueces evalan globalmente los tems (probabilidad de que un sujeto
con competencia mnima responda correctamente a cada tem del test)
Para calcular el punto de corte se suman los valores de las probabilidades establecidas por cada
uno de los jueces y se calcula la media.

R. MEDRANO (TUTOR) Pgina 5


PSICOMETRA ORIENTACIONES PARTE II (PROPIEDADES MTRICAS)

Mtodo Ebel: similar al mtodo de Angoff. Los jueces evalan globalmente desde una doble
perspectiva: la dificultad del tem (fcil, medio y difcil) y su relevancia (esencial, importante,
aceptable y dudoso). Se articula una matriz con 12 categoras en las que se ubican todos los tems
del test los jueces establecen el porcentaje de tems que debera contestar un sujeto
mnimamente competente.

XC = puntuacin correspondiente al punto de corte


p = proporcin de tems en cada casilla que el sujeto
Punto de corte XC = p (M) mn. competente debera contestar correctamente.
M = media de los valore esperados
n = n de tems en cada celda.

Mtodo Jaeger: otra variante del mtodo de Angoff. Para determinar el punto de corte se precisan
tres sesiones: 1 cada juez en cada uno de los tems afirma (SI / NO) ser contestado
correctamente por los sujetos mnimamente competentes; 2 se calcula el nmero de tems a los
que cada juez respondi con un SI y se facilita a los jueces; se repite el proceso inicial y cada juez
puede o no cambiar de opinin; 3 se repite el proceso de la 2 sesin.
Punto de corte Mediana ms baja de los diferentes grupos de jueces.

Mtodos combinados: mtodo del grupo lmite y grupos de contraste.

Mtodo del grupo lmite (Zieky y Livingstone): los jueces, por acuerdo, definen tres niveles de
competencia (competente, lmite y no competente). Despus los jueces seleccionan a los sujetos
lmite y se les aplica el test.
Punto de corte Media o Mediana de las puntuaciones que han obtenido en el test los sujetos
lmite competentes (la mediana es mejor porque no tiene en cuenta puntuaciones extremas)

Mtodo de los grupos de contraste: los jueces clasifican a los sujetos en dos grupos (los que
son competentes y los que no lo son) y se les administra el test.

COMPETENTES NO COMPETENTES

Punto de corte
Interseccin de las distribuciones de
puntuaciones de ambos grupos
(Curvas Normales)
PUNTO DE CORTE

Mtodos de compromiso: Beuk y Hofstee

Mtodo de Beuk: los jueces tienen en cuenta las puntuaciones de los sujetos en el test en el que
estamos interesados en establecer un punto de corte y las respuestas a dos preguntas: 1
porcentaje mnimo de tems que los jueces creen que un sujeto debera contestar correctamente
para superar el test y 2 porcentaje de sujetos que estiman que obtendrn la puntuacin mnima
para superar el test.

Mtodo de Hofstee: Los jueces recogen informacin sobre cuatro puntos: el punto de corte que
los jueces consideran adecuado (porcentaje de tem que los sujetos deben superar), el punto de
corte que los jueces consideran inadecuado (porcentaje mximo admisible de sujetos que fallan en
el test), el porcentaje mnimo admisible de sujetos que fallan en el test y la distribucin de
resultados obtenidos en el test.

R. MEDRANO (TUTOR) Pgina 6


PSICOMETRA ORIENTACIONES PARTE II (PROPIEDADES MTRICAS)

2 PARTE: EVALUACIN DE LA PROPIEDADES MTRICAS DE LOS INSTRUMENTOS DE


MEDICIN PSICOLGICA

TEMA N 6 VALIDEZ DE LAS INFERENCIAS I

Para poder medir variables psicolgicas, constructos tericos,


variables latentes o atributos psicolgicos es necesario seleccionar
una serie de conductas que representen algn aspecto de ese
constructo y que sean consideradas indicadores del mismo.
Entre los requisitos que deben cumplir los instrumentos elaborados
para medir estas conductas, destacan dos fundamentales:
Que proporcionen medidas fiables
Que se puedan hacer inferencias vlidas a partir de esas
medidas fiables.
Fiabilidad de las medidas Grado en que las puntuaciones
obtenidas al aplicar un test reflejan su nivel real en el rasgo o
caracterstica medida (grado en que esas puntuaciones estn
libres de errores aleatorios)
Validez de las inferencias Grado de relacin que se puede
establecer entre la evidencia emprica obtenida y el concepto
terico que se tiene del constructo.

1.-INTRODUCCIN AL CONCEPTO DE VALIDEZ Y SU EVOLUCIN HISTRICA

El concepto de validez hace referencia al grado en que el test mide aquello que pretende medir.
En la medida en que la relacin entre el test y el constructo que pretende medir sea ms estrecha,
el test ser ms vlido.
La relacin entre el test y el constructo alude a la relacin entre las puntuaciones obtenidas por
los sujetos en el test y la medida obtenida en el indicador o indicadores del constructo. Hasta los
aos 50 del siglo pasado, la forma de operativizar la relacin entre el test y el criterio era
mediante un coeficiente de correlacin.

Evolucin histrica

Validez relacionada con criterios externos:


Validez predictiva (Un test era vlido en la medida en que existiera correlacin entre las
puntuaciones obtenidas por los sujetos en el test y las obtenidas en el criterio externo
seleccionado)
Validez concurrente (se diferencia de la validez predictiva en que la recogida de la
informacin tanto del test como del criterio se hace simultneamente)
Validez retrospectiva (cuando se puede obtener la medida del criterio con anterioridad a la
del test)
Validez relacionada con criterios internos:
Validez de contenido (la validez relacionada con criterios internos al propio test. Utilizada
sobre todo en los test de conocimientos que tratan de estudiar hasta qu punto a partir del
contenido de los test, se puede inferir el rendimiento en una determinada materia; el test en
s mismo constituye su propio criterio)
Validez de constructo (implica recoger toda la informacin necesaria para poder tener la
garanta suficiente de que las conductas observables, que se han elegido como indicadores
del constructo que se quiere medir, lo son realmente)

Posteriormente, los tipos de validez se reducen a tres Validez de contenido (determinar el


rendimiento o actuacin de un sujeto en un universo de situaciones); Validez relativa al criterio
(incluye la concurrente y la predictiva) y validez de constructo (inferir el grado en el que un sujeto
posee algn rasgo o atributo que se supone vendr reflejado por su ejecucin en el test)

R. MEDRANO (TUTOR) Pgina 1


PSICOMETRA ORIENTACIONES PARTE II (PROPIEDADES MTRICAS)

1974 Se afirma por primera vez que la validez se refiere a la adecuacin de las inferencias que
se realizan a partir de las puntuaciones de los test u otras formas de medida. Se mantiene la
distincin de los tres tipos de validez y se consideran formas independientes de interpretar las
inferencias realizadas.

1999 (concepcin unitaria de validez) La validez hace referencia al grado en que la evidencia
emprica obtenida y los conocimientos aportados por las teoras apoyan las inferencias que se
hagan a partir de las puntuaciones obtenidas en el test cuando ste se utiliza para un objetivo
concreto.

Acuerdo generalizado, desde el punto de vista cientfico, la nica validez la validez de


constructo (las otras dos quedaran incluidas en sta y seran consideradas como estrategias de
validacin para comprender mejor lo que mide un test)

La validacin de los tests es un proceso continuo que permite obtener distintos tipos de
evidencia emprica, y un proceso de validacin ideal debe incluir los tipos de evidencia implicados
en los tres tipos tradicionales de validez: la de constructo, la de contenido y la relativa al criterio.
As, se considera la validez como un concepto unitario y el proceso de validacin como un
proceso continuo que permitir recoger la evidencia necesaria para poder interpretar las
puntuaciones al aplicar los tests para un determinado objetivo.

2.- VALIDACIN DEL CONTENIDO

Objetivo Analizar hasta qu punto los elementos o tems que componen un test son una
muestra relevante y representativa (implica la necesidad de una clara y exhaustiva especificacin
de todas las posibles conductas observables que son representativas del constructo a medir). Para
un estudio de validacin de un test es necesario analizar hasta qu punto los elementos que lo
componen son una muestra representativa de la clase de problemas o situaciones sobre las que
van a hacer inferencias y extraer conclusiones.

En los TRC y tests de rendimiento acadmico, las puntuaciones se suelen utilizar para hacer
inferencias sobre el grado en que los sujetos dominan un campo de conocimientos (dominio), no
para hacer inferencias sobre conductas externas al test o sobre el constructo medido. En estos
tests las puntuaciones se suelen utilizar para dar cuenta de si los sujetos han alcanzado un nivel
mnimo de competencia en una determinada materia. El dominio de contenidos se suele hacer
ms en referencia a objetivos educativos que al constructo.

La forma tpica de llevar a cabo un estudio de validacin de contenido, es utilizando un grupo de


expertos (juicio subjetivo) que sern los encargados de analizar dos aspectos fundamentales:
Que el test no incluya aspectos irrelevantes del dominio de inters.
Que incluya todos los elementos importantes que definen el dominio.

Para llevar a cabo la especificacin del dominio, es necesario:


1 - Analizar las reas de contenido que se deben cubrir.
2 - Analizar los procesos que se van a evaluar y su importancia relativa. Se puede
construir una tabla de doble entrada en la que las columnas representen las distintas reas
de contenido (dominio) que definen el constructo y las filas las distintas operaciones o
procesos cognitivos implicados. Las celdillas incluyen el porcentaje de tems que deben
contener la prueba segn cada rea de contenido y cada proceso cognitivo empleado.

Para evaluar la relevancia de los tems en relacin con el dominio hay varios procedimientos: uno
de ellos (Hambleton 1980) consiste en presentar a los expertos una serie de fichas cada una de
las cuales contiene un tem. Cada experto expresar en una escala de 5 puntos el grado de ajuste
de cada tem, de manera que el 1 indique un mal ajuste y el 5 un ajuste muy bueno. Hecho esto,
se calcula la media o la mediana de los valores asignados por cada uno de los expertos a cada
tem y el valor obtenido ser el que indique el grado de relevancia del tem. Se podrn seleccionar
los que muestren un alto grado de ajuste y eliminar los que no.

R. MEDRANO (TUTOR) Pgina 2


PSICOMETRA ORIENTACIONES PARTE II (PROPIEDADES MTRICAS)

La representatividad: grado en que se han cubierto las especificaciones del dominio, en cuanto a
contenidos y a objetivos propuestos. En la medida en que el dominio este ms y mejor
representado, las inferencias sern ms precisas. Lo ideal sera poder contar con un banco de
tems referidos al dominio de inters y a partir de este extraer una muestra aleatoria de tems.

3.- VALIDACIN DEL CONSTRUCTO

Proceso que permitir obtener evidencia acerca de la capacidad del test para medir el
constructo (evidencia de que las conductas observables que se han elegido como indicadores del
constructo, realmente lo son). Trata de garantizar cientficamente que la variable que el test
pretende medir es una variable aceptable y consistente en el mbito terico de la psicologa
(descansa en suficientes comprobaciones experimentales que lo verifican)

Para llevar a cabo un estudio de validacin es necesario:


1 Definir el constructo de inters a partir de las teoras que existen acerca del mismo
(Postular una serie de hiptesis acerca de la naturaleza y grado de relacin entre el
constructo y una serie de variables y entre el constructo de inters y otros constructos)
2 Disear el instrumento de medida adecuado (debe incluir elementos relevantes y
representativos de aquellas conductas que sean especficas y concretas del constructo)
3 Obtener datos empricos de las relaciones entre las puntuaciones obtenidas al
aplicar el test y las variables hipotetizadas.

As, es necesario estudiar las relaciones entre: el constructo y las conductas observables
representativas del constructo. El constructo y otros constructos y las conductas tomadas
como indicadores del constructo y las puntuaciones obtenidas por los sujetos en el test.

Los estudios de validacin de constructo se centran en el anlisis de la estructura del test. Se


estudian las interrelaciones entre las puntuaciones obtenidas por los sujetos en los distintos tems
(estructura interna) y las relaciones entre las puntuaciones obtenidas en el test y otras medidas
obtenidas en variables externas al mismo y consideradas relevantes (estructura externa)

Mtodos para la validacin del constructo:

A.- Matriz Multimtodo-Multirrasgo (propuesto por Campbell y Fiske 1959, permite el anlisis
de la estructura externa del test) Se intenta medir un mismo constructo mediante distintos
procedimientos y distintos constructos mediante el mismo procedimiento. Una vez obtenidas todas
las medidas, calcular las intercorrelaciones entre ellas:
Si las correlaciones entre las medidas del mismo constructo a travs de distintos
procedimientos son altas, el constructo quedar validado (existe validez convergente)
Si estas correlaciones son significativamente ms altas que las obtenidas al correlacionar
las medidas de distintos constructos con el mismo procedimiento (existe validez
discriminante)

B.- Anlisis Factorial (la tcnica ms utilizada para poner a prueba las hiptesis planteadas a
cerca de la estructura externa del constructo y las relaciones del mismo con otras variables) Se
puede utilizar con dos enfoques: el exploratorio (no se establecen hiptesis previas acerca del
nmero de dimensiones, es la propia tcnica la que nos aportar esta informacin) y
confirmatorio (se establecen a priori hiptesis, y mediante las tcnicas oportunas se comprueba
si se pueden aceptar las hiptesis propuestas).

Para llevar a cabo un anlisis factorial se parte de un conjunto de n medidas tomadas a la misma
muestra de sujetos en un conjunto de variables observables, a partir de ellas se obtiene una
matriz (n x n) con las intercorrelaciones entre todas ellas. Mediante Anlisis Factorial, se intenta
identificar un nmero ms reducido de variables latentes llamadas factores.
Cuando en un mismo factor se agrupan mltiples indicadores del constructo (validez
convergente) y Cuando en el anlisis se han obtenido medidas de otros constructos y estas
aparecen agrupadas en distintos factores (validez discriminante)

R. MEDRANO (TUTOR) Pgina 3


PSICOMETRA ORIENTACIONES PARTE II (PROPIEDADES MTRICAS)

4.-VALIDACIN REFERIDA AL CRITERIO

Objetivo principal evaluar la hiptesis de relacin entre test y criterio. Se utilizan dos tipos de
ndices para describir la capacidad de un test o conjunto de tests para predecir un criterio:
Medidas correlacionales (coeficiente de validez, de determinacin, de alineacin, etc.
Medidas de error en la prediccin (errores de estimacin).

Estos estudios se suelen realizar desde dos perspectivas diferentes dependiendo del uso que se
vaya a dar al test y del tipo de inferencia:
Validez predictiva (los tests se van a utilizar para la seleccin, clasificacin o colocacin de
personas en determinados puestos). Se trata de analizar la capacidad de los test para
pronosticar el posterior rendimiento de los sujetos en un trabajo, a partir de las puntuaciones
obtenidas en el test. La medida del criterio se obtiene con posterioridad a la del test.
Validez concurrente (utilizar los test para hacer un diagnstico. La medida del criterio se
obtiene a la vez que la del test)

La teora no juega el papel principal, se acenta el inters en el aspecto emprico del proceso ms
que en el terico. Un estudio de validacin de constructo del criterio ayudar a determinar las
dimensiones a medir, cmo se medir cada una de ellas y si se desea, cmo combinarlas.

Pasos a seguir para disear un estudio de validacin:


1. Definir claramente el criterio que se quiere medir.
2. Identificar el indicador o indicadores que se van a utilizar para medir el criterio.
3. Seleccionar una muestra de sujetos representativa.
4. Aplicar el test a la muestra y obtener una puntuacin para cada uno.
5. Obtener una medida de cada sujeto en el criterio, bien en el mismo momento de la
aplicacin del test (validacin concurrente) o bien al cabo de un cierto tiempo (validacin
predictiva)
6. Determinar la relacin entre las puntuaciones de los sujetos en el test y el criterio.

Problema de seleccin y medicin del criterio Los test de seleccin los utilizamos tratando
de seleccionar aquellas personas que vayan a tener una mayor probabilidad de realizar un trabajo
o aprovechar el programa con xito. El concepto de xito tiene muchas facetas, y es muy difcil de
definir de forma precisa. Hemos de tener en cuenta que todos los indicadores son parciales y
no ofrecen una comprensin completa del criterio. En esta lnea Thorndike y Hagen (1989)
consideran que los indicadores deben cumplir una serie de requisitos:
Que sean relevantes (un indicador es relevante en la medida en que se corresponde con
el criterio). Para apreciar la relevancia es necesario tener en cuenta consideraciones
racionales y apoyarse en los juicios de expertos.
Que estn libres de sesgos (que las medidas criterio representen la verdadera
competencia de los sujetos y no estn determinadas por factores que acten de manera
diferencial en determinados grupos)
Que sean fiables (las medidas criterio de los indicadores han de ser estables)
Que sean accesibles (tener en cuenta las limitaciones econmicas y de tiempo)

Procedimientos estadsticos para la validacin referida al criterio Los ms utilizados estn


basados en correlaciones. La utilizacin de una tcnica u otra depende del diseo de recogida de
datos par la validacin y del nmero de variables implicadas:
Un nico test predictor y un solo indicador del criterio: la correlacin y el modelo de
la regresin lineal simple. Segn la medida (Pearson, biserial, coeficiente phi, etc.)
Varios predictores y un solo indicador de criterio (cuando se utiliza una batera de
tests para un nico criterio): la correlacin y la regresin lineal mltiple.
Varios predictores cuantitativos y varios indicadores del criterio cuantitativos: la
regresin lineal mltiple y la correlacin cannica (dificultad para interpretar resultados)
Procedimientos basados en la teora de decisin (validez y utilidad en las
decisiones): Se basan en diferentes mtodos para optimizar las decisiones realizadas

R. MEDRANO (TUTOR) Pgina 4


PSICOMETRA ORIENTACIONES PARTE II (PROPIEDADES MTRICAS)

con el test: tcnicas especialmente la Teora de la utilidad multiatributo.

5.- VALIDACIN CON UN NICO PREDICTOR Y UN SOLO INDICADOR DEL CRITERIO

La correlacin nos permitir conocer el grado de asociacin entre el test y el criterio.


El modelo de regresin nos permitir pronosticar, a partir de las puntuaciones obtenidas
en el predictor, las puntuaciones en el criterio.

EL COEFICIENTE DE VALIDEZ Correlacin entre las puntuaciones obtenidas por los sujetos
en el test predictor y las obtenidas en el criterio. A partir de las puntuaciones de los sujetos, se
podrn obtener tantos coeficientes de validez como indicadores de criterio se elijan para su
validacin.
INDICADOR TEST (X)
CRITERIO (Y)
Continua Dicotomizada Dicotmica
Continua Pearson Biserial Biserial puntual
Dicotomizada Biserial Tetracrica biserial
Dicotmica Biserial puntual biserial

COEFICIENTE DE VALIDEZ (SEGN EL TIPO DE VARIABLES IMPLICADAS)


(Valores entre -1 y 1)
TIPO DE VARIABLES FRMULA DE LA CORRELACIN

Test (X) y Criterio (Y) variables continuas N XY X Y


CORRELACIN DE PEARSON rxy =
2 2
N X2 ( X) N Y2 ( Y)

Test (X) continua; Criterio (Y) dicotomizada


CORRELACIN BISERIAL X p X q pq X p X p
XP = Media en X de los que obtuvieron un 1 en Y rb = =
Xq = Media en X de los que obtuvieron un 0 en Y Sx y Sx y
X = Media en X de toda la muestra
SX = Desviacin tpica en X de toda la muestra
p y q = proporcin de personas con 1 0 en Y
y = Ordenada que divide el rea en dos partes X p Xq Xp X
rbp = pq = p/q
Test (X) continua; Criterio (Y) dicotmica Sx Sx
CORRELACIN BISERIAL PUNTUAL

cb ad
Test (X) dicotmica; Criterio (Y) dicotmica =
COEFICIENTE ( a + b) ( c + d ) ( a + c) ( b + d )
a, b, c y d representan el nmero de personas
de la muestra cuyas puntuaciones en X y en Y son X
respectivamente (0,1), (1,1), (0,0), (1,0). 0 1
p y q = proporcin de personas con 1 0 en Y 1 a b
y = Ordenada que divide el rea en dos partes Y 0 c d

Test (X) dicotomizada; Criterio (Y) dicotmica bc ad pq


COEFICIENTE BISERIAL biserial =
Un hbrido entre correlacin biserial y el coeficiente ( a + b) ( c + d ) y
, con el mismo significado de smbolos.

CORRELACIN TETRACRICA Tanto X como Y son variables continuas que se han dicotomizado
artificialmente. Clculo muy laborioso. Se han ofrecido algunas aproximaciones ms utilizada calcular
la razn bc/ad y consultar la tabla correspondiente. Si la razn es menor que la unidad se debe usar la
recproca ad/bc y consultar la tabla, en este caso ser negativa.

R. MEDRANO (TUTOR) Pgina 5


PSICOMETRA ORIENTACIONES PARTE II (PROPIEDADES MTRICAS)

EL MODELO DE REGRESIN LINEAL

Conocido el grado de asociacin entre el test y el criterio, se puede utilizar el modelo de


regresin para hacer pronsticos (a partir de las puntuaciones obtenidas por los sujetos en el
test, hacer estimaciones acerca de su puntuacin en el criterio).

Mediante el modelo de regresin se intenta buscar una ecuacin lineal que haga mnimos los
errores de pronstico Y= a + bX

MODELO DE REGRESIN LINEAL SIMPLE Y= A + B X


(A y B) = Constantes de la regresin
Sy B pendiente de la recta de regresin
Clculo de la pendiente (B) b = rxy [cambio en los valores del criterio Y por cada
Sx cambio unitario en el test X]
A ordenada en el origen [valor pronosticado en
Clculo ordenada en el origen (A) a = Y bX el criterio (Y) cuando en el test (X) se obtiene un
valor 0].

ECUACIONES DE LA RECTA DE REGRESIN


Sy Sy Sy
Puntuaciones Directas Y = Y rxy + rxy X = rxy ( X X ) + Y
Sx Sx Sx

Sy
Puntuaciones Diferenciales Y = rxy
Sx
( X X) // Puntuaciones Tpicas Z y = rxy Z x

rXY = Coeficiente de validez // SX = Desv tpica (punt en el test) // SY = Des tpica (punt en el criterio)

Utilidad de las ecuaciones El coeficiente de validez indica la eficacia


Permiten pronosticar la puntuacin que obtendr del test o variable predictora para estimar el
en el criterio otra muestra de sujetos, de las mismas criterio. Cuanto ms se aproxime a 1, la
caractersticas, a partir de las puntuaciones que estimacin ser ms exacta (1 = el valor
obtengan en el test. estimado coincide con la puntuacin que
obtuvieron los sujetos en el criterio)

Error de estimacin (Y- Y) diferencia entre las puntuaciones que ha obtenido un sujeto en el
criterio y la que se le pronostica mediante la ecuacin de regresin

Varianza residual (Varianza error) representa 2


la variabilidad media de las puntuaciones de los
S2
=
(Y Y )

sujetos en el criterio, respecto a la puntuacin que YX


se les pronostica mediante la recta de regresin.
N
Tambin se denomina Error cuadrtico medio
Tambin S2y. x =S2y (1-r2xy)
rXY = coeficiente de validez del test
Y = punt obtenidas por cada sujeto en el criterio 2
Y= punt pronosticas a cada sujeto mediante la ecuacin
de regresin. SY X =
(Y Y )

N = nmero de sujetos de la muestra N


______
Error tpico estimacin Desv tpica de errores Tambin Sy. x = Sy 1-r2xy

Propiedades fundamentales

Y = Y La media de las punt en el criterio es igual a la media de las puntuaciones pronosticadas.


(Y Y) = 0 La suma de los errores de estimacin es 0(media de los errores cometidos = 0)
S2y = S2y + S2y. x La varianza de las punt obtenidas en el criterio = a la varianza de las
puntuaciones pronosticadas ms la varianza de los residuos o varianza error.

R. MEDRANO (TUTOR) Pgina 6


PSICOMETRA ORIENTACIONES PARTE II (PROPIEDADES MTRICAS)

INTERVALO CONFIDENCIAL

Debido a los errores conviene hacer la estimacin por intervalos.


Asumimos que la distribucin de los errores se ajusta a una distribucin normal, cuya desviacin
tpica viene dada por el error tpico de estimacin, se establece un intervalo confidencial en torno a
la puntuacin pronosticada.
Pasos a seguir:
Determinar un nivel de confianza y buscar la puntuacin tpica asociada (Zc)
Calcular el error tpico de estimacin (Sy. x)
Calcular el error mximo (Zc) (Sy. x)
Aplicar la ecuacin correspondiente y obtener la puntuacin pronosticada.
Establecer el intervalo de confianza Y (Zc) (Sy. x)

INTERPRETACIN DE LA EVIDENCIA OBTENIDA (CAPACIDAD PREDICTIVA DEL TEST)

S2y = S2y + S2y. x A partir de esta ecuacin se puede averiguar la proporcin de la varianza de las
puntuaciones de los sujetos en el criterio (varianza de la VD), que se puede explicar a partir de las
varianza de las puntuaciones pronosticadas y que proporcin no se puede explicar y corresponde
a los residuos.

As, tambin podemos considerar otras formas de expresin de:


_____
La varianza de error S2y. x =S2y (1-r2xy) // El error tpico de estimacin Sy. x = Sy 1 - r2xy

Interpretacin de resultados a travs de tres coeficientes bsicos

2
COEFICIENTE DE DETERMINACIN C.D. = rXY

Equivale al coeficiente de validez al cuadrado (r 2xy) // Representa la proporcin (o porcentaje) de


la varianza de las puntuaciones de los sujetos en el criterio (VD) que se puede pronosticar a partir
del test (VI). Tambin se define como varianza comn o asociada entre el test y el criterio.

SY X 2
COEFICIENTE DE ALIENACIN C. A. = K = = 1 rXY
SY
Alude a la inseguridad o el azar que afecta a los pronsticos // Representa la proporcin de la
varianza de las puntuaciones de los sujetos en el criterio (VD) que no se puede predecir a partir
del test (VI). Es decir, la proporcin de varianza error que hay en la varianza de las puntuaciones
de los sujetos en el criterio // El coeficiente de alineacin al cuadrado es el complementario del
coeficiente de determinacin.

Consideraciones Cuanto menor sea el error tpico en relacin con la desviacin tpica del
criterio, menor ser el coeficiente K (oscila entre 0 y 1, ser mximo cuando el coeficiente de
validez sea 0 y mnimo cuando el coeficiente de validez sea 1)
El coeficiente de alineacin al cuadrado es el complementario del coeficiente de determinacin.

2
COEFICIENTE DE VALOR PREDICTIVO C.V .P. = 1 1 rXY
Es el complementario del coeficiente de alineacin // Se trata de otra forma de expresar la
capacidad del test para pronosticar el criterio // Representa la proporcin de seguridad en los
pronsticos (o el porcentaje si se multiplica por 100)

PROBLEMA EJEMPLO

R. MEDRANO (TUTOR) Pgina 7


PSICOMETRA ORIENTACIONES PARTE II (PROPIEDADES MTRICAS)

Se quiere comprobar hasta qu punto se puede utilizar para hacer una seleccin de controladores
areos un test construido para medir rapidez perceptiva (estudio de validacin). Para ello se
seleccionan 5 controladores los cuales se les aplica el test (X) y, a la vez, se pide a sus jefes
directos que los evalen (Y).Los resultados obtenidos son los que figuran en la tabla adjunta

Test (X) CLCULOS


SUJETOS

X1 X2 X3 X4 Y X XY X2 Y2 Y (Y-Y) (Y-Y)2
1 1 0 0 1 5 2 10 4 25 10,56 -5,56 30,91
2 1 1 1 0 15 3 45 9 225 12,59 2,41 5,81
3 1 1 0 1 13 3 39 9 169 12,59 0,41 0,17
4 1 0 0 0 8 1 8 1 64 8,53 -0,53 0,28
5 1 0 0 0 12 1 12 1 144 8,53 3,47 12,04
Sumatorios 53 10 114 24 627 49,21

1.- Averiguar el coeficiente de validez Tanto el test como la variable criterio son variables
cuantitativas; por tanto, el ndice ms adecuado para obtener el coeficiente de validez es el de
Pearson.
N XY X Y 5 * 114 10 * 53
rxy = = = 0.50
[N X2 ( X ) ][N Y ( Y )
2 2 2
] 5 * 24 100 5 * 627 53 2

Dado que el valor mximo del coeficiente de validez es 1, se puede considerar que el test tiene
una capacidad predictiva media (discreta)

2.- Ecuaciones de regresin Se utilizan para predecir las puntuaciones que obtendrn otros
sujetos de similares caractersticas en el criterio, a partir de sus puntuaciones en el test.

Clculos para obtener las ecuaciones de regresin

Medias Y =10,6 y X = 2
X2 24
Varianzas 2
SX = X 2= 2 2 = 0,8; S X = 0.8 = 0,89
Desviaciones N 5
Tpicas
S Y2 =
Y 2 Y 2 = 627 10.6 2 = 13.04; S Y = 13.04 = 3,61
N 5

Constantes SY
regresin (a y b) b = rxy b = 05 (3,61 / 0,89) = 2,028
SX
a = Y (b X) a = 10,6 ( 4,056) = 6,544

Ecuaciones Y= 6,5 + 2,03 X // y= 2,03 x // ZY = 0,5 ZX


Regresin Directas Diferenciales Tpicas

Nivel Confianza NC = 95%; Z C = Z = Z 0.975 = 1,96


1
2

3.- Error tpico de estimacin Comprobamos que la varianza de las puntuaciones de los
sujetos en el criterio es igual a la varianza de las puntuaciones pronosticadas ms la varianza de
los errores.
Error tpico de Estimacin S yx = S y 1 rxy2 = 3.61 1 0.5 2 = 3.61 0.75 = 3,13

S2y = (49,21 / 5) = 9,84 S2y = S2y + S2y. x 13 = 9,84 + 3,13

R. MEDRANO (TUTOR) Pgina 8


PSICOMETRA ORIENTACIONES PARTE II (PROPIEDADES MTRICAS)

4.- Intervalos confidenciales (Para un sujeto que ha obtenido en el test 4 puntos)

Estimacin puntual (con la ecuacin de regresin) Punt directas / diferenciales / Tpicas

Y= 6,5 + 2,03 (4) = 14,6 // y= 2,03 (4 2) = 4 // ZY = 0,5 [(4-2) / 0,89] = 1,12

Estimacin por intervalo Punt directas / diferenciales / Tpicas

Nivel de confianza 95% Zc = 1,96 Error tpico de estimacin Sy. x = 3,13

Error mximo: (Zc) (Sy. x) (1,96 3,13) = 6,13 (Punt directas y diferenciales)

Error mximo: (Zc) (SZY ZX ) (1,96 0,87) = 1,7 (Puntuaciones tpicas)

Donde SZY ZX = 1 rxy2 SZY ZX = 0.87

Y (Zc) (Sy. x) 14,6 6,13 = (8,5 y 20,7) Puntuaciones directas

y (Zc) (Sy. x) 4 6,13 = (-2,1 y 10,1) Puntuaciones diferenciales

ZY (Zc) (Sy. x) 1,12 1,7 = (-0,58 y 2, 82) Puntuaciones tpicas

5.- Coeficientes

2
COEFICIENTE DE DETERMINACIN C.D. = rXY CD 0,52 = 0,25
25% de la varianza de las puntuaciones de los sujetos en el criterio (VD) que se puede
pronosticar a partir del test (VI) 25% de varianza comn entre el test y el criterio.
SY X 2
COEFICIENTE DE ALIENACIN C. A. = K = = 1 rXY K = 3,13 / 3,61 = 0,87
SY
87% de inseguridad en los pronsticos 0.872 = (75%) de la varianza de las
puntuaciones en el criterio (VD) que no se puede pronosticar a partir del test (VI)
2
COEFICIENTE DE VALOR PREDICTIVO C.V .P. = 1 1 rXY 0,13
13% de seguridad en los pronsticos.

R. MEDRANO (TUTOR) Pgina 9


PSICOMETRA ORIENTACIONES PARTE II (PROPIEDADES MTRICAS)

2 PARTE: EVALUACIN DE LA PROPIEDADES MTRICAS DE LOS INSTRUMENTOS DE


MEDICIN PSICOLGICA

TEMA N 7 VALIDEZ DE LAS INFERENCIAS II

1.- VALIDACIN CON VARIOS PREDICTORES Y UN SOLO INDICADOR DEL CRITERIO

Cuando se desea conocer el influjo de varias variables


predictoras cuantitativas en otra tambin cuantitativa (criterio),
los procedimientos estadsticos que permiten obtener esa
informacin y solucionar esos problemas son la correlacin
mltiple y el modelo de regresin lineal mltiple (permite
obtener una ecuacin de regresin, combinando las variables
predictoras seleccionadas para que los errores de pronstico
que se cometen al estimar el criterio sean mnimos, y se
eliminen las variables que no aportan informacin relevante)
Siguiendo un criterio pedaggico, nicamente utilizaremos el
modelo con dos variables predictoras.

Para eliminar el efecto de las variables que no aportan informacin relevante se utilizan la
correlacin parcial y la correlacin semiparcial:

CORRELACIN PARCIAL CORRELACIN SEMIPARCIAL


rYX 1 rYX 2 rX 1 X 2
RYX 1X 2 =
rYX 1 rYX 2 rX 1 X 2 rY ( X 1X 2 ) =
(1 r 2YX 2 )(1 rX21 X 2 ) 1 r 2 X 1X 2

rYX 2 rYX 1rX 1 X 2 rYX 2 rYX 1rX 1 X 2


RYX 2X 1 = rY ( X 2X 1) =
(1 r 2YX 1 )(1 rX21 X 2 )
1 r 2 X 1X 2
En la 1 se calcula la correlacin entre la variable La 1 expresa la correlacin entre la variable
criterio (Y) y la variable predictora X1 eliminando la criterio (Y) y la predictora X1 cuando de sta se
influencia de la X2 elimina la influencia de la variable predictora X2
En la 2 se calcula la correlacin entre la variable La 2 expresa la correlacin entre la variable
criterio (Y) y la variable predictora X2 eliminando la criterio (Y) y la predictora X2 cuando de sta se
influencia de la X1 elimina la influencia de la variable predictora X1

1.1.- EL COEFICIENTE DE VALIDEZ MLTIPLE

El coeficiente de validez mltiple Correlacin Mltiple entre las puntuaciones obtenidas por
la muestra en la variable criterio y las obtenidas en el conjunto de las variables predictoras.

Correlacin mltiple:
Grado de asociacin entre la VD (criterio) y rYX2 1 + rYX2 2 2rYX 1 rYX 2 rX 1 X 2
RY . X 1 X 2 =
el conjunto de variables predictoras X 1 yX 2 1 rX21 X 2

Otra forma de expresarla (coeficientes de regresin mltiple en puntuaciones tpicas) :

Y = puntuaciones de los sujetos en el criterio


RY . X 1 X 2 = b1 rYX 1 + b2 rYX 2 X1 y X2 = puntuaciones en las 2 VV predictoras
b1 yb2 : coeficientes regresin puntuaciones tpicas

R. MEDRANO (TUTOR) Pgina 1


PSICOMETRA ORIENTACIONES PARTE II (PROPIEDADES MTRICAS)

1.2.- EL MODELO DE REGRESIN LINEAL MLTIPLE

El modelo de regresin lineal mltiple Se traduce en ecuaciones de un plano (no de una


recta como en la simple) o hiperplano si son ms de dos variables predictoras. Si tenemos dos
variables predictoras (X1 y X2) y un criterio Y, la ecuacin del modelo de regresin ser:

(a) = ordenada en el origen. Trmino independiente y


' equivale al valor que toma la variable tomada como
Y = a + b1 X 1 + b2 X 2 indicador del criterio cuando X1 = X2 = 0.
b1 = indica lo que aumenta el criterio al aumentar en una
Los valores que deben alcanzar a, unidad la variable X1 mientras permanece constante la
b1 y b2 deben ser aquellos que variable X2
hagan mnimos los errores de b2 = indica el aumento del criterio cuando la variable X 2
pronstico. aumenta en una unidad y la que permanece constante es
la variable X1.

Ecuaciones de regresin

Z Y' = b1 Z X 1 + b2 Z X 2
Donde y ' = b1 x1 + b2 x 2 Y ' = a + b1 X 1 + b2 X 2
rYX 1 rYX 2 rX 1 X 2
b1 =
1 rX21 X 2 Donde Donde

r r r SY SY
a = Y b1 X 1 b2 X 2
b2 = YX 2 YX2 1 X 1 X 2 b1 = b1 ; b2 = b2
1 rX 1 X 2 S X1 SX2
Los coeficientes b de regresin
rYX1 y rYX2 = correlaciones entre son iguales en puntuaciones
la variable criterio VD y cada a = 0 pasa por el origen de directas y diferenciales.
una de las var predictoras VI coordenadas.
rYX1X2 correlacin entre las dos
variables predictoras
a = 0 pasa por el origen de
coordenadas.
Puntuaciones tpicas Puntuaciones diferenciales Puntuaciones directas

Las ecuaciones de los planos de regresin en puntuaciones directas y diferenciales corresponden


a planos paralelos. Las ecuaciones de los planos de regresin en puntuaciones diferenciales y
tpicas pasan por el origen de coordenadas.

La varianza residual o varianza error y el error tpico de estimacin mltiple

El coeficiente de validez mltiple RY. X1X2 indica la eficacia de las variables predictoras para estimar
el criterio. Cuanto ms alto sea el coeficiente de validez, ms exacta es la estimacin. Pero el
coeficiente de validez no es perfecto y est afectada por el error de estimacin.

Error de estimacin: diferencia entre la puntuacin obtenida en el criterio y la pronosticada


mediante la ecuacin de regresin (Y Y). A la varianza de todos los errores de estimacin se
llama varianza residual, varianza de error o error cuadrtico medio. Representa la variabilidad
media de las puntuaciones de los sujetos en el criterio respecto a la puntuacin que se les
pronostica mediante la recta de regresin.

2 (Y Y ' ) 2
S YX 1 X 2 = Varianza residual o varianza de error
N
2
(Y Y ' ) 2 S ZyX 1 X 2 = 1 RYX
S YX 1 X 2 =
// S YX 1 X 2 = S Y 1 RYX2 1 X 2
1X 2

N
Error tpico de estimacin mltiple
Puntuaciones directas y diferenciales Puntuaciones tpicas

R. MEDRANO (TUTOR) Pgina 2


PSICOMETRA ORIENTACIONES PARTE II (PROPIEDADES MTRICAS)

Intervalos de confianza

La distribucin de los errores de estimacin se ajusta a una distribucin normal, cuya desviacin
tpica viene dada por el error tpico de estimacin mltiple. Se establece un intervalo
confidencial en torno a la puntuacin pronosticada. Pasos:
Determinar un nivel de confianza y buscar su puntuacin tpica (NC Zc asociada)
Calcular el error tpico (S2y. x1x2)
Calcular el error mximo Emax = Zc (Sy. x1x2)
Aplicar la ecuacin de regresin y obtener la puntuacin pronosticada
Establecer el intervalo de confianza Y Emax

1.3.- INTERPRETACIN DEL COEFICIENTE DE VALIDEZ MLTIPLE


S Y2 = S Y2' + S YX
2
1X 2
La varianza total de las puntuaciones obtenidas por los sujetos en el
criterio (VD) se puede expresar como la suma de la varianza de las puntuaciones pronosticadas (a
partir de las variables predictoras) y la varianza de los residuos (varianza de error)

El coeficiente de validez mltiple se interpreta a travs de tres coeficientes:

Coeficiente de determinacin mltiple Equivale al coeficiente de validez mltiple al cuadrado.


2 2 Es la proporcin de la varianza de las puntuaciones del
2 S Y' S YX 1 X 2 criterio que se puede pronosticar a partir de las
C.D. = RYX 1X 2 = = 1
2 2
S S variables predictoras (varianza comn o asociada
Y Y entre el criterio y las variables predictoras)
Representa la inseguridad o el azar que afecta a los
Coeficiente de alienacin mltiple pronsticos. Al cuadrado es el complementario del C.
S YX 1 X 2 Determinacin (representa las puntuaciones en el
2
C. A = K = = 1 RYX 1X 2
criterio que no se puede predecir a partir de las
SY variables predictoras)
K: oscila entre 0 y 1 (Cuando el coef de validez vale 0
K ser mximo; cuando vale 1 K ser mnimo)
Coeficiente de valor predictivo mltiple Complementario del Coeficiente de Alienacin
2 (proporcin o porcentaje de seguridad con que se
C.V .P = 1 1 RYX 1X 2 hacen los pronsticos)

R. MEDRANO (TUTOR) Pgina 3


PSICOMETRA ORIENTACIONES PARTE II (PROPIEDADES MTRICAS)

PROBLEMA EJEMPLO

Disponemos de las puntuaciones de 5 sujetos en tres variables: promedio de horas de ejercicio al


da (X1), promedio diario de kilocaloras consumidas (X2) y kilos perdidos (Y). Con los datos de la
tabla, planteamos los anlisis ms tpicos sobre el modelo de Regresin lineal mltiple ( = 0,05)

X1 X2 Y X21 X22 Y2 X1 X2 X1 Y X2 Y
1 4 4 1 16 16 4 4 16
1,5 3,75 6 2,25 14,0625 36 5,625 9 22,5
2 3 7 4 9 49 6 14 21
2,5 2 9 6,25 4 81 5 22,5 18
3 1,5 10 9 2,25 100 4,5 30 15
= 10 = 14,25 = 36 = 22,5 = 45,31 = 282 = 25,12 = 79,5 = 92,5
_ _ _
X1 = 2 X2 = 2,85 Y = 7,2 S2x1 = 05 S2x2 = 094 S2Y = 456

COEFICIENTES DE REGRESIN PARCIAL Y ECUACIN DE REGRESIN MLTIPLE


B1 = 1 (SY / S1) 1 = ry1 ry2 r12 / 1 r122

B1 = 1071 (213 / 07) = 323 1 = 0993 [(- 0976) (- 0985)] / 00298 = 1071

B2 = 2 (SY / S2) 2 = ry2 ry1 r12 / 1 r122

B2 = 0079 (213 / 097) = 017 2= (- 0976) (0993) (- 0985)] / 00298 = 0079

_ _ _
B0 = Y - B1 X1 - B2 X2 B0 = 72 3235 (2) 0174 (285) = 0234

Ecuacin de regresin mltiple Y = 0234 + (3235) X1 + (0174) X2

N XY X
Y
rxy =
1.- Intercorrelaciones entre las variables N 2 2
2
X ( X ) N 2
Y ( Y )


5 79,5 10 36 37,5
rYX1 = ---------------------------------------- = ------------------- = 0,993
[5 282 362] [5 22,5 102] 10,677 3,535

5 92,5 14,25 36 (- 50,5)


rYX2 = ------------------------------------------------ = -------------------- = (- 0,976)
[5 282 362] [5 45,31 14,252] 10,677 4,846

5 25,12 14,25 10 (- 16,9)


rX1X2 = ------------------------------------------------ = -------------------- = (- 0,985)
[5 22,5 102] [5 45,31 14,252] 3,535 4,856

2 2
rYX 1 + rYX 2 2 rYX 1 rYX 2 rX 1 X 2
2.- Correlacin mltiple RY . X 1 X 2 =
1 rX21 X 2
___________________________
RY. 12 = (0,986 + 0,952 - 191) / (0,0298) = 0,993

Coeficiente de determinacin mltiple R2Y. 12 = (0,9935)2 = 0,987 (Un 98,7% de la varianza


de Y se debe a la variacin conjunta de X1 y X2.

R. MEDRANO (TUTOR) Pgina 4


PSICOMETRA ORIENTACIONES PARTE II (PROPIEDADES MTRICAS)

rYX1 rYX 2 rX 1 X 2
3.-Correlaciones parciales RYX1 X 2 =
(1 rYX 2 )(1 rX21 X 2 )

0,993 - (- 0,976)(- 0,985) 0,032


rYX
R YX1.X2 = ------------------------------- = ------------------- =
0,132 rYX1 rX 1 X 2
r
1 (-0,976) (1 R
r YX 2r X 1
0,97) 0,243= 2

RYX1 X 2 =
YX1 YX 2 X1 X 2
(1 rYX1 )(1 rX21 X 2 )
Correlacin entre la variable criterio (Y) y2la (X 1), habiendo eliminado de esta correlacin el
(1 rYX 2 )(de
efecto de la variable (X2). Antes
1 eliminar
rX 1 Xesta
2
) variable la correlacin era = 0,947 (vemos
que el valor disminuye, luego X2 est influyendo positivamente)

rYX 2 rYX1 rX 1 X 2
RYX 2 X 1 =
(1 rYX1 )(1 rX21 X 2 )

(- 0,976) (0,993)(- 0,985) 0,0021


R YX2.X1 = ---------------------------------- = ------------------- = 0,145
(1 0,993) (1 0,97) 0,0145

Correlacin entre la variable criterio (Y) y la (X 2), habiendo eliminado de esta correlacin el
efecto de la variable (X1). Antes de eliminar esta variable la correlacin era = - 0,975 (vemos
que el valor disminuye, luego X1 est influyendo positivamente)

4.- Correlaciones semiparciales

(0,993) - (-0,976)(- 0,985) 0,032


r Y (X1.X2) = ------------------------------- = ------------ = 0,185
(1 0,97) 0,173

(-0,976) - (0,993)(-0,985) 0,0021


r Y (X2.X1) = ------------------------------- = ------------------- = 0,012
(1 0,97) 0,173

Cuando se elimina la influencia que una variable predictora tiene sobre la otra, la
correlacin obtenida vara de forma importante (la correlacin entre las variables
predictoras era muy alta (- 0,987). Hay que evitar esta circunstancia porque as disminuye
el % de varianza que explican del criterio.

5.- Ecuaciones de regresin mltiple

Puntuaciones tpicas ZY = 1 ZX1 + 2 ZX2 ZY = (1,071) ZX1 + (0,079) ZX2

Puntuaciones directas Y = A + B1 X1 + B2 X2 Y = 0234 + (3235) X1 + (0174) X2

Puntuaciones diferenciales y= B1 x1 + B2 x2 y = (3235) x1 + (0174) x2

Las ecuaciones de los planos de regresin en puntuaciones directas y diferenciales corresponden


a planos paralelos. Las ecuaciones de los planos de regresin en puntuaciones diferenciales y
tpicas pasan por el origen de coordenadas.

6.- Varianza de error o varianza residual y Error tpico de estimacin mltiple

R. MEDRANO (TUTOR) Pgina 5


PSICOMETRA ORIENTACIONES PARTE II (PROPIEDADES MTRICAS)

S2Y. X1X2 = S2Y (1 - R2Y. 12) 4,56 (1 0987) = 0,059


_______ _________
SY. X1X2 = SY 1 - R2Y. 12 2,135 1 0987 = 0,243

8.- Intervalo confidencial para los pronsticos. Pronosticar el peso que perder en dos meses
un hombre que hace un promedio de 1,75 horas de ejercicio diarias (X 1) y consume 2,2 Kcal / da
(X2). Ecuacin de regresin mltiple Y = 0234 + (3235) X1 + (0174) X2
Pronstico Y = 0,234 + (3,235) (1,75) + (0,174) (2,2) 6,278
(La prdida en peso pronosticada para esa persona ser de 6, 278 Kilos)

Determinar un nivel de confianza y buscar su puntuacin tpica ( = 0,05 Zc = 1,96)


Calcular el error tpico (Sy. x1x2) = 0,243
Calcular el error mximo Emax = 1,96 0,243 0,476
Establecer el intervalo de confianza Y Emax 6,278 0,476 = ( 5,802 y 6,754)
Se trata de los lmites entre los que se encontrar la puntuacin en el criterio del sujeto
seleccionado, con una probabilidad de acierto del 95%.

INTERPRETACIN DEL COEFICIENTE DE VALIDEZ MLTIPLE:

Coeficiente de determinacin mltiple R2Y. 12 = (0,9935)2 = 0,987 (Un 98,7% de la varianza de


Y se debe a la variacin conjunta de X1 y X2.

_____________
Coeficiente de alienacin mltiple 1 - R2Y. 12 0,114. Indica que todava hay,
aproximadamente, un 11,4% de inseguridad en los pronsticos. Elevado al cuadrado 0,114 2
(0,013) 1,3% representa el porcentaje de varianza del criterio que no se puede explicar a
partir de las variables predictoras.

_________
Coeficiente de valor predictivo mltiple 1 - 1 - R2Y. 12 1 0,114 = 0,886. Es el
complementario del coeficiente de alienacin y representa el porcentaje de seguridad en los
pronsticos.

1.4.- MTODOS PARA SELECCIONAR LAS VARIABLES PREDICTORAS MS ADECUADAS

Mtodo Forward (hacia delante)

Stepwise (paso a paso) es el ms utilizado.


Clculo de las intercorrelaciones entre las variables.
Seleccionar la variable predictora (VI) cuya correlacin con el criterio sea ms alta y se
construye la ecuacin de regresin.
Se aade a la ecuacin, una a una, las dems variables predictoras. Primero aquella cuya
correlacin semiparcial con el criterio sea ms alta (de mayor a menor), despus de haber
eliminado la influencia de la anterior, y as sucesivamente.
Cada vez que se incluye una variable predictora en la ecuacin se calcula el aumento en el
Coeficiente de determinacin mltiple y se analiza si ese aumento es significativo. Se detiene el
anlisis cuando el aumento no es significativo.

Mtodo Backward (haca atrs)

Es inverso al anterior y menos utilizado.


Clculo del coeficiente de determinacin mltiple entre la variable criterio y el conjunto de
predictoras.
Se eliminan una a una las variables menos relevantes, calculando en cada proceso de
eliminacin la reduccin en el coeficiente de determinacin.
El procedimiento se detiene cuando la reduccin sea significativa.

PROBLEMA EJEMPLO

R. MEDRANO (TUTOR) Pgina 6


PSICOMETRA ORIENTACIONES PARTE II (PROPIEDADES MTRICAS)

En una salida de ordenador encontramos los siguientes datos se trata de un problema que
aporta 8 variables independientes (X18) de tipo cuantitativo para explicar una conducta (Y)
tambin de tipo cuantitativo. Se recaba informacin de 70 sujetos.

AJUSTE DEL MODELO


2
R R R2 CORREGIDA ERROR TPICO
0,874 0,764 0,733 4,638

Tabla del ANOVA para el contraste de la Regresin


FUENTE DE SUMAS GRADOS DE MEDIAS ESTADSTICO DE
VARIACIN CUADRTICA LIBERTAD CUADRTICAS CONTRASTE
S
Debido a la SC REG p=8 MC REG
Regresin 4248,304 531,038 F = 24,69
Residual SC ERROR n-p-1 = 61 MC ERROR = 2
(Errores) 1311,996 21,508
SC TOTAL n-1 = 69 F se distribuye con 8 y 61 gl
TOTAL 5560,3 Significacin .000

Decisin
La F es significativa; por tanto, rechazamos la H0 (1 = 2 == 8) La regresin es significativa.

Coeficientes no Coeficient Correlaciones


estandarizados tipificado
s
Variables B Error Beta t Significac Orden Parcial Semiparcia
Tpico . cero l
1 3,143 .686 .468 4,58 .000 .564 .506 .285
2 10,983 5,678 .886 1,934 .058 .709 .240 .120

De las ocho VVII slo dos aportan coeficientes de la regresin significativos (hemos eliminado el
resto porque no son estadsticamente relevantes). Considerando el coeficiente de determinacin
(R2 = 0, 764) podemos afirmar que entre todas las variables independientes explican el 76,4% de la
VD. Teniendo en cuenta la significacin casi toda la varianza la explican dos variables (1 y 2); que,
a su vez, son las que presentan un coeficiente de correlacin parcial ms alto con la VD.

Mtodo de pasos sucesivos (Stepwise) Primero tomaramos la variable n 2 que es la que


ms correlaciona con la VD (0,709) y, por tanto, la que explica ms varianza. Una vez incorporada
la 2, incluye la 1, la que correlaciona ms con los residuos (parte no explicada por la 1 variable) y
comprueba si el cambio en R2 es o no significativo. El programa opera sucesivamente.

Estadsticos de cambio
Modelo R R2 R2 Cambi Cambio Gl 1 Gl 2 Significac.
Corregida o En F Cambio F
En R2
2 .709 .502 .495 .502 68,645 1 68 .000
1 .864 .747 .740 .245 64,908 1 67 .000

Ejemplo para la variable n 1 F = R2Cambio (N p - 1) / q (1 R2)

F = 0,245 (70-2-1) / 1 (1-0,747) F = 64,908 (q = n de variables que entran en el modelo)

Mtodo de eliminacin hacia atrs (Backward) Se introducen todas las variables predictoras
y se sacan una a una hasta quedarse con las que realmente estiman significativamente la VD. Se
procede de modo similar pero eliminando hacia atrs.

R. MEDRANO (TUTOR) Pgina 7


PSICOMETRA ORIENTACIONES PARTE II (PROPIEDADES MTRICAS)

2.- VALIDEZ Y UTILIDAD DE LAS DECISIONES

Se trata de procedimientos que analizan la validez de las decisiones a partir de las puntuaciones
en uno o varios tests en relacin a un criterio dicotmico. La puntuaciones se dicotomizan a
partir de un punto de corte (PC); es decir, se asignan en dos categoras (aptos no aptos;
admitidos rechazados, etc.). Este tipo de procedimientos se utilizan generalmente en los test
referidos a criterio (TRC)

En un estudio de validacin se aplica una prueba a todos los sujetos y se fija un punto de corte
(PC) Todos que lo superen se consideran Aptos y los que no l superen No aptos. Despus de
cierto tiempo se comprueba cul ha sido el rendimiento de ambas categoras.

Clasificacin de los sujetos en funcin del test y del criterio


NAA + NRR Aciertos (calificados del mismo modo en
CRITERIO el test y en el criterio admitidos o rechazados)
A R NRA Falsos negativos (rechazados que deberan
A NAA NAR NAT haber sido admitidos)
TEST NAR Falsos positivos (admitidos que deberan
R NRA NRR NRT haber sido rechazados)
NAC N de alumnos aptos en el criterio
NAC NRC N NRC N de alumnos no aptos en el criterio
NAT N de alumnos aptos en el test
NRT N de alumnos no aptos en el test

ndices de validez

COEFICIENTE KAPPA (COHEN) Fc = n de casos en los que hay coincidencia entre


Evala la consistencia o acuerdo entre el predictor y el criterio (Fc = NAA + NRR)
las decisiones adoptadas a partir de las Fa = n de casos en que el predictor y criterio
puntuaciones en el predictor (test) y el coinciden por azar (se multiplican las frecuencias
criterio (rendimiento) marginales y se dividen por el nmero total de
Fc Fa sujetos y una vez calculados se suma)
K = N = n de sujetos de la muestra // K cuando el
N Fa resultado se acerca a 1 mxima validez del test.

Para calcular las frecuencias esperadas Fa = ( de Fila de Columna)/ N


Proporcin clasificaciones correctas PCC = (NAA + NRR) / N
Sensibilidad: proporcin de sujetos seleccionados en S = NAA / NAC
el test respecto al total que tuvieron xito en el criterio.
Especificidad: proporcin de sujetos correctamente E = NRR / NRC
rechazados en el test respecto al total de no aptos en
el criterio (valor mximo 1)
Razn de eficacia: proporcin de aspirantes RE = NAA / NAT
seleccionados en el test con buen rendimiento en el
criterio.

ndices de seleccin

Razn de idoneidad (proporcin de sujetos que RI = NAC / N


rinden bien en el criterio)
Razn de seleccin (proporcin de sujetos aptos en RS = NAT / N

R. MEDRANO (TUTOR) Pgina 8


PSICOMETRA ORIENTACIONES PARTE II (PROPIEDADES MTRICAS)

el test)

PROBLEMA EJEMPLO

Se quiere conocer la validez de un test para predecir el rendimiento de los deportistas en un


partido a partir de los datos de la tabla siguiente:

CRITERIO (Resultado del partido)


Bueno Malo
Buen 8 (aciertos) 2 (falso positivo) 10
TEST Rendimiento
Mal 4 (falso negativo) 10 (aciertos) 14
Rendimiento
12 12 24

ndices de validez
NDICE KAPPA K = Fc Fa / N Fa ndice Kappa (validez media):
Fc = aciertos (8 + 10 = 18)
K = (18 12) / (24 -12) 0,5 Fa = (10 12) / 24 = 5 y Fa = (12 14) / 24 =7
(validez media) Fa = 5 + 7 = 12

Proporcin clasificaciones correctas:


PCC = (NAA + NRR) / N PCC = 18 / 24 = 0,75 Aciertos (8 y 10) / n de casos

Sensibilidad: proporcin de sujetos


S = NAA / NAC = 8 / 12 = 0,67 seleccionados en el test respecto al total que
tuvieron xito en el criterio.
Especificidad: proporcin de sujetos
E = NRR / NRC = 10 / 12 = 0,83 correctamente rechazados en el test respecto
al total de no aptos en el criterio.
Razn de eficacia: proporcin de aspirantes
RE = NAA / NAT = 8 / 10 = 0,8 seleccionados en el test con buen rendimiento
en el criterio.

ndices de seleccin

RI = NAC / N = 12 / 24 = 0,5 Razn de idoneidad: prop sujetos que rinden bien en criterio.

RS = NAT / N = 10 / 24 = 0,417 Razn de seleccin: proporcin de sujetos aptos en el test.

PARA SITUAR EL PUNTO DE CORTE

En teora debera situarse en el valor donde se cometan menos errores. Dado que la validez de
las decisiones depende de dnde se situ el PC, es necesario analizar las consecuencias ya
que no tiene la misma importancia cometer un error u otro (falsos negativos o positivos). En
trminos de decisin estadstica, el PC se debe situar teniendo en cuenta la matriz que refleja
las prdidas y ganancias derivadas de las decisiones:

R. MEDRANO (TUTOR) Pgina 9


PSICOMETRA ORIENTACIONES PARTE II (PROPIEDADES MTRICAS)

Criterios utilizados en la toma de


Falsos A CIERTOS decisiones (ambientes de incertidumbre):
Aceptado negativos Verdaderos + Criterio maximin (elegir alternativa que,
entre los resultados ms desfavorables,
Criterio RA AA
RR AR permita la mxima ganancia (mximo de
mnimo)
Rechazado
RECHAZADOS Falsos Criterio minimax: se estudian las
Verdaderos positivos alternativas que van a proporcionar las
negativos
mximas perdidas y se elige la que ocasione
una prdida menor (mnimo de los mximos)

MTODOS DE SELECCIN

Para realizar de modo adecuado la seleccin hay que combinar la informacin disponible
mediante los siguientes modelos:

Modelo Compensatorio (aditivo): a cada sujeto se le asigna una nica puntuacin global
(los sujetos pueden compensar las bajas puntuaciones). La forma adecuada de otorgar una
puntuacin global es mediante el modelo de regresin
Modelo conjuntivo: se fijan de antemano unos mnimos en cada una de las pruebas. Slo
se seleccionan los sujetos que hayan superado esos mnimos en todas las pruebas.
Modelo disyuntivo: slo se exige superar un determinado nivel de competencia en algn de
los predictores.
Modelo conjuntivo compensatorio: se aplica el modelo conjuntivo y se seleccionan los
sujetos que superan los mnimos en cada uno de los predictores. A continuacin se les aplica
el modelo compensatorio de forma que queden ordenados segn su puntuacin global. Para
efectuar la seleccin, se puede elegir a los mejores o establecer un PC.
Modelo disyuntivo compensatorio (despus de aplicar el modelo disyuntivo se aplica el
compensatorio)

PARA ESTIMAR LA EFICACIA DE UNA SELECCIN

Para estimar la eficacia de la seleccin podemos considerar dos formas:

Mediante la razn de eficacia (proporcin de personas seleccionadas que tienen xito en el


criterio)
Mediante el modelo de regresin (si se verifican los supuestos, permite determinar la
probabilidad de que los seleccionados tengan xito en el criterio)

Situaciones:
1) No hay nmero limitado de plazas y se seleccionan todos los sujetos que superan una
determinada puntuacin en el o los predictores.
2) Hay un nmero limitado de plazas y se seleccionan a los que hayan obtenido mejores
resultados en el o los predictores.

Se estima la puntuacin pronosticada en el criterio de los sujetos (mediante la ecuacin de


regresin). Se asume que las distribuciones de los errores de estimacin condicionados a una
determinada puntuacin en el test se ajustan a la distribucin normal, con media dada en la
puntuacin pronosticada en el criterio y una desviacin tpica dada por el error tpico de
estimacin. La puntuacin tpica correspondiente al punto crtico del criterio Zc (tablas de la curva
normal) y es la que marca la separacin entre la posibilidad de xito y la de fracaso.

PROBLEMA EJEMPLO
300 aspirantes a controlador areo realizaron un test de rapidez perceptiva, de los que fueron
admitidos los 15 mejores. Las puntuaciones en el test se distribuyen segn la curva normal con
media 5 y desviacin tpica 3. El coeficiente de validez del test es de 0,90 respecto a un criterio
con una varianza de 9 puntos y una media de 6. Para que un aspirante haya sido seleccionado

R. MEDRANO (TUTOR) Pgina 10


PSICOMETRA ORIENTACIONES PARTE II (PROPIEDADES MTRICAS)

qu puntuacin mnima se le debe pronosticar en el criterio?


2
Datos del problema rxy = 0.90; S x = 3; X = 5; Y = 6; S y = 9;
Para aplicar la formula tenemos que hallar X 15 de 300
supone un 5%. La probabilidad de que Z sea mayor que, X X X5
ser P (Z 0.05) = 1 - P (Z 0.95) = segn tabla- Zx = ;1.64 = ; X = 9,92
Sx 3
1.64

SY 3
Y ' = rxy ( X X ) + Y = 0.9 (9.92 5) + 6 = 10.43
SX 3

3.- FACTORES QUE INFLUYEN EN EL COEFICIENTE DE VALIDEZ

VARIABILIDAD DE LA MUESTRA: El coeficiente de validez tiende a aumentar a medida que la


variabilidad es mayor y disminuye a medida que la muestra es ms homognea. Para un mismo
predictor y una misma medida del criterio el coeficiente puede variar de muestra a muestra.
SUPUESTOS
La pendiente de la ecuacin de regresin que permite pronosticar S sy
el criterio a partir de la variable predictora es igual en aspirantes B = b R XY Y = rxy
(representados con las letras maysculas) y seleccionados SX sx
(representados con letras minsculas)
El error tpico de estimacin es igual en ambos grupos:
SYX = s yx S Y 1 R XY
2
= s y 1 rxy2
Si se quiere conocer el coeficiente de validez de la batera en el grupo de aspirantes, se despejan
las ecuaciones anteriores:
S X rxy
R XY =
S X2 rxy2 + s x2 s x2 rxy2
Si se quiere estimar cul es la variabilidad de la muestra de aspirantes en el criterio, despejamos las
ecuaciones anteriores:
2 S2X
S Y = sy 1 rXY + r 2 XY
S 2x

FIABILIDAD DE LAS PUNTUACIONES (TEST Y CRITERIO): Cuando calculamos el coeficiente de


validez hay que tener en cuenta que estas puntuaciones empricas estn afectadas por errores de
medida que influyen en el coeficiente de validez, produciendo una serie de sesgos que es necesario
eliminar o controlar. La frmula de atenuacin (Spearman) permite corregir la atenuacin,
disminucin o reduccin del coeficiente de validez debida a errores de medida.
CASOS PARTICULARES
Estimacin del coeficiente de validez suponiendo que el test y el rxy
criterio tuvieran una fiabilidad perfecta. Rvxvy =
R Vx Vy coeficiente de validez terico (puntuaciones en el test y en el rxx' ryy '
criterio libres de errores)
Estimacin del coeficiente de validez suponiendo que el test tuviera rxy
una fiabilidad perfecta. Rvxy =
rxy coeficiente de validez inicial rxx '
Estimacin del coeficiente de validez suponiendo que el criterio tuviera rxy rxy
una fiabilidad perfecta. R xvy = =
rxx y ryy coeficientes de fiabilidad iniciales (x = test e y = criterio) rvy ryy '
Estimacin del coeficiente de validez en el supuesto de mejorar la rxy
fiabilidad del test y del criterio. R xy =
rxx ' ryy '
RXX coeficiente de fiabilidad final del test (despus de ser mejorado)
RYY coeficiente de fiabilidad final del criterio (despus de mejorado) R xx ' R yy '

R. MEDRANO (TUTOR) Pgina 11


PSICOMETRA ORIENTACIONES PARTE II (PROPIEDADES MTRICAS)

Estimacin del coeficiente de validez en el supuesto de mejorar la rxy


fiabilidad del test. R xy =
rxx'
R xx '
Estimacin del coeficiente de validez en el supuesto de mejorar la rxy
fiabilidad criterio. R xy =
ryy '
R yy '
Valor mximo del coeficiente de validez: si fuera igual a la unidad sera rxy
el valor mximo que puede alcanzar el coeficiente de validez (el ndice RVxVy = 1
de fiabilidad) rxy rvx rxx ' ryy '

LONGITUD DEL TEST: La mejora del coeficiente de fiabilidad, al aumentar la longitud del test,
tambin repercute en la mejora del coeficiente de validez.
La relacin del coeficiente de validez con la fiabilidad y la longitud del
test viene dada por la expresin adjunta:
RXY coeficiente de validez final (estimado al modificar longitud del test) rxy n
R XY =
rxy coeficiente de validez inicial del test (antes de modificar la longitud) 1 + (n 1) rxx'
n = n de veces que se aumenta o disminuye la longitud del test
rxx coeficiente de fiabilidad inicial del test.
Cuando se quiere saber el n de veces que hay que aumentar o 2
R XY (1 rxx' )
disminuir la longitud del test para conseguir un determinado valor del n= 2 2
coeficiente de validez, se aplica la frmula rxy R XY rxx'
Para saber cuntos tems deben aadirse, segn la longitud EF
n= EF = n * EI
EI

PROBLEMAS EJEMPLO FACTORES QUE INFLUYEN (Coeficiente validez)


Las puntuaciones en un test predictor y un criterio de inters presentan un coeficiente de fiabilidad
de 0,75 y 0,60, respectivamente. Asimismo, sabemos que el coeficiente de determinacin es igual
a 0,25.
rXX = 0,75 (coeficiente de fiabilidad inicial o emprico del test)
rYY = 0,60 (coeficiente de fiabilidad inicial o emprico del criterio)
r2XY = 0,25 (permite obtener rXY = 0,5 coeficiente de validez inicial o emprico)

1.- Cul sera el valor del coeficiente de validez si tanto las puntuaciones del test como del
criterio estuviesen libres de errores de medida?:

rxy 0.5 Si se pudieran eliminar todos los errores de


RVxVy = = = 0,75 medida que afectan al test y al criterio, habra
rxx ' ryy ' 0.75 * 0.60 un aumento considerable del coeficiente de
validez (R VxVy de 0,5 a 0,75)

2.- Cul sera el valor del coeficiente de validez si slo el test tuviera una fiabilidad perfecta?

rxy Si se pudieran eliminar todos los errores de


Rvxy = R VxY (0,5 / 0,87) = 0,57 medida que afectan al test, habra un leve
rxx ' aumento del coeficiente de validez:
(R VxY de 0,5 a 0,57)

3.- Cul sera el valor del coeficiente de validez si slo el criterio tuviera una fiabilidad perfecta?

R. MEDRANO (TUTOR) Pgina 12


PSICOMETRA ORIENTACIONES PARTE II (PROPIEDADES MTRICAS)

rxy Si se pudieran eliminar todos los errores de


R xvy = R VxY (0,5 / 0,77) = 0,65 medida que afectan al criterio, habra un
ryy ' aumento importante del coeficiente de validez:
(R XVy de 0,5 a 0,65)

4.- Cul sera el valor del coeficiente de validez mejorando la fiabilidad del test (0,90), del criterio
(0,70) de ambos?:

rxy rxy rxy


R xy = R xy = R xy =
rxx ' ryy ' RXY = 0,59 rxx' RXY = 0,55 ryy ' RXY = 0,54
R xx ' R yy ' R xx' R yy '
RXY = 0,5 / (0,75/0,90)(0,60/0,70) RXY = 0,5 / (0,75/0,90) RXY = 0,5 / (0,60/0,70)
Como era esperable el mayor aumento del coeficiente de validez se produce cuando se
mejora la validez del test y del criterio. No obstante, el aumento es mucho menor que
cuando se eliminan los errores.

5.- Si un test tiene un coeficiente de fiabilidad de 0,64, cul sera el valor mximo del coeficiente
de validez que se podra alcanzar?

El valor mximo que puede alcanzar el coeficiente


rxy rvx ; rxv = rxy = 0.64 = 0.8 de validez es el ndice de fiabilidad.

PROBLEMAS EJEMPLO (VALIDEZ Y LONGITUD)


El coeficiente de fiabilidad de un test X es = 0,53, aplicado a un grupo con varianza 25. Si se
aaden 5 tems paralelos a los que tiene el test, el coeficiente de fiabilidad pasara a ser = 0,63; el
porcentaje de varianza comn entre el test original y un criterio externo es del 25%. El coeficiente
de validez, si se eliminasen por completo los errores de medida del test original, sera:
2 2
S y2'
Datos del problema rxx ' = 0.53; S = 25 : S x = 5; R XX ' = 0.63; r =
x xy = 0.25; rxy = 0.5
Sy
rxy 0.5
Rvxy = = = 0.68 R VxY Coeficiente de validez en el supuesto de que el
rxx ' 0.53 test tuviera una fiabilidad perfecta

El coeficiente de validez del test despus de aadirle los 5 elementos paralelos

rxy n 0.50 1.51


R XY = = = 0.54 RXY Coeficiente de validez estimado al
1 + (n 1)rxx ' 1 + (1.51 1)0.50 modificar la longitud del test.

R XX ' (1 rxx ' ) Al aadir 5 elementos aumenta la


0.63(1 0.53)
n= = = 1,51 longitud del test n = 1,51
rxx ' (1 R XX ? ) 0.53 (1 0.63)

PROBLEMAS EJEMPLO (VALIDEZ Y LONGITUD)


Un test compuesto por 30 tems presenta una fiabilidad de 0,60 y una validez de 0,70, cuntos
tems paralelos tendramos que aadir si deseamos alcanzar un coeficiente de validez de 0,80?

Datos del problema R XY = 0.80; rxy: = 0.70; rxx ' = 0.60; EI = 30

R. MEDRANO (TUTOR) Pgina 13


PSICOMETRA ORIENTACIONES PARTE II (PROPIEDADES MTRICAS)

2
R XY (1 rxx ' ) 0.80 2 (1 0.60)
n= = = 2.4150 Se debe aumentar la longitud del
rxy2 R XY
2
rxx ' 0.70 2 0.80 2 * 0.60 test 2,415 veces.
EF El aumento supone un nmero de
n= EF = n * EI = 2.4150 * 30 = 72.4 tems
EI EF EI = 74,45 30 =42,45 42

R. MEDRANO (TUTOR) Pgina 14


PSICOMETRA ORIENTACIONES PARTE II (PROPIEDADES MTRICAS)

2 PARTE: EVALUACIN DE LA PROPIEDADES MTRICAS DE LOS INSTRUMENTOS DE


MEDICIN PSICOLGICA

TEMA N 8 ANLISIS DE LOS TEMS

INTRODUCCIN

El anlisis de los tems pretende obtener evidencias sobre su calidad con objeto de identificar
los que se han de descartar, reformular los que puedan ser mejorados y conservar los que
presenten buenas propiedades psicomtricas (conociendo la calidad de cada uno de los tems,
podramos deducir la calidad psicomtrica del test)

En general, el anlisis de los tems de un test se


puede llevar a cabo mediante dos procedimientos
complementarios: anlisis cuantitativos (se
obtienen determinados estadsticos basados en la
distribucin de las respuestas de los sujetos a las
distintas alternativas) y juicio de expertos (se
cuestiona la calidad mtrica del tem en funcin de
criterios conocidos). Un buen anlisis de tems debe
incluir ambos procedimientos (cuantitativo y
cualitativo)

Una vez analizada la calidad psicomtrica de los tems de un test se procede a estudiar la calidad
global del test mediante la fiabilidad y la validez.

Los tems pueden adoptar distintos formatos y evaluar variables cognitivas (aptitudes,
rendimiento, etc.) en las que hay respuestas correctas e incorrectas y no cognitivas (actitudes,
intereses, valores, etc.) en las que no hay respuestas correctas e incorrectas. Los procedimientos
cuantitativos que se utilizan aluden a tems aptitudinales o de rendimiento (existe una alternativa
correcta y una o varias incorrectas)

Aspectos a evaluar

El anlisis de la alternativa correcta permite obtener: el ndice de dificultad (proporcin de


sujetos que responde al tem correctamente), el ndice de discriminacin (capacidad del tem
para diferenciar a los sujetos con distinto nivel en el rasgo medido), la fiabilidad (cuantifica el
grado en el que el tem est midiendo con precisin el atributo de inters) y la validez del tem
(determina el poder predictivo de cada uno de los tems respecto a un criterio externo de
inters). Los ndices de dificultad y discriminacin estn relacionados con la media y la varianza
de las puntuaciones totales del test; la fiabilidad y la validez, con la desviacin tpica.
El anlisis de las respuestas incorrectas (distractores) aporta evidencias sobre la utilidad de
cada alternativa y su contribucin a la calidad mtrica del tem.
El funcionamiento diferencial de los tems (FDI): sujetos de distintos grupos de pertenencia,
con un mismo nivel en el rasgo medido, tienen distintas probabilidades de xito en el tem.

1.- DIFICULTAD DE LOS TEMS

Para cuantificar la dificultad de los tems dicotmicos o dicotomizados se utiliza la proporcin de


sujetos que han respondido correctamente al tem (depende de la muestra utilizada):

ID = A / N A = nmero de sujetos que aciertan el tem.


(Oscila entre 0 y 1) N = nmero de personas que intentan responder el tem.

Cero indica que ningn sujeto lo ha acertado (difcil) / Uno que todos lo ha acertado (fcil)

R. MEDRANO (TUTOR) Pgina 1


PSICOMETRA ORIENTACIONES PARTE II (PROPIEDADES MTRICAS)

El ndice de dificultad est directamente relacionado con la media y la varianza del test:

ID = X / N Siendo X (0 1 aciertos / errores) el ndice de dificultad es igual a


_ la media de aciertos o errores.
X = ID La media de las puntuaciones en el test = suma de los ndices de
dificultad de los tems.
Varianza de los tems dicotmicos (p = proporcin de sujetos que
S2 = p q responden correctamente al tem (p = ID) y (q = 1 p)
Un tem alcanza su mxima varianza cuando p = 0,5

Correccin de los aciertos por azar En tems de eleccin mltiple, se debe hacer una
correccin en el clculo de la dificultad del tem que controle las respuestas al azar. A mayor
nmero de distractores (alternativas incorrectas) menos probables son los aciertos por azar.

IDC = ndice de dificultad corregido


A E / (K 1) q A = Aciertos // E = Errores
IDC = ----- -- ---------------- = p - --------- p y q = proporcin de aciertos / errores
N N K-1 k = nmero de alternativas del tem
N = n personas que intentan responder el tem

En general los tems no deben tener dificultades por debajo de 0,20 no por encima de 0,80 (la
mayora deben presentar niveles medios entre 0,30 y 070)

PROBLEMA EJEMPLO
En la tabla aparecen las respuestas de 200 sujetos a 3 alternativas (A, B, C), donde la opcin B es
la correcta. Por filas aparece la frecuencia de sujetos que han seleccionado cada alternativa y que
han obtenido puntuaciones superiores e inferiores al 50% de su muestra.

A B* C
50% Superior 19 73 47 139
50% Inferior 35 10 16 61
54 83 63 200

ndice de dificultad del tem corrigiendo el azar es:

IDC = p (q / K-1) (83/200) - (0,585/2) = 0,1225

Tambin IDC = A - [E / (K 1)] / N IDC = 83 - (117 / 2) / 200 = 0,1225

2.- PODER DISCRIMINATIVO DE LOS TEMS

Lgica del concepto dado un tem, los sujetos con buenas puntuaciones en el test han de
acertarlo en mayor proporcin que los que tienen bajas puntuaciones.
Discriminar diferenciar entre los sujetos en funcin de su nivel de competencia. En general, el
clculo del poder discriminativo de un tem implica contrastar la proporcin de aciertos entre dos
grupos extremos de aptitud, uno bajo y otro alto (si el tem discrimina adecuadamente, la
proporcin de aciertos sera mayor en el grupo de alta aptitud que en el de baja aptitud)

Formas de estudiar el poder discriminativo de los tems


tems de actitudes:
ndice de discriminacin basado en los ndice de Homogeneidad (IH); basado en la
grupos extremos correlacin
ndices de discriminacin basados en la ndice de discriminacin basado en la
correlacin correlacin corregida
ndice de discriminacin basado en los
grupos extremos.

R. MEDRANO (TUTOR) Pgina 2


PSICOMETRA ORIENTACIONES PARTE II (PROPIEDADES MTRICAS)

ndice de discriminacin basado en los grupos extremos:

pS = proporcin aciertos grupo superior


D = pS pi pi = proporcin aciertos grupo inferior

Interpretacin (nivel discriminacin del tem) Observaciones


Valores Interpretacin Kelly aconseja tomar el 27% el 25%
D 0,40 Discrimina muy bien superior e inferior para formar los grupos.
0,30 D 0,39 Discrimina bien El ndice oscila entre ( 1) y 1 (todos los
0,20 D 0,29 Discrimina poco sujetos del grupo superior aciertan el tem)
0,10 D 0,19 Necesita revisin 0 indica que es acertado indistintamente
D 0,10 Carece de utilidad por ambos grupos

Problema ejemplo: Las respuestas de los sujetos de una muestra a un elemento de un test, se
distribuyeron segn la tabla adjunta. La respuesta correcta es la C y tanto las puntuaciones en el
test como en el tem se distribuyen normalmente. Averiguar el ndice de discriminacin del tem.

Alternativas del tem 120 - 30


A B C* D D = --------------------- = 0,64
27% 10 0 120 10 140
Superior Discrimina muy bien
27% Inferior 10 0 30 100

ndices de discriminacin basados en la correlacin (la discriminacin tambin se puede


definir como la correlacin entre las puntuaciones de los sujetos en el tem y sus puntuaciones en
el test). La puntuacin total de los sujetos en el test se calcula descontando la puntuacin del tem
y el ndice de correlacin debe ser coherente con el tipo de puntuaciones del tem y del test.

Correlacin Correlacin biserial-puntual Correlacin biserial


_ _ _ _
pXY pX pY X A XT _____ XA X T
= ----------------------- rbp = ------------------- p/q rb = ------------------- (p/y)
pX qX pY qY SX SX
El test (criterio) continua Test e tem continuas
El test (criterio) y el tem y el tem dicotmica Una se dicotomiza (tem)
Variables dicotmicas
___
Relacin entre rbp y rb rbp = rb (Y / pq

pXY = proporcin de sujetos que han acertado el tem y son aptos en el criterio
pX y pY = proporcin de sujetos que han superado el tem o son aptos en el criterio
qX y qY = proporcin de sujetos que no han superado el tem o no son aptos en el criterio
_ _
XA y XT = media del test de los sujetos que aciertan el tem / media del test
SX = desviacin tpica del test
p y q = proporcin de sujetos que aciertan / fallan el tem
y = altura curva normal, corresponde a una Z (P. Tpica) que deja por debajo una prob.

Problemas ejemplo Se ha construido un test que se corrige clasificando a los sujetos en dos
categoras: aptos y no aptos. Todos los elementos del test son dicotmicos. Se aplica el test a un
grupo normativo y obtenemos la siguiente tabla:

tem 6 (X)
Acierta (1) Falla (0)
Aptos (1) 120 30 150
120/330 = 0,36 150/330 = 0,45
No Aptos 20 160 180
Test (Y) 180/330 = 0,55
Criterio (0)
140 190 330
140/330 = 0,42 190/330 = 0,58

= (0,36 0,420,45) /(0,420,580,450,55) = 0,171 / 0,245 = 0,69

R. MEDRANO (TUTOR) Pgina 3


PSICOMETRA ORIENTACIONES PARTE II (PROPIEDADES MTRICAS)

Problemas ejemplo A partir de los datos de la tabla calcular el poder discriminativo del tem n
2, utilizando la correlacin biserial y la biserial puntual.

tems Total (Test)


Sujetos 1 (a) 2 (b*) 3 (c) X (X i2)
A 1 1 1 3 2
B 1 0 1 2 2
C 0 1 1 2 1
D 0 0 0 0 0
E 1 1 1 3 2

Sujetos que aciertan el tem n 2 = A, C, E ________


Media en el test = (2+1+2 = 5) / 3 = 1,67 rbp = [(1,67 1,4) / 0,8] (0,6/0,4)
Media total test = (2+2+1+0+2 = 7) / 5 = 1,40
Desviacin tpica del test rbp = 0,337 1,22 = 0,41
______________ __________
X2/n Media2 SX = (2,6 1,96 0,8
rb = [(1,67 1,4) / 0,8] (0,6/0,3863)
Proporcin sujetos que han acertado / fallado el tem:
p (3/5) = 0,6 y q (2/5) = 0,4 rb = 0,337 1,55 = 0,52
y = valores recogidos en la tabla n 7 del formulario,
con p = 0,60.
___
Relacin entre correlacin biserial puntual y biserial rbp = rb (Y / pq
(la biserial siempre es la mayor) _____
tem con buen ndice de discriminacin. 0,52 (0,3863 / 0,24) = 0,41

tems de Actitudes: Como se ha visto, para los tems de las actitudes no existen respuestas
correctas o incorrectas (el sujeto se sita en un continuo en funcin del grado del atributo medido).
El procedimiento para estimar la discriminacin de los tems de actitudes es calcular la correlacin
entre las puntuaciones del tem y las del test (como los tems no son dicotmicos correlacin
de Pearson)

ndices de discriminacin en los test de actitudes


ndice de Homogeneidad (IH)
N JY X J J = Suma puntuaciones de los sujetos en el
R JX =
elemento J.
[ N X ( ) ][
2 2
X N J ( )2
]J
2
X = Suma puntuaciones de los sujetos en el
elemento J.
RJX = correlaciones entre las puntuaciones de
RJX = Cov (jx) / SJ SX los sujetos en el elemento J y en la escala
total.
Correlacin corregida R J (X-J) = correlacin entre las puntuaciones
R JX S X S J de los sujetos en el elemento J y en la escala
RJ ( X J ) = total (descontando la puntuacin del tem)
S 2 X + S 2 J 2 R JX S X S J N = nmero total de los sujetos de la muestra
SX y SJ = desviaciones tpicas de las
puntuaciones en el test y en el tem.
ndice de discriminacin (grupos extremos) _ _
X SJ X IJ XSJ y XIJ S2IJ y S2SJ = Medias y Desviaciones
T= de las puntuaciones obtenidas en el tem por
(n S 1) S 2 SJ + (ni 1) S 2 IJ el 25% de los que obtuvieron en el test las
[ ]
1 / n S + 1 / ni puntuaciones ms altas y ms bajas.
n S + ni 2 nS y ni = sujetos grupo superior e inferior

R. MEDRANO (TUTOR) Pgina 4


PSICOMETRA ORIENTACIONES PARTE II (PROPIEDADES MTRICAS)

Problema ejemplo La siguiente matriz de datos representa las respuestas dadas por ocho
sujetos a un test de eleccin mltiple de seis elementos, cada uno de ellos con cuatro alternativas
de respuesta. Por simplicidad, en la matriz se ha indicado nicamente si el sujeto ha elegido la
opcin correcta (con un 1) o una opcin incorrecta (con un 0). Calcular El ndice de
homogeneidad del elemento n 4 y determinar el nmero de discriminaciones que puede hacer el
tem n 5:
tems Total (Test)
Sujetos X1 X2 X3 X4 X5 X6 X X X4 X2 X24
1 1 1 0 0 1 0 3 0 9 0
2 1 1 1 1 1 0 5 5 25 1
3 1 1 1 0 0 0 3 0 9 0
4 1 0 0 1 0 0 2 2 4 1
5 1 1 0 0 0 0 2 0 4 0
6 1 1 1 1 0 0 4 4 16 1
7 1 0 0 0 0 0 1 0 1 0
8 1 1 0 0 1 0 3 0 9 0
3 23 11 77 3

ndice de homogeneidad (IH)

Clculos previos
(8 11) (23 3) S2X = (77 / 8) (23 / 8)2 = 9,625 - 8,26 1,36
RXJ = ------------------------------------
(8 77 232) (8 3 -32) S2J = (3 / 8) (3 / 8)2 = 0,375 - 0,141 = 0,23
19
RXJ = -------------- = 0,53 SJ = 0,48 y SX = 1,17
(87 15)

Correlacin corregida R J (X-J) = correlacin entre las


(0,53 1,17) 0,48 0,14 puntuaciones de los sujetos en el
IH = ----------------------------------------------- = ---------- = 0,14 elemento J y en la escala total
(1,36 + 0,23 20,531,170,48) 1 (descontando la puntuacin del tem)

Problema ejemplo En la tabla se representan las puntuaciones dadas al tem n 9 por el 25%
de los sujetos con puntuaciones ms altas, y el 25% con puntuaciones ms bajas en un test de
actitudes formado por tem de tipo Likert con 10 categoras de respuesta. Sabiendo que la
varianza de ambos grupos (superior e inferior) es igual a 1,56, podemos decir que el elemento n
9 discrimina de manera estadsticamente significativa? (NC = 95% / Contraste bilateral)

Sujeto Punt. 8,67 3,67


20 10 T = ------------------------------------------- = 4,9
25% 2 9 (21,56)+(21,56) / 4 [1/3+1/3]
Superior 13 7
3 4 Medias (10+9+7)/3 = 8,67 y (4+5+2)/3 = 3,67
25% Inferior 5 5
8 2 SS = Si = 1,56

Decisin (NC 95%; bilateral) t con n1 + n2 2 (3+3-2 = 4) grados de libertad t0,975 = 2,78
Como T = 4,9 > TC = 2,78 Rechazamos H0 (las medias son distintas y, por tanto, el tem n 9
tiene poder discriminativo)

Factores que afectan a la discriminacin (relacionados con la discriminacin):

Variabilidad de los tems (si no hay variabilidad en las respuestas el tem no discrimina)
Dificultad del tem (con dificultad media, p = 0,5, el tem alcanza mximo poder discriminativo)
Dimensionalidad del test (el test debe medir un nico concepto; unidimensional)
Fiabilidad del test (tems con poco poder discriminativo se asocian a tests poco fiables)

R. MEDRANO (TUTOR) Pgina 5


PSICOMETRA ORIENTACIONES PARTE II (PROPIEDADES MTRICAS)

Relacin entre variabilidad del test y discriminacin de los tems:

SX = SJ rJX SX y SJ = desviaciones tpicas del test y de las puntuaciones en el tem J.


_________ rJX = ndice de discriminacin del tem J.
SX = p q r2JX p y q = proporcin de sujetos que aciertan / fallan el tem J.
(tems dicotmicos)

Relacin entre fiabilidad del test y discriminacin de los tems (Alpha de Cronbach):

n S 2J n S 2
J
= coeficiente de fiabilidad del test
= 1 = 1
Se sustituye SX por SJ rJX
n 1 S 2 X n 1 [ S r ] 2

J JX

3.- NDICES DE FIABILIDAD Y VALIDEZ DE LOS TEMS

ndice de Fiabilidad de los tems (criterio interno) se utiliza para cuantificar el grado que el
tem en cuestin est midiendo con precisin el atributo de inters.
ndice de Validez de los tems (criterio externo) Implica correlacionar las puntuaciones
obtenidas por una muestra de sujetos en el tem con las puntuaciones obtenidas por los
mismos sujetos en algn criterio externo de inters.

FIABILIDAD VALIDEZ ACLARACIONES


SJ = desviacin tpica de las puntuaciones en el tem J.
IF = SJ IDJ IV = SJ rJY IDJ = ndice de discriminacin del tem J
rJX = ndice de discriminacin del tem J.
IF = SJ rJX IV = SJ rbpJY rJY = correlacin entre puntuaciones en el tem J y en el criterio.
rbpJY = correl biserial puntual (criterio = continua; tem = dicotmica)
Relacin entre los parmetros del tem y la fiabilidad y validez del test
S J rJY IVJ IFJ e IVJ = ndices de fiabilidad y validez del tem J.
rXY =
=
La validez del test (rXY) se puede estimar a partir de la discriminacin
S J rJX IFJ de cada uno de los tems (rJX), de su validez (rJY) y de su nivel de
dificultad (SJ = pJ qJ)

Equivalencia de inters [ SJ rJX]2 = S2X El sumatorio al cuadrado de los ndices de fiabilidad


(IF) de los tems, coincide con la varianza de las puntuaciones de los sujetos en el test (ver Alfa de
Cronbach). A mayores ndices de fiabilidad en los tems, mejor fiabilidad en el test.

Problema ejemplo En la tabla se presentan las puntuaciones de 5 sujetos en un test de tres


tems y los correspondientes ndices de validez:

tems TOTAL TEST MENOS TEM


Sujeto A (1) B C (3) X X-i1 X-i2 X-i3
s (2)
A 0 0 1 1 1 1 0
B 1 1 1 3 2 2 2
C 1 0 0 1 0 1 1
D 1 1 1 3 2 2 2
E 1 1 1 3 2 2 2
Prob = 0,8 0,6 0,8

Para calcular la varianza de cada elemento (los tems son dicotmicos: 1 acierto y 0 fallo)
tem A (p = 4 aciertos / 5 respuestas = 0,8; por tanto, 1 fallo / 5 respuestas = 0,2)
tem B (p = 3 aciertos / 5 respuestas = 0,6; por tanto, 2 fallo / 5 respuestas = 0,4)
tem C (p = 4 aciertos / 5 respuestas = 0,8; por tanto, 1 fallo / 5 respuestas = 0,2)
Desviacin Tpica de cada tem SJ = pq S2A = (4/5)(1/5) = 0,16 SA = 0,40
S2B = (3/5)(2/5) = 0,24 SB = 0,49 // S2C = (4/5)(1/5) = 0,16 SC = 0,40
ndices de Validez (rJY) A = (0,20) // B = (0,40) // C = (0,60)

R. MEDRANO (TUTOR) Pgina 6


PSICOMETRA ORIENTACIONES PARTE II (PROPIEDADES MTRICAS)

Pasamos a calcular las correlaciones entre cada tem (1, 2 y 3) y la puntuacin total en el
test (eliminando la correspondiente al tem implicado):

Media XP = Media en el test de los sujetos que aciertan el tem

tem 1 (2+0+2+2) / 4 = 1,5


tem 2 (2+2+2) / 3 = 2
tem 3 (0+2+2+2) / 4 = 1,5

_
X = Media total del test (eliminando tem n 1) (1+2+0+2+2 / 5 = 1,4)
_
X = Media total del test (eliminando tem n 2) (1+2+1+2+2 / 5 = 1,6)
_
X = Media total del test (eliminando tem n 3) (0+2+1+2+2 / 5 = 1,4)

Desviacin tpica de las puntuaciones del test

Para tems 1 y 3 S2X = (02+22+12+22+22) / 5 (1,4)2 = 0,64 SX = 0,8


Para tems 2 S2X = (12+22+12+22+22) / 5 (1,6)2 = 0,24 SX = 0,49

ndices de discriminacin rbpJY


________
Para el tem 1 rbp = [(1,5 1,4) / 0,8] (0,8/0,2) = 0,125 2 = 0,25
_______
Para el tem 2 rbp = [(2 1,6) / 0,49] (0,6/0,4) = 0,816 1,22 = 0,99
_______
Para el tem 3 [(1,5 1,4) / 0,8] (0,8/0,2) = 0,125 2 = 0,25

A partir de los ndices de validez y fiabilidad de los tems calculamos el coeficiente de validez del
test:

S J rJY [ (0,40 x0,20) + (0,49 x0,40) + (0,40 x0,60)]


rXY = rXY = = 0,76
S J rJX [ (0,40 x0,25) + (0,49 x0,99) + (0,40 x0,25)]

4.- ANLISIS DE DISTRACTORES.-

Una vez realizado el anlisis de las alternativas correctas, para mejorar la calidad de los tems
resulta igual de relevante analizar los distractores o respuestas incorrectas. Bsicamente, este
anlisis pretende:

Controlar que todas las acciones incorrectas sean equiprobables (igual de atractivas para los
que no conocen la respuesta correcta) y elegidas por un mnimo de sujetos (10%)
Que el rendimiento en el test de los sujetos que seleccionan las respuestas incorrectas sea
menor al de los sujetos que han seleccionado las correctas (se espera que a ms aptitud
disminuya el nmero de sujetos que seleccionan las alternativas incorrectas y viceversa).

Equiprobabilidad de los distractores Los distractores son equiprobables si son seleccionados


por un nmero mnimo de sujetos y son igualmente atractivos para los que no conocen la

R. MEDRANO (TUTOR) Pgina 7


PSICOMETRA ORIENTACIONES PARTE II (PROPIEDADES MTRICAS)

respuesta correcta. Se comprueba mediante la prueba Chi-Cuadrado de Independencia:

( FT FO) 2 FT = frecuencias terica


2
= FT
FO = frecuencias observadas
X2 = se distribuye con K-1 gl (K = n alternativas incorrectas)

Problema ejemplo Se sospecha que las alternativas incorrectas de un tem del ltimo examen
de Psicometra no son equiprobables. En la siguiente tabla se muestra la frecuencia de sujetos
que seleccionaron cada una de las tres alternativas del tem, donde la B es la correcta. Averiguar
si las alternativas incorrectas son estadsticamente equiprobables a un nivel de confianza del 95%.

FT = n de respuestas incorrectas (36+52 = 88) 88/2 = 44


X2 = (44-36)2 + (44-52)2 / 44 2,91
A B* C
36 389 52 Valor terico X2 (Tabla con k 1 = 1 gl y = 0,05) 3,84
Como 2,91 < 3,84 Aceptamos H0 (las alternativas incorrectas
son igualmente atractivas para todos los sujetos)

Poder discriminativo de los distractores (basado en la correlacin biserial puntual) Si,


normalmente, esperamos que la correlacin entre el test y la opcin correcta sea alta y positiva; en
el caso de los distractores, lo esperable es que su correlacin sea negativa (cuando aumenta la
aptitud de los sujetos, disminuye la proporcin de sujetos que elige la opcin incorrecta). Para
cuantificar el poder discriminativo de los distractores recurrimos a la correlacin que ser biserial,
biserial puntual o de Pearson en funcin de las variables:

XA = media en el test de los sujetos que han seleccionado la


X A XT alternativa incorrecta a estudiar. XT = media del test.
rbp = p/q
SX SX = desviacin tpica del test
p y q = proporcin de sujetos que aciertan y fallan.

Problema ejemplo En la siguiente tabla se muestran las respuestas de cinco sujetos a un tem
de tres alternativas, donde la opcin correcta es la C, as como la opcin incorrecta seleccionada y
la puntuacin total obtenida en el test. Calcular la discriminacin del distractor A utilizando la
correlacin biserial puntual y comentar el resultado.

Sujet tem X X X- i _ _
o XA = (3+4) / 2 = 3,5 y XT = (1+3+4+0+3) / 5 = 2,2
1 1 2 1 S2X-i = (12+32+42+02+32 / 5) -2,22 = 2,16 SX = 2,16 = 1,47
2 0 3 3 p y q (2/5 = 0,4 y 0,6)
(A)
3 0 4 4 _______
(A) rbp = [(3,5 2,2) / 1,47] (0,4/0,6) = 0,73
4 1 1 0
5 0 3 3
(B)

El resultado (rbp = 0,73), indica que el distractor est confundiendo a los sujetos que obtienen
mejores puntuaciones en el test; por tanto, no discrimina en sentido contrario a la alternativa
correcta, tal como cabra esperar de un buen distractor.

5.- FUNCIONAMIENTO DIFERENCIAL DE LOS TEMS (FDI)

Funcionamiento diferencial de los tems (FDI) de forma sistemtica sujetos de distintos


grupos de pertenencia, pero con el mismo nivel en el rasgo medido, tienen distintas probabilidades
de xito en el tem de estudio.

Conceptos bsicos:

R. MEDRANO (TUTOR) Pgina 8


PSICOMETRA ORIENTACIONES PARTE II (PROPIEDADES MTRICAS)

Sesgo (sujetos igualmente hbiles no tienen la misma probabilidad de acertar el tem por el
hecho de pertenecer a subpoblaciones distintas). El sesgo est relacionado con la validez de
constructo e indica que est actuando alguna variable extraa.

FDI (detecta que un tem est funcionando de manera distinta en dos grupos con el mismo nivel
de aptitud). Detectada la circunstancia, no apunta posibles causas.
Impacto (diferencias reales entre grupos que se deben a diferencias en el nivel de competencia
de las subpoblaciones).Mientras que en el FDI las diferencias se deben a motivos distintos al
nivel de competencia, en el impacto hay un grupo de sujetos ms competente.

Para detectar FDI se utiliza el mtodo de Mantel-Haenszel


Primero, identificar una variable que sea la posible causante del FDI.
Estructurar dos grupos, uno de referencia (GR) que suele ser el grupo favorecido y otro focal
(GF) que suele ser el perjudicado.
Se establecen distintos niveles de aptitud (a partir de la puntuacin obtenida en el test)
Se cuentan las respuestas correctas e incorrectas para cada grupo y nivel de habilidad.

Correcta Incorrecta Ai Di
Grupo de Referencia
s
Ai
s
Bi NRi
Ni
A, B, C y D
Frecuencias
(GR) MH = absolutas de
Bi Ci
Grupo Focal
(GF)
Ci Di NFi Ni
cada categora
de habilidad i
N1i N0i Ni

El procedimiento se traduce en los siguientes criterios:

Un tem no presenta FDI si el cociente entre los que


H0: (Ai / Bi) = (Ci / Di) aciertan el tem y lo fallan es el mismo para los dos grupos
Para todas las categoras de cada uno de los niveles de aptitud.

Los valores de MH oscilan entre 0 e


[Valores >1 indican que el tem favorece al grupo de referencia (GR) y menores al grupo
focal (GF)]
[Valores iguales o prximos a 1 indican que el tem no presenta FDI.

Problema ejemplo Se quiere investigar si un test de razonamiento matemtico presenta sesgo


en uno de sus tems. Para ello se contabilizaron los aciertos y errores en un grupo de nios y otro
de nias en las categoras de alta y baja competencia. Analizar si existe FDI, tomando como
referencia el grupo de los nios.

GRUPO BAJA COMPETENCIA GRUPO ALTA COMPETENCIA


ACIERTOS ERRORES ACIERTOS ERRORES
Nios 4 (A) 6 (B) 12 (A) 8 (B)
(GR)
Nias (GF) 3 (C) 7 (D) 9 (C) 11 (D)
Suma () 7 13 21 10

Grupo Trminos de la expresin de Mantel-Haenszel


Competenci
a
Ai Di Ai Di / Ni Bi Ci Bi Ci / Ni
Baja (7 4 = 28) (28 / 20 = 1,4) (3 6 = 18) (18 / 20 =0,9)
Alta (11 12 = 132) (132 / 40 = 3,3) (9 8 = 72) (72 / 40 = 1,8)
Suma () 4,70 2,70

R. MEDRANO (TUTOR) Pgina 9


PSICOMETRA ORIENTACIONES PARTE II (PROPIEDADES MTRICAS)

Ai Di
Ni 4,70
Dado que MH (1,74) > 1, el tem presenta FDI y
favorece al grupo de referencia (nios)
MH = = = 1,74
Bi Ci 2,70
Ni

R. MEDRANO (TUTOR) Pgina 10


PSICOMETRA ORIENTACIONES PARTE III (APLICACIN Y EVALUACIN)

3 PARTE: APLICACIN DE LOS INSTRUMENTOS Y EVALUACIN DE LOS SUJETOS

TEMA N 9 ASIGNACIN, TRANSFORMACIN Y EQUIPARACIN DE LAS PUNTUACIONES.

1.- INTRODUCCIN

Una vez elaborada la prueba definitiva hay que aplicarla, asignar


puntuaciones a los sujetos y dotar de significado a las puntuaciones para
poder interpretarlas. Los principales procedimientos de interpretacin son:
Interpretacin referida a la norma se compara la puntuacin del
sujeto con las obtenidas en el mismo test por un grupo de referencia
(grupo normativo / baremo del test)
Interpretacin referida al criterio determinar el grado de dominio
que un sujeto tiene sobre un criterio preestablecido. El punto de corte
diferencia los que dominan y no dominan el criterio.

1.- TRANSFORMACIN DE LAS PUNTUACIONES EN LOS TEST REFERIDOS A NORMAS

Al ser una interpretacin normativa, es necesario seleccionar una muestra representativa de la


poblacin a la que se aplica el test y sobre esa muestra se obtienen todas las normas. La puntuacin
de un sujeto se puede ubicar en el baremo del grupo normativo para interpretarla. Las puntuaciones
directas se pueden transformar en otras escalas para facilitar su interpretacin:

TRANSFORMACIONES LINEALES TRANSFORMACIONES NO LINEALES

Escala de puntuaciones tpicas Rango de percentiles


Escala de puntuaciones tpicas derivadas Escalas tpicas normalizadas
Puntuaciones derivadas normalizadas

Transformaciones lineales (Escalas tpicas y Tpicas derivadas): se transforman las puntuaciones


directas en tpicas (diferencia entre la puntuacin emprica obtenida por el sujeto en el test y la media
del grupo de referencia, dividido por la desviacin tpica del grupo de referencia) y mediante distintas
transformaciones lineales se obtienen las escalas tpicas derivadas (permiten evitar los valores
negativos y decimales)

X X La escala de puntuaciones tpicas (Z) tiene de media 0


ZX = y una desviacin tpica de 1 N (0, 1). La distribucin de
SX las puntuaciones tpicas de una variable normal suele
oscilar entre 3.
Y = a + b ZX Escala D = 50 + 20 ZX
a = Media nueva escala
Escala T de McCall = 50 + 10 ZX
b = Desviacin Tpica nueva escala

Problema ejemplo Hemos aplicado un test de razonamiento lgico a una muestra de 200 sujetos.
Se ha obtenido una media de 20 puntos y una desviacin tpica de 5 puntos. Averiguar e interpretar la
puntuacin tpica de dos sujetos que obtuvieron en el test 15 y 30 puntos.

Z1 = (15 20) / 5 = (- 1,00) Se encuentra a una desviacin tpica por debajo de la media del grupo.
Z2 = (30 20) / 5 = 2,00 Se encuentra a dos desviaciones tpicas por encima de la media del grupo.

Transformando las puntuaciones segn las anteriores escalas tpicas derivadas:

D = 50 + 20 (- 1) = 30 // D = 50 + 20 (2) = 90
T = 50 + 10 (-1) = 40 // T = 50 + 10 (2) = 70

R. MEDRANO (TUTOR) Pgina 1


PSICOMETRA ORIENTACIONES PARTE III (APLICACIN Y EVALUACIN)

Transformaciones no lineales

Rango Percentil (sitan al sujeto en una determinada posicin dentro del grupo normativo
(x100 indica el % de sujetos que deja por debajo)
Escalas tpicas normalizadas (se obtienen a travs de los percentiles, aluden a la puntuacin
tpica que le corresponde a una puntuacin emprica obtenida por un sujeto en un test con una
distribucin normal). Si la distribucin se aleja de la normal se pueden falsear los datos.
Escalas normalizadas derivadas (permiten evitar los valores negativos y decimales). Al incluir
en el eneatipo sujetos con distintas puntuaciones se pierde informacin.

100 f 100 N PX I
PX = f b + d ( X C Li ) = f ac X C = Li + fb
N I N 100 fd
PX % de sujetos con una puntuacin directa inferior a X; I = amplitud del intervalo
fb = frecuencia acumulada bajo el intervalo crtico; XC =Puntuacin correspondiente al centil
fd = frecuencia absoluta dentro del intervalo crtico; Li = lmite inferior del intervalo crtico
fac = frecuencia acumulada al punto medio del intervalo donde se encuentra X C

Zn = Zp = CX Puntuacin tpica que en una DN corresponde al centil de la puntuacin X.


Cuando las puntuaciones se distribuyen segn la curva normal, las puntuaciones tpicas y
las tpicas normalizadas coinciden.

Escalas normalizadas derivadas ESTANINOS ENEATIPOS (E = 5 + 2 Zn)


Zn = puntuacin tpica normalizada del sujeto // Puntuaciones del 1 al 9

Problemas ejemplo A un grupo de 100 sujetos se les ha aplicado un test de razonamiento


numrico. Las puntuaciones obtenidas, que se distribuyen segn la curva normal, fueron las siguientes:

X f XM fa fa / XM % acumulado
30-32 10 31 100 95 95
27-29 14 28 90 83 83
24-26 20 25 76 66 66
21-23 21 22 56 45,5 45,5
18-20 30 19 35 20 20
15-17 5 16 5 2,5 2,5

Puntuaciones centiles correspondientes a las puntuaciones directas 19 y 28:


PX = 5 + (30/3) (19 17,5) 5 + 15 = 20 y PX = 76 +( 14/3) (28 26,5) 76 + 7 = 83

La mediana (percentil 50) P50 = 20,5 + (50 35) (3/21) = 20,5 + 2,14 = 22,64

Puntuaciones tpicas normalizadas correspondientes a las puntuaciones directas 19 y 28:


X = 19 P20 Zn = (-0,84) y X = 28 P83 Zn = 0,95

Puntuaciones derivadas normalizadas (media 50 y desviacin tpica 20) de 19 y 28:


50 + 20 (0,95) = 69 y 50 + 20 (-0,84) = 33

Eneatipos E = 5 + 2 (0,95) 7 y E = 5 + 2 (-0,84) 4

Normas cronolgicas Se interpreta la puntuacin obtenida por el sujeto en el test en relacin a su


edad y a la puntuacin media obtenida por los sujetos de su edad. Para Crocker y Algina no son muy
recomendables porque no se pueden comparar las puntuaciones de un mismo sujeto en distintas reas
y el significado de un ao de edad mental no es constante en el desarrollo evolutivo del nio.

CI = (EM / EC) 100 Cociente intelectual (CI) se divide la edad mental entre la edad
cronolgica, multiplicando por 100 el valor obtenido. Cuando
coinciden la edad mental y la cronolgica el CI = 100.

2.- EQUIPARACIN DE LAS PUNTUACIONES

R. MEDRANO (TUTOR) Pgina 2


PSICOMETRA ORIENTACIONES PARTE III (APLICACIN Y EVALUACIN)

Proceso mediante el cual se establece una correspondencia entre las puntuaciones de dos o ms
test, de manera que sea indistinto el empleo de uno u otro, puesto que las puntuaciones de cualquiera
de ellos se podran expresar en trminos de las del otro test. Se llama equiparacin horizontal
cuando, midiendo el mismo rasgo, los test se han intentado construir con la misma dificultad y
equiparacin vertical cuando, midiendo el mismo rasgo, tienen distinta dificultad.

Requisitos para poder realizar la equiparacin de puntuaciones:


Que los test midan el mismo constructo psicolgico
Que lo hagan con la misma fiabilidad

DISEOS DE EQUIPARACIN
(Es conveniente que el nmero de sujetos utilizados sea representativo de la poblacin)

Diseos de un solo grupo: se administran las dos formas del test, cuyas puntuaciones queremos
equiparar, al mismo grupo de sujetos; ambas formas deben medir la misma caracterstica y
presentar el mismo grado de dificultad. Pueden influir el efecto orden de presentacin y el
cansancio. La variante diseo de un solo grupo contrabalanceado evita los problemas descritos
(se dividen los sujetos en dos grupos y se administran los test en orden inverso.

Diseo de grupos equivalentes: se extraen dos muestras de la poblacin y a cada una se le


administra una forma del test (tambin se pueden alternar las formas dentro de cada grupo). Evita
los efectos de fatiga y orden de presentacin.

Diseos de grupos no equivalentes con tems comunes (diseo de anclaje): A cada grupo se
le administra una sola forma del test y, como a priori no son equivalentes, adems se les aplica un
test comn (test de anclaje) que permite establecer las equivalencias entre los test equiparar.
El diseo tiene dos modalidades el anclaje interno (conjunto de tems comunes a ambos test que
aparecen intercalados con el resto de tems propios de las dos formas) y el anclaje externo (los
tems comunes aparecen formando un test independiente). Se sugiere el 20% de tems comunes
respecto a la longitud total del test (30 tems comunes pueden ser suficientes en los test extensos)

MTODOS DE EQUIPARACIN

MTODO DE LA MEDIA: Se asume que las puntuaciones de uno de los test difieren, en una cuanta
constante, de las puntuaciones del otro test (la diferencia entre las puntuaciones obtenidas por los
sujetos en ambos test es constante)

MTODO LINEAL: Las diferencias entre las puntuaciones pueden variar (las diferencias entre las
puntuaciones bajas pueden ser mayores que entre las altas). El mtodo se basa en la equiparacin
de aquellas puntuaciones directas que tienen la misma puntuacin tpica. Se contemplan
procedimientos para:
Diseos de un solo grupo Diseos de grupos equivalentes Diseo de anclaje
MTODO EQUIPERCENTIL: Consiste en equiparar aquellas puntuaciones cuyos percentiles
son iguales (es el mtodo de equiparacin ms habitual)

Problema ejemplo (Mtodo de la media) Consideremos los test X e Y con medias 65 y 70,
respectivamente; segn el mtodo de la media, para equiparar las puntuaciones de ambos test
tendramos que sumarle a las puntuaciones del test X cinco puntos (o restarle cinco puntos a las de Y)

Para X = 60 X* = Y 60 + 5 = 65

X* = puntuacin del test Y transformada en una puntuacin del test X


X* = Y = X X + Y _ _
X e Y = media de los test X e Y // X = puntuacin del test.

Error tpico de medida de las puntuaciones equiparadas S e = S ( X */ X )

R. MEDRANO (TUTOR) Pgina 3


PSICOMETRA ORIENTACIONES PARTE III (APLICACIN Y EVALUACIN)

Mtodo lineal (Diseo de grupos equivalentes)


_ _
S
X * = Y = Y ( X X ) + Y X = b Y = c Medias del test X y del test Y.
SX SY y SX = Desviaciones tpicas puntuaciones del test X e Y.
a = (SY / SX) Cociente entre las desviaciones tpicas
X * = a ( X b) + c X* = puntuacin test Y equivalente a una del test X
Error tpico N1 y N2 = n de sujetos en ambas muestras
2 S2 = Varianza de las puntuaciones en el test Y
2S Y
Se = ( Z 2 X + 2) (X * X )
N1 + N 2 ZX = ZX (puntuacin tpica en el test X)
SX

Problema ejemplo El departamento de recursos humanos de una empresa ha desarrollado dos


cuestionarios para evaluar el grado de satisfaccin en el trabajo de sus empleados. En un estudio
piloto, se asignan de forma aleatoria las dos pruebas a 12 sujetos de tal manera que 6 realizan la forma
X y 6 la forma Y. Los resultados obtenidos son los que aparecen en la tabla. Equiparar las
puntuaciones de ambos cuestionarios y calcular el error tpico de medida de la puntuacin equiparada
correspondiente a X = 50.
Supuestos iniciales Se trata de un diseo de dos grupos equivalentes (a cada grupo de sujetos se
le aplica una forma distinta del test)

Forma X Forma Y X* =Y = 0,72 (x 43,3) + 41,2


40 36 X* = 0,72 (40 43,3) + 41,2 39
39 41 X* = 0,72 (39 43,3) + 41,2 38
44 39 X* = 0,72 (44 43,3) + 41,2 42
50 45 X* = 0,72 (50 43,3) + 41,2 46
46 40 X* = 0,72 (46 43,3) + 41,2 43
41 46 X* = 0,72 (41 43,3) + 41,2 40
= 260 = 247

Ecuacin de equiparacin (conversin) X * = a ( X b) + c X* = Y = 0,72 (X 43,3) + 41,2

Y
S 3,02
Tambin X * = Y = ( X X ) + Y Y = ( X 43,3) + 41,2 = 0,72 (X-43,3) + 41,2
SX 4,17
_ ____
X = (260/6 = 43,3) // S2X = (11354 / 6) 43,32 = 17,4 // SX = 17,4 = 4,17
_ ___
Y = (247/6 = 41,2) // S2Y = (10239 / 6) 41,22 = 9,1 // SY = 9,1 = 3,02

Las puntuaciones resultantes de aplicar la ecuacin de equiparacin se recogen en la tabla e indican


los valores de X que se corresponden con Y (40 en X se corresponde con 39 puntos en el test Y, etc.)

Error tpico de la puntuacin equiparada (X = 50) 2,63


2
2S 2Y 2 9,1 50 43,3
Se = ( Z 2 X + 2) S e = + 2 = 2,63
N1 + N 2 6 + 6 4,17

Mtodo lineal (Diseo de un solo grupo


X* = puntuacin test Y equivalente a
una del test X.
S 2Y1 + S 2Y 2 X 1 + X 2 Y1 + Y2 Los subndices 1 y 2 aluden a los
X* = Y = X +
S 2 X1 + S 2 X 2 2 2 subgrupos (1 se aplic el test X y 2 el
test Y y viceversa)
Error tpico rXY = correlacin entre ambos test
( S 2 Y )(1 rXY )( Z 2 X (1 + rXY ) + 2)
Se = (X * X )
N ZX =
S 2Y = S2Y1 + S2Y2 SX

R. MEDRANO (TUTOR) Pgina 4


PSICOMETRA ORIENTACIONES PARTE III (APLICACIN Y EVALUACIN)

Problema ejemplo El psiclogo de un centro escolar ha decidido utilizar dos formas distintas de un
test para estudiar el grado de motivacin de los alumnos con problemas de aprendizaje en su centro.
Para calcular la equiparacin de las puntuaciones, el psiclogo cuenta con las puntuaciones obtenidas
en las dos formas del test por 30 alumnos. La mitad de los alumnos respondieron primero a la forma X
y luego a la forma Y, y la otra mitad respondieron primero a la forma Y y luego a la forma X. La suma
de las puntuaciones obtenidas en las dos formas y la suma de las puntuaciones al cuadrado fueron las
que se recogen en la tabla. Calcular la ecuacin de equiparacin de las puntuaciones de ambas formas
del test (correlacin entre ambos test rXY = 0,8)

Supuestos iniciales Se trata de un diseo de un solo grupo (se administran los dos test al mismo
grupo de sujetos pero en orden inverso)

GRUPO 1 GRUPO 2
FORMA X FORMA Y FORMA X FORMA Y
x 189 195 210 202
x2 2420 2635 2986 2810

Ecuacin de equiparacin (conversin)

* S 2Y1 + S 2Y 2 X 1 + X 2 Y1 + Y2
X =Y= X + X* = 1,51 (X 13,3) + 13,23
S 2 X1 + S 2 X 2 2 2
___________
X* = (12,82 / 5,63 [(X 26,6/2)] + (26,47/2) = 1,51 (X 13,3) + 13,23

GRUPO 1 _ _
X1 = (189/15 = 12,6) // Y1 = (195/15 = 13)
____
S2X1 = (2420 / 15) 12,62 = 2,57 // SX1 = 2,57 = 1,6
___
S2Y1 = (2635 / 15) 132 = 6,66 // SY1 = 6,66 = 2,58
GRUPO 2 _ _
X2 = (210/15 = 14) // Y2 = (202/15 = 13,47)
____
S2X2 = (2986 / 15) 142 = 3,07 // SX2 = 3,07 = 1,75
___
S2Y2 = (2810 / 15) 13,462 = 6,16 // SY2 = 6,16 = 2,48

GRUPO TOTAL Media X = (399/30 = 13,3) S2X = (5406 / 30) 13,32 = 3,31
Media Y = (397/30 = 13,23) S2Y = (5445 / 30) 13,232 = 6,47

Calcular el error tpico de medida de la puntuacin equiparada correspondiente a X = 15

Primero calculamos la puntuacin equiparable en el test Y (aplicando la ecuacin de equiparacin):

X* = 1,51 (15 13,3) + 13,23 X* = Y = 15,8

( S 2 Y )(1 rXY )[ Z 2 X (1 + rXY ) + 2)] 6,47 0,2[(1,37 2 1,8) + 2]


Se = = 0,48
N 30

(X * X )
Donde Z X = ZX = (15,8 -13,3) / 1,82 ZX = 1,37
SX

R. MEDRANO (TUTOR) Pgina 5


PSICOMETRA ORIENTACIONES PARTE III (APLICACIN Y EVALUACIN)

Diseo de anclaje
S Y2 + b 2 YZ 2 ( S 2 Z S 2 Z 2 )
*
X =Y = [ X ( X 1 + b XZ 1 ( Z Z1 ))] + [Y2 + bYZ 2 ( Z Z 2 ) ]
2 2 2 2
S X 1 + b XZ 1 ( S Z S Z1
Z = Test Zeta
Error tpico bXZ1 y bYZ2 = pendientes de la recta de regresin
(de X sobre Z y de Y sobre Z) en los grupos 1 y
2.
2 S 2 Y (1 r 2 )[ Z 2 X (1 + r 2 ) + 2) SY 2
S EX * = bYZ 2 = rYZ 2
N SZ 2
S X1 b b
bYZ 1 = rXZ 1 r = XZ 1 = YZ 2
S Z1 SX SY

Problema ejemplo La direccin de un empresa desea evaluar los conocimientos de marketing de


sus agentes. Puesto que no es posible llevar a cabo la evaluacin de todos los agentes a la vez, se
han confeccionado dos test distintos, de 50 preguntas cada uno. De las 50 preguntas, 15 son comunes
a ambos test y 35 diferentes. Las puntuaciones obtenidas por los 5 agentes de cada grupo se recogen
en la tabla. Calcular la ecuacin de equiparacin.

GRUPO A GRUPO B
TEMS TEMS TEMS TEMS
COMUNES (Z1) DIFERENTES (X1) COMUNES (Z2) DIFERENTES (Y2)
14 32 10 20
12 25 10 25
9 26 8 20
11 19 13 30
10 15 15 25

Supuestos iniciales Se trata de un diseo de anclaje (se cuenta con dos grupos de sujetos, a cada
grupo se le administra una forma diferente del test y un test de anclaje (Z) que es comn a ambos
grupos)
Realizando los clculos previos obtenemos los datos del cuadro siguiente:

GRUPO A Media X1 Media Z1 S2X1 S2Z1


23,4 11,2 34,6 2,96
GRUPO B Media Y2 Media Z2 S2Y2 S2Z2
24 11,2 14 6,16
GRUPO TOTAL (A + B) Media Z S2Z
11,2 4,56

CORRELACIONES rxz1 = 0,60 ryz2 = 0,67

PENDIENTES RECTA bXZ1 = 0,60 (5,88/1,72) 2,05 bYZ2 = 0,67 (3,74/2,48) 1,01
REGRESIN

Ecuacin de equiparacin (conversin)

S + b 2 YZ2 ( S 2 Z S 2 Z 2 )
Y2
*
X =Y = [ X ( X 1 + b XZ 1 ( Z Z1 )) ] + [Y2 + bYZ 2 ( Z Z 2 ) ]
S 2 X 1 + b 2 XZ 1 ( S 2 Z S 2 Z1

2
14 + 1,01 ( 4,56 6,16)
X* = [ X ( 23,4 + 2,05(11,2 11,2))] + ( 24 + 1,01(11,2 11,2)
34,6 + 2,05 2 ( 4,56 2,96)

R. MEDRANO (TUTOR) Pgina 6


PSICOMETRA ORIENTACIONES PARTE III (APLICACIN Y EVALUACIN)

X* = Y = [3,517 / 6,428 = 0,547] (X 23,4) + 24 0,547 (X 23,4) + 24

Calcular el error tpico de medida de la puntuacin equiparada correspondiente a X = 25

X* = 0,547 (X 23,4) + 24 X* = 0,547 (25 23,4) + 24 24,8

2 S 2 Y (1 r 2 )[ Z 2 X (1 + r 2 ) + 2] 2 14(0,88)[0,0576(1,12) + 2]
S EX * = = = 1,2
N 35

Donde Z X = (24,8 23,4) / 5,88 0,24 (Z2X = 0,0576)


r = (bXZ1 / SX) = (bXZ2 / SY) = (2,05/5,88) = 0,35 // (1,01/3,74) 0,27 (las diferencias se deben al reducido
n de casos; tomamos 0,35) r2 = 0,12 (1 0,12 = 0,88)

MTODO EQUIPERCENTIL
100 f 100 I = amplitud del intervalo
PX = f b + d ( X C Li ) = f ac XC =Puntuacin correspondiente al centil.
N I N Li = lmite inferior del intervalo crtico

PX % de sujetos con una puntuacin directa inferior a X


fb = frecuencia acumulada bajo el intervalo crtico;
fd = frecuencia absoluta dentro del intervalo crtico;
fac = frecuencia acumulada al punto medio del intervalo donde se encuentra X C

Problema ejemplo Se construyeron dos formas alternativas de un test de 10 tems y ambas fueron
aplicadas a los mismos grupos. Las distribuciones de frecuencias de las puntuaciones de las dos
formas se presentan en la tabla. A partir de los datos equipare las puntuaciones de ambas formas
utilizando la equiparacin equipercentil.

DATOS INICIALES EQUIPARACIN EQUIPERCENTIL


PUNTUACI FORMA A FORMA B PERCENTIL FORMA A FORMA B
N
0 0 13 5 2 1
1 2 19 10 3 1
2 17 54 25 4 2
3 28 36 35 5 3
4 39 39 50 6 4
5 50 40 60 6 5
6 65 49 70 7 6
7 56 27 85 7 7
8 27 17 90 8 8
9 11 12 95 9 9
10 4 5 99 10 10

R. MEDRANO (TUTOR) Pgina 7


PSICOMETRA ORIENTACIONES PARTE III (APLICACIN Y EVALUACIN)

3.- EL MANUAL DEL TEST

Normas de la APA para elaborar el manual de un test:


1. Actualizacin peridica de las pruebas (menos de 5 aos)
2. En la nueva actualizacin se incluirn los nuevos resultados (positivos o negativos)
3. Revisin y actualizacin si la nueva informacin sobre el test contradice la anterior
4. Con cada nueva revisin es necesario nuevo estudio y anlisis estadstico
5. Incluir ejemplos sobre la interpretacin de datos y estadsticos del test
6. Informar sobre la existencia de error sistemtico
7. Especificar las aplicaciones (tanto de carcter prctico como investigador)
8. Tanto las instrucciones como las normas debern reproducirn la misma situacin
9. Toda informacin cuantitativa ser precisa y clara
10. Debe figurar toda la bibliografa del test
11. Los criterios de puntuacin deben estar bien definidos
12. Informacin sobre la fiabilidad (error de medida del test y dificultad, varianza y
discriminacin de tems)
13. Descripcin de los procedimientos y muestras para la obtencin de los resultados
14. La fiabilidad en pruebas de rendimiento acadmico, inteligencia y aptitudes, se calcular
para cada grupo de edad y curso acadmico.
15. Descripcin de las caractersticas estadsticas si el test consta de dos ms formas
16. En el test-retest se incluir el tiempo transcurrido
17. Si se incluyen subtest correlacionados con el rango de puntuaciones globales se incluirn
tablas de equivalencia
18. Test con subtest se presentar una matriz de correlaciones y estadsticos descriptivos
19. Estabilidad de las puntuaciones en el tiempo y sus factores de riesgo
20. Periodo de caducidad de las puntuaciones del test
21. Informacin de la validez referente a usos y aplicaciones del instrumento
22. La validez de contenido del test ser referida al sector del dominio que refleja los tems
23. Descripcin del procedimiento de seleccin y criterios en el proceso de validacin
24. Situaciones en que se utilicen la validez predictiva y su generalizacin
25. Datos sobre la homogeneidad de las conductas seleccionadas como criterio
26. La valoracin de los datos sobre la validez debe tener en cuenta las VV personales
27. Actualizacin de valores de validez
28. En test de orientacin escolar, se presentarn datos sobre la relacin test- aptitud verbal
29. Fciles de interpretar las puntuaciones y realizar las escalas
30. Actualizacin de baremos (debe advertirse si se obtiene de muestras pequeas.
31. Informacin de resultados en cada uno de los grupos, teniendo en cuenta sexo, edad, etc.

R. MEDRANO (TUTOR) Pgina 8


Psicometra Centro Asociado UNED A Corua

VALIDACIN CON UN NICO PREDICTOR Y UN SOLO VALIDACIN CON VARIOS PREDICTORES Y UN


INDICADOR DEL CRITERIO [TEMA 6] SOLO INDICADOR DEL CRITERIO [TEMA 7]

EL COEFICIENTE DE VALIDEZ (rxy) EL COEFICIENTE DE VALIDEZ MLTIPLE


El coeficiente de validez (rxy) se define como la correlacin entre Viene dado por la correlacin mltiple entre las puntuaciones
las puntuaciones obtenidas por los sujetos en el test predictor y las obtenidas por la muestra de sujetos en el criterio (Y) y las obtenidas
obtenidas en el criterio. en el conjunto de variables predictoras. La correlacin mltiple, va a
El tipo de correlacin utilizada para el clculo del coeficiente de permitir analizar el grado de asociacin entre la variable dependiente
validez depender de la naturaleza de las variables implicadas. (criterio, Y) y el conjunto de variables predictoras, en nuestro caso
X1 y X2.
En el caso de que tanto el test (X) como el criterio (Y) son dos 2 + r 2 2r r
rYX YX YX 1 YX 2 rX 1 X 2
variables cuantitativas continuas el coeficiente de validez se calcula RY X 1 X 2 = 1 2

mediante la correlacin de Pearson 1 rX2


1X 2

NXY XY Otra forma de expresar la correlacin mltiple es en funcin de los


rxy = coeficientes de regresin mltiple en puntuaciones tpicas y de las
[ NX 2 (X )2 ] [ NY 2 (Y )2 ] correlaciones de cada variable predictora con el criterio:

RY X 1 X 2 = b1*rYX1 + b2*rYX 2

EL MODELO DE REGRESIN LINEAL SIMPLE EL MODELO DE REGRESIN LINEAL MLTIPLE


Una vez conocido el grado de asociacin entre el test y el criterio se El modelo de regresin mltiple permite obtener una ecuacin de
puede utilizar el modelo de regresin para hacer pronsticos. As regresin, ponderando y combinando las variables predictoras
pues, el modelo de regresin lineal se puede utilizar para hacer seleccionadas, de manera que los errores de pronstico que se
estimaciones de la puntuacin de los sujetos en el criterio a partir de cometan al estimar el criterio sean mnimos, y eliminando las
las puntuaciones obtenidas por los mismos en el test. variables que no aportan ninguna informacin relevante.
Mediante el modelo de regresin se intenta buscar una ecuacin Aunque la estructura de este modelo es igual que la del modelo de
lineal que haga mnimos los errores de pronstico. Esta ecuacin regresin simple, las ecuaciones de regresin ya no son ecuaciones
pondr de manifiesto la relacin de dependencia lineal entre el test y de una recta sino de un plano o hiperplano segn que las variables
el criterio y tomar la forma: predictoras sean dos o ms. Si tenemos las puntuaciones obtenidas
por una muestra de sujeto en dos variables predictoras X1 y X2 y en
el criterio Y. La ecuacin del modelo de regresin sera:
Y = a + b X Y = a + b1X1 + b2X2
Y = puntuacin pronosticada en el criterio Y = puntuacin pronosticada en el criterio
a = ordenada en el origen o trmino constante, que representa el a = ordenada en el origen del plano de regresin. Es el trmino
valor pronosticado en el criterio (Y) cuando en el test (X) se obtiene independiente y equivale al valor que toma la variable tomada como
un valor cero. indicador del criterio (Y) cuando X1 = X2 = 0
b = pendiente de la recta de regresin, que representa el cambio en b1 = indica lo que aumenta el criterio al aumentar en una unidad la
los valores del criterio Y por cada cambio unitario en el test X variable X1 mientras permanece constante la variable X2.
b2 = indica el aumento del criterio cuando la variable X2 aumenta en
una unidad y permanece constante la variable X2.

Ecuacin en puntuaciones tpicas (obsrvese que la pendiente de la Ecuacin en puntuaciones tpicas (a = 0):
recta de regresin (b) es igual al coeficiente de validez (rxy) y a = 0)
Zy = bZx Z Y ' = b1* Z X1 + b2* Z X 2
rYX1 rYX 2 r X 1 X 2 rYX 2 rYX1 rX 1 X 2
b = rxy Z 'Y ' = rxy Z x b1* = b2* =
1 r X2 X 1 rX2
1 2 1X 2

Ecuacin en puntuaciones diferenciales (a = 0): Ecuacin en puntuaciones diferenciales (a = 0):


y = bx y ' = b1 x1 + b2 x 2
Sy Sy SY SY
b = rxy y ' = rxy x b1 = b1* b2 = b2*
Sx Sx S X1 SX2

Ecuacin en puntuaciones directas: Ecuacin en puntuaciones directas:


Y = a + bX y = a + b1 X 1 + b2 X 2
Sy Sy SY SY
a = Y bX y b = rxy Y ' = rxy (X X ) +Y a = Y b1 X 1 b2 X 2 b1 = b1* b2 = b2*
Sx Sx S X1 SX2

1
Psicometra Centro Asociado UNED A Corua

UN NICO PREDICTOR Y UN SOLO CRITERIO VARIOS PREDICTORES Y UN SOLO CRITERIO

La varianza residual o varianza de error y el error tpico de La varianza residual o varianza de error y el error tpico de
estimacin estimacin mltiple
El coeficiente de validez indica la eficacia del test o variable El coeficiente de validez mltiple indica la eficacia de las variables
predictora para estimar el criterio. En la medida en que el coeficiente predictoras para estimar el criterio. En la medida en que el
de validez sea ms alto, la estimacin ser ms exacta; en el lmite, coeficiente de validez sea ms alto, la estimacin ser ms exacta y,
cuando el coeficiente de validez fuera la unidad, el valor estimado en el lmite, cuando el coeficiente de validez fuera la unidad, el valor
coincidira con la puntuacin que realmente obtuvieran los sujetos en estimado coincidira con la puntuacin que realmente obtuvieran los
el criterio. Sin embargo, dado que nunca se alcanzan coeficientes de sujetos en el criterio. Sin embargo, a pesar de haber utilizado ms
validez perfectos (iguales a 1 en valor absoluto), la estimacin de una variable predictora, el coeficiente de validez no ser perfecto
vendr afectada por el denominado error de estimacin, la (igual a 1 en valor absoluto) y la estimacin vendr afectada por el
diferencia entre la puntuacin que ha obtenido un sujeto en el criterio denominado error de estimacin que equivale a la diferencia entre
y la que se le pronostica mediante la ecuacin de regresin: la puntuacin que ha obtenido un sujeto en el criterio y la que se le
E = Y Y pronostica mediante la ecuacin de regresin (Y Y).
E = Y Y
Con cada sujeto se comete un determinado error de estimacin. A la Con cada sujeto se comete un determinado error de estimacin. A la
varianza de todos los errores de estimacin cometidos con los varianza de todos los errores de estimacin cometidos con los
sujetos de la muestra seleccionada se denomina varianza residual, sujetos de la muestra seleccionada se denomina varianza residual,
varianza error o error cuadrtico medio. varianza error o error cuadrtico medio y su frmula es:

S Y2X =
(Y Y ' ) 2
S Y2X X =
(Y Y ') 2

N 1 2 N
Esta varianza de error representa la variabilidad media de las Esta varianza de error representa la variabilidad media de las
puntuaciones de los sujetos en el criterio respecto a la puntuacin puntuaciones de los sujetos en el criterio respecto a la puntuacin
que se les pronostica mediante la recta de regresin. que se les pronostica mediante la recta de regresin.
Otra forma de expresin de la varianza de error Otra forma de expresin de la varianza de error mltiple
SY2 X = SY2 ( 2
1 r XY ) SY2 X
1X2
= SY2 (1 RY2 X
1X2
)

A la desviacin tpica de esos errores se le denomina error tpico A la desviacin tpica de estos errores se denomina: error tpico de
de estimacin. estimacin mltiple y su frmula es:

S Y X =
(Y Y ' ) 2
SY X =
(Y Y ') 2

1X 2 N
N
Otra forma de expresin del error tpico de estimacin Otra forma de expresin del error tpico de estimacin mltiple
SY X = SY 2
1 rXY SY X = SY (1 RY2X )
1X 2 1X 2

Cuando la escala que se utiliza es la de puntuaciones tpicas, dado Cuando la escala que se utiliza es la de puntuaciones tpicas, dado
que la desviacin tpica es la unidad, la frmula del error tpico de que la desviacin tpica es la unidad, la formula del error tpico de
estimacin es: estimacin es:
2
S Z Y Z X = 1 rXY SZ = (1 RY2X )
Y Z X1 Z X 2 1X 2

Intervalos de confianza Intervalos de confianza


Debido a los errores de estimacin que se cometen al hacer los Al igual que ocurra cuando slo se utilizaba un predictor, ms que
pronsticos, ms que estimaciones puntuales es conveniente estimaciones puntuales es conveniente hacerlas por intervalos
hacerlas por intervalos; para ello, asumiendo que la distribucin de debido a los errores de estimacin que se cometen al hacer
dichos errores se ajusta a una distribucin normal cuya desviacin pronsticos; para ello, asumiendo que la distribucin de dichos
tpica viene dada por el error tpico de estimacin, se establece un errores se ajusta a una distribucin normal cuya desviacin tpica
intervalo confidencial en torno a la puntuacin pronosticada. Los viene dada por el error tpico de estimacin mltiple, se establece un
pasos a seguir son los siguientes: intervalo confidencial en torno a la puntuacin pronosticada. Los
pasos a seguir son los siguientes:
Determinar un nivel de confianza y buscar su puntuacin tpica Determinar un nivel de confianza y buscar su puntuacin tpica
asociada (Zc) asociada (Zc)
Calcular el error tpico de estimacin: SY X S Z Y Z X Calcular el error tpico de estimacin: SY X 1 X 2 S Z Y Z X Z X
1 2

Calcular el error mximo: Emx = Zc SY X Zc S ZY Z Z Calcular el error mximo: Emx = Zc SY X 1 X 2 Zc S Z Y Z X Z X2


1
Aplicar la ecuacin de regresin correspondiente y obtener la Aplicar la ecuacin de regresin correspondiente y obtener la
puntuacin pronostica (Y, y Zy) puntuacin pronosticada (Y, y Zy)
Establecer el intervalo de confianza: Y Emx Establecer el intervalo de confianza: Y Emx
2
Psicometra Centro Asociado UNED A Corua

UN NICO PREDICTOR Y UN SOLO CRITERIO VARIOS PREDICTORES Y UN SOLO CRITERIO

Interpretacin de la evidencia obtenida acerca de la capacidad Interpretacin de la evidencia obtenida acerca de la capacidad
predictora del test predictora del conjunto de variables utilizadas
La varianza de las puntuaciones obtenidas por los sujetos en el La varianza total de las puntuaciones obtenidas por los sujetos en
criterio (Y) se puede expresar como la suma de la varianza de las el criterio (Y) se puede expresar como la suma de la varianza de las
puntuaciones pronosticadas a partir de la variable predictora (Y) y puntuaciones pronosticadas a partir de las variables predictoras (Y)
la varianza de los residuos o varianza error: y la varianza de los residuos o varianza error.
SY2 = SY2' + SY2X SY2 = SY2' + SY2X
1X 2

Dicho de otro modo, la varianza total de los valores de Y (S2Y) es Dicho de otro modo, la varianza total de los valores de Y (S2Y) es
igual a la varianza explicada por el test (S2Y) ms la varianza igual a la varianza explicada por el influjo conjunto de X1 y X2 (S2Y)
debida al azar o varianza residual (S2YX) ms la varianza debida al azar o varianza residual (S2YX1X2)
A partir de esta ecuacin se puede averiguar la proporcin de la A partir de esta ecuacin se puede averiguar la proporcin de la
varianza de las puntuaciones de los sujetos en el criterio que se varianza de las puntuaciones de los sujetos en el criterio que se
puede explicar a partir de la varianza de las puntuaciones en el puede explicar a partir de la varianza de las puntuaciones en las
predictor (varianza de las puntuaciones pronosticas) y qu variables predictoras (varianza de las puntuaciones pronosticadas)
proporcin no se puede explicar y corresponde a los residuos y qu proporcin no se puede explicar y corresponde a los
residuos.
Coeficiente de determinacin Coeficiente de determinacin mltiple
2 = SY2 ' SY2'
CD = rXY CD = RY2X =
SY2 1X 2 SY2
Equivale al coeficiente de validez al cuadrado y representa la Equivale al coeficiente de validez mltiple al cuadrado y representa
proporcin (o porcentaje) de la varianza de las puntuaciones de los la proporcin de la varianza de las puntuaciones de los sujetos en
sujetos en el criterio que se puede pronosticar a partir del tests. el criterio que se puede pronosticar a partir del conjunto de
Tambin se define como la varianza comn asociado entre el test y variables predictoras. Tambin se define como la varianza comn o
el criterio. asociada entre el criterio y las variables predictoras.
Coeficiente de alienacin al cuadrado Coeficiente de alienacin mltiple al cuadrado
SY2 ' SY2X SY2' SY2X
CA 2 = 1 rXY
2 = 1 = CA 2 = 1 RY2X = 1 = 1X 2
SY2 SY2 1X 2 SY2 SY2
El coeficiente de alienacin al cuadrado es el complementario del El coeficiente de alienacin al cuadrado es el complementario del
coeficiente de determinacin y representa, por lo tanto, la coeficiente de determinacin y representa, por tanto, la proporcin
proporcin (o el porcentaje si se multiplica por 100) de la varianza (o porcentaje si se multiplica por 100) de la varianza de las
de las puntuaciones de los sujetos en el criterio que no se puede puntuaciones de los sujetos en el criterio que no se puede predecir
predecir a partir del test, es la proporcin de varianza error que hay a partir del conjunto de variables predictoras, es la proporcin de
en la varianza de las puntuaciones de los sujetos en el criterio. varianza error que hay en la varianza de las puntuaciones de los
sujetos en el criterio.
Coeficiente de alienacin Coeficiente de alienacin mltiple
S SY X 1 X 2
CA = 2
1 rXY = Y X CA = 1 RY2X =
SY 1X 2 SY
Aunque la frmula es equivalente a la del error tpico de estimacin Aunque la frmula es equivalente a la del error tpico de estimacin
en puntuaciones tpicas, de cara a la interpretacin de este en puntuaciones tpicas, de cada a la interpretacin de este
coeficiente conviene saber que, en realidad, indica la proporcin coeficiente conviene saber que, en realidad, indica la proporcin
que represente el error tpico de estimacin respecto a la desviacin que representa el error tpico de estimacin mltiple respecto a la
tpica de las puntuaciones en el criterio. En la medida en que el desviacin tpica de las puntuaciones en el criterio. En la medida en
error tpico sea ms pequeo que la desviacin tpica del criterio el que el error tpico sea ms pequeo que la desviacin tpica del
coeficiente K ser menor. El valor del coeficiente K oscila entre 0 y criterio, el coeficiente K ser menor. El valor del coeficiente K oscila
1, ser mximo cuando el coeficiente de validez sea 0 y ser entre 0 y 1, ser mximo cuando el coeficiente de validez sea 0 y
mnimo cuando el coeficiente de validez valga 1. El coeficiente de ser mnimo cuando el coeficiente de validez valga 1. El coeficiente
alienacin representa la inseguridad, o el azar, que afecta a los de alienacin representa la inseguridad, o el azar, que afecta a
pronsticos. los pronsticos.
Coeficiente de valor predictivo Coeficiente de valor predictivo mltiple
C.V .P. = 1 2
1 rxy CVP = 1 1 RY2X
1X 2

Es el complementario del coeficiente de alienacin y es otra forma Es el complementario del coeficiente de alienacin y es otra forma
de expresar la capacidad del test para pronosticar el criterio ya que de expresar la capacidad de las variables predictoras para
representa la proporcin (o porcentaje si se multiplica por cien) de pronosticar el criterio. Se interpreta como la proporcin (o
seguridad en los pronsticos. porcentaje) de seguridad con que se hacen los pronsticos.

También podría gustarte