Universidad Católica de Santiago del Estero - DAR.
Chazarreta Victoria 22/04/24
Definición de test: (APA 1999) Procedimiento evaluativo por medio del cual una
muestra de comportamiento de un dominio especificado es obtenida y
posteriormente evaluada y puntuada empleando un proceso estandarizado.
Un test está formado por una serie de ítems o preguntas. Cada ítem requiere una
respuesta del individuo que está tomando el test.
Paradigmas:
● Teoría clásica de los test: Sencillo, robusto, da cobertura a las necesidades de
los profesionales de la medición psicológica, tanto en la estimación del error
como en la validez. Iniciada por Spearman y consolidada por los desarrollos
teóricos y metodológicos de Thurstone, Thorndike y Gullikson.
Hipótesis: La puntuación observable de una persona en un test es una función de dos
componentes: Su puntaje verdadero (inobservable) y el error de medición implícito en
la prueba.
Modelo de puntuación verdadera como valor esperado. Esperado alude a que la
puntuación verdadera es un concepto matemático, probabilístico, es decir, la
puntuación verdadera del sujeto en un test sería el promedio aritmético de las
puntuaciones empíricas obtenidas en infinitas aplicaciones.
Se basa en supuestos débiles pero generales, quiere decir que son adaptables a
distintas situaciones, si los supuestos son ciertos, las conclusiones serán verdaderas
El supuesto principal trata de explicar la puntuación verdadera de un sujeto en
función de la puntuación observada y los errores de medición.
Se espera esa sola respuesta, y su puntaje tiene margen de error.
● Teoría de la respuesta al ítem: Rasch (1963) y Lord (1980)
Intenta brindar una fundamentación probabilística al problema de medir constructos
latentes (no observables) y considera al ítem como unidad básica de medición.
La puntuación de una prueba en el modelo clásico estima el nivel de un atributo
(aptitud, rasgo de personalidad, interés) como la sumatoria de respuestas a ítem
individuales, mientras que la TRI utiliza el patrón de respuesta.
Diferencia principal: La diferencia principal entre la teoría clásica de los test y la TRI
es que la relación entre el valor esperado y el rasgo en la TCT es de tipo lineal,
mientras que en la TRI las relaciones pueden ser funciones de tipo exponencial.
Son funciones matemáticas que relacionan las probabilidades de una respuesta
particular a un ítem con la aptitud general del sujeto
A medida que el sujeto responde se lo va asociando hacía su área de interés.
Confiabilidad: El resultado de la medición es un valor observado que no coincide con
el valor verdadero y, en consecuencia, siempre se mide con un margen de error. En
términos matemáticos, este valor es la esperanza matemática de la puntuación
observada y podría pensarse como la media de las puntuaciones observadas
obtenida de infinitas administraciones de un instrumento dado a una persona.
Tomando en consideración este supuesto, se puede inferir que cuanto mayor sea el
error, menos confiables serán los resultados obtenidos en el proceso de medición. Es
Universidad Católica de Santiago del Estero - DAR.
Chazarreta Victoria 22/04/24
importante considerar que con el término “error” nos referimos a cualquier variación
de las puntuaciones de una prueba que no sea asimilable a las variaciones en la
magnitud del rasgo que está siendo evaluado. Siempre que medimos repetidamente
un fenómeno, sea éste de naturaleza física o social, es inevitable una cierta dosis de
error, debido a imprecisiones del instrumento o a la influencia de las posibles fuentes
de variación de las puntuaciones de un test. En el dominio de los tests psicológicos
esta variabilidad es mayor que en la medición de los fenómenos físicos, debido a las
características muy dinámicas del objeto de medición (el comportamiento humano) y
la mayor cantidad de fuentes de error que pueden afectar las puntuaciones, en
comparación con otros dominios del conocimiento.
“La confiabilidad puede entenderse como la exactitud o precisión de una medición, o
el grado en el cual las puntuaciones de una prueba están libres de esos errores de
medición. Esta exactitud o precisión de las puntuaciones permite que éstas se
mantengan constantes en diferentes circunstancias”.
Validez: Que el test mida lo que pretende medir. Es un aspecto esencial de la
medición psicológica y se relaciona con la investigación del significado teórico de las
puntuaciones obtenidas por medio de un test.
Se distinguen 3 etapas:
Una primera etapa operacional, en la que predomina una perspectiva
exclusivamente pragmática de las aplicaciones de los tests. Este enfoque coincide
con el operacionalismo dominante en la epistemología de la primera mitad del siglo
pasado y se manifiesta en la noción de validez como sinónimo de la correlación entre
las puntuaciones de un test y algún criterio que el test intenta predecir.
Posteriormente se comprendió que este concepto de validez exclusivamente ligado a
la predicción de criterios externos no era útil para muchos tests en los que ellos
mismos constituyen su propio criterio (por ejemplo, en pruebas de rendimiento) y esto
condujo a introducir el concepto de validez de contenido. Otro cambio importante se
produjo con la aparición del clásico artículo de Cronbach y Meehl (1955) donde se
presentó por primera vez el concepto de validez de constructo y se caracterizó a esta
última como el aspecto fundamental e inclusivo de las restantes dimensiones de la
validez (Martínez Arias, 1995). Esta publicación inició un segundo estadio teórico, en el
cual asume un papel fundamental la teoría psicológica y se distinguen 3 tipos de
validez:
● De constructo, contenido y predictiva.
Por último, el período actual o contextual se caracteriza por una extensión de la
concepción anterior, a la que se agrega la importancia otorgada al uso propuesto
para el instrumento. Esto significa que, en realidad, nunca se valida un test en sí
mismo sino que su validez se verifica para determinados propósitos. En esta nueva
perspectiva ya no se habla de distintos tipos de validez sino de un proceso de
recolección de diferentes tipos de evidencia para un concepto unitario. Esta
concepción contemporánea de validez se refleja en la última versión de las Normas
Universidad Católica de Santiago del Estero - DAR.
Chazarreta Victoria 22/04/24
Técnicas para los Tests Psicológicos y Educativos (APA, 1999), donde se la define como
la adecuación, significación y utilidad de las inferencias específicas hechas a partir
de las puntuaciones de los tests.
La validez es un concepto unitario y siempre se refiere al grado en que la evidencia
empírica apoya las inferencias realizadas en función de los resultados de un test.
La APA (1999) propuso cinco tipos de evidencia de validez, basadas en: el contenido
del test, la estructura interna del test, el proceso de respuestas al test, las relaciones
con otras variables externas al test y las consecuencias de su aplicación.
Pruebas psicométricas: En el estudio de la personalidad, interés básico, es la validez
de construcción. Es difícil encontrar una variable medida por una técnica proyectiva
que no mida un método objetivo. Son cuantificables.
Pruebas proyectivas: Su interpretación es de carácter cualitativo subjetivo, apegada
a la experiencia clínica y fundamentada en el dominio de la teoría psicodinámica y
centrada en el constructo de la proyección. No tienen calificaciones cuantificables
(con excepción a las ya acotadas). No tienen estimación de consistencia interna
(confiabilidad). No hay posibilidad de datos normativos adecuados. Observan una
faceta inconsciente de la personalidad (no observable, no cuantificable y por lo tanto
no medible desde la psicometría), por esto no es posible su validación. Su interés
principal es la individualidad. Incluyen una interacción entre el examinador y la
prueba.
Tipos de pruebas según lo que se mide:
Nunnally Propone tres tipos de test: Habilidades, rasgos de personalidad y la medida
de preferencias (intereses, valores y actitudes).
• Medición de habilidades: Aptitudes, el rendimiento o logro y la inteligencia. Se
relacionan con las diferencias individuales de los sujetos en cuanto al nivel de
ejecución máximo en diferentes tareas, cuando están intentando hacerlas. Significa
que las habilidades se relacionan con la ejecución respecto a criterios específicos de
éxito (tales como respuestas a problemas matemáticos y demás).
Test de inteligencia: Wais (adulto), Wisc (niños en edad escolar) y Wppssi
(preescolares).
Medición de los rasgos de personalidad: Hace referencia a un constructo que
expresa las tendencias estables de una persona a comportarse de una forma
determinada en diferentes situaciones.
Test: Técnicas proyectivas (psicodiagnóstico de Roscharch) estos emplean estímulos
ambiguos ante los cuales se espera que los sujetos proyectan sus sentimientos,
deseos y emociones. Pruebas objetivas verbales, cuestionario de personalidad de
Cattell, cuestionario de personalidad de Eysenck.
Universidad Católica de Santiago del Estero - DAR.
Chazarreta Victoria 22/04/24
• Medición de constructos motivacionales (intereses, actitudes y autoeficiencia
percibida): Evaluación de todas las formas de la motivación y las preferencias.
Intereses: Patrones de gustos, aversiones o indiferencias por actividades particulares
relacionadas con carreras y / o ocupaciones.
Test: inventarios, Modelo riasge de holland, cuestionario de intereses profesionales
(flogliatto)
Actitudes: Sentimientos acerca de objetos sociales particulares, tipos de personas,
instituciones sociales, políticas gubernamentales, entre otras. Se distinguen de los
intereses porque tienen un objetivo particular.
Test: Escalas tipo Lickert.
Autoeficiencia: “Creencias en las propias capacidades para ejecutar determinados
cursos de acción” (Bandura). Para ellos las creencias de las personas acerca de sí
mismas son elementos claves para la determinación de su motivación y
comportamiento.
Test: Inventario de autoeficiencia para inteligencias múltiples, con fines de
orientación vocacional.
Tipos de pruebas según su construcción:
● Individuales: Se aplican a una persona a la vez y el examinador lo hace de la
misma forma que un psicoterapeuta.
● Grupales: Se puede aplicar a varias personas al mismo tiempo.
● Con lápiz y papel
● Con elementos
● Con o sin tiempo límite
● Verbales o de ejecución
● Visuales, auditivos o computarizados
Áreas de aplicación: Laboral, educativo, clínico, sanitario, criminológica.
Test de estandarización: Sirve para obtener un dato que luego lo voy a relacionar a
un grupo, es una muestra homogénea, la mayor cantidad de características que lo
asemeja al sujeto. Prueba en donde un sujeto, sus respuestas se asocian a un grupo
de referencia.
Diseños instrumentales: Se basan en un paradigma que busca generalizar los datos.
Indicadores operacionales: Es la respuesta que el sujeto da. Son los indicadores
operacionales empíricos de la variable que medimos.
Rapport: Es un fenómeno en el que una o más personas sienten que están en sintonía
psicológica y emocional. Trata de establecer una buena comunicación con el sujeto
que estamos evaluando, para que se sienta cómodo de responder lo que desee.
Puede ser a través de entrevistas u otros recursos. Cuando se establece esta
Universidad Católica de Santiago del Estero - DAR.
Chazarreta Victoria 22/04/24
comunicación es subjetiva, cuando esta se vuelve objetiva se debe poner en alto
porque la situación se vuelve incómoda y no puede continuar.
Estandarización: Es uno de los métodos utilizados para la interpretación de
puntuaciones. Para poder realizar esta interpretación comparativa de los puntajes
individuales se requiere un proceso denominado estandarización, el que se
desarrolla mediante las siguientes operaciones:
a) Selección de una muestra representativa de la población meta para la cual se
elaboró el instrumento, o muestra de estandarización.
b) Administración del test a esa muestra y registro de las puntuaciones originales de
los individuos.
c) Transformación de las puntuaciones originarias en puntuaciones derivadas que
indican la posición relativa de los puntajes directos individuales en relación con el
grupo de referencia.
El producto final de este proceso de estandarización son los baremos de un test.
Baremos: Han sido definidos como tablas de equivalencia entre puntuaciones
originarias y transformadas que permiten la comparación de los resultados
individuales con los de un grupo de referencia. Los baremos son normas establecidas
por convención para evaluar los méritos personales, tal como lo define el diccionario
de la Real academia española. Considera al 50% como número base, si pasa este
tiene mayor capacidad intelectual, si no lo pasa tiene menos.
Media: Es la puntuación aritmética promedio en una distribución. Para calcularla, se
suman las puntuaciones y se divide el resultado entre el número de casos.
Desviación estándar: Es una aproximación de la desviación promedio con respecto a
la media. Proporciona una aproximación útil de que tanto una puntuación
característica se encuentra por arriba o por debajo de la puntuación promedio. Tiene
ventajas ya que, conocer la desviación estándar de un grupo de datos distribuidos
normalmente nos permite hacer afirmaciones precisas sobre la distribución, también
la utilizamos mayormente en una muestra para estimar la desviación estándar de una
población.
Correlación: Es un índice matemático que describe la dirección y magnitud entre
variables. Para calcularlo existen varias formas, pero todas incluyen pares de
observaciones: Para cada observación en una variable, hay una observación en otra
variable para la misma persona. Pero antes de calcularlo hay que regresar a su
método en el que se fundamenta que es la regresión. Ambas aumentan o disminuyen.
Cuando es perfecta cada variable sube, cuando no lo es el autor del test busca las
respuestas más cercanas a las esperadas para la correlación, de esta manera las
otras se rechazan
Universidad Católica de Santiago del Estero - DAR.
Chazarreta Victoria 22/04/24
Puntaje derivado: Se obtiene restando un valor constante de cada puntuación
original y dividiendo el resultado por otra constante. Se transforma la puntuación a
puntajes z, se obtiene una distribución con la misma forma, pero una media y una
desviación estándar diferente a la distribución de las puntuaciones originales. Las
puntuaciones estándar expresan la distancia del individuo a la media en función de
la desviación estándar de la distribución.
Uno de los puntajes derivados comunes es el percentil. Este puntaje transforma el
puntaje directo en una escala del 1 al 100, donde cada punto se llama centil. Por
ejemplo, si un individuo obtiene un puntaje directo equivalente al percentil 80,
significa que supera al 80% del grupo normativo en el atributo evaluado.
Otro tipo de puntaje derivado son los puntajes estándar, que utilizan fracciones de la
desviación estándar como unidad de medida. Algunos ejemplos de puntajes estándar
son el puntaje CI (coeficiente intelectual), el puntaje eneatipo (escala del 1 al 9) y el
puntaje decatipo (escala del 1 al 10). Estos puntajes proporcionan una medida relativa
del desempeño del individuo en comparación con el grupo normativo.
Además, la edad mental también se considera un puntaje derivado. Este puntaje
compara el desempeño del individuo en el test con el desempeño típico de una
determinada edad cronológica.
Puntaje bruto: El puntaje bruto, también conocido como puntaje directo u original, es
el resultado inicial de un test. Se obtiene sumando las respuestas correctas que ha
dado el individuo.
El puntaje bruto es una medida inicial y sin procesar de cómo lo hizo un individuo en
un test, basada simplemente en la cantidad de respuestas correctas que dio. Sin
embargo, este puntaje bruto a menudo se transforma o se ajusta de alguna manera
(por ejemplo, a través de la estandarización) para permitir comparaciones más
significativas entre individuos o grupos.
Promedio: