Validez
• Grado en que la prueba mide lo que pretende medir
• Debemos definir la validez de la puntuación de la prueba respecto
a un uso específico.
• Preguntarnos: ¿la escala de depresión del MMPI-2 es válida para identificar
la gravedad de una depresión?
• La validez no es todo o nada, hay grados; existen pruebas sin
validez para ciertos propósitos específicos. Pueden haber
puntuaciones de una prueba que sean válidas para un propósito y
no para otro.
Constructo e instrumento de medición
Constructo y prueba
• La subrepresentación del constructo se refiere al grado en que una
prueba no logra capturar aspectos importantes del constructo.
• La varianza irrelevante se refiere al grado en que las puntuaciones
de la prueba son afectadas por procesos externos al constructo
para el que fue pensada la prueba.
Subrepresentación del constructo y varianza
irrelevante para el constructo
Tipos de validez tradicional
• Validez de contenido
• Validez de criterio
• Validez concurrente
• Validez predictiva
• Validez de constructo
Validez de contenido
• Muestra la relación entre el contenido de una prueba y un dominio
de conocimiento, conducta, etc.
• Debe haber una buena correspondencia entre el dominio general y
el contenido de la prueba.
• Noción de muestreo:
• El contenido de la prueba cubre una muestra representativa de todos los
posibles contenidos del dominio.
• Se usa en pruebas de aprovechamiento y reclutamiento laboral
Validez de contenido
• Se comienza con una definición cuidadosa del contenido que
deseamos cubrir
• Se utiliza un cuadro de dos vías donde se cubren los temas del
contenido
• Se contrasta reactivo por reactivo el contenido de la prueba con el
contenido del dominio a evaluar.
• Al contrastar e identificar los porcentajes en que los reactivos
cubren la medición del rasgo, se hace un juicio: suficiente o
insuficiente.
Cuadro de dos vías
Validez de criterio
• Busca establecer la relación entre el desempeño en la prueba y
otro criterio que se considera importante sobre el constructo de
interés.
• Validez predictiva: la prueba busca identificar que tan bien le va a ir a un
estudiante en su carrera con el resultado de la prueba de admisión. Se
busca predecir el estatus de algún criterio que será alcanzado en el futuro.
• Validez concurrente: buscar la concordancia entre el desempeño en la
prueba y el estatus actual en alguna otra variable. [Link]. Determinar la
relación entre la puntuación de una prueba y la valoración del clínico
acerca del nivel actual de depresión
• Ambos conceptos son lo mismo, la diferencia es de temporalidad.
Criterio externo
• El criterio externo es sobre lo
que queremos obtener
información.
• Determinaremos si la prueba
proporciona información útil
acerca del probable estado de
la persona en relación con el
criterio externo.
Validez de criterio
• Obtenemos la validez por
medio de un coeficiente de
correlación (casi siempre
Pearson).
• Denominado coeficiente de
validez.
• Una vez obtenido el
coeficiente de correlación
podremos predecir el valor del
criterio a partir de el resultado
de la prueba
Método de grupos contrastados
• Tenemos un grupo de 50 diagnosticados con esquizofrenia (el
diagnóstico es realizado por clínicos expertos y un grupo de 50 que
no tienen ningún diagnóstico psiquiátrico.
• Aplicamos la prueba y buscamos identificar diferencias
significativas entre las puntuaciones de un grupo y de otro.
Método de grupos contrastados
• Es un método de validez de
criterio
• El criterio es la pertenencia a un
grupo
• Buscamos demostrar que la
prueba diferencia un grupo de
otro.
• Mientras mayor es la
diferenciación entre grupos, más
válida es la prueba.
Método de correlación con otras pruebas
• Correlacionar la prueba que se quiere validar con alguna otra que
se supone es una medida válida del constructo pertinente.
• La correlación (generalmente de Pearson) entre las puntuaciones
de ambas pruebas muestra la validez de criterio con este método.
Sensibilidad y especificidad
• Usamos estos conceptos al querer clasificar en dos grupos opuestos
[Link]: riesgo suicida vs no riesgo suicida.
• Sensibilidad se refiere al grado en que una prueba identifica al
grupo criterio (personas que en realidad intentaron suicidarse), la
especificidad es el grado en que la prueba no identifica o evita
identificar al grupo contraste (personas sin riesgo suicida).
• Se expresan en términos de porcentaje de sensibilidad y
especificidad.
Validez de constructo
• Se usa cuando una prueba quiere medir un constructo que no es
claro, no está del todo definido o no hay un criterio externo.
• Cuanlquier evidencia que apoye la proposición de que la prueba
mide el constructo meta es útil.
Estructura interna
• En validez, la consistencia interna funciona de manera similar a la
confiabilidad.
• La consistencia interna alta indica que la prueba mide algo de manera
consistente, un constructo o rasgo particular.
• La consistencia interna proporciona solo una evidencia débil
relacionada con la validez.
Procesos de respuesta
• La manera como se responde a una prueba puede proporcionar
evidencia relacionada con la validez de una prueba.
• Este tipo de análisis de validez no ofrece evidencia sólida pero es
útil para proporcionar ideas acerca de lo que la prueba puede o no
puede estar midiendo.
• Se trata de buscar como los examinados se aproximan a las
respuestas en la prueba, cómo es que le hicieron para responder
tal cosa.
Efecto de las variables experimentales
• Ejemplos para entender este método:
• Al querer identificar la validez de una prueba de creatividad, la aplicamos,
en un inicio, damos un curso de técnicas de pensamiento creativo y luego
volvemos a aplicar. Esperamos que las puntuaciones suban si es que
realmente mide el proceso creativo.
Cambios maduracionales o en el desarrollo
• Se espera que un chaval, a lo largo de su desarrollo tenga una
capacidad mental mayor.
• El mostrar que esta capacidad mental va evolucionando midiendo
con un instrumento en particular permitirá establecer datos de
validez de la prueba.
• Esperamos un mejor desempeño en matemáticas con un chaval de
4to que con uno de 2do.
Validez consecuencial
• Relacionada con las consecuencias de su uso e interpretación de
una prueba en particular.
• Declaración del autor respecto a las consecuencias de la prueba. [Link]: el
autor menciona que una prueba de depresión no solo será una medida
válida de depresión sino que llevará a una terapia más eficaz. Entonces
debe reunir evidencia que valide la consecuencia que menciona.
• Consecuencias que no se relacionan con las declaraciones hechas por los
autores.
• Este es un término novedoso, se introdujo en 1985 y en 1999 se le dedicó
una sección completa en el Standards for Educational.
• Suele ser un término con mucha controversia.