LIBRO
LIBRO
Objetivos
Introducción
No existe ciencia sin medición = No hay pedagogía sin medida educativa
[Link]
La medida en educación
“Si pongo en una báscula dos personas de 80 kilos, la báscula marcará 160 kilos (…), pero si pongo
dos personas con CI=100 a resolver juntas un test de inteligencia, no puedo asegurar que obtengan una
puntuación CI=200”
Medidas Aditividad y
Nivel de Razón
físicas proporcionalidad
Medidas Ordenación y
distancia -
Nivel Ordinal y
psicológicas de Intervalo
proximidad
“La evaluación no es una medida simple, sino que lleva inmerso un proceso de emitir juicio de valor sobre
las mediciones realizadas”
Cuando es posible establecer un orden o rango dentro de las categorías de acuerdo con un criterio,
tenemos medidas ordinales…
…los valores sólo indican “mayor que o menor que” (orden), pero no determinan distancia o
proximidad (no hay una unidad constante entre ellos)
y = cx (c≠0)
Ej.: 1 kilo = 2,2 libras
“En investigación educativa las variables que manejamos llegan, en el mejor de los casos, a ser de
intervalo. Sólo determinadas variables físicas de los sujetos (pero sin relevancia o con poca relevancia desde
el aspecto educativo, como el peso, la altura, etc.) alcanzan la medida de nivel de razón”
El modelo de teoría de respuesta al ítem (TRI) o rasgo latente de Rasch se fundamenta en la idea de
que la respuesta a un ítem sólo depende de la capacidad del sujeto y la dificultad intrínseca del ítem.
“Si los datos no se ajustan al modelo, son los datos los que deben cambiarse, no el modelo” (dicho
de otra forma, el axioma es el modelo; si los datos no se ajustan, entonces se desecha el instrumento)
1, 1, 3, 5, 8, 10, 17
“No obstante, aunque el significado empírico de los números no afectara a la validez de las
manipulaciones realizadas sobre ellos; sí afecta a las conclusiones extraídas de los resultados de esas
manipulaciones”
Ejemplo: utilizar una medida de razón ([Link]. “tiempo de comunicación con los compañeros”) como
indicador de una medida ordinal ([Link]. “integración escolar”); y aplicar erróneamente las propiedades de la
primera sobre la segunda.
Técnica
• p.e. Técnica de cuestionario - Encuesta
Instrumento
• p.e. Cuestionario CAE de adaptación escolar (cuestionario cerrado)
Recurso
• p.e. El ordenador como medio para aplicar el instrumento
6 grandes técnicas:
• La observación
• La entrevista
• El cuestionario
• Las pruebas objetivas y tests
• Las técnicas grupales y sociométricas
• El análisis de documentos
[Link]
76d32e79367c4b3255dda4d [Link]
[Link] [Link]
Objetivos
• Dificultad.
• Discriminación / Homogeneidad
• Análisis de los distractores (alternativas incorrectas de un ítem).
• Fiabilidad
• Validez
• Unidimensionalidad
TCT - Dificultad
El grado de dificultad de un ítem está en función del número de personas que conteste de forma
correcta al mismo.
𝐴
𝐼𝐷 =
𝑁
donde:
A = número de personas que aciertan el ítem
N = número total de personas que responden al ítem
𝐸
𝑞 𝐴−
′
𝐼𝐷 = 𝑝 − = 𝐾 −1
𝑘−1 𝑁
donde:
p = proporción de aciertos (índice de dificultad sin corregir)
q = proporción de fallos
k = número de alternativas del ítem
El Índice de Dificultad (ID) no es una propiedad intrínseca del ítem, pues su valor depende de la
muestra de sujetos a la que se aplique (…) el ID sólo tiene sentido en tests o pruebas objetivas donde hay
respuestas correctas e incorrectas.
Ejemplo 1: Se supone un ítem de evocación (sin alternativas) que es contestado acertadamente por
17 estudiantes de una clase compuesta de 30 estudiantes. ¿ID del ítem?
A 17
ID = = = 0,56̂ → Ítem fácil
N 30
Ejemplo 2: Se supone un ítem de evocación (sin alternativas) que es contestado erróneamente por 25
estudiantes y acertadamente por 7 estudiantes. Todos los estudiantes han contestado al ítem. ¿ID del ítem?
7 7
ID = = = 0,22 → Ítem muy difícil
25+7 32
TCT - Discriminación
Este índice determina la potencia del ítem para discriminar el grupo de sujetos que tiene mayor
cantidad de aciertos en la prueba, frente al de menos aciertos (…)
Es decir, un ítem discrimina bien cuando existe correlación positiva entre la puntuación obtenida en
el ítem con la puntuación obtenida en el test (…) Se utilizan dos:
Dividida la muestra en dos grupos extremos: a) una parte donde está el 27% de personas con
mayor puntuación en el test (extremo superior) y b) otra parte con el 27% de menor puntuación (extremo
inferior).
𝐷 = 𝑝+ − 𝑝−
p+ representa la proporción de individuos del extremo superior que aciertan el ítem
p- representa la proporción de individuos del extremo inferior que aciertan el ítem
Ejemplo 4: Tenemos un test que aplicamos a 600 estudiantes. De los 162 estudiantes con peor
puntuación total en el test, 30 han acertado el ítem 1; y de los 162 con mejor puntuación total, 95 han
acertado dicho ítem. ¿Cuál es el índice D de discriminación del ítem 1?
95 30
𝐷 = 𝑝+ − 𝑝− = − = 0,40 → Índice de discriminación alto
162 162
r puede ir desde -1 ↔ 0 ↔ +1
Ejemplo 5: Tenemos los resultados de las respuestas de 4 sujetos a una prueba de 4 ítems (“1” =
acierto; “0” = fallo) ¿IH del ítem 4? Examen Septiembre 2016
𝑁 ∑ 𝑥𝑦 − ∑ 𝑥 ∑ 𝑦
𝑟=
√[𝑁 ∑ 𝑥 2 − (∑ 𝑥 )2 ][𝑁 ∑ 𝑦 2 − (∑ 𝑦)2 ]
(4 · 2) − (1 · 7) 8−7 1 1 1
r= = = = = = 0,174
√[(4 · 1) − 12 ] · [(4 · 15) − 72 ] √[4 − 1] · [60 − 49] √3 · 11 √33 5,74
Ejemplo 6: Se supone que 400 individuos contestan a un ítem con 5 alternativas (A, B, C, D y E), y que
la E es la respuesta correcta. Las respuestas de los 276 sujetos que fallan en las distintas alternativas son:
A B C D
91 42 66 77 Empírica
69 69 69 69 Teórica
¿Se puede afirmar, con un nivel de confianza del 95%, que hay equiprobabilidad en los distractores?
Ji-cuadrado mide la discrepancia entre la distribución empírica y la teórica, si éstas son iguales el
resultado de ji-cuadrado es 0
(𝑓𝑜 − 𝑓𝑒 )2
𝑓𝑜 → frecuencia observada → empírica χ2 = ∑
𝑓𝑒
𝑓𝑒 → frecuencia esperada → teórica
Nivel de confianza
TCT – Fiabilidad
Suponemos el modelo lineal clásico de medida: Error aleatorio e independiente
X=V+e
Aunque un instrumentos de medida no es bueno por el hecho de ser fiable (…) sin tal propiedad la
medición no es aceptable (…) esto es, podemos afirmar que la fiabilidad es una condición necesaria,
aunque no suficiente, de un instrumento de medida de calidad.
Se calcula la correlación que existe entre las puntuaciones obtenidas por un mismo
grupo de sujetos en 2 aplicaciones sucesivas de una misma prueba en 2 momentos
diferentes.
TCT – Fiabilidad
Ejemplo 7. Procedimiento de las dos mitades: ¿Cuál es la fiabilidad de un test que tiene como
correlación entre sus ítems pares e impares rxx = 0,79?
2·𝑟𝑥𝑥
𝑅𝑥𝑥 = fórmula de Spearman-Brown
1+𝑟𝑥𝑥
Rxx = coeficiente de fiabilidad del test
Se realiza una corrección al alza. Al correlacionar dos mitades se ha acortado
artificialmente el ancho de variación de las dos cosas que se han correlacionado,
por lo que se está subestimando el valor final.
rxx se calcula mediante el coeficiente de correlación de Pearson entre las mitades
2 · 0,79 1,58
𝑅𝑥𝑥 = = = 0,88
1 + 0,79 1,79
Ejemplo 8. Alfa de Cronbach: En un test compuesto por 8 ítems, la suma de las varianzas individuales
del conjunto de ítems fue 16. Si la varianza del test vale 54, ¿cuánto vale el coeficiente de Cronbach?
Examen Febrero 2015
n = número de ítems
∑ 𝑆𝑗2 = sumatorio de las varianzas de los ítems
𝑆𝑥2 = varianza de la puntuación total en el test
8 16 8
α= (1 − ) = (1 − 0,29) = 1,14 · 0,703 = 0,804
8−1 54 7
Cuanto más longitud tiene el instrumento (ítems forman parte del instrumento) es más probable que
sea más fiable.
𝑅𝑥𝑥 (1 − 𝑟𝑥𝑥 )
𝑛=
𝑟𝑥𝑥 (1 − 𝑅𝑥𝑥 )
𝑛º í𝑡𝑒𝑚𝑠 𝑓𝑖𝑛𝑎𝑙𝑒𝑠
2,25 = El test se ha alargado 2,25 veces
25
Ejemplo 10. Fiabilidad y longitud. Dada una prueba que consta de 30 ítems, cuya fiabilidad es rxx =
0,93, ¿cómo repercutiría en la fiabilidad de la misma un aumento de 10 nuevos ítems paralelos a los
originales? (página 160 del libro de Estadística de 1º curso)
𝑛𝑟𝑥𝑥´
𝑅𝑥𝑥´ = con:
1+(𝑛−1)𝑟𝑥𝑥´
𝑛º í𝑡𝑒𝑚𝑠 𝑓𝑖𝑛𝑎𝑙𝑒𝑠 30 + 10
𝑛= = = 1,33
𝑛º í𝑡𝑒𝑚𝑠 𝑖𝑛𝑖𝑐𝑖𝑎𝑙𝑒𝑠 30
1,33 · 0,93 1,24 1,24
𝑅𝑥𝑥 = = = = 0,948
1 + (1,33 − 1) · 0,93 1 + 0,33 · 0,93 1 + 0,31
TCT – Validez
“La fiabilidad de un instrumento es condición necesaria pero no suficiente para una valoración
positiva de éste; necesita el concurso de la validez para completar dicha valoración”
Tabla de especificación
(se estudia en el tema 4)
Si las dos medidas se toman en el mismo periodo temporal se habla de validez concurrente del
instrumento con respecto al criterio
Si la medida del criterio se toma con posterioridad a nuestro instrumento, hablamos de validez
predictiva del instrumento con respecto al criterio.
Ejemplo 12. ¿Validez del test? ¿Índice de validez del ítem I? Examen Septiembre 2016
N → número de sujetos = 4 𝑁 ∑ 𝑥𝑦 − ∑ 𝑥 ∑ 𝑦
X Y
𝑟=
√[𝑁 ∑ 𝑥 2 − (∑ 𝑥 )2 ][𝑁 ∑ 𝑦 2 − (∑ 𝑦)2 ]
Ítems
Sujetos 1 2 3 4 Criterio X Y X·Y X2 Y2
A 1 0 1 1 4 3 4 12 9 16
B 0 1 1 0 2 2 2 4 4 4
C 0 1 1 1 4 3 4 12 9 16
D 1 0 0 0 1 1 1 1 1 1
∑X = 9 ∑ Y = 11 ∑ X · Y = 29 ∑ X 2 = 23 ∑ Y 2 = 37
X Y
Ítems
Sujetos 1 2 3 4 Criterio X Y X·Y X2 Y2
A 1 0 1 1 4 1 4 4 1 16
B 0 1 1 0 2 0 2 0 0 4
C 0 1 1 1 4 0 4 0 0 16
D 1 0 0 0 1 1 1 1 1 1
∑X = 2 ∑ Y = 11 ∑X · Y = 5 ∑ X2 = 2 ∑ Y 2 = 37
(4 · 5) − (2 · 11) 20 − 22 −2 −2 −2
r= = = = = = −0,192
√[(4 · 2) − 22 ] · [(4 · 37) − 112 ] √[8 − 4] · [148 − 121] √4 · 27 √108 10,39
TCT – Dimensionalidad
La dimensionalidad hace referencia a si
lo que mide el test se concreta en una o más
dimensiones. Es decir, si lo medido es
unidimensional o multidimensional.
𝑅𝑥𝑦 =
𝑟𝑥𝑦 √𝑛
√1 + (𝑛 − 1)𝑟𝑥𝑥´
“La Teoría de Respuesta al Ítem (TRI) intenta brindar una fundamentación probabilística al problema
de medir constructos latentes (no observables) y considera al ítem como unidad básica de medición (…)
(…) La puntuación de una prueba en el modelo clásico (TC) estima el nivel de un atributo (aptitud,
rasgo de personalidad, interés, etc…) como la sumatoria de respuestas a ítems individuales, mientras que la
TRI se centra exclusivamente en el ítem”
En la TRI se supone que cada ítem es capaz de medir por sí solo el rasgo.
Teoría Clásica de los Test (TCT) vs. Teoría de Respuesta al Ítem (TRI)
Tanto la TCT como la TRI abordan el mismo problema: tratar de calcular el error cometido al medir
variables de naturaleza psicopedagógica, pero…
Apuntes de Marcos Román 11
Técnicas e instrumentos para la recogida de información - Pedagogía - UNED - 2019/2020 Tema 2
TCT TRI
• Puntaje Verdadero (V) • Aptitud (θ) (nivel de aptitud del sujeto en un
• Lineal → X = V + e constructo/rasgo que está midiendo un ítem)
• Las características métricas • Exponencial
(fiabilidad y validez) son del test • Las características métricas son de cada ítem,
en su conjunto, y están referidas y son invariantes a la muestra elegida. Basta
al grupo normativo comprobar el ajuste al modelo con una
• A posteriori muestra grande (n>300). (Sí el ítem no se
ajusta es que éste no funciona)
• A priori.
→100%
Probabilidad de acertar el ítem
• Función exponencial.
• θ → Está en unidades típicas, es
→50% decir, en teoría va desde -∞ a +∞,
pero realmente está entre -3 y +3.
• θ = 0 → es aptitud media.
• P(θ) está expresada en tanto por 1
𝑒 𝐷(𝜃−𝑏)
𝑃(𝜃) =
1+𝑒 𝐷(𝜃−𝑏)
b=0
P(θ): Probabilidad de acertar el ítem. b=1
θ: Nivel de habilidad del sujeto.
b: Índice de dificultad del ítem.
e: Base de los logaritmos neperianos (2,718)
D: Constante (D = 1,7)
Pueden haber curvas más a la derecha → b = 1 → el ítem sería más difícil porque hay que tener más
aptitud para tener una probabilidad de acierto del 50%.
Ejercicio 1. Supuesto un modelo TRI de Rasch de un solo parámetro, y dado un ítem con b=0. ¿Cuál
es la probabilidad de acertar dicho ítem para un sujeto con una aptitud θ = -1? ¿Y con θ = 0? ¿Y con θ = 2?
[Tomamos D=1,7]
0,96
𝑒 𝐷(𝜃−𝑏)
𝑃(𝜃) = 0,5
1 + 𝑒 𝐷(𝜃−𝑏)
0,154
𝑒 1,7·(0−0) 𝑒 1,7·0 𝑒0 1 1
𝑃(0) = 1,7·(0−0)
= 1,7·0
= 0
= = = 0,5
1+𝑒 1+𝑒 1+𝑒 1+1 2
θ=2→
𝑒 1,7·(2−0) 𝑒 1,7·2 𝑒 3,4 29,96 29,96
𝑃(2) = = 1,7·2
= 3,4
= = = 0,96
1 + 𝑒 1,7·(2−0) 1 + 𝑒 1+𝑒 1 + 29,96 30,96
θ = -1 →
𝑒 1,7·(−1−0) 𝑒 1,7·(−1) 𝑒 −1,7 0,18 0,18
𝑃(−1) = = = −1,7
= = = 0,154
1 + 𝑒 1,7·(−1−0) 1 + 𝑒 1,7·(−1) 1 + 𝑒 1 + 0,18 1,18
Ítem 1
b2 > b1 → El ítem 2 tiene mayor
Ítem 2
índice de dificultad
b1 ≈ – 0,75 b2 ≈ + 1
Cuando observamos a un sujeto con mayor aptitud (por ejemplo con 1,5) en la gráfica de la izquierda
su probabilidad de acierto del ítem aumenta muy poco, sin embargo, en la gráfica de la derecha aumenta
tanto que se aproxima bastante a 1, ya que la pendiente de la curva es más pronunciada, y por lo tanto el
ítem de la gráfica de la derecha discrimina más que el ítem de la gráfica de la izquierda.
Ejercicio 3. Supuesto un modelo TRI de Rasch de dos parámetros. Para un sujeto con un nivel de
aptitud θ = 1 ¿Cuál es la probabilidad de acertar el ítem de la izquierda? ¿Y el ítem de la derecha?
[Tomamos D=1,7]
𝑒 𝐷𝑎(𝜃−𝑏)
𝑃(𝜃) =
1 + 𝑒 𝐷𝑎(𝜃−𝑏)
Izquierda:
Derecha:
Ejercicio 4. ¿Cuál de los tres ítems cuyas CCI se representan tiene una mayor probabilidad de ser
acertado por azar?
cÍtem 3 ≈ 0
cÍtem 2 ≈ 0,18
cÍtem 1 = 0,40
Ítem 1
El ítem 1 es el que tiene una mayor
probabilidad de acierto por azar. Ítem 2
Ítem 3
–∞ θ
Ejercicio 5. Supuesto un modelo TRI de tres parámetros. Dado un sujeto con un nivel de aptitud θ=0,
¿cuál es su probabilidad de acertar un ítem si a=1,5; b=0,5; y c=0,1? ¿y si “c” se eleva hasta c=0,3?
[Tomamos D=1,7]
(1 − 𝑐)𝑒 𝐷𝑎(𝜃−𝑏)
𝑃(𝜃) = 𝑐 +
1 + 𝑒 𝐷𝑎(𝜃−𝑏)
c = 0,1
1
P(θ) 0,5
0,1
θ=0 b =0,5
c = 0,3
Aplicaciones de la TRI
Tema 3 La observación
Objetivos
La observación
Uno de los actos innatos del ser humano es la observación, de esta manera
construye el conocimiento de su entorno.
Mientras que la mayoría de las variables del dominio cognitivo se miden a través de pruebas; las
variables que mejor se prestan a la observación como técnica de medida son…
Tipos de observación
Unidades de observación
Las unidades de observación son el conjunto de eventos de conducta que se pueden adoptar a la hora
de realizar un proceso de observación…
Molares (Global)
Unidades de medida
A continuación se presentan un conjunto de posibles medidas que se pueden extraer de un registro
observacional…
Registro anecdótico
Sistema de rasgos
Sistema de categorias
Codificación
El proceso de observar
c1 c2 c3 c3 ni.
c1 0 1 2 0 3
c2 4 2 3 1 10
c3 2 0 4 2 8
c4 1 2 0 3 6
n.i 7 5 9 6 27
Donde ni. y n.i son las observaciones marginales por cada categoría.
1 9 1 0,33 − 0,24
𝑃𝑜 = · (0 + 2 + 4 + 3) = = 0,33; 𝑃𝑒 = 2 · (3 · 7 + 5 · 10 + 8 · 9 + 6 · 6) = 0,24; 𝜋 = = 0,12
27 27 27 1 − 0,24
Ejemplo 2: Complete la tabla, calcule el coeficiente Kappa (π) e interprételo (Examen Septiembre
2013)
c1 = agresivo c2 = asertivo
c3 = pasivo c4 = tímido
Observador 1 Observador 2
Sujeto 1 c1 c3
Sujeto 2 c4 c4
… … …
Sujeto 18 c3 c3
Observador 2
Los acuerdos entre los dos
c1 c2 c3 c4 ni.
observadores se
Observador 1
c1 1 3 0 0 4 encuentran en la diagonal.
c2 2 3 0 0 5 Cuantos más casos se
c3 1 0 2 1 4 encuentren en la diagonal
c4 1 2 0 2 5 es mayor el acuerdo.
n.i 5 8 2 3 18
Sumatorio de los
N → Número de sujetos
valores en la diagonal
Sumatorio de los
P0 → Proporción de acuerdos observados.
productos marginales
Pe → Proporción de acuerdos esperables por azar.
1+3+2+2 8
𝑃𝑜 = = = 0,44̂
18 18
(5 · 4) + (8 · 5) + (2 · 4) + (3 · 5) 20 + 40 + 8 + 15 83
𝑃𝑒 = 2
= = = 0,25
18 324 324
0,44 − 0,25 0,19
𝜋= = = 0,253
1 − 0,25 0,75
c1 c2 c3 c4
[1,] 3 4 3 2 12
[2,] 4 1 4 1 10
[3,] 0 2 0 2 4
[4,] 4 0 2 1 7
11 7 9 6 33
3+1+0+1 5
𝑃𝑜 = = = 0,151
33 33
(11 · 12) + (7 · 10) + (9 · 4) + (6 · 7) 132 + 70 + 36 + 42 280
𝑃𝑒 = 2
= = = 0,257
33 1089 1089
0,151 − 0,257 −0,106
𝜋= = = −0,142
1 − 0,257 0,743
Ejemplo 4: Un observador, a partir de una grabación de vídeo, ordena a 8 sujetos de una clase de
más a menos agresivo tras una primera observación A; y vuelve a hacerlo tras una segunda observación B
¿Cuál es la fiabilidad entre observaciones (intra-observador)?
Calculamos la correlación entre las dos columnas. Con el coeficiente de correlación ordinal de
Spearman (rs)
Siendo:
D = diferencia de rangos o posiciones que ocupa un mismo sujeto en dos observaciones distintas.
D D2
-2 4
0 0
-2 4
-1 1
2 4
0 0
0 0
3 9
2
∑ D = 22
6 · 22 132 132
𝑟𝑠 = 1 − 2
=1− =1− = 1 − 0,26 = 0,74
8 · (8 − 1) 8 · 63 504
Diagrama de dispersión
Análisis de datos
En el análisis de datos será necesario recoger la información de las unidades de medida con lo que se
pueden realizar una gran variedad de análisis cuantitativos. El tipo de análisis a utilizar depende en primera
instancia de los objetivos e hipótesis de investigación planteadas y en segundo lugar de las posibilidades
informativas de los datos registrados (sólo frecuencia, duración, secuencia de categorías, ...).
Objetivos
Los test están dirigidos a la medida de aptitudes, capacidades y/o habilidades. (Inteligencia, aptitud
visoespacial, aptitud numérica, razonamiento… Los test se pueden aplicar aunque no haya habido un
proceso de enseñanza-aprendizaje explícito. Las capacidades ya las posee el individuo y se aplica el test
para ver en qué medida se da una determinada capacidad).
Las pruebas objetivas están dirigidas a la medida de conocimientos. (Las pruebas se suelen aplicar
una vez se ha acometido un proceso de enseñanza-aprendizaje).
2. Test
Con el nombre de “test” se engloba todo un conjunto de instrumentos que se vienen utilizando en la
investigación educativa con la intención de recoger información sobre las aptitudes, capacidades y/o
habilidades de los sujetos.
Los test son reactivos, al sujeto se le presenta una serie de ítems, que son problemas o situaciones
problemáticas, y se pide al sujeto que reaccione ante ellos emitiendo una respuesta. Los ítems muchas
veces reciben el nombre de reactivos, ya que son el elemento de estímulo que provoca la respuesta en el
sujeto y a partir de esa respuesta se puede inferir el nivel que el sujeto tiene de esa capacidad que se está
midiendo.
3. Pruebas objetivas
Las pruebas objetivas están dirigidas a la medida de conocimientos.
Conocimiento
Comprensión
Aplicación
Total
Clasificación de Bloom
En el ámbito cognitivo…
Respecto a la longitud de la prueba debe tenerse en cuenta: la tabla de especificaciones, para que
estén representadas todas las celdas (p.e. 2 ítems por celda); el tiempo estimado de aplicación de la prueba
(p.e. 1 minuto por ítem); la fiabilidad estimada y deseada para la prueba.
Cuando hablamos de ‘longitud’ de una prueba, nos referimos al número de ítems que la forman. A
este respecto, una prueba debe contener como mínimo 1 ítem procedente de cada una de las celdas de la
tabla de especificación. De hecho, algunos autores elevan esta exigencia hasta 2 ítems por celda.
• Pruebas de velocidad: tienen un tiempo limitado, pensadas para que no se puedan realizar enteras.
Se mide no solo si se hacen los ítems sino la velocidad haciéndolos.
• Pruebas de potencia: sin límite de tiempo. Calcular la potencia máxima, rendimiento máximo del
sujeto.
Las características métricas deseadas marcarán finalmente el reparto de los ítems porque si la
prueba está orientada para un nivel de conocimientos se debe saber el nivel de dificultad de los ítems y la
discriminación de los mismos…
La construcción de los ítems se debe realizar por personas expertas en la temática y conocedoras de
la población diana. Se aconseja crear unas tres veces más de ítems que los necesarios y cuando menos el
25% más.
Reglas generales:
Confección de la prueba…:
LAS INSTRUCCIONES
Es importante el orden en que se incluyen las preguntas en la prueba, ya que la secuencia de los
ítems puede influir en el rendimiento del sujeto…
Pautas generales:
• Al inicio de la prueba: presentación solicitando colaboración del sujeto y dándole a conocer los
objetivos de la prueba.
• Los ítems se ordenan de fácil a difícil, de general a particular, de menos personales a más
personales (comprometidas).
• Los ítems se ordenan de forma lógica y se agrupan de manera temática para evitar el desconcierto
del sujeto.
• Los datos del sujeto que se tomen como variables de análisis (p.e. variables sociodemográficas) se
sitúan al final.
• Respecto del aspecto formal: evitar ítems cortados, gráficas deslocalizadas o con poca resolución
Colectiva (todos lo hacen a la vez, pero Prueba escrita o prueba Personal (el aplicador está
cada uno hace su prueba) o Individual en la web presente), por correo o por teléfono
La puntuación de la prueba habitualmente resulta de sumar las puntuaciones de todos los ítems. Si el
investigador desea ponderar algunos ítems, la suma será ponderada según estos valores.
En las pruebas cognitivas de elección múltiple se puede dar el caso que los sujetos contesten a los
ítems por azar → fórmula de corrección.
𝐸
𝑋=𝐴−
𝐾−1
A = aciertos
E = errores
K = alternativas
* Un sujeto con: Se pueden relacionar entre sí. Cuando lo que se está midiendo se
E.C.= 7 años distribuye de manera normal se pueden transformar las puntuaciones
E.M.= 9 años típicas en percentiles por las propiedades de la curva normal.
Decimos que tiene edad mental de 9 años porque su rendimiento en los test es igual o parecido al de
un sujeto típico/medio de 9 años de edad.
E.M. 9
P. C. = E.C.
x 100 = 7 x 100 → Se obtiene un cociente intelectual (C.I.). Ya no se utiliza.
** Porcentaje de sujetos que quedan por debajo de un determinado sujeto en el rendimiento de una
prueba. Por ejemplo, si un sujeto está en un percentil 70 quiere decir que su rendimiento en la prueba
supera o deja por debajo al 70% de sus compañeros/compañeras de la misma edad.
*** Quiere decir cuantas desviaciones típicas está el sujeto por encima o por debajo de la media de
su grupo de referencia. Si está en la media la puntuación típica es 0, si está por encima tiene puntuación
típica positiva y si está por debajo tiene puntuación típica negativa. Puntuaciones z.
Criterios Tipos
Método Psicométricos (Inteligencia/aptitud)
Proyectivos (Personalidad/motivación)
Finalidad Investigación
Diagnóstico
Área de comportamiento Rendimiento
Inteligencia y aptitudes
Personalidad, actitudes e intereses
Apuntes de Marcos Román 6
Técnicas e instrumentos para la recogida de información - Pedagogía - UNED - 2019/2020 Tema 4
Tipo Ejemplos
Rendimiento académico De cada materia, lectura, escritura, cálculo
Inteligencia Wais, Wisc, Factor G de Catell, Matrices progresivas de Raven
Aptitudes diferenciales Factor verbal, factor numérico, razonamiento abstracto, factor espacial,
razonamiento mecánico, rapidez y precisión perceptiva, memoria y atención.
Ejemplo: DAT
Aptitudes especiales Habilidad psicomotora, destreza manual, destreza digital, ritmo, velocidad,
artísticas, musicales, etc.
Personalidad Temperamento, carácter, ajuste, introversión-extroversión, autoconcepto.
Ejemplo: MMPI, EPI, 16PF de Catell, etc.
Proyectivos Psicodiagnóstico de Rorschach, test del árbol de Koch, grafología, etc.
Autoconcepto Tennessee Self-Concept Scale, etc.
Cuestionario de intereses Inventario de intereses profesionales
Valores Cuestionario de valores de Scott, test de reacción valorativa de V. García Hoz,
etc.
Sociométricos Basados en el sociograma introducido por Moreno
Creatividad Test de pensamiento divergente de Guilford, test de asociaciones remotas de
Mednick, etc.
[Link]
Datos
Grupo 𝑋ത = 20
𝑠=5
Sujeto 𝑋𝑖 = 30
30 − 20
𝑧𝑖 = = +2
5
El sujeto se está desviando dos desviaciones típicas por encima de la media.
z
-∞ 0 +∞
-3 +3
z = +2
La tabla nos indica para cada z el porcentaje, expresado en tanto por 1, que queda por debajo.
Segundo
decimal de la
puntuación
típica
𝑃(𝑧≤2) = 0,9772
Datos
Grupo 𝑋ത = 22,4
𝑠 = 4,2
Sujeto 𝑋𝑖 = 20
Observando estos datos podemos deducir que la puntuación típica va a ser negativa y el percentil va
a estar por debajo de 50
Se pide:
20 − 22,4
𝑧𝑖 = = −0,57
4,2
f) Calcular el percentil donde estaría la niña
La tabla solo recoge puntuaciones positivas por lo que debemos hacer una simetría.
1º buscamos la z = + 0,57
𝑃(𝑧≤0,57) = 0,7157
71,5% 28,5%
z
-∞ 0 +∞
-3 +3
z = +0,57
28,5% 71,5%
z
-∞ 0 +∞
-3 +3
z = -0,57
Pc = 28
Pasar una z a una escala que siempre tenga un valor positivo y entero.
Escala t:
𝑡 = 50 + 10𝑧
𝑡 = 50 + 10 · (−0,57) = 44,28
18. Has aplicado una prueba estandarizada de rendimiento lector a los/as 80 alumnos/as de 6º de
Primaria de tu colegio. En el manual de la prueba aparece que ésta ha sido baremada a nivel nacional con
una muestra suficiente y representativa de sujetos de 6º Primaria. Dice el manual que la puntuación en la
prueba, que puede variar entre 0 y 100 puntos, se distribuyó normalmente en la muestra nacional de
baremación; con una media de 50 puntos y una desviación típica de 16 puntos. Ahora quieres seleccionar a
un subgrupo de tus alumnos/as de 6º de Primaria, de rendimiento lector excelente, bajo la condición de
que estén en un percentil 85 o superior (tomando la muestra nacional como referencia).
¿Qué puntuación típica (z) en la prueba debe tener como mínimo un alumno de tu centro para ser
seleccionado?
a. 0,68
b. 0,82
c. 1,04
Para ser seleccionado, un sujeto debe tener al menos una puntuación típica en la prueba z=1,04. Tal y
como puede verse en la tabla de la curva normal, dicha puntuación típica deja por debajo de sí al 85,08% de
los sujetos; lo cual se corresponde al percentil 85.
19. Siguiendo con los mismos datos, ¿qué puntuación directa en la prueba debe tener como mínimo
un/a alumno/a para ser seleccionado?
a. 55,5
b. 66,6
c. 77,7
Para ser seleccionado, un sujeto debe tener como mínimo una puntuación directa en la prueba Xi =
66,6. Se detalla a continuación:
𝑋𝑖 − 𝑋ത
𝑧𝑖 =
𝑠
𝑋𝑖 − 50
1,04 =
16
𝑋𝑖 = (1,04 · 16) + 50 = 66,6
20. Siguiendo con los mismos datos, y bajo el supuesto de que el rendimiento lector de tus
alumnos/as sea análogo al de la muestra nacional de referencia, ¿cuántos de los estudiantes de 6º
Primaria de tu centro serán seleccionados para el subgrupo de rendimiento excelente?
a. 8
b. 10
c. 12
Objetivos
Ventajas: Inconvenientes:
• Información de (casi) cualquier • No analiza en profundidad temas
población. complejos (se suele complementar
• Información sobre hechos con la técnica de entrevista).
pasados.
• Gran capacidad para estandarizar
datos.
• Relativamente barata.
2. Tipos de encuestas
Tipo de encuestas
Por la forma de Por su Por su naturaleza Por sus fines
Por su finalidad
realizarse contenido temporal científicos
Cara a cara Hechos Transversales (una vez Exploratorias Político-sociales
Postal Opiniones en un momento dado) Descriptivas Comerciales
Telefónica Actitudes Longitudinales (ver la Explicativas Fines específicos
Ordenador evolución en varios Predictivas
On-line momentos temporales) Evaluativas
Ventajas: Inconvenientes:
• Mayor índice de respuesta. • Coste elevado en dinero y tiempo.
• Son fiables, evitan influencias de • Posible influencia del entrevistador.
terceras personas. • Se deben controlar los datos de los
• Respuestas menos evasivas e entrevistadores para evitar
inconcretas. falseamiento.
• Permiten la utilización de
materiales auxiliares.
• Pueden obtenerse datos
secundarios del entrevistado.
Ventajas: Inconvenientes:
• Se puede obtener información con • Falta de representatividad muestral,
mayor rapidez. pues deben tener teléfono.
• Coste más reducido que la • Brevedad obligada de la encuesta
‘encuesta personal’ (máximo15 minutos).
• Permite acceder a personas más • No se puede utilizar material
ocupadas. auxiliar (fotografías, bocetos…)
• El índice de respuesta suele ser
bastante elevado (aunque en los
últimos años ha descendido por la
presión del telemarketing)
Ventajas: Inconvenientes:
• Coste aún más reducido que la • Baja tasa de respuesta (10 20%).
‘encuesta telefónica’. Conviene incentivarla con premios.
• Sistema flexible para el • La identidad del encuestado es una
encuestado, que elige en qué variable incontrolada.
momento responder (respuestas • Debe contarse con un directorio postal
más meditadas). completo.
• Se evitan sesgos procedentes del • Se obtiene poca cantidad de información.
entrevistador. • Problemas con la representatividad de la
muestra respondiente.
Apuntes de Marcos Román 2
Técnicas e instrumentos para la recogida de información - Pedagogía - UNED - 2019/2020 Tema 5
Se ha comprobado que más del 75% de encuestados on-line que contestan, lo hacen
en las primeras 48 horas tras la recepción del ‘link’.
• Error de medida → derivado de que las respuestas no sean fiables → este error se recude en las
encuestas on-line por la ausencia del sesgo del entrevistador.
• Error de no-cobertura → en este caso, derivado de que no toda la población tiene acceso a
Internet.
• Error de muestreo → derivado de no enviar el cuestionario on-line a una muestra suficiente y
representativa de la población que se desea encuestar.
• Error de no-respuesta → derivado de que haya un sesgo sistemático del tipo de sujetos que no
llegan a contestar el cuestionario on-line.
VERSATILIDAD
•La ‘encuesta personal’ es la más versátil.
TIEMPO
•La ‘encuesta telefónica’ es la más rápida. (on-line)
COSTE
•La ‘encuesta postal’ es la más económica. (on-line)
PRECISIÓN
•La ‘encuesta personal’ es la más precisa porque es la que permite ejercer mayor control
sobre la identidad del entrevistado y asegurar su cooperación.
Selección de la muestra
La calidad de una investigación mediante encuesta viene determinada en gran medida por lo
acertado que sea el diseño de las preguntas del cuestionario.
Por tanto, el elemento básico del cuestionario son las preguntas. Es por ello que la bondad de un
cuestionario depende de la clase de preguntas empleadas en él y de su adecuada formulación.
Según la contestación
Preguntas abiertas
que admitan
Preguntas semi-
abiertas
De respuesta
Dicotómicas
espontánea
Preguntas cerradas
De respuesta
De respuesta sugerida
categorizada
De valoración
Por tanto, el elemento básico del cuestionario son las preguntas. Es por ello que la bondad de un
cuestionario depende de la clase de preguntas empleadas en él y de su adecuada formulación.
De introducción o
de contacto Identificación
Según su función en el
Según su contenido
De filtro Acción
cuestionario
Intención
De control
Opinión
Baterías o "embudo
de preguntas" Información
Amortiguadoras Motivos
Las preguntas de filtro se realizan para establecer si a un determinado encuestado le afectan o no las
preguntas posteriores y, por tanto, si el encuestador se las debe o no formular. En definitiva, las preguntas
de filtro establecen puntos de bifurcación en la realización del cuestionario.
Las preguntas de control se utilizan para comprobar la veracidad de las respuestas de los
encuestados. Para ello, lo que se suele hacer es colocar la misma pregunta, pero redactada de forma
Apuntes de Marcos Román 6
Técnicas e instrumentos para la recogida de información - Pedagogía - UNED - 2019/2020 Tema 5
distinta en distintas partes del cuestionario. Si las respuestas a ambas son contradictorias, entonces la
sinceridad del encuestado queda bajo sospecha, y sus respuestas deberían ser excluidas del posterior
análisis.
Batería: todas las preguntas tratan sobre un mismo tema. Siempre deben ir juntas en el cuestionario
en forma de batería, empezando por las más sencillas y luego las más complejas.
Amortiguadoras: se refiere a que cuando estamos preguntando temas escabrosos o pensamos que
serán reticentes a contestar, hay que preguntar suavizando la pregunta y no preguntar de modo brusco y
directo.
Hay que tener también especial cuidado en el orden en que se incluyen las preguntas en el
cuestionario, ya que el modo en el que se secuencian las preguntas puede influir en la naturaleza de las
respuestas del encuestado y, por consiguiente, sesgarlas.
La finalidad de la codificación es facilitar la operación de contar y analizar las respuestas dadas por la
muestra que ha sido encuestada.
Un cuestionario bien codificado debe contener la información exacta con respeto a las variables. Por
tanto, la codificación permite saber, una vez recogidos los datos, el número total de variables a analizar y su
ubicación exacta en la matriz de datos. La matriz de datos viene determinada por N sujetos (filas) * P
variables (columnas)
Validez Fiabilidad
(ausencia de error sistemático) (ausencia de error aleatorio)
De De Factorial Longitud Muestra
contenido criterio
Muestreo aleatorio
•Se basa en el principio de la elección de los individuos al azar.
•Cada elemento de la población tiene probabilidad de ser elegido como parte de la muestra.
•Garantiza mejor la representatividad de la muestra respecto de la población.
Muestreo empírico
•La selección de la muestra se realiza a partir de los criterios o necesidades fijados por el propio
encuestador.
•Tiene riesgo de que no haya representatividad de la muestra respecto de la población.
Una vez elegido el tipo de muestreo, es necesario determinar el tamaño de la muestra necesario
para que nuestras estimaciones sobre la población sean suficientemente precisas.
Ejemplo 4
𝑧2 · 𝑝 · 𝑞
Tamaño de la muestra para población infinita → 𝑛 =
𝑒2
n=?
Interpretación (ejemplo):
En este caso podríamos decir con el 95% de confianza que entre 68% – 74% del conjunto de la
población catalana está a favor de la independencia.
Ejemplo 2
(𝑧 2 · 𝑝 · 𝑞 · 𝑁)
Tamaño de la muestra para poblaciones finitas → 𝑛 =
𝑒 2 (𝑁−1) +(𝑧 2 · 𝑝 · 𝑞)
Ejemplo 1
(𝑧 2 · 𝑝 · 𝑞 · 𝑁)
Tamaño de la muestra para poblaciones finitas → 𝑛 =
𝑒 2 (𝑁−1) +(𝑧 2 · 𝑝 · 𝑞)
Ejemplo 3
(𝑧 2 · 𝑝 · 𝑞 · 𝑁)
Tamaño de la muestra para poblaciones finitas → 𝑛 =
𝐸 2 (𝑁−1) +(𝑧 2 · 𝑝 · 𝑞)
La información que se incluye en el informe ha de ser muy clara, incluyéndose únicamente aquella
que sea relevante para la audiencia destinataria del mismo, y para las decisiones que haya que tomar
posteriormente.
IINFORMES TÉCNICOS
vs.
INFORMES DIVULGATIVOS
Portada
Índice de contenidos
Introducción
•Fundamentación teórica
•Antecedentes
•Pregunta de investigación
Metodología
•Participantes
•Materiales e instrumentos
•Procedimiento
Resultados
Discusión
Conclusiones
Implicaciones y Recomendaciones
Referencias
Anexos
[Link] [Link]
[Link]
4.7. Conclusiones
5. Un ejemplo de encuesta
Tema 6 La entrevista
Objetivos
1. Introducción
La entrevista es una conversación verbal entre dos o más personas con
una finalidad.
2. Características de la entrevista
La entrevista como técnica de investigación es considerada como una de las
formas de los métodos de encuesta.
3. Fases de la entrevista
La entrevista se puede dividir en varias fases…
Registro y
Producción Realización Informe
montado
4. Tipos de entrevista
Entrevista
individual
Entrevista
grupal
(Tema 9)
Ventajas: Inconvenientes:
• Facilita la elaboración de • Los entrevistados se pueden molestar
informes. por la rigidez de la entrevista.
• Fácil de administrar y valorar. • Alto coste en la preparación de la
• Evaluación objetiva. entrevista.
• Se necesita poco • Se reduce la posibilidad de respuestas
entrenamiento del espontáneas o de abrir líneas
entrevistador. adicionales de investigación.
• El alto nivel de estructuración acota el
campo de posibles aplicaciones.
Ventajas: Inconvenientes:
• El entrevistador tiene mayor • El entrevistador puede introducir sus
flexibilidad al poder realizar la sesgos en las contestaciones debido a la
pregunta que crea oportuna no acotación.
en cada momento. • Puede introducirse información extraña
• El entrevistador puede que genere “ruido”.
explorar áreas que surjan • El análisis e interpretación de los
sobre la marcha. resultados resulta más laborioso.
• Puede producir información • Alarga el tiempo de tratamiento de los
de temas que a priori se datos, al tener que separar “grano” y
consideraron irrelevantes. “paja”.
5. Análisis de datos
Tanto en la entrevista estructurada como la no estructurada, si se quiere realizar un análisis estadístico
de datos, se necesita previamente la categorización de los mismos.
EJEMPLO
[Link]
Objetivos
1. Las escalas
El término ‘escala’ tiene un significado diverso…
Las escalas son una serie de indicadores a partir del cual el sujeto indica en qué grado o frecuencia está
de acuerdo con un determinado enunciado. Se distingue de las listas de control, que se utilizan mucho en
evaluación en infantil y primaria, en que estas últimas lo que determinan es sólo la presencia o ausencia del
rasgo, característica o conducta, ya que en las escalas hay graduación o gradación, y éstas determinan el
grado o frecuencia o el nivel de intensidad en la cual se da una determinada circunstancia o en la cual un
sujeto indica en qué grado un enunciado se puede aplicar a sí mismo.
Las escalas se utilizan para determinar el grado o frecuencia con que se da una característica, rasgo
o conducta. Por lo general, una escala consta de una serie de ítems y un conjunto de categorías que
representan el grado de variación de la característica, rasgo o conducta que representa el ítem.
Categorías
“Tolerancia con los compañeros”
Nº INDICADORES TA PA NA/ND PD TD
01 Pienso que siempre tengo la razón
02 Me gusta participar en debates
03 Facilito el diálogo cuando hay opiniones diferentes
04 Considero que normalmente mi opinión es la más correcta
05 Me molesta cuando alguien piensa distinto a mí TA: Totalmente de acuerdo
06 Me desagrada que otros tengan la razón PA: Parcialmente de acuerdo
07 Escucho con atención la opinión de otros
Ítems
Los “métodos centrados en los sujetos” estudian las diferencias individuales en las actitudes que se
producen en los sujetos ante determinados estímulos (un ejemplo dentro de este tipo de métodos son las
escalas de Likert). Los “métodos centrados en los estímulos” miden y ordenan los diferentes estímulos u
objetos propuestos (un ejemplo dentro de este tipo de métodos son las escalas de Thurstone). Los “métodos
centrados en las respuestas” escalan conjuntamente a los sujetos y a los estímulos, es decir, escalan las
respuestas (un ejemplo dentro de este tipo de métodos son las escalas de Guttman).
2. Escalas de estimación
Cuando la escala se aplica en el contexto de la observación, se la conoce por el nombre de escala de
estimación ('rating scales'); a través de la cual el observador aprecia el grado en que una característica o
conducta se da en el sujeto observado.
¡Ojo! Con el 'efecto halo'... Una sola característica del sujeto que se está valorando (observando)
arrastra la valoración de todas las demás características. Ej. Considerar como inteligente a un alumno que
tiene buena presencia.
Efecto Halo
“Sesgo cognitivo que nos lleva a valorar a las
personas generalizando en ellas un rasgo que nos
parece particularmente positivo o negativo”
Edward L. Thorndike
...y con el efecto 'tendencia central' Marcar siempre las categorías centrales, es decir, la predisposición
del investigador a una valoración central. Ej. Marcar siempre “A veces”
3. Escalas de actitudes
Actitud = se refiere a la predisposición para actuar de una cierta forma o
manera, en contra o a favor, respecto a un objeto (p.e. 'actitud ante el alcohol').
Algunos autores distinguen tres componentes (dimensiones) de la actitud:
cognitivo, afectivo y conductual. (p.e. Cognitiva: ‘el consumo de alcohol afecta al
hígado’ (este ítem se refiere a los conocimientos que posee el sujeto sobre el
objeto que se está valorando); Afectiva: ‘cuando veo a alguien borracho me da
asco’ (parte de la actitud que tiene que ver con los sentimientos o afectos);
Conductual: ‘solo pruebo el alcohol en Navidad’ (tiene que ver con la conducta del
sujeto hacia el objeto). Las escalas de actitudes en general tienen que tener ítems
que recojan estas tres dimensiones.
Las escalas de actitudes (o de opinión), intentan medir la actitud de los sujetos a través de la valoración
que cada sujeto asigna a cada ítem que compone la escala. No hay respuestas correctas e incorrectas.
Tradicionalmente se suelen distinguir tres tipos de escala de actitud: sumativas (Likert), diferenciales
(Thurstone), y acumulativas (Guttman).
En primer lugar, se debe estudiar la dimensión de la actitud a medir y las conductas relacionadas con
la misma. De este proceso se recogerán un conjunto de ítems, mayor que los que compondrán la escala final.
El número de ítems elegido permitirá cubrir todo el rango de conductas que refleja la actitud de estudio.
Definir que se quiere medir/evaluar para hacer una tabla de especificación para que los ítems recojan
todo lo que se pretende medir con la escala.
Libros
Prensa ‘Compro el periódico
todos los días’
Cómics ‘Cuando veo una viñeta me
pongo de buen humor’
Consejos:
• La redacción del ítem provoca la emisión de juicio por parte del sujeto, sin inducirle.
• El orden de presentación de las preguntas debe ser aleatorio para no provocar sesgos por la
presencia de rachas de preguntas que reflejen actitudes favorables seguidas de rachas de preguntas
que reflejen actitudes desfavorables.
Para evitar el efecto de aquiescencia, el sujeto empieza contestando una determinada categoría en
un ítem y continúa contestando al resto de ítems con la misma categoría indistintamente, hay que
poner ítems en sentido directo (redactados en sentido favorable a la actitud que se está midiendo)
e ítems en sentido inverso.
P.e. Actitud hacia la lectura:
1. Tengo muchos libros en casa. 1 2 3 4 5 → (está a favor de la lectura)
Para evitar que todos los ítems estén redactados en este sentido y evitar que los sujetos continúen
contestando 4 o 5, se debe alternar, de forma aleatoria, ítems que vayan al revés, enunciados en
sentido inverso (evitar las rachas de preguntas que reflejen actitudes solo favorables):
2. Odio los cómics. 1 2 3 4 5
Estos ítems inversos se deben puntuar al revés a la hora de hacer la suma total, se deben recodificar
en espejo: 1 → 5; 2 → 4; 3 se queda igual; 4 → 2 y 5 → 1.
• Se administrará este conjunto inicial de ítems a una muestra piloto de individuos, para desechar
ítems mal formulados o de baja discriminación en la escala.
Por ejemplo: A continuación encontrarás una serie de afirmaciones acerca del consumo diario de café
con leche en el desayuno. Por favor, indica en qué grado estás de acuerdo con cada afirmación...
Versión de 5 puntos…
(menos habitual)
(más habitual)
Versión de 7 puntos…
Versión gráfica
Para estudiar el poder discriminatorio de cada ítem en la escala, Likert propuso dos procedimientos:
• Grado o índice de homogeneidad (IH) del ítem = coeficiente de correlación entre las puntuaciones
de los sujetos en el ítem y en el total de la escala (descontando el ítem). Los ítems con IH < 0,2 se
desechan.
• Grado de discriminación del ítem = Likert propone estudiar si hay diferencias significativas en la
puntuación al ítem, comparando el 25% superior y el 25% inferior de los sujetos en el total de la
escala.
Para este fin se aconseja obtener las puntuaciones tipificadas o normalizadas (z), para entonces
calcular el porcentaje de personas cuya puntuación es inferior a un determinado z (percentil)
• Fiabilidad: método de las dos mitades con la correlación de Spearman-Brown o Alfa de Cronbach.
• Validez: validez de constructo, factorial, predictiva...
Ítem 1 Ítem 2 Ítem 3 Ítem 4 → si fuera inverso habría que recodificar las Ítem 5
puntuaciones
Sujeto 1 4 3 5 6→2 4
Sujeto 2 3 4 7 7→1 2
Sujeto 3 4 3 6 6→2 1
Sujeto 4 4 3 7 5→3 2
Sujeto 5 2 4 8 7→1 1
No entra
Apuntes de Marcos Román 6
Técnicas e instrumentos para la recogida de información - Pedagogía - UNED - 2019/2020 Tema 7
Escalas centradas en los estímulos, es decir, son los estímulos los que están graduados. Hay ítems más
o menos intensos con respecto a aquello que se está valorando.
Las escalas son más difíciles de construir, es decir, construir ítems que estén graduados en intensidad,
pero son más fáciles de contestar por parte de los sujetos.
Clasificación de los ítems en categorías: Prueba de jueces (≈ 200) → (≈ 20). Se pide a cada juez que
valore los 100 ítems y los clasifique en qué punto del 1 al 11 sitúa cada ítem según su opinión.
•Ordenación de los enunciados en un continuo de 11 niveles, desde el nivel de actitud más desfavorable
(1) al de actitud más favorable (11), pasando por la actitud neutra (6)
No entra
EJEMPLO 5 – Página 235 del Libro - ¿Criterio de Ambigüedad del ítem?
𝑛
−𝑁𝑖−1
4
𝑄1 = 𝑙𝑖−1 + · 𝑎𝑖 con Q1 cuartil primero
𝑛𝑖
Estas fórmulas no son necesarias para el examen ya que se facilitan directamente los datos del cuartil
1 y el cuartil 3.
C.A. = Q3 – Q1 → si hay mucho consenso, la diferencia entre los dos cuartiles es pequeña, las
puntuaciones están concentradas alrededor de un valor.
Q1 = 4,64
Q3 = 5,47
Por convenio, se considera que un conjunto de ítems constituye una escala de Guttman, si su coeficiente
de reproductividad es mayor que 0,90.
Escala imperfecta: se va a comprobar si esta escala se aproxima suficientemente a una escala perfecta
para afirmar que es una escala de Guttman
Ítems
Sujetos P. Escala
1 2 3 4 5
S1 1 1 1 1 0 4
S2 1 1 0 1 0 3
S3 1 1 1 0 1 4
S4 1 0 0 1 0 2
S5 1 0 0 0 1 2
S6 0 1 0 1 0 2
S7 1 1 1 1 1 5
S8 1 0 1 0 0 2
S9 0 0 0 0 1 1
P. Ítem 7 5 4 5 4
Coeficiente de reproductividad:
𝑛º 𝑑𝑒 𝑒𝑟𝑟𝑜𝑟𝑒𝑠 𝑛º 𝑑𝑒 𝑒𝑟𝑟𝑜𝑟𝑒𝑠
𝐶. 𝑅. = 1 − =1−
𝑛º 𝑑𝑒 𝑟𝑒𝑠𝑝𝑢𝑒𝑠𝑡𝑎𝑠 𝑛º 𝑑𝑒 𝑠𝑢𝑗𝑒𝑡𝑜𝑠 · 𝑛º 𝑑𝑒 í𝑡𝑒𝑚𝑠
Se ordenan los sujetos y los ítems, con la opción que presente menos errores, dando como resultado
la tabla:
Ítems
Sujetos P. Escala Errores
1 4 2 3 5
S7 1 1 1 1 1 5 -
S1 1 1 1 1 0 4 -
S3 1 0 →1 1 1 1 →0 4 2
S2 1 1 1 0 0 3 -
S4 1 1 0 0 0 2 -
S5 1 0 →1 0 0 1 →0 2 2
S6 0 →1 1 1 →0 0 0 2 2
S8 1 0 →1 0 1 →0 0 2 2
S9 0 →1 0 0 0 1 →0 1 2
P. Ítem 7 5 5 4 4 10
Teniendo en cuenta que el sujeto 3 obtuvo una puntuación de 4, para ajustarse al patrón (1,1,1,1,0),
en el ítem 4 debería haber puntuado 1 y en el ítem 5 debería haber puntuado 0, por lo tanto, cuenta con dos
errores.
10
𝐶. 𝑅. = 1 − = 0,77
9·5
Como 0,77 < 0,90 en este caso no es una escala de Guttman, se aparta demasiado.
Ejemplos de las mismas son las escalas de ortografía, de redacción, de dibujo y de composición…
…o más recientemente, las que hemos desarrollado para graduar el aprendizaje infantil de la
programación informática con Scratch
[Link]
Nivel 1
[Link]
Nivel 2
[Link]
Nivel 3
[Link]
5. Diferencial semántico
El diferencial semántico (o de Osgood) es un instrumento de recogida de información, a través del
cual se pretende conocer los significados connotativos, afectivos o subjetivos, que tienen los objetos,
fenómenos, hechos o situaciones para los sujetos.
Mediante este instrumento se pide a un sujeto que evalúe un ‘objeto’ en función de varios criterios,
cada uno de los cuales presentado como una pareja de adjetivos bipolares (bueno-malo, blanco-negro,
cálido-frío, etc.).
Se supone que las escalas tipo Osgood pueden tratarse estadísticamente como de intervalo.
Osgood comprobó que las personas tienden a valorar las cosas en función de los adjetivos que
utilizamos en el lenguaje.
Ejemplos…
El ‘objeto’ a medir deberá ser definido con precisión para evitar ambigüedades.
El estímulo u ‘objeto’ puede ser muy variado, incluyendo conceptos verbales (palabras) o no verbales
(imágenes, estímulos físicos).
Cada uno de los ‘objetos’ se evalúa mediante las escalas bipolares. Éstas representan una reacción de
tipo afectivo (subjetivo, connotativo) hacia el concepto. Las escalas bipolares se representan en un continuo,
dividido normalmente en 7 categorías, cuyos extremos son los adjetivos mencionados.
Una vez elaborado el diferencial semántico, su aplicación se suele hacer en cuadernillos, donde
aparecen los diferentes ‘objetos’ evaluados junto con sus escalas bipolares (1 ‘objeto’ por página del
cuadernillo). Se suele pedir a los sujetos que contesten de forma rápida, ya que se prima la espontaneidad
de la respuesta afectiva.
Normalmente, para la valoración de cada escala bipolar, el número más pequeño (1 ó -3) corresponde
a la categoría más próxima al adjetivo con connotaciones negativas; mientras que el número más grande
(7 ó +3) corresponde a la categoría más próxima al adjetivo con connotaciones positivas.
1) Se está construyendo una escala tipo Osgood y recoge datos de cuatro factores relativos a tres
conceptos:
Conceptos Factores
c1: Rioja f1: precio
c2: Valdepeñas f2: sabor
c3: Ribera del Duero f3: color
f4: embotellado
Calcular cuál es la distancia entre cada uno de los vinos, cuanto menor sea la distancia quiere decir que
son más parecidos entre sí y cuanto mayor sea la distancia quiere decir que son más diferentes.
Queremos saber cuál es la distancia entre cualquier pareja de vinos. También pueden preguntar entre
qué pareja está la distancia más pequeña.
Factores
f1 f2 f3 f4
Conceptos
c1 5 3 4 4
c2 2 5 4 5
c3 4 4 3 5
∑d2 = sumatorio de las diferencias de los dos objetos en cada uno de los factores al cuadrado
Si se calcularan todas las distancias D(c1, c2); D(c2, c3) y D(c1, c3) se podría ver en qué caso la distancia
es más pequeña y así ver cuales son los vinos más parecidos.
Objetivos
1. Pruebas criteriales
Un grupo de test que merecen una mención aparte por sus implicaciones educativas
es el de los test referidos al criterio o test de referencia criterial (TRC). Son test que están
pensados para ver si un sujeto domina o no un contenido o un conocimiento concreto. Se
suelen utilizar para certificar o acreditar a una persona en ese conocimiento. P.e: un test
para certificar que un sujeto puede ser piloto de aviones. Son pruebas de evaluación
conductual con ítems de ejecución conductual en situaciones reales.
Los TRC tienen su origen en un artículo de Robert Glaser (1963). Berk (1998) define
los test de referencia al criterio como “construidos para evaluar el nivel de ejecución de un sujeto con
respecto a un dominio de conductas bien definidas”. Indican si el sujeto es apto o no apto. Si es apto significa
que domina todas las conductas, no solo una parte.
Test clásicos o test •Intentan medir y escalar a las personas en función del grupo normativo
referidos a una de referencia
norma (TRN) •Responden a la pregunta “¿En qué percentil se encuentra el sujeto?”
Temas 2 y 4
Obligan a definir con mayor claridad y operatividad los objetivos o criterios de interés, en la línea de la
evaluación conductual.
Obligan a muestrear exhaustivamente los objetivos a evaluar (validez de contenido) y exigen sumo
cuidado al confeccionar los ítems: aparecen en consecuencia gran variedad de formatos de ítems.
Obligan a desarrollar técnicas para establecer adecuadamente los puntos de corte, para determinar
quién pasa y quién no pasa el TRC. El punto de corte debe establecerse en función del contenido, no
de las personas evaluadas.
Al centrarse operativamente en objetivos muy específicos, son muy útiles para detectar puntos fuertes
(dominio) y puntos débiles (deficiencias) de los estudiantes, en vez de simplemente analizar las
diferencias entre ellos; y así tomar decisiones de enseñanza.
Los test de nivel o de dominio determinan si el sujeto ha conseguido el nivel instructivo necesario
para promocionar de un curso a otro.
Los test de diagnóstico pretenden detectar la existencia de problemas relacionados con el aprendizaje,
aportando información sobre su origen y características.
“El conocimiento del dominio instruccional es crucial porque está relacionado con la validez de
contenido y constructo (…) por dominio de instrucción se entiende el conjunto de todos aquellos elementos
(objetivos, acciones, tareas…) que representan el propósito de la instrucción…
…las unidades que definen el dominio no deben solaparse y deben cubrir el dominio en su totalidad
(mutua exclusión y exhaustividad) …
…por tanto, el profesor ante una unidad didáctica o lección debe proponer ítems que recojan todos
los objetivos, contenidos y actividades relativos a la unidad a evaluar”
Revisión lógica: correspondencia entre los ítems y la operativización del dominio de contenidos; se
realiza mediante el juicio de expertos.
•Congruencia ítem-objetivo (representatividad).
•Calidad técnica
•Ausencia de sesgo (neutralidad respecto a los sujetos o grupos).
Revisión empírica: se estudia la aplicación de la prueba y su funcionamiento; en varias etapas:
•Formulación de hipótesis en relación con la dificultad y poder discriminativo esperados en cada
ítem.
•Aplicación a una muestra de alumnos.
•Análisis de los resultados para determinar el nivel de dificultad, discriminación y validez de cada
ítem.
•Interpretación y toma de decisiones respecto a los ítems analizados.
En relación con la revisión empírica de los ítems, pueden obtenerse varios índices…
Índices de discriminación: los ítems de los TRC deben maximizar la discriminación de los individuos de
los grupos experimental y control, y minimizar la discriminación dentro del propio grupo. Son los
llamados índices de sensibilidad a la instrucción.
•DISGN o ganancia neta
•DISCI-SI o diferencia entre los grupos ‘con’ y ‘sin’ instrucción
Índice de homogeneidad: tiene como propósito que los ítems que cubren un mismo objetivo se
comporten de forma similar (tanto en una aplicación del test como en sucesivas). Se puede calcular con
la correlación ítem-total.
DISGN o ganancia neta. Proporción de sujetos que responden al ítem incorrectamente en el pretest y
correctamente en el postest, menos la proporción de sujetos que responden incorrectamente en el pretest
y en el postest. Su rango de variación es [-1,1].
En el ítem 2 → 6 sujetos (2,3,4,5,9 y 10) contestan mal en el pretest y bien en el postest y 2 sujetos (6
y 8) contestan mal en las dos ocasiones. Se divide por el total de sujetos.
DISCI-SI o diferencia entre los grupos con instrucción y sin instrucción. Diferencia entre la proporción de
sujetos que aciertan el ítem en el grupo con instrucción menos la proporción de individuos que aciertan el
ítem en el grupo sin instrucción.
Grupo Ítem 1
Sujetos (todos en Grupo Control –
Experimental – 7 4
condición Sin instrucción 𝐷𝐼𝑆𝐶𝐼−𝑆𝐼 = − = 0,3
Con instrucción 10 ∗ 10
‘postest’)
Ítem 1 Ítem 2 Ítem 1 Ítem 2
1 0 1 0 1 Ítem mejorable.
2 0 0 1 1
Ítem 2
3 1 0 1 1 8 2
4 0 0 1 1 𝐷𝐼𝑆𝐶𝐼−𝑆𝐼 = − = 0,6
10 10
5 1 0 1 1
6 0 0 0 0 Es más sensible a la instrucción.
7 0 1 1 1
*Se divide por el total de sujetos.
8 1 0 1 0
9 0 0 0 1
10 1 0 1 1
Suma de aciertos 4 2 7 8
Para determinar los estándares o puntos de corte se utiliza de nuevo el juicio de los expertos (los
mismos que han definido el dominio e intervenido en la revisión lógica de los ítems propuestos)
Fiabilidad y validez
La validez viene indicada por la adecuación de la prueba a los objetivos de la misma (de contenido, de
criterio, y de constructo) Validez de contenido: los ítems o las situaciones de evaluación conductual reflejan
los objetivos de la instrucción.
[Link]
Objetivos
1. Introducción
Las técnicas grupales de recogida de información tratan de
identificar las conductas de los sujetos cuando éstos se
encuentran dentro de un grupo.
2. Tipos
Las técnicas grupales se pueden clasificar en…
3. Grupos focales
El grupo focal es una técnica en la que un moderador introduce un tema de
discusión a un grupo de individuos, dándoles la oportunidad de que interactúen
con sus comentarios y opiniones dirigidos en todo momento hacia los objetivos de
análisis (“foco”).
Obtener más información sobre percepciones, ideas, actitudes, experiencias, o creencias. Son útiles
para la recopilación de la perspectiva propia de las partes interesadas / afectadas en un proceso (o
‘públicos audiencias objetivo’ en marketing)
•Ejemplo: en una evaluación de un programa de prevención de la violencia escolar, se hacen grupos
focales con estudiantes procedentes de centros violentos.
Obtener información adicional (de carácter interpretativo) como complemento a los datos
cuantitativos recogidos.
•Ejemplo: como complemento a una encuesta sobre integración cultural aplicada al profesorado de
un barrio con población inmigrante, se realizan grupos focales con algunos de dichos profesores para
interpretar mejorar algunos de los resultados de la encuesta.
Apuntes de Marcos Román 1
Técnicas e instrumentos para la recogida de información - Pedagogía - UNED - 2019/2020 Tema 9
Ventajas: Desventajas:
• Relativamente fáciles de • El facilitador puede caer en sesgos.
configurar. • La discusión puede quedar
• Dinámica de grupo que da más monopolizada o desviada por unos
información que individuos por pocos.
separado. • El análisis de datos es muy costoso.
• Útil para el conocimiento más
profundo de un tema.
4. Grupo nominal
Se denomina grupo nominal a una reunión grupal de grupo pequeño (y
‘natural’), en la que se fomenta la participación de todos los miembros del
grupo, evitando la monopolización de la reunión por los ‘dirigentes’, sobre todo
ante causas de inhibición como jerarquía, inseguridad, timidez…
5. Entrevista en profundidad
La entrevista en profundidad es el proceso de
comunicación mediante interacción dinámica entre dos
personas, entrevistador y entrevistado, bajo control del
primero.
6. El Brainstorming
El Brainstorming (o ‘tormenta de ideas’) es una técnica de creatividad
desarrollada en una reunión de grupo con personas seleccionadas (…) es una
técnica efectiva para generar cúmulos de ideas sobre un asunto específico, para
luego determinar qué idea o ideas presentan la mejor solución.
7. El método Delphi
El método Delphi se realiza mediante la distribución de una serie de
cuestionarios (o ‘documentos’) en varias rondas (o ‘circulaciones’) a un grupo de
expertos (o ‘panel’). En cada ronda, los panelistas reciben realimentación sobre las
respuestas del resto del grupo y tienen la oportunidad de revisar y cambiar las suyas
propias si lo desean. El proceso termina cuando el
investigador (o ‘moderador’) considera que se ha llegado a un
determinado nivel de consenso o que la información
obtenida es suficiente.
Ventajas: Inconvenientes:
• Es anónimo: ningún miembro del • Intercambio de información
panel de expertos conoce quiénes limitado, puesto que los expertos
son los otros miembros; y las no llegan a interactuar nunca entre
respuestas de cada ronda se ellos.
recirculan de manera anónima. • Se reduce la motivación de los
• Se evita la presión de los expertos, al no existir recompensa
miembros dominantes. social por su contribución.
Características:
[Link]
[Link]
8. Técnicas sociométricas
A diferencia de las técnicas de observación, cuya atención se
concentra en el estudiante como individuo, las técnicas sociométricas
concentran su atención en el grupo y las interacciones sociales que se
presentan en él (…) en otras palabras, hablamos de
la repercusión que la situación del grupo tiene en
cada uno de sus miembros.
8.1. El sociograma
El sociograma es una técnica que pretende poner de manifiesto los lazos de
influencia y de preferencia que existen en el grupo (…) para un docente es de gran
utilidad conocer la presencia de lazos de vínculo entre sus estudiantes con el fin de
utilizarlos a favor de la promoción del grupo.
1) ¿Cuáles de tus compañeros consideras que dan opiniones muy acertadas en la mayoría de los casos?
2) ¿Con cuáles de tus compañeros prefieres convivir ya sea en el estudio o en la diversión? ¿Y a cuáles
rechazas?
Una vez el profesor cuenta con las respuestas (…) una forma muy práctica de visualizar los resultados
es representar gráficamente cada estudiante por medio de un círculo (o triángulo, según el sexo), y de allí
trazar flechas hacia los círculos (o triángulos) de los compañeros que ha seleccionado. Por tanto, los
sociogramas se caracterizan por la representación gráfica de las elecciones y rechazos de los individuos de
un grupo.
Para realizar un sociograma se parte de una matriz de doble entrada, o ‘matriz sociométrica’, en la
cual normalmente se ponen los ‘electores’ en las filas, y los ‘elegidos’ en las columnas.
2) Un profesor forma parejas entre los 6 alumnos de su tutoría (2 niños y 4 niñas) para realizar unas
dinámicas grupales. Para ello, les formula las siguientes preguntas:
¿Con quién de tus compañeros prefieres estudiar? ¿Con quién de tus compañeros no quieres estudiar?
Electores
Alumno 3: Prefiero estudiar con 5; No quiero estudiar con 6. 2 R A
Alumno 4: Prefiero estudiar con 5; No quiero estudiar con 2. 3 A R
Alumno 5: Prefiero estudiar con 4; No quiero estudiar con 3. 4 R A
Alumno 6: Prefiero estudiar con 5; No quiero estudiar con 3. 5 R A
6 R A
No entra
8.2. Escala de distancia social
Hay grupos de clase que reaccionan de forma unánime ante alguna
propuesta de los profesores, y otros donde las opiniones son dispares al
existir sub-grupos a menudo enfrentados y en donde casi nunca una
propuesta recibe el apoyo o el rechazo por unanimidad (…) para comprobar
la existencia de estas situaciones se pueden utilizar los llamados ‘índices de
integración y cohesión’.
Integración
• Un sujeto está ‘integrado’ en su grupo cuando mantiene una red de interrelaciones con otros
miembros del grupo, que le generan la sensación de dependencia-pertenencia al mismo.
• La ‘integración’ se define como una relación particular de cada sujeto respecto al grupo.
Cohesión
• Un grupo está ‘cohesionado’ cuando el sistema de interrelaciones que funciona entre sus miembros
mantiene a estos satisfactoriamente ligados al grupo.
• La ‘cohesión’ no es, por tanto, una cuestión de cada miembro del grupo por separado, sino algo
inherente al grupo en su conjunto.
Las ‘escalas de distancia social’ nos permiten conocer la opinión y actitud afectiva de cada estudiante
respecto de sus compañeros. Para dicho objetivo se redactan proposiciones que van desde la mayor
cercanía a la mayor lejanía (pasando por distintos grados de proximidad); posteriormente cada estudiante
enjuicia la situación en que se encuentra cada compañero respecto a él.
El ‘índice de integración’ de cada sujeto es la suma de las puntuaciones emitidas sobre él por sus
compañeros. Puede tomar valores entre:
Siendo:
(OJO! En las matrices de distancia social, a diferencia de las matrices sociométricas, en las filas están
los ‘enjuiciados’ (valorados) y en las columnas los ‘enjuiciadores’ (valoradores))
Apuntes de Marcos Román 8
Técnicas e instrumentos para la recogida de información - Pedagogía - UNED - 2019/2020 Tema 9
El ‘índice de cohesión’ se calcula como la media de los índices de integración de los sujetos del grupo.
Nos da una información muy valiosa y de conjunto sobre el grupo, que se puede comparar con otros grupos
o con sí mismo a lo largo del tiempo.
∑ í𝑛𝑑𝑖𝑐𝑒 𝑑𝑒 𝑖𝑛𝑡𝑒𝑔𝑟𝑎𝑐𝑖ó𝑛
Í𝑛𝑑𝑖𝑐𝑒 𝑑𝑒 𝑐𝑜ℎ𝑒𝑠𝑖ó𝑛 =
𝑁ú𝑚𝑒𝑟𝑜 𝑑𝑒 𝑚𝑖𝑒𝑏𝑟𝑜𝑠
Ejemplo 4 – Examen de Septiembre 2013
1) Un pedagogo quiere trabajar en un grupo con sus alumnos y necesita valora la relación existente
entre María, Susana, Francisco y Sara. Para llevarlo a cabo, les solicita a cada uno de ellos que
complete la siguiente frase con el nombre de un compañero: “Prefiero que …………estuviera en mi
grupo”
Valoradores
María Susana Francisco Sara Total
Valorados
María -- 3 2 1 6
Susana 3 -- 3 3 9
Francisco 3 1 -- 3 7
Sara 2 3 3 -- 8
Siendo:
1.- Nada; 2.- Poco; 3.- Mucho.
ÍNDICES DE INTEGRACIÓN:
(6+9+7+8)/4=7,5
En un estudio sobre las relaciones grupales entre cuatro miembros de una clase, se han obtenido los
siguientes resultados, como respuesta a la pregunta “Prefiero compartir mi tiempo libre con…”. Siendo estas
las opciones de repuestas ofrecidas:
A B C D
4. Siempre A -- 3 1 4
3. Muchas veces
B 2 -- 3 2
2. Pocas veces
C 1 3 -- 4
1. Nunca
D 3 2 4 --
• ¿Entre qué valores oscilará la escala que permite valorar el índice de integración de cada alumno?
Calcule e interprete el índice de integración de cada uno de los miembros del grupo.
• Realice la representación gráfica de los índices de integración.
• Calcule e interprete el índice de cohesión grupal.
a) El índice de integración en este caso con una escala de 4 categorías, oscila entre 4*(n-1) y (n-1) donde
n es el número de casos. Luego oscilará entre 4*3 y 3, es decir, entre 12 y 3. Los valores de integración
son: 8, 7, 8 y 9 respectivamente para A, B, C y D, por lo cual, D es el más integrado del grupo y B el
menos integrado, no obstante, todos tienen un nivel medio de integración.
b)
Un profesor quiere valorar la relación en un grupo de cinco estudiantes para lo cual realiza una
pregunta entre los mismos: ¿valore el interés que tiene en sentarse junto a …… para realizar un trabajo
grupal? Los resultados fueron los siguientes:
5.- Tiene mucho interés 4.- Prefiere que esté en su grupo 3.- Le es indiferente
2.- Prefiere no formar parte de su grupo 1.- No quiere que esté en su grupo
Se pide:
Apuntes de Marcos Román 10
Técnicas e instrumentos para la recogida de información - Pedagogía - UNED - 2019/2020 Tema 9
Un ejemplo real…
[Link]
[Link] [Link]
Objetivos
1. Análisis de Documentos
El análisis de documentos es la base de la investigación histórica y el fundamento
de toda investigación que pretenda estar incluida en la realidad del momento en que se
desarrolla.
• Métodos clásicos
o [Link].: la crítica literaria o el análisis de textos mediante el método histórico.
o Se procede mediante dos tipos de análisis:
▪ Interno: se analiza el contenido del texto (calidad y veracidad)
▪ Externo: se analiza el contexto del texto (autenticidad y resonancia)
• Métodos cuantitativos
o No pretenden sustituir a los métodos clásicos, sino complementarlos.
o Con estos métodos se intenta eliminar el subjetivismo de la persona que analiza los
documentos.
o Algunos de ellos son:
▪ La semántica cuantitativa
▪ Análisis de contenido
▪ Documentación bibliográfica
2. Análisis de Contenido
El análisis de contenido es una técnica de investigación para la descripción
objetiva, sistemática y cuantitativa del contenido manifiesto de la comunicación.
• Objetividad
o El proceso de análisis puede ser replicado por otro investigador, llegando a los mismos
resultados.
• Sistematización
o El análisis se realiza según unas pautas ordenadas, que se aplican sobre la totalidad del
contenido recogido.
• Cuantificable
o El análisis se traduce en datos cuantitativos, que pueden ser sometidos a tratamiento
estadístico.
• Manifiesto
o El análisis se aplica sobre el contenido manifiesto de la comunicación, dejando fuera los
aspectos implícitos o soterrados.
EJEMPLO
Ventajas: Inconvenientes:
• Técnica no intrusiva. • Escritos no homogéneos, con
• Información de bajo coste. diferentes propósitos.
• Disposición de los documentos
limitada.
3. Tipos de Documentos
Los tipos de documentos que se pueden someter a un análisis de contenido son muy variados…
• Actas, circulares.
• Informes, programas.
Apuntes de Marcos Román 2
Técnicas e instrumentos para la recogida de información - Pedagogía - UNED - 2019/2020 Tema 10
Objetivos y contexto
Determinar los objetivos perseguidos por la investigación, el universo objeto de estudio, la elección
del tipo de documento y las unidades de contenido dentro del documento.
Ejemplo: Estudiar los materiales escolares durante la Segunda República, a través de los libros de texto
y cuadernillos escolares publicados en España desde 1931 a 1939.
Unidades de análisis
Determinar las unidades de muestreo, unidades de contexto y unidades de registro.
Ejemplo: De todo el universo, vamos a analizar una muestra de 50 libros de texto, tanto de editoriales
progresistas como conservadoras, analizando su léxico, proposiciones, temáticas y discursos.
…por ejemplo, si aparece o no la palabra ‘Dios’, cuántas veces, si viene sistemáticamente antes o
después de otra palabra o frase como ‘Patria’, si se concentra de determinada manera…
Categorización
Es la clasificación de los elementos del texto a partir de los criterios previamente establecidos.
Ejemplo: Categorizar cada oración en función de un criterio de contenido temático, como puede ser la
postura con respecto a laIglesia: ‘pro-clerical’, ‘anticlerical’, ‘neutro’…
Codificación
Traducir la categorización a valores numéricos según reglas predefinidas (libro de códigos), para su
posterior tratamiento estadístico.
Fiabilidad y validez
La fiabilidad se estima por el grado de acuerdo entre codificadores independientes.
• Fiabilidad
• Modelo de Rasch
D = 1,7
e = 2,718
Tema 3: La observación
Tamaño de la muestra para población infinita Tamaño de la muestra para población finita
2
𝑧 · 𝑝 · 𝑞 (𝑧 2 · 𝑝 · 𝑞 · 𝑁)
𝑛= 𝑛= 2
𝑒2 𝑒 (𝑁 − 1) + (𝑧 2 · 𝑝 · 𝑞)