Validez externa
La validez externa tiene que ver con qué tan generalizables son los resultados de un experimento a
situaciones no experimentales y a otros sujetos o poblaciones. Responde a la pregunta: ¿Lo que
encontré en el experimento a qué sujetos, poblaciones, contextos, variables y situaciones puede
aplicarse?
Fuentes de invalidación externa
1. Efecto reactivo o de interacción de las pruebas
Se presenta cuando la preprueba aumenta o disminuye la sensibilidad o la calidad de la reacción
de los sujetos a la variable experimental, haciendo que los resultados obtenidos para una
población con preprueba no puedan generalizarse a quienes forman parte de esa población pero
sin preprueba.
2. Efecto de interacción entre errores de selección y el tratamiento experimental
Este factor se refiere a que se digan personas con una o varias características que hagan que el
tratamiento experimental tenga efecto, el cual no se daría si las personas no tuvieran esas
características.
3. Efectos reactivos de los tratamientos experimentales
La "artificialidad" de las condiciones puede hacer que el contexto experimental resulte atípico
respecto a la manera como se aplica regularmente el tratamiento.
4. Interferencia de tratamientos múltiples
Si los tratamientos no son de efecto reversible, es decir, si no se pueden borrar sus efectos, las
conclusiones solamente podrán hacerse extensivas a las personas que experimentaron la misma
secuencia de tratamientos, sean múltiples o repetición del mismo.
5. Imposibilidad de replicar los tratamientos
Cuando los tratamientos son tan complejos que no pueden replicarse en situaciones no
experimentales, es difícil generalizar a éstas.
Para lograr una mayor validez externa, es conveniente tener grupos lo más parecidos posible a la
mayoría de las personas a quienes se desea generalizar y repetir el experimento varias veces con
diferentes grupos (hasta donde el presupuesto y los costos de tiempo lo permitan). También,
tratar de que el contexto experimental sea lo más similar posible al contexto al que se pretende
generalizar.
TIPOS DE INSTRUMENTOS DE MEDICIÓN O RECOLECCIÓN DE LOS DATOS DISPONEMOS EN LA
INVESTIGACIÓN SOCIAL
En la investigación del comportamiento disponemos de diversos tipos de instrumentos para medir
las variables de interés y en algunos casos se pueden combinar dos o más métodos de recolección
de los datos. A continuación describimos -brevemente- estos métodos o tipos de instrumentos de
medición.
9.6.1. Escalas para medir las actitudes
Una actitud es una predisposición aprendida para responder consistentemente de una manera
favorable o desfavorable respecto a un objeto o sus símbolos. Así, los seres humanos tenemos
actitudes hacia muy diversos objetos o símbolos.
Los métodos más conocidos para medir por escalas las variables que constituven actitudes son: el
método de escalonamiento Likert, el diferencial semántico y la escala de Guttman.
Escalamiento tipo Likert
Consiste en un conjunto de ítems presentados en forma de afirmaciones o juicios ante los cuales
se pide la reacción de los sujetos a los que se les administra. Es decir, se presenta cada afirmación
y se pide al sujeto que externe su reacción eligiendo uno de los cinco puntos de la escala. A cada
punto se le asigna un valor numérico. Así, el sujeto obtiene una puntuación respecto a la
afirmación y al final se obtiene su puntuación total sumando las puntuaciones obtenidas en
relación a todas las afirmaciones.
Las afirmaciones califican al objeto de actitud que se esta midiendo Y deben expresar sólo una
relación lógica, además es muy recomendable que no excedan de -aproximadamente- 20 palabras.
Las alternativas de
respuesta o puntos de la escala son cinco e indican cuanto se está de acuerdo con la afirmación
correspondiente. Debe recordarse que a cada una de ellas se le asigna un valor numérico y sólo
puede marcarse una opción. Se considera un dato inválido a quien marque dos o más opciones.
Asimismo, pueden hacerse distintas combinaciones como "totalmente verdadero" o
"completamente no".
Es indispensable comentar que el número de categorías de respuesta debe ser el mismo para
todas las afirmaciones. Y las alternativas de respuesta pueden colocarse horizontalmente o
verticalmente.
DIRECCIÓN DE LAS AFIRMACIONES
Las afirmaciones pueden tener dirección: favorable o positiva y desfavorable o negativa. Y esta
dirección es muy importante para saber cómo se codifican las alternativas de respuesta. Si la
afirmación es positiva significa que califica favorablemente al objeto de actitud, y entre los sujetos
estén más de acuerdo con la afirmación, su actitud es más favorable.
Si estamos "muy de acuerdo" implica una actitud más favorable que si estamos "de acuerdo". En
cambio, si estamos "muy en desacuerdo" implica una actitud muy desfavorable. Por lo tanto,
cuando las afirmaciones son positivas se califican comúnmente de la siguiente manera:
(5) Muy de acuerdo
(4) De acuerdo
(3) Ni de acuerdo, ni en desacuerdo
(2) En desacuerdo
(1) Muy en desacuerdo
Si la afirmación es negativa significa que califica desfavorablemente al objeto de actitud, y entre
los sujetos estén más de acuerdo con la afirmación, su actitud es menos favorable, esto es, más
desfavorable.
EJEMPLO
(1) Totalmente de acuerdo
(2) De acuerdo
(3) Ni de acuerdo, ni en desacuerdo
(4) En desacuerdo
(5) Totalmente en desacuerdo
FORMA DE OBTENER LAS PUNTUACIONES
Las puntuaciones de las escalas Likert se obtienen sumando los valores obtenidos Respecto a cada
frase. Por ello se le denomina escala aditiva.
Como puede observarse en la figura 9.8, las afirmaciones 1, 2, 5 y 8 son negativas (desfavorables)
y les afirmaciones 3, 4, 6 y 7 son positivas (favorables). Ejemplo de una escala Likert
Ejemplo del libro (sumando la escala Likert):
VALOR = 1 +2+1 +3+1 +l +2+1 =12
Una puntuación se considera alta o baja según el número de ítems o afirmaciones. Por ejemplo, en
la escala para evaluar la actitud hacia el organismo tributario la puntuación mínima posible es de 8
(1+1+1+1+1+1+1+1) y la máxima es de 40 (5+5+5+5+5+5+5+5),porque hay ocho afirmaciones. La
persona del ejemplo obtuvo "12", su actitud hacia el organismo tributario es mas bien sumamente
desfavorable.
En las escalas Likert a veces se califica el promedio obtenido en la escala mediante la sencilla
fórmula PT /NT (donde PT es la NT puntuación total en la escala y NT es el número de
afirmaciones), y entonces una puntuación se analiza en el continuo 1-5 de la siguiente manera,
con el ejemplo de quien obtuvo 12 en la escala 12/8=1.5 el 1.5 es la ubicación en una escala que
va del 1 al 5 la posición donde se encuentra el sujeto mediante este instrumento.
A veces se acorta o incrementa el número de categorías, sobre todo cuando los respondientes
potenciales pueden tener una capacidad muy limitada de discriminación o por el contrario muy
amplia.
Un aspecto muy importante de la escala Likert es que asume que los ítems o afirmaciones miden
la actitud hacia un único concepto subyacente, si se van a medir actitudes hacia varios objetos,
deberá incluirse una escala por objeto aunque se presenten conjuntamente, pero se califican por
separado. En cada escala se considera que todos los ítems tienen igual peso.
COMO SE CONSTRUYE UNA ESCALA LlKERT
En términos generales, una escala Likert se construye generando un elevado número de
afirmaciones que califiquen al objeto de actitud y se administran aun grupo piloto para obtener las
puntuaciones del grupo en cada afirmación. Estas puntuaciones se correlacionan con las
puntuaciones del grupo a toda la escala (la suma de las puntuaciones de todas las afirmaciones), y
las afirmaciones cuyas puntuaciones se correlacionan significativamente con las puntuaciones de
toda la escala, se seleccionan para integrar el instrumento de medición. Asimismo, debe calcularse
la confiabilidad y validez de la escala.
PREGUNTAS EN LUGAR DE AFIRMACIONES
En la actualidad, la escala original se ha extendido a preguntas y observaciones.
MANERAS DE APLICAR LA ESCALA LlKERT
Existen dos formas básicas de aplicar una escala Likert. La primera es de manera
autoadministrada: se le entrega la escala al respondiente y éste marca respecto a cada afirmación,
la categoría que mejor describe su reacción o respuesta. Es decir, marcan su respuesta. La segunda
forma es la entrevista; un entrevistador lee las afirmaciones y alternativas de respuesta al sujeto y
anota lo que éste conteste. Cuando se aplica vía entrevista, es muy necesario que se le entregue al
respondiente una tarjeta donde se muestran las alternativas de respuesta o categorías.
DIFERENCIAL SEMÁNTICO
consiste en una serie de adjetivos extremos que califican al objeto de actitud, ante los cuales se
solicita la reacción del sujeto. Es decir, este, tiene que calificar al objeto de actitud en un conjunto
de adjetivos bipolares, entre cada par de adjetivos se presentan varias opciones y el sujeto
selecciona aquella que refleje su actitud en mayor medida.
EJEMPLOS DE ESCALAS BIPOLARES
Objeto de actitud: Candidato "A"
justo:________:________:________:_________:________:_______:________: injusto
Debe observarse que los adjetivos son "extremos" y que entre ellos hay siete opciones de
respuesta. Cada sujeto califica al candidato "A" en términos; de esta escala de adjetivos bipolares.
MANERAS DE APLICAR EL DIFERENCIAL SEMÁNTICO
La aplicación del diferencial semántico puede ser autoadministrada (se le proporciona la escala al
sujeto y éste marca la categoría que describe su reacción o considera conveniente) o mediante
entrevista (el entrevistador marca la categoría que corresponde a la respuesta del sujeto). En esta
segunda situación, es muy conveniente mostrar una tarjeta al respondiente, la cual incluye los
adjetivos bipolares y sus categorías respectivas.
Las respuestas se califican de acuerdo con la codificación. Por ejemplo, si una persona tuvo la
siguiente
respuesta:
rico: __X____:_______:_________:______:_______:_______: pobre
la escala oscila entre 1 y 7, esta persona obtendría un siete (7).
En ocasiones se puede incluir la codificación en la versión que se les presenta a los respondientes
con elpropósito de clarificar las diferencias entre las categorías.
PASOS PARA INTEGRAR LA VERSION FINAL
Para integrar la versión final de la escala se deben llevar a cabo los siguientes pasos:
1. Generamos una lista de adjetivos bipolares exhaustiva y aplicable al objeto de actitud a medir.
De ser posible, resulta conveniente que se seleccionen adjetivos que hayan sido utilizados en
investigaciones similares a la nuestra (contextos parecidos).
2. Construimos una versión preliminar de la escala y la administramos a un grupo de sujetos a
manera de prueba piloto.
3. Correlacionamos las respuestas de los sujetos para cada par de adjetivos o ítem. Así,
correlacionamos un ítem con todos los demás –cada par de adjetivos contra el resto-.
4. Calculamos la confiabilidad y validez de la escala total (todos los pares de adjetivos).
5. Seleccionamos los ítems que presenten correlaciones significativas con los demás ítems.
Naturalmente, si hay confiabilidad y validez, estas correlaciones serán significativas.
6. Desarrollamos la versión final de la escala.
La escala final se califica de igual manera que Likert: sumando las puntuaciones obtenidas respecto
a cada ítem o par de adjetivos.
Su interpretación depende del número de ítems o pares de adjetivos. Asimismo, en ocasiones se
califica el promedio obtenido en la escala total: Puntuación total/ número de ítems.
Y se pueden utilizar distintas escalas o diferenciales semánticos para medir actitudes hacia varios
objetos. Por ejemplo, podemos medir con cuatro pares de adjetivos la actitud hacia el candidato
“A”, con otros tres pares de adjetivos la actitud respecto a su plataforma ideológica y con otros
seis pares de adjetivos la actitud hacia su partido político, Tenemos tres escalas, cada una con
distintos pares de adjetivos para medir la actitud en relación a tres diferentes objetos.
El diferencial semántico es estrictamente una escala de medición ordinal, pero es común que se le
trabaje como si fuera de intervalo.
ESCALOGRAMA DE GUTTMAN
Se basa en el principio de que algunos ítems indican en mayor medida la fuerza o intensidad de la
actitud. La escala está constituida por afirmaciones, las cuales poseen las mismas características
que en el caso de Likert. Pero el escalograma garantiza que la escala mide una dimensión única.
Algunos autores consideran que el escalograma más que ser un método de medición de actitudes,
es una técnica para determinar si un conjunto de afirmaciones reúnen los requisitos de un tipo
particular de escala
Para construir el escalograma es necesario desarrollar un conjunto de afirmaciones pertinentes al
objeto de actitud. Éstas deben variar en intensidad. Por ejemplo, si pretendiéramos medir la
actitud hacia la calidad en el trabajo dentro del nivel gerencial, la afirmación: “La calidad debe
vivirse en todas las actividades del trabajo y en el hogar” es más intensa que la afirmación: “La
calidad debe vivirse sólo en las actividades más importantes del trabajo”. Dichas afirmaciones se
aplican a una muestra a manera de prueba piloto. Y una vez administradas se procede a su
análisis. Cabe agregar que las categorías de respuesta para las afirmaciones, pueden variar entre
dos (“de acuerdo-en desacuerdo”, “si-no” ,etcétera) o más categorías (v.g., las mismas categorías
que en el caso de Likert).
La escala Guttman, también conocida como escala acumulativa o análisis de escalograma, se crea
con elementos que pueden ordenarse de manera jerárquica. Es representativa de la actitud
extrema de los encuestados, es decir, extremadamente positiva o negativa, según el tema de
investigación. Además, forma parte de las tres escalas unidimensionales junto con la escala de
Likert y la escala de Thurstone.
Esta escala es utilizada por los investigadores en situaciones donde se requiere una escala
unidimensional para opiniones continuas. “La escala unidimensional indica que las opciones de
respuesta tienen un solo parámetro de medición, es decir, que se puede asociar un rango de
números a la escala.
Por ejemplo: “En una escala del 0 al 10, ¿hasta qué punto estás satisfecho con el servicio de esta
aerolínea?”. – puede indicarse con opciones de respuesta unidimensionales.
La escala Guttman tiene una lista de declaraciones. Se puede inferir que los encuestados que están
de acuerdo con la declaración colocada al final de esta lista, habrían estado de acuerdo con todas
las declaraciones anteriores a la última. Cada declaración tendrá un peso correspondiente
asociado a ella. La acumulación del peso de acuerdo con la retroalimentación de los encuestados
ayudará a los investigadores a predecir el número de declaraciones agradables para los
encuestados.
Por ejemplo, en una escala de 5, si un encuestado obtiene una puntuación de 3, indica que está de
acuerdo con las 3 primeras afirmaciones de la escala. Si otro encuestado obtiene una puntuación
de 5, indica que está de acuerdo con todas las afirmaciones de esta escala acumulativa.
El objetivo principal es filtrar a los encuestados que cumplen con el 100% de las afirmaciones
mencionadas en la escala. Pero, prácticamente es improbable que los encuestados cumplan
totalmente con una serie de afirmaciones y, por lo tanto, el análisis de escalogramas se lleva a
cabo para evaluar el conjunto más cercano de afirmaciones con las que la audiencia objetivo está
de acuerdo.
Para qué se utiliza la escala Guttman
La escala Guttman es popular en aplicaciones de escala social y también en el cálculo de la cultura
organizacional, la educación o la evaluación de logros en general.
Aplicación 1: La escala Guttman se utiliza para evaluar la estructura jerárquica de una
organización.
Incluye preguntas que analizan la jerarquía de empleados como:
Estoy dispuesto a contribuir a las causas sociales apoyadas por mi organización.
Estoy dispuesto a trabajar más horas para completar la tarea asignada.
Estoy dispuesto a comunicarme mejor con los miembros de mi equipo.
Estoy dispuesto a asistir a conferencias y seminarios.
Aplicación 2: Este método también se puede utilizar para medir el recorrido de un cliente.
En este caso, las siguientes preguntas pueden formar parte de la escala:
Podría resolver fácilmente mi problema poniéndome en contacto con el equipo de servicio
al cliente.
Podría hacer que me entregaran los productos en mi puerta.
Podría ponerme en contacto con el equipo de apoyo rápidamente.
Podía buscar los productos requeridos fácilmente en el sitio web de la empresa.
Podía hacer el pago de los productos fácilmente.
Ventajas de la escala Guttman
Es de naturaleza altamente jerárquica y estructurada: Por ello puede ser extremadamente
productiva en encuestas y cuestionarios cortos. Por ejemplo, para analizar la distancia social, la
jerarquía de los empleados, las etapas de evolución, etc.
Se utiliza con el objetivo de obtener información para múltiples consultas: La escala Guttman
incluye múltiples enunciados para que los encuestados respondan, lo que ocupa un breve espacio
en una encuesta en línea.
Es más intuitiva que otras escalas unidimensionales: La forma en que las respuestas están
representadas en esta escala hace que la escala de Guttman sea extremadamente intuitiva para
los usuarios.
Produce datos de forma ordenada: Las afirmaciones mencionadas en esta escala tienen su grado
de importancia y en consecuencia los valores asociados. Por lo tanto, los resultados de esta escala
son en términos de rangos.
La escala de Guttman es la herramienta adecuada para obtener el grado de identificación que las
personas tienen sobre un tema específico. La representación de las respuestas hace que esta
escala sea meramente intuitiva.
Cuando los individuos se escalan perfectamente respecto a las afirmaciones, esto quiere decir que
los ítems verdaderamente varían gradualmente en intensidad. Es la prueba empírica de que están
escalados por su intensidad. Se le denomina "reproductividad al grado en que un conjunto de
afirmaciones o ítems escalan perfectamente en cuanto a intensidad, Esto significa, que el patrón
de respuesta de una persona en relación a todos los ítems puede, ser reproducido con exactitud,
simplemente conociendo su puntuación total en toda la escala (Black y Champion, 1976).
La reproductividad ideal se da cuando nadie rompe el patrón de intensidad de la escala. Sin
embargo en la realidad, sólo unas cuantas escalas del tipo de Guttman reúnen la reproductividad
ideal, la mayoría contienen inconsistencias o rupturas al patrón de intensidad. El grado en que se
alcanza el patrón perfecto de intensidad de la escala o reproductividad, se determina analizando el
número de personas o casos que rompen dicho patrón, que es el quinto paso para construir el
escalograma de Guttman.
ANÁLISIS DEL NUMEPO DE ERRORES 0 RUPTURAS AL PATRON IDEAL, DE INTENSIDAD DE LA
ESCALA
Un error es una inconsistencia en las respuestas de una persona a una escala, es un rompimiento
con el patrón ideal de intensidad de ésta
Como se han mencionado anteriormente, cuando el número de errores es excesivo, la escala no
presenta reproductividad y no puede aceptarse. La reproductividad se determina mediante un
coeficiente.
La fórmula de este coeficiente es: Coeficiente de reproductividad = Número de errores o
inconsistencias/Número total de respuestas
El coeficiente de reproductividad oscila entre 0 y 1, y cuando equivale a .90 o más nos indica que
el número de errores es tolerable y la escala es unidimensional y se acepta. Cuando dicho
coeficiente es menor a .90 no se acepta la escala. Guttman originalmente recomendó administrar
un máximo de 10 a 12 ítems o afirmaciones a un mínimo de 100 personas
Cuando se aplica la versión definitiva de la escala los resultados se codifican de la misma manera
que en la escala Likert, dependiendo del número de categorías de respuesta que se incluyan. Y al
igual que la escala Likert y el diferencial semántico, todos los ítems deben tener el mismo número
de categorías de respuesta, Este es un requisito de todas las escalas de actitud. Asimismo, se
considera una respuesta inválida a quien marque dos o más opciones para una misma afirmación.
El escalograma de Guttman es una escala estrictamente ordinal pero que se suele trabajar como si
fuera de intervalo. Puede aplicarse, mediante entrevista -con uso de tarjetas conteniendo las
opciones o categorías de respuesta- o puede ser autoadministrada.
9.6.2. Cuestionarios
Tal vez el instrumento más utilizado para recolectar tos datos es el cuestionario. Un cuestionario
consiste en un conjunto de preguntas respecto a una o más variables a medir.
¿Qué tipos de preguntas puede haber?
El contenido de las preguntas de un cuestionario puede ser tan variado como los aspectos que se
midan a través de éste. Y básicamente, podemos hablar de dos tipos de preguntas: "cerradas” y
“abiertas".
Las preguntas "cerradas" contienen categorías o altemativas de respuesta que han sido
delimitadas. Es decir, se presentan a los sujetos las posibilidades de respuesta y ellos deben
circunscribirse a éstas. Las preguntas "cerradas" pueden ser dicotómicas (dos alternativas de
respuesta) o incluir varias alternativas de respuesta.
Las escalas de actitudes en forma de pregunta caerían dentro de la categoría de preguntas
"cerradas". Ahora bien, hay preguntas “cerradas”, donde el respondiente puede seleccionar más
de una opción o categoría de respuesta.
En otras ocasiones, el respondiente tiene que jerarquizar opciones. Por ejemplo: ¿cuál de los
siguientes conductores de televisión considera usted el mejor?, ¿cuál en segundo lugar?, ¿cuál en
tercer lugar?
En cambio, las preguntas “abiertas” no delimitan de antemano las alternativas de respuesta. Por lo
cual el número de categorías de respuesta es muy elevado, En teoría es infinito.
¿ Usamos preguntas abiertas o cerradas?
Las preguntas “cerradas” son fáciles de codificar y preparar para su análisis, Asimismo, estas
preguntas requieren de un menor esfuerzo por parte de los respondientes. Éstos no tienen que
escribir o verbalizar pensamientos, sitio simplemente seleccionarla alternativa que describa mejor
su respuesta. Responderá un cuestionario con preguntas cerradas toma menos tiempo que
contestar a uno con preguntas abiertas. Si el cuestionario es enviado por correo, se tiene una
mayor respuesta cuando es fácil de contestar y requiere menos tiempo completarlo. La principal
desventaja de las preguntas “cerradas” reside en que limitan las respuestas de la muestra y -en
ocasiones- ninguna de las categorías describe con exactitud lo que las personas tienen en mente,
no siempre se captura lo que pasa por las cabezas de los sujetos.
Para poder formular preguntas “cerradas” es necesario anticipar las posibles alternativas de
respuesta. De no ser así es muy difícil plantearlas. Asimismo, el investigador tiene que asegurarse
que los sujetos a los cuales se les administrarán, conocen y comprenden las categorías de
respuesta.
Las preguntas "abiertas” son particularmente útiles cuando no tenemos información sobre las
posibles respuestas de las personas o cuando esta información es insuficiente. También sirven en
situaciones donde se desea profundizar una opinión o los, motivos de un comportamiento, Su
mayor desventaja es que son más difíciles de codificar, clasificar y preparar para su análisis.
Además, pueden presentarse sesgos derivados de distintas fuentes
Una recomendación para construir un cuestionario es que se analice variable por variable qué tipo
de pregunta o preguntas pueden ser más confiables y válidas para medir a esa variable, de
acuerdo con la situación del estudio (planteamiento del problema, características de la muestra,
análisis que se piensan efectuar, etcétera).
¿Cómo se codifican las preguntas abiertas?
Las preguntas abiertas se codifican una vez que conocernos todas las respuestas de los sujetos a
las cuales se les aplicaron o al menos las principales tendencias de respuestas en una muestra de
los cuestionarios aplicados.
El procedimiento consiste en encontrar y darle nombre a los patrones generales de respuesta
(respuestas similares o comunes), listar estos patrones y después asignar un valor numérico o
símbolo a cada patrón, Así, un patrón constituirá una categoría de respuesta. Para cerrar las
preguntas abiertas, se sugiere el siguiente procedimiento, basado parcialmente en Rojas (198 1,
pp. 150-15 1):
1 . Seleccionar determinado número de cuestionarios mediante un método adecuado de
muestreo, asegurando la representatividad de los sujetos investigados.
2. Observar la frecuencia con que aparece cada respuesta a la pregunta.
3. Elegir las respuestas que se presentan con mayor frecuencia (patrones generales de respuesta).
4. Clasificar las respuestas elegidas en temas, aspectos o rubros, de acuerdo con un criterio lógico,
cuidando que sean mutuamente excluyentes.
5. Darle un nombre o título a rada tema, aspecto o rubro (patrón general de respuesta).
6. Asignarle el código a cada patrón general de respuesta.
9.6.3. Análisis del contenido
el análisis de contenido es una técnica para estudiar y analizar la comunicación de una manera
objetiva, sistemática y cuantitativa. Krippendorff (1982) extiende la definición del análisis de
contenido a una técnica de investigación para hacer inferencias válidas y confiables de datos con
respecto a su contexto.
¿COMO SE REALIZA EL ANÁLISIS DE CONTENIDO?
El análisis de contenido se efectúa por medio de la codificación, que es el proceso a través del cual
las características relevantes del contenido de un mensaje son transformadas a unidades que
permitan su descripción y análisis preciso. Lo importante del mensaje se convierte en algo
susceptible de describir y analizar. Para poder codificar es necesario definir el universo a analizar,
las unidades de análisis y las categorías de análisis.
UNIVERSO
UNIDADES DE ANÁLISIS
Las unidades de análisis constituyen segmentos del contenido de los mensajes que son
caracterizados para ubicarlos dentro de las categorías. Bereison (1952) menciona cinco unidades
importantes de análisis:
1) La palabra. Es la unidad de análisis más simple, aunque como señala Kerlinger (1975), puede
haber unidades más pequeñas como letras, fonernas o símbolos. Así, se puede medir cuántas
veces aparece una palabra en una mensaje (v.g., veces que en un programa televisiva de fin de
año se menciona al Presidente).
2) El tema. Éste se define a menudo como una oración, un enunciado respecto a algo. Los temas
pueden ser más o menos generales. Kerlinger (1975, p. 552) utiliza un excelente ejemplo para ello:
"Las cartas de adolescentes 0 estudiantes de colegios superiores pueden ser estudiadas en sus
expresiones de autoreferencia. Este sería el tema más extenso. Los temas que constituyen éste
podrían definirse como cualesquiera oraciones que usen “yo”, "mí" y otros términos que indiquen
referencia al yo del escritor. Así, se analizaría qué tanta autoreferencia está presente en dichas
cartas.
Si los temas son complejos, el análisis del contenido es más difícil, especialmente si se complica al
incluirse más de una oración simple.
3) El ítem. Tal vez es la unidad de análisis más utilizada y puede definirse como la unidad total
empleada por los productores del material simbólico (Bereison 1952). Ejemplos de ítems pueden
ser un libro, una editorial, un programa de radio o televisión, un discurso, una ley, un comercial,
una carta amorosa, una conversación telefónica, una canción o la respuesta a una pregunta
abierta. En este caso lo que se analiza es el material simbólico total.
4) El personaje. Un individuo, un personaje televisivo, un líder histórico, etcétera. Aquí lo que se
analiza es el personaje.
5) Medidas de espacio-tiempo. Son unidades físicas como el centímetro-columna (por ejemplo, en
la prensa), la línea (en escritos), el minuto (en una conversación o en radio), el periodo de 20
minutos (en una interacción), el cuadro (en televisión), cada vez que se haga una pausa (en un
discurso). Estas unidades se enclavan, colocan o caracterizan en categorías, esto podría
representarse de la siguiente manera:
a)En un solo estudio se pueden utilizar más de una unidad de análisis.
b)Los cálculos de palabras y las unidades amplias, como el ítem y las medidas de espacio-tiempo,
son más adecuadas en los análisis que dan énfasis a asuntos definidos,
c)Las unidades amplias y las más definidas son válidas para la aceptación o rechazo en una
categoría.
d)Las unidades amplias generalmente requieren de menos tiempo para su codificación que las
unidades pequeñas, referidas a las mismas categorías y materiales.
e)Debido a que los temas u oraciones agregan otra dimensión al asunto, la mayoría de las veces
son más difíciles de analizar que las palabras y las unidades amplias. El lema es adecuado para
análisis de significados y las relaciones entre éstos.
CATEGORIAS
Las categorías son los niveles donde serán caracterizadas las unidades de análisis. Tal y como
menciona Holsti (1968), son las -casillas o cajones- en las cuales son clasificadas las unidades de
análisis.
TIPOS DE CATEGORIAS
Krippendorff (1982) señala cinco tipos de categorías:
1) De asunto o tópico. Las cuales se refieren a cuál es el asunto, tópico o tema tratado en el
contenido (¿de qué trata el mensaje o la comunicación?)
2) 2) De dirección. Estas categorías se refieren a cómo es tratado el asunto (¿positiva o
negativamente?, ¿favorable o desfavorable?, ¿nacionalista o no nacionalista?, etc.),
3) De valores. Se refieren a categorías que indican qué valores, intereses, metas, deseos o
creencias son revelados.
4) De receptores. Estas categorías se relacionan con el destinatario de la comunicación (¿a
quién van dirigidos los mensajes?).
5) Físicas. Son categorías para ubicar la posición y duración o extensión de una unidad de
análisis
REQUISITOS DE LAS CATEGORIAS
En un análisis de contenido se suelen tener varias categorías, pero éstas deben cumplir con los
siguientes requisitos:
1) Las categorías y subcategorías deben ser exhaustivas. Es decir, abarcar todas las posibles
subcategorías de lo que se va a codificar. Por ejemplo, la categoría 1deología del esposo" no
podría prescindir de la subcategoría "neutral".
2) Las subcategorías deben ser mutuamente excluyentes, de tal manera que una unidad de análisis
puede caer en una y sólo una de las subcategorías de cada categoría. Por ejemplo, un personaje
no puede ser "bueno" y "malo" a la vez.
¿CUÁLES SON LOS PASOS PARA LLEVAR A CABO EL ANÁLISIS DE CONTENIDO?
Ya hemos mencionado tres:
1.Definir con precisión el universo y extraer una muestra representativa.
2.Establecer y definir las unidades de análisis.
3.Establecer y definir las categorías y subcategorías que representen a las variables de la
investigación.
4.Seleccionar a los codificadores. Los codificadores son las personas que habrán de asignar las
unidades de análisis a las categorías. Deben ser personas con un nivel educativo profesional
(estudiantes a nivel de licenciatura como mínimo).
5.Elaborar las hojas de codificación. Estas hojas contienen las categorías y los codificadores anotan
en ellas cada vez que una unidad entra en una categoría o subcategoría.
Asimismo, las categorías y subcategorías deben estar codificadas con sus respectivos valores
numéricos
6.Proporcionar entrenamiento de codificadores. Este entrenamiento incluye que los codificadores
se familiaricen y compenetren con las variables, comprendan las categorías y subcategorías y
entiendan las definiciones de ambas. Además debe capacitarse a los codificadores en la manera de
codificar y debe discutirse ampliamente con ellos las diferentes condiciones en que puede
manifestarse o estar presente cada categoría y subcategoría. Asimismo, los codificadores deben
comprender completamente en qué consiste la unidad de análisis.
7.Calcular la confiabilidad de los codificadores. Una vez que se lleva a cabo el entrenamiento, los
codificadores realizan una codificación provisional de una parte representativa del material (el
mismo material para todos los codificadores), para ver si existe consenso entre ellos. Si no hay
consenso no puede efectuarse un análisis de contenido confiable.
Para lo anterior se calcula la confiabilidad de cada codificador (individual) y la confiabilidad entre
codificadores. El cálculo de la confiabilidad individual de los codificadores depende de si tenemos
uno o varios de éstos.
A. Si se dispone de un solo codificador (porque el material es reducido), se observan las
diferencias de la codificación del mismo mensaje hecha por el codificador en dos tiempos
diferentes. Si las diferencias son muy pequeñas, el codificador es individualmente
confiable. Este tipo de confiabilidad es llamado "confiabilidad intra-codificador". La cual
mide la estabilidad de la prueba y re-prueba de un codificador a través del tiempo.
Otro método consistiría en que el codificador trabaje una parte representativa del
material y después aplicara su codificación (resultados) la siguiente fórmula:
Confiabilidad individual = Número de unidades de análisis catalogadas correctamente por
el codificador/Número total de unidades de análisis
Suponiendo que un mensaje conste de 20 unidades y se logren correctamente 20, la
confiabilidad será de 1 (20/20) que es el máximo de confiabilidad.
B. Si se dispone de varios codificadores, la confiabilidad individual puede determinarse así:
Se les pide a todos los codificadores que codifiquen el mismo material, se toman los
resultados de todos menos los de uno y se compara la codificación de éste contra la del
resto. Así se procede con cada codificador.
También puede aplicarse a todos los codificadores la fórmula mencionada para calcular la
confiabilidad individual y quien se distancie del resto se considera un caso poco confiable.
EJEMPLO
Codificador A Codificador B Codificador C Codificador D
0.89 0.93 0.92 0.67
El cálculo de la confiabilidad intercodificadores se realiza por pares decodificadores
(parejas). Se pide a cada pareja formada que codifique el material, se comparan los
resultados obtenidos por las parejas, se cuenta el número de acuerdos entre las parejas,
se determina el número de unidades de análisis y se aplica la siguiente fórmula:
Confiabilidad entre dos parejas = Número total de acuerdas entre dos parejas / número
total de unidades de análisis codificadas
No es conveniente tolerar una confiabilidad menor que 0.85 (ni total ni entre dos parejas)
y de ser posible debe superar el 0.89. Al igual que con ours instrumentos de medición, la
confiabilidad oscila entre 0 (nula confiabilidad) y 1 (confiabilidad total). En el análisis de
contenido una baja confiabilidad puede deberse a que las categorías y1o unidades de
análisis no han sido definidas con claridad y precisión, a un deficiente entrenamiento o a
inhabilidad de los codificadores.
Cuando se obtiene una baja conflabilidad debe detectarse y corregirse el problema.
Asimismo, es conveniente calcular la confiabilidad a la mitad de la codificación (con el
material codificado) y al finalizar ésta.
8. Efectuar la codificación. Lo que implica contar las frecuencias de repetición de las
categorías (número de unidades que entran en cada categoría).
9. Vaciar los datos de las hojas de codificación y obtener totales para cada categoría.
10. Realizarlos análisis estadísticos apropiados.
9.6.4. Observación
La observación consiste en el registro sistemático, válido y confiable de comportamientos o
conducta manifiesta. Puede utilizarse como instrumento de medición en muy diversas
circunstancias.
PASOS PARA CONSTRUIR UN SISTEMA DE OBSERVACION
Los pasos para construir un sistema de observación son:
1. Definir con precisión el universo de aspectos, eventos o conductas a observar.
Por ejemplo, si nuestro interés es observar los recursos con que cuentan las escuelas de un distrito
escolar debemos definir lo que concebimos como escolar. Un universo podría ser el
comportamiento verbal y no verbal de un grupo de alumnos durante un semestre. Otro universo
sería las conductas de un grupo de trabajadores durante sus sesiones en círculos de calidad o
equipos para la calidad, en un periodo de un año. O bien las conductas agresivas de un grupo de
esquizofrénicos en sesiones terapéuticas.
2.Extraer una muestra representativa de los aspectos, eventos o conductas a observar. Un
repertorio suficiente de conductas para observar.
3.Establecer y definir las unidades de observación. Por ejemplo, cada vez que se presenta una
conducta agresiva, cada minuto se analizará si el alumno está o no atento a la clase, durante dos
horas al día (7:00 a 9:00 horas), el número de personas que leyeron el tablero de avisos de la
compañía, etcétera. El concepto de unidad de análisis es el mismo que en el análisis de contenido
solamente que en la observación se trata de conductas, eventos o aspectos.
4. Establecer y definir las categorías y subcategorías de observación. Estas categorías son similares
a las definidas para el análisis de contenido. Y la observación también consiste en asignar unidades
a categorías y subcategorías de observación.
LAS SUBCATEGORIAS PUEDEN SER ESCALAS DE ACTITUDES
Al establecer las subcategorías, éstas pueden ser escalas del tipo Likert, Guttman o diferencial
semántico.
5. Seleccionar a los observadores. Los observadores son aquellas personas que habrán de codificar
la conducta y deben conocer las variables, categorías y subcategorías.
6. Elegir el medio de observación. La conducta o sus manifestaciones pueden codificarse de
distintos medios: puede observarse directamente y ser codificada, puede filmarse en videocinta y
analizarse (con o sin audio dependiendo del hecho de que se evalúe o no la conducta verbal). En
algunos casos el observador se oculta y observa (por ejemplo, a través de un espejo de doble
vista). Otras veces participa con los sujetos y codifica. En ciertas ocasiones se codifican
manifestaciones de la conducta y la observación es "a posteriori (por ejemplo, un estudio para
evaluar las condiciones higiénicas de una comunidad o la infraestructura con que cuenta una
población). El medio a través del cual se observe depende de la investigación en particular.
7. Elaborar las hojas de codificación. Cuyo formato es el mismo que se presentó en el apartado
sobre análisis de contenido.
8. Proporcionar entrenamiento de codificadores (en las variables, categorías, subcategorías,
unidades de análisis y el procedimiento de codificar, así como sobre las diferentes maneras como
puede manifestarse una categoría o subcategoria de conducta).
9. Calcular la confiabilidad de los observadores (intra-observador e interobservadores). Los
procedimientos y fórmulas pueden ser las mismas que las vistas en el apartado sobre el análisis de
contenido, lo único que cambia es la palabra "codificador(es)", "codificación", "codificada(s)"; por
“observador(es)”, “observación”, "observada(s)".
10. Llevara cabo la codificación por observación.
11.Vaciar los datos de las hojas de codificación Y obtener totales para cada categoría.
12.Realizar los análisis apropiados.
TIPOS DE OBSERVACION
La observación puede ser participante o no participante. En la primera, el observador interactúa
con los sujetos observados y en la segunda no ocurre esta interacción. Por ejemplo, un estudio
sobre las conductas de aprendizaje de niños autistas, en donde una instructora interactúa con los
niños y al mismo tiempo codifica.
VENTAJAS DE LA OBSERVACICIN
Tanto la observación como el análisis de contenido tienen varias ventajas:
1) Son técnicas de medición no obstrusivas. En el sentido que el instrumento de medición no -
estimula" el comportamiento de los sujetos (las escalas de actitud y los cuestionarios pretenden
"estimular" una respuesta a cada ítem). Los métodos no obstrusivos simplemente registran algo
que fue estimulado por otros factores ajenos al instrumento de medición.
2) Aceptan material no estructurada.
3) Pueden trabajar con grandes volúmenes de datos (material).
9.6.5. Pruebas e inventarios estandarizados
En la actualidad existe una amplia diversidad de pruebas e inventarios desarrollados por diversos
investigadores para medir un gran número de variables. Estas pruebas tienen su propio
procedimiento de aplicación, codificación e interpretación, y se encuentran disponibles en
diversas fuentes secundarias y terciarias, así como en centros de investigación y difusión de¡
conocimiento. Hay pruebas para medir habilidades y aptitudes (v.g., habilidad verbal,
razonamiento, memoria, inteligencia, percepción, habilidad numérica), la personalidad, los
intereses, los valores, el desempeño, La motivación, el aprendizaje, el clima laboral en una
organización, etcétera.
También se puede disponer de pruebas clínicas para detectar conducta anormal, pruebas para
seleccionar personal, pruebas para conocer las percepciones y/o opiniones de las personas
respecto a diversos tópicos, pruebas para medir la autoestirna y -en fin- otras muchas variables del
comportamiento.
El problema en el uso de estas pruebas es que la mayoría ha sido desarrollada en contextos muy
diferentes al latinoamericano, y en ocasiones su utilización puede ser inadecuada, inválida y poco
confiable.
Cuando se utilice como instrumento de medición una prueba estandarizada es conveniente que se
seleccione una prueba desarrollada o adaptada por algún investigador para el mismo contexto de
nuestra estudio y que sea válida Y confiable (debernos tener información a este respecto). En el
caso de que elijamos una prueba diseñada en otro contexto, es necesario adaptarla y aplicar
pruebas piloto para calcular su validez y confiabilidad, así como ajustarla a las condiciones de
nuestra investigación. El instrumento o prueba debe demostrar que es válido y confiable para el
contexto en el cual se va a aplicar.
9.6.6. Sesiones en profundidad
¿QUÉ SON LAS SESIONES EN PROFUNDIDAD?
Un método de recolección de datos cuya popularidad ha crecido son las sesiones en
profundidad. Se reúne a un grupo de personas y se trabaja con éste en relación a las variables de
la investigación.
Pueden realizarse una o varias reuniones. El procedimiento usual es el siguiente.
PASOS PARA REALIZAR LAS SESIONES DE GRUPO
1.Se define el tipo de personas que habrán de participar en la sesión o sesiones.
2.Se detectan personas del tipo elegido.
3.Se invita a estas personas a la sesión o sesiones.
4.Se organizan la sesión o sesiones. Cada sesión debe efectuarse en un lugar confortable,
silencioso y aislado. Los sujetos deben sentirse cómodos y relajados. Asimismo, es indispensable
planear cuidadosamente lo que se va a tratar en la sesión o sesiones (desarrollar una agenda) y
asegurar los detalles (aún las cuestiones más sencillas como el servir café y refrescos).
5.Se lleva a cabo cada sesión. El conductor debe ser una persona entrenada en el manejo o
conducción de grupos y debe crear "rapport" en el grupo (clima de confianza). Asimismo, debe ser
un individuo que no sea percibido como "distante" por los participantes de la sesión y tiene que
propiciar la participación de todos. La paciencia es una característica que deberá tener.
Durante la sesión se pueden pedir opiniones, hacer preguntas, administrar cuestionarios, discutir
casos, intercambiar puntos de vista, valorar diversos aspectos. Es conveniente que cada sesión se
grabe en cinta o videocinta y después realizar análisis de contenido y observación. El conductor
debe tener muy en claro la información o datos que habrán de recolectarse y evitar desviaciones
del objetivo planteado.
6.Elaborar el reporte de sesión. El cual incluye principalmente datos sobre los participantes (edad,
sexo, nivel educativo y todo aquello que sea relevante para el estudio), fecha y duración de la
sesión, información completa del desarrollo de la sesión, actitud y comportamiento de los
participantes hacia el conductor y la sesión en sí, resultados de la sesión y observaciones del
conductor, as¡ como una bitácora de la sesión.
7.Llevar a cabo la codificación v análisis correspondientes.