Serie: Metodologías cuantitativas y cualitativas en Ciencias Sociales
Directores:
M- Ángeles Cea D’A ncona
Miguel S. Valles M artínez
i"
LA INVESTIGACION
COMO PROCESO
Planificación y desarrollo
Marian Ispizua y Cristina Lavía
DEXTRA
Consulte la página [Link]
Diseño de cubierta: ©Theldeas • [Link]
Maquetación Lettcra63. I Diseño editorial
© Marian Ispizua, Cristina Cavia
© Dextra Editorial S. L.
c/ Arroyo de Fontarrón, 271, 28030 Madrid
Teléfono: 91 773 37 10
info@[Link]
Reservados todos los derechos. Está prohibido, bajo las sanciones penales y el resarcimiento
civil previstos en las leyes, reproducir, registrar o transmitir esta publicación, íntegra o parcial
mente por cualquier sistema de recuperación y por cualquier medio, sea mecánico, electrónico,
magnético, electroóptico, por fotocopia o por cualquier otro, sin la autorización expresa por
escrito de Dextra Editorial, S. L.
ISBN: 978-84-16277-73-5
Depósito Legal: M-23670-2016
Impreso en España-Printed in Spain
ÍN D IC E
Prólogo ........................................................................................................... 9
1. Proyectos de investigación................................................................................................ 13
1.1. Qué es una investigación social, cuándo investigar, por qué y para qué:
tipos de investigaciones s o c ia le s .................................................................................. 15
1.2. Investigación: tareas y f a s e s ...........................................................................................19
1.3. Investigación cuantitativa y cualitativa. Algunos d is e ñ o s .................................... 22
1.4. Redacción del proyecto de investigación ................................................................. 32
1.4.1. Preliminares e introducción ............................................................................. 35
1.4.2. Objetivos e hipótesis o preguntas de investigación .................................... 38
1.4.3. Selección del diseño de investigación: técnicasy fu e n te s ....................... 42
1.4.4. Plan de trabajo ................................................................................................... 42
1.5. Aspectos éticos de la investigación s o c ia l................................................................. 45
2. Identificando a la población a analizar. Seleccionando a los sujetos,
unidades de observación y análisis. Poblaciones y muestras ............................ 55
2.1. Estudios exhaustivos vs. estudios m uéstrales ..................................................... 58
2.1.1. Estudios exhaustivos .......................................................................................... 58
2.1.2. Estudios m uéstrales ............................................................................... 60
La investigación como proceso
2.2. M uestreo para estudios cu a n tita tivo s...................................................................... 61
2.2.1. Métodos probabilísticos ........................................................................ 65
2.2.2. Muestreo no probabilístico ................................................................... 69
2.2.3. El tamaño de la muestra y el muestreo aleatorio como base
para su cálculo ....................................................................................... 74
2.2.4. Diseños polietápicos ............................................................................. 79
2.2.5. Submuestras, muestreo no proporcionado y ponderación .................. 81
2.2.6. Otras consideraciones prácticas sobre muestreo para estudios
cuantitativos .......................................................................................... 84
2.3. M uestreo cualitativo ..................................................>................................................. 87
2.3.1. Estrategias y criterios de selección m uestraI ........................................ 89
2.3.2. El tamaño de la m uestra ........................................................................ 94
2.3.3. Credibilidad y transferibilidad ............................................................... 97
3. E x p lo ra n d o la in fo rm a ció n e x is t e n t e ........................................................................... 99
3.1. Principales tipos de fuentes dCinfo rm ació n se c u n d a ria .................................... 105
3.1.1. Registros internos vs. externos ............................................................. 106
3.1.2. Documentos de acceso público y documentos privado ....................... 107
3.2. Sobre las fuentes b ib lio g rá fica s................................................................................ 109
3.3. Bancos de datos y datos se c u n d a rio s...................................................................... 111
3.4. Ventajas, lim itaciones y retos del uso de fuentes secundarias
para la in ve stiga ció n ...................................................................................................... 116
3.5 Organism os productores de datos e inform ación se c u n d a ria ........................... 118
3.5.1 Las fuentes estadísticas oficiales: Instituto Nacional
de Estadística (INE) y equivalentes ........................................................ 120
3.5.2. Centro de Investigaciones Sociológicas (CIS) y los repositorios
de datos de investigación ..................................................................... 121
4. C re a n d o nuestra p ro p ia in f o r m a c ió n ........................................................................... 125
4.1. Paréntesis previo: operacionalización de conceptos y m edición,
fiabilidad y v a lid e z ............................. 127
4.2. La e n cu e sta ....................................................................................................................... 131
4.2.1. Tipos de estudios mediante encuesta .................................................. 133
4.2.2. Los elementos de la encuesta en la recogida de información:
muestra, cuestionario y modo de administración ................................ 135
6
índice
4.3. La sociom etría y el análisis de redes sociales...........................................................146
4.4. El método D e lp h i.......................................................................................................... 149
4.5. E n tre v ista s........................................................................................................................ 152
4.5.1. El desarrollo de la entrevista en profundidad ....................................... 155
4.5.2. Entrevistas en grupo .............................................................................. 157
4.6. O b se rvació n ......................................................................................................................159
4.6.1. Observación directa participante ......................................................... 161
4.6.2. Observación directa no participante .................................................... 164
4.6.3. Observación indirecta y documental...................................................... 170
4.7. Las m etodologías participativas ................................................................................. 174
5. El análisis y la interpretación de los datos ................................................................177
5.1. Análisis cuantitativo de d a to s ......................................................................................178
5.1.1. Análisis descriptivo y comparaciones descriptivas ............................... 183
5.1.2. Diferencias significativas entre muestras (o grupos) .......................... 197
5.1.3. Análisis de tablas de contingencia y asociación entre variables ......... 214
5.1.4. Análisis de correlaciones ...................................................................... 222
5.2. El análisis cualitativo de los datos ............................................................................229
5.2.1. Análisis de contenido ......................................................................... 232
5.2.2. Análisis interpretativo ............................................................................ 235
6. Presentación de resultados y redacción del informe ................................. 245
6.1. Tipos de inform es: inform e general e informe ejecutivo .................................. 246
6.1.1. La estructura de los informes generales .............................................. 249
6.1.2. Otros condicionantes para la elaboración de informes ...................... 255
6.2. Presentaciones orales ...................................................................................................258
6.3. P ó ste re s.............................................................................................................................260
6.4. El uso de gráficos, tablas e ilustraciones ................................................................ 262
A modo de epílogo: el análisis dela información de la información ...................... 269
Bibliografía .................................................................................................................................... 273
/
P R Ó LO G O
Este es un texto sobre la práctica de la investigación social. Se trata de una revisión
actualizada del proceso de la investigación social -desde la redacción del proyecto
hasta la divulgación de resultados- que puede adaptarse a varios tipos de investi
gaciones en otros tantos campos de las ciencias sociales (sociología, ciencia política,
trabajo social, comunicación, antropología, etc.), e incluso en otros como el urbanis
mo o las ciencias de la salud, que en ocasiones trabajan con diseños y datos propios
de las ciencias sociales.
Lo que queremos aportar es un conjunto de reflexiones sobre la investigación
como proceso completo, pero en clave práctica, unas veces desvelando problemas
pero otras también proponiendo soluciones concretas o, al menos, aportando ejem
plos que ilustren modos de proceder con los que resolver tareas e interrogantes en
distintas fases de una investigación. Como se señala en muchas ocasiones a lo largo
del texto, el mundo de la investigación social es tan extenso, variado, y a veces hasta
complejo, que resulta muy difícil abarcarlo todo a la vez. También la elaboración de
manuales que recojan toda la batería de recursos metodológicos y técnicos que se
podrían requerir para afrontar una investigación concreta es un trabajo enorme.
Pero, más allá de la amplitud de esa tarea (enseñar «cómo se hace» todo), el plan
teamiento de este texto desde el principio fue otro.
Este texto surge de nuestra experiencia investigadora y también docente, pero
no es un manual reducido de métodos y técnicas de investigación social. La idea
inicial siempre fue la de compilar de algún modo las respuestas que hemos ido acu
mulando a gran parte de las dudas que el alumnado de grado y postgrado nos suele
plantear al afrontar sus primeras investigaciones en solitario, junto a otras reflexio-
La investigación como proceso
nes que también nos han ido surgiendo en nuestra propia práctica investigadora.
Hemos venido observando que muchas de estas cuestiones no suelen provenir solo
de una falta de conocimientos, que simplemente se pudiera solventar estudiando
más y mejor las técnicas y los procedimientos contrastados que están a disposición
de quien quiera aprenderlas. Parte importante del aprendizaje del «oficio» de in
vestigar también viene del tener asesoramientos o guías que acentúen la visión de
conjunto de todo el proceso: cómo las distintas tareas y las decisiones que se van
tomando se condicionan unas a otras, cómo los diferentes estilos de investigar pue
den adaptarse a cada circunstancia específica para responder con el rigor necesario
a los interrogantes que nos plantea la realidad.
Este texto es, por tanto, panorámico, pero prácti conrea lista y actualizado. Hemos
procurado no citar toda la literatura disponible, sino centrarnos en las referencias
más actuales posibles, aunque también se incluyen, inevitablemente, textos básicos
o clásicos. Con ello pretendemos principalmente señalar una selección de los ma
teriales que nos parecen más interesantes en cada caso, asumiendo también que
otra literatura de referencia es conocida o al menos fácilmente localizable a través
de la actual. Los motivos por los cuales hemos seleccionado tanto las aportaciones
metodológicas como los ejemplos de investigaciones que se citan son variados y
no quiere decir que lo que no a p a le e no merezca atención (aquí hay una evidente
limitación de extensión], ni que lo que aparece sea el único ejemplo disponible.
Cuando se han utilizado textos u otros materiales escritos en otros idiomas, los re
producimos bajo nuestra propia traducción. En definitiva, en cada caso aportamos
aquellas referencias que han ido surgiendo como buenos ejemplos del discurrir de
nuestras reflexiones, debates y conclusiones.
El texto se organiza en seis capítulos a modo de una secuencia de investigación.
En el primer capítulo abordamos el hecho mismo de que la investigación es un pro
ceso a través de su planteamiento inicial y la tarea de redactar un proyecto de inves
tigación. Este es uno de los trabajos más difíciles a los que se enfrentan investigado-
res/as noveles precisamente porque exige toda la experiencia de tener la visión de
conjunto para poder anticipar una planificación que sea posible llevar a cabo con
unos objetivos y bajo unas condiciones concretas. En este capítulo se marcan tam
bién algunos de los ejes en los que se basan también nuestras aportaciones sobre
muchas cuestiones concretas en el resto del texto. Uno de ellos es la importancia
práctica de diferenciar las investigaciones según su aproximación metodológica
cuantitativa o cualitativa, que es central. Para ver además de un modo organizado
las distintas posibilidades, presentamos una serie de «diseños» que son a los que
recurrimos la mayor parte de las veces que se plantea la necesidad de realizar una
nueva investigación. Algunos de estos diseños se desarrollarán más en los capítulos
siguientes.
Otro eje importante sobre el que se organiza la visión del proceso de investiga
ción es la distinción entre tipos de investigaciones por su destino o finalidad, y que
van de lo más formalmente académico (tesis doctorales, investigaciones de grupos
10
Prólogo
o equipos universitarios) a lo más puramente profesional bajo encargo (a demanda,
para resolver necesidades específicas). En todos los estadios intermedios de ese
continuum es posible realizar investigación de calidad y relevante. Otro eje es que,
más allá de que fuera posible (que no lo es) una lista de instrucciones precisas so
bre cómo hacerlo todo en investigación, las actitudes de las personas que investiga
mos hacia el proceso son determinantes; no solo las cuestiones éticas a las que hay
que atender, sino la honestidad metodológica y el compromiso de la investigación
social con las realidades sociales conforman para cada investigación un proceso
único con sus decisiones y sus matices.
El segundo capítulo trabaja una de las dimensiones en principio más «técnicas»
de las investigaciones sociales, como es la de la definición de poblaciones y las ta
reas de muestreo, diferenciando el muestreo para diseños cuantitativos del de los
cualitativos. Aquí se intenta aportar ideas muy realistas sobre lo que se puede hacer
con recursos siempre limitados y la tecnología actual, tanto para afrontar la tarea
directamente como para evaluar diseños ajenos.
El tercer capítulo está dedicado a la información denominada «secundaria».
Como se expone desde el inicio, el recurso a la información disponible relativa a
las cuestiones que son objeto de investigación forma parte de todos los proyectos,
bien sea como referencia de contexto o bien como base empírica de todo el estudio
(estudios secundarios). Teniendo en cuenta los costes de recabar información de
primera mano en cada investigación y el hecho de que vivimos una era de «revolu
ción de los datos», investigar exige, cada vez más, las habilidades específicas de des
entrañar las posibilidades de las fuentes secundarias disponibles, seleccionando,
organizando, analizando e interpretando información que ya «está ahí».
El capítulo cuatro repasa el conjunto de tareas centrales de las investigaciones
sociales, que consisten en recabar las evidencias necesarias sobre aquellas cues
tiones que investigamos; evidencias que serán analizadas para responder a los ob
jetivos o preguntas de investigación. Cuando estos «datos», ya sean cuantitativos o
cualitativos, hay que recogerlos de primera mano, son en realidad «creados», como
figura en el título. De los muy diversos modos de crear la información necesaria
para el análisis de distintos tipos de realidades sociales, aquí seleccionamos la en
cuesta, las entrevistas, la observación, la sociometría y el análisis de redes, el Delphi
y las metodologías participativas. Básicamente, en el capítulo se destacan aquellos
aspectos de cada técnica que pueden ayudar a reconocer cuándo y para qué tipo de
investigación sería una buena opción metodológica. También en cada caso se inten
ta apuntar los elementos más determinantes de la elección de unos u otros modos
de construir datos y a efectos prácticos, sobre todo con la idea de que las personas
que se inician en investigación puedan orientar mejor sus esfuerzos.
El capítulo cinco se dedica al análisis de las evidencias empíricas recabadas o
construidas en el proceso de investigación. En esta parte, el texto es obligadamente
sintético, ya que explicar todo posible modo de análisis de datos o información es
inabordable en este formato. El capítulo afronta, por un lado, el «modo estadísti-
11
La investigación como proceso
co» de análisis de datos cuantitativos y, por otro lado, los «modos cualitativos» de
análisis de textos y discursos a través del análisis de contenido y el análisis inter
pretativo. Realmente son dos escenarios prácticos completamente diferentes, pero
responden al mismo «momento» de averiguación en el proceso de investigación
y, desde esa perspectiva, se organiza la exposición y reflexión sobre las tareas de
análisis.
En el caso del análisis estadístico solo se exponen las aplicaciones más básicas
(pero habituales) descriptivas e inferenciales, sobre todo con la intención de re
producir una forma realista de trabajo analítico para «hacer hablar» a los datos.
Trabajando la gestión de datos y los cálculos con software estadístico, los puntos
fuertes del análisis cuantitativo son la elección de procedimientos adecuados y la
interpretación de resultados, y es lo que hemos ejemplificado en concreto aquí. Res
pecto a los análisis cualitativos también hemos optado por reflejar aquellos aspec
tos que nos parecen más clarificadores dentro de un tipo de estilo analítico que se
caracteriza por la flexibilidad, la falta de sistematicidad, la permanente apertura a
las nuevas evidencias.
Por último, el capítulo seis cierra el proceso con las tareas de elaboración de
informes y divulgación de resultados, que no por aparentemente más sencillas re
quieren menos atención. En esto^uspectos también hay mucho que aprender del
trabajo de la comunidad científica y profesional. Aunque parezca que la capacidad
comunicativa de quienes investigamos se da por supuesta, mucha creatividad y ori
ginalidad son resultado de trabajos bien planificados.
Antes de terminar, queremos expresar nuestro agradecimiento a los directores
de esta serie de Metodologías cuantitativas y cualitativas en Ciencias Sociales, M‘-
Ángeles Cea DAncona y Miguel S. Valles Martínez, excelentes sociólogos, por confiar
en nosotras y animarnos en este proyecto. También damos las gracias especialmen
te a Alfredo Molina, editor de Dextra, por la oportunidad y las facilidades que nos ha
brindado a lo largo del proceso de elaboración de este texto. Nuestros compañeros
y compañeras en la investigación nos han aportado su experiencia, e incluso mate
rial concreto procedente de su propio trabajo de investigación: muchas gracias por
ello. Por supuesto, quienes finalmente han hecho posible culminar este proyecto
son nuestras familias, a las que dedicamos este libro.
Finalmente, recordamos que este texto está pensado sobre todo para estudian
tes de postgrado y para todas las personas que se inician en el proceso, proponien
do investigaciones completas o integrándose en equipos de investigación. Si bien
también nos gustaría que otros investigadores e investigadoras con distintas expe
riencias encuentren en el mismo una fuejnte de reflexión y diálogo acerca del proce
so de investigación social.
12
1. P R O Y EC TO S DE IN V E S T IG A C IÓ N
La idea central que rige este texto es destacar la visión de la investigación social
como un proceso continuo. Orientar de modo práctico a quienes quieren adentrar
se en la investigación, en su planteamiento y desarrollo como proceso es el reto que
nos proponemos. Sin embargo, la amplitud del objetivo es evidente en la medida
en que «las» investigaciones sociales, es decir, cada investigación social tiene unos
condicionantes específicos que la definen a menudo desde su inicio.
Son diversos los modos en que podríamos abordar una descripción general de
en qué consiste este proceso, habiendo además bastante material de consulta al
respecto. Básicamente, los textos y manuales sobre métodos y técnicas de investi
gación suelen hacer referencia a un esquema circular de fases y tareas más o menos
generales o concretas, como puede verse en Cea D'Ancona (2012). Esquema que con
frecuencia lleva a exponer el también habitual debate sobre las diferencias entre
metodologías cuantitativas o cualitativas y sobre la adecuación de las investigacio
nes reales a una visión tradicional de la lógica de la ciencia y del método científico.
Esta idea del quehacer científico en la conocida esquematización de Wallace (1976,
22) representa el camino de la generación de conocimiento científico como la cone
xión ordenada y secuenciada de cuatro componentes esenciales del conocimiento
(teorías, hipótesis, observaciones y generalizaciones empíricas) a través de cua
tro procesos cognitivos: deducción (de las hipótesis desde o a partir de la teoría),
operacionalización (de conceptos para obtener observaciones desde las hipótesis),
interpretación (mediante análisis de observaciones para obtener generalizaciones
La investigación como proceso
empíricas) e inducción (hasta la teoría y en el sentido en que los contrastes de hipó
tesis planteadas lo indique). Es la «lógica de la ciencia» en términos amplios.
En cualquier caso aquí vamos a optar por una visión más pragmática y pegada
a la realidad. Toda investigación social de cualquier tipo se ha realizado a partir de
un proyecto (o propuesta), y redactar un proyecto de investigación suele ser una de
las primeras tareas a las que enfrentarse al iniciar una investigación. Una tarea en la
que los y las investigadores/as noveles suelen sentirse un tanto desorientados. Esta
idea de cómo afrontar organizadamente una investigación concreta tiene a veces
denominaciones que pueden resultar algo confusas y, en consecuencia, contenidos
algo diferentes. Las referencias alternativas a términos como diseños, planes, es
trategias o aproximaciones, e incluso como perspectivas, métodos y metodologías,
muy a menudo no ayudan a identificar el plano en el que nos movemos.
Al referirnos aquí al proyecto de investigación, hablamos de una propuesta anti
cipada, que describe la investigación que se pretende llevar a cabo en sus aspectos
principales y hasta donde es posible especificarla. En ese sentido, el proyecto es
una especie de plan tentativo de la investigación que incluye esquemáticamente los
principales aspectos del proceso de investigación que se va a llevar cabo, respon
diendo a cada una de las previsibles fases. El proyecto se piensa, se discute en equi
po, se prepara, normalmente se l^dacta y a veces se presenta ante otros agentes
implicados antes de considerarlo definitivo.
Paradójicamente, para elaborar un proyecto de investigación hay que conocer y
anticipar muchos de los elementos de todo proceso, pero sobre todo hay que enten
der el proceso de modo coherente y saber cómo es previsible que se relacionen los
diversos componentes de la investigación que se pretende llevar a cabo. Por esto, el
proyecto es en sí mismo el primer reto, y puede que el más duro, a la hora de poner
en práctica la investigación social.
Nosotras pensamos, porque así lo vemos en la práctica, que un buen modo de
acercarse a la coherencia de un proceso de investigación es a través de la tarea
concreta de redactar el proyecto. Por eso la hemos elegido para poder seleccionar
aquellos aspectos o aquellas cuestiones relativas al desarrollo de cada investigación
que nos parecen de especial interés. Por la mencionada amplitud del campo, clara
mente esta no podrá ser una aproximación completamente panorámica en todo el
espectro posible de investigaciones. Pero lo que sí pretendemos es que sea integra-
dora. Precisamente porque en investigación todo está relacionado entre sí, hay que
buscar algún modo organizado de explicarlo.
En este capítulo inicial abordamos primero una contextualización de los diferen
tes tipos de investigaciones sociales que se pueden tener en cuenta, para después
proponer un esquema del proceso y una selección de diseños que consideramos
más extendidos entre las investigaciones sociales reales. Tras exponer brevemente
las características de los diseños, daremos unas pautas básicas sobre cómo poder
decidir acerca de qué diseños se ajustan mejor a qué necesidades de investigación.
Como en capítulos sucesivos se tratarán más a fondo muchos de estos elementos,
14
Proyectos de investigación
aquí el capítulo se cierra con la visión de conjunto a través del cronograma y de
una reflexión sobre los aspectos éticos de la investigación. En resumen, la idea es
presentar los componentes que podrían ser comunes y consideramos más impor
tantes para «llevar a cabo» una investigación empírica en las ciencias sociales, con
la finalidad de ayudar a verlo de un modo que sea práctico.
1.1. Qué es una investigación social, cuándo investigar, por qué y para qué:
tipos de investigaciones sociales
Realmente el mundo de la investigación social es muy amplio y también muy diver
so. No solo por las temáticas o las áreas de conocimiento en que se insertan las in
vestigaciones, sino por los modos de llevarlas a cabo y su finalidad última. Identida
des, pobreza, educación, cambios familiares, actitudes y opiniones políticas, uso de
tecnologías, pautas de consumo, desigualdades sociales y desarrollo, patrones de
género, etc., desde lo más cotidiano a lo más institucional, desde lo más inmediato y
actual, hasta intentar incluso llegar a prever los cambios sociales que tendrán lugar.
Todas las realidades sociales son campo potencial de investigación. Además, cada
una de estas cuestiones puede ser abordada para su conocimiento y comprensión
desde diversos enfoques, con distintas ópticas y para diferentes fines. A lo largo del
texto se irá desarrollando parte de esta diversidad a través de ejemplos.
Podemos adelantar que, si en este momento atendemos a la incorporación de los
más recientes desarrollos tecnológicos en cuanto a comunicaciones e información
disponible (a partir de internet y las nuevas formas de comunicación), los campos
y utilidades en los que se inscribe buena parte de la investigación social son aún
más numerosos porque la realidad social cada vez es más rápida y más extensa
en términos espacio-temporales. En definitiva, por el hecho de estar en una deter
minada realidad social, todas las personas estamos expuestas de algún modo a la
investigación social.
A diferencia del conocimiento informal o de sentido común sobre el mundo en
que todos vivimos, el conocimiento científico de las realidades sociales suele des
cribirse y acotarse a partir de sus dos elementos clave: el objeto y el método. La
investigación social pretende conocer un objeto complejo, genéricamente «la socie
dad», y hacerlo usando «el método científico», como lo hace cualquier otra ciencia
(Babbie, 1996). En este sentido, el método se define como:
«la lógica de investigación que legitima y estructura un conjunto de decisiones y ac
tividades planificadas con objeto de establecer enunciados verdaderos sobre la rea
lidad social (...) La determinación del método es la clave del diseño investigador y se
ve influida por posiciones metateóricas (cómo se puede conocer la realidad), por el
objeto de la investigación (preguntas y problemas que hay que responder/solucio
nar), las orientaciones teóricas desde las que se representa el objeto, y las técnicas de
obtención y análisis de datos» (Bericat, 1998,19).
15
La investigación como proceso
Sobre el objeto, es obligado poner de manifiesto que la realidad social en términos
amplios tiene características distintivas que no tiene la realidad natural que otras
personas también investigan, y que afectan al modo en que podemos aprehenderla
y conocerla (Beltrán, 1991).
Que la realidad social tiene dimensiones objetivas y subjetivas (hechos y signi
ficados), que es construida producto de la reflexividad y la interacción humana y
que es constantemente cambiante (en términos espacio-temporales) son peculia
ridades que en la práctica, como iremos viendo, siempre se hacen presentes de un
modo u otro en el conjunto de decisiones que conlleva cada proceso de investiga
ción social. Todo esto hace que cada investigación, como producto unitario de esa
actividad de alcanzar conocimiento científico de la sociedad, deba ser algo diferente
de la mera acumulación (con difusión) de información.
Lo que distingue la investigación social de otros modos de acercarse a las reali
dades sociales o de captar la sociedad es que la investigación es, como proceso, una
forma específica de captar y construir la realidad social. Esta forma pasa por obser
var y analizar esa realidad con arreglo a un plan científico que puede ser o no común
a otras ciencias, o bien respondiendo al menos a ciertas reglas sistemáticas. Estas
reglas guían aquellas tareas que hay que llevar a cabo: plantear preguntas o derivar
hipótesis desde el conocimiento precedente; seleccionar los modos de acceso a la
realidad para obtener la información necesaria y /o operacionalizar variables, y re
copilar evidencias empíricas y analizarlas para responder con ello a las preguntas
o hipótesis iniciales. Sin duda, el grado de flexibilidad con que esta secuencia o este
plan pueden adaptarse a cada investigación en particular, o a tipos identificables de
investigaciones que parten de premisas comunes, sigue siendo objeto de discusión
y de necesidad de posicionamiento para gran parte de la comunidad científica en
ciencias sociales. Nuestra posición prefiere afrontar inicialmente la investigación
destacando que en lo fundamental «todos los investigadores sociales participan de
un diálogo entre las ideas ("teoría") y las pruebas empíricas ("datos") cuando cons
truyen sus representaciones de la vida social» (Ragin, 2007, 20). Estas definiciones
mínimas, sin embargo, no pretenden ocultar que hay diferentes modos de ver lo
que es más definitorio de la investigación social frente a otro tipo de actividad, ya
que las investigaciones sociales se pueden enfocar de modos distintos, como tam
bién especificaremos más adelante.
¿Por qué o para qué investigar? ¿De dónde surgen las investigaciones? Aunque
no siempre se destaca, clarificar el origen de cada investigación es crucial para po
der abordarla. «Cualquier proyecto de investigación exitoso requiere dos cosas: una
pregunta de investigación con sentido y un modo apropiado de responder a la cues
tión (...) Decidir cómo realizar tu investigación depende de una comprensión clara
de por qué la estás haciendo» (Morgan, 2014,41). Si nos fijamos en el para qué o en
el porqué de la investigación, hay una diferenciación no muy mencionada (Bergua,
2011, 67), pero que es muy importante a la hora de considerar el proceso completo
y que afecta mucho a los primeros pasos en una carrera o actividad investigadora:
16
Proyectos de investigación
la diferencia entre las investigaciones de finalidad fundamentalmente académica
frente a las de finalidad más profesional. Tanto en el campo de la sociología, como
en los de la ciencia política o de la psicología, antropología, comunicación y otros, la
necesidad de investigar puede surgir en un contexto o bien de demanda o bien tiene
un propósito que nace de habernos hecho preguntas que nos llevan a investigar.
Digamos que la investigación que prioriza el hecho de participar en la construcción
de conocimiento es la que suele denominarse más académica, pero también hay
investigación que responde muy directamente a necesidades de distintos sectores
de la sociedad (empresas, organizaciones, instituciones, gobiernos) o incluso a pro
blemas o fenómenos sociales concretos.
Es importante ver que en un caso es la persona que investiga quien «busca» su
investigación: busca un tema o un campo de conocimiento o un grupo de investiga
ción que son de su interés y, de ese modo, la investigación se convierte en un tipo de
actividad que tiene algunas características propias, sobre todo en el plano compe
titivo a un nivel superior. Las tesinas de grado o postgrado, trabajos fin de máster,
las tesis doctorales y las investigaciones con financiación competitiva en programas
públicos entrarían en este tipo en el cual una clave básica es que estas investiga
ciones son sometidas a evaluación formal bajo criterios académicos y dentro de
una comunidad científica. En el otro caso, el de las investigaciones que responden
a necesidades sociales o a demandas de carácter más profesional (informes de si
tuación, diagnósticos sociales, estudios de mercado, proyecciones o estimaciones,
entre muchas otras) se prioriza el resultado final, los intereses de las personas o
colectivos demandantes y que haya respuesta concreta al encargo o al problema
planteado. Por descontado, las investigaciones profesionales también se entiende
que tienen que realizarse con arreglo a «método» en el sentido de procedimientos
contrastados (si no, no sería investigación) y también, por lo mismo, las investi
gaciones académicas tienen que tener algún resultado relevante. Sin embargo, los
distintos condicionantes específicos de cada contexto de investigación hacen que,
en el proceso de investigación, se tomen unas decisiones u otras. De alguna forma,
los sujetos destinatarios de la investigación (audiencia científica o académica, pú
blicos generales más amplios o clientela muy concreta) y el contexto en el que surge
moldean la forma concreta que vaya a tener.
De entrada, estas diferencias ya se pueden apreciar comparando los informes
finales de los estudios o investigaciones: por ejemplo, el informe de una investiga
ción universitaria en colaboración internacional y con financiación pública sobre
la integración de la segunda generación de la inmigración extranjera en nuestro
país (Aparicio y Portes, 2014) con la presentación infográfica disponible en inter
net de la IV Oleada del Observatorio de Redes Sociales de una empresa consultora
de investigación y marketing ( The Cocktail Analysis, 2013). En el primer caso vemos
un informe extenso estructurado al modo académico (contexto, teoría, metodolo
gía, resultados, bibliografía) y en el que se integran teorías, evidencias, análisis y
reflexión. En el segundo caso, el estudio realizado presenta primero un resumen
17
La investigación como proceso
básicamente gráfico de resultados (datos cuantitativos) con un enlace a otra pre
sentación de diapositivas en que se profundiza y amplía la exposición de resultados
y donde se explican brevemente los objetivos y metodología de la investigación.
Esta diferenciación anterior entre investigaciones más académicas e investiga
ciones a demanda puede conectarse también con una de las clasificaciones cono
cidas de tipos de investigaciones (sociales) que diferenciaban las investigaciones
«básicas» frente a las «aplicadas» (Sierra Bravo, 1991, 33). Otros criterios impor
tantes que condicionan y sirven para clasificar los tipos de investigación suelen ser
el alcance o tratamiento temporal: la diferencia entre las investigaciones seccio
nales (que abordan la realidad en un momento actual) y las longitudinales (que
reconstruyen el pasado o tratan de hacer prospectiva de futuro) es muy importante
en prácticamente todos los aspectos del proceso. También es discriminante en el di
seño y desarrollo de las investigaciones es el marco o tipo de situación en que se de
sarrollan, sean estas más bien espontáneas o «de campo» o bien más «artificiales»
(e incluso de laboratorio). En cualquier caso, aquí no interesa tanto ver criterios de
clasificación para investigaciones sociales que se pueden consultar en la literatura
disponible sino aportar algunas pautas prácticas y relevantes para llevar a cabo
una investigación social y también para evaluar la investigación realizada por otros.
Por ello nos va a interesar más iríeñalando algunas cuestiones actuales que condi
cionan los tipos de investigaciones que realmente se están haciendo para orientar
con ello los pasos de quienes quieran adentrarse en el mundo de la investigación
social. Así, por ejemplo, hay retos muy interesantes que se derivan de la creciente
velocidad en el acceso y circulación de información como consecuencia de la incor
poración de las nuevas tecnologías de comunicación (el universo internet) también
a la investigación: la construcción de series temporales basadas en la posibilidad de
mantener diseños que se pueden repetir en el tiempo, así como las mejores opor
tunidades para llevar a cabo estudios transculturales, son rasgos importantes del
panorama actual de la investigación social, pero también incrementan los focos de
atención metodológica a diversos aspectos del proceso. Por ejemplo, esto sucede
con las cuestiones de traducción de instrumentos a otros idiomas, cuando se traba
ja en comparaciones internacionales o por la necesidad de controlar especialmente
las implicaciones de medición en un contexto de monitorización de grandes volú
menes de datos.
Antes de pasar a más especificaciones de procedimiento relacionadas con los
proyectos, quisiéramos introducir ya algunas otras consideraciones que «atravie
san» nuestra visión de la investigación y que consideramos que se deben tener pre
sentes:
Traducir las demandas o las ideas, sean propias o ajenas, en proyectos de
investigación no es ninguna función mecánica y requiere cierto tiempo de
trabajo porque exige ver la investigación, cada investigación, en su conjun
to. Sin embargo, también hay que saber que ninguna investigación «pensá
is
Proyectos de investigación
da» es completamente nueva: hay que buscarlas y trabajar sobre las apor
taciones de quienes también han investigado sobre las mismas cuestiones.
- Tampoco existen diseños de investigación tan estandarizados que puedan
utilizarse como un esquema completamente cerrado: cada investigación
exige tomar decisiones específicas acerca de múltiples aspectos y eso hace
que el resultado introduzca habitualmente variaciones sobre los esquemas
formales.
- Toda investigación social tiene que incluir algún compromiso de relevancia
o impacto con la propia sociedad, sea este de carácter social, participativo
o, incluso, político. Con cada investigación se trata de conocer algo más de
la realidad social en la que todas las personas vivimos. Pero ese objetivo de
bería tener una finalidad última: es lo que nos capacita para poder actuar
sobre esa realidad y transformarla.
- Como actividad humana y social, la investigación social debe reflexionar so
bre las consideraciones éticas implicadas en todo el proceso y debe acoger
se a códigos éticos de actuación.
1.2. Investigación: tareas y fases
Si surge la necesidad o la demanda de llevar a cabo una investigación, el proyecto
debe contemplar distintos tipos de elementos que suponen decisiones al menos
provisionales. Realmente hay bastantes posibles versiones de lo que debe incluir un
proyecto, incluso si ya de entrada diferenciamos los académicos de los de encargo,
pero la base es siempre entender el proceso de investigación como un todo y acen
tuar una visión secuencial del mismo. De algún modo, todas las propuestas deben
recoger lo más básico del proceso: aclarar la finalidad del proyecto (para qué) y /o la
pregunta o preguntas a que responden; formular objetivos que cubran el abordaje
de las preguntas; decidir alguna (o algunas) estrategia metodológica que sirva para
cumplir los objetivos y realizar un diseño técnico específico no solo de cómo se va
a obtener, sino también de cómo se va a analizar la información necesaria. Además,
el destino final de la investigación, sobre todo cuando es «a demanda», también es
muy importante a la hora de organizar el proceso de la investigación: saber qué
quiere o necesita quien encarga una investigación o para qué prevé utilizar sus re
sultados es un eje central en el diseño de una investigación.
Paralelamente el proyecto tiene que considerar todos los aspectos prácticos
relacionados con los recursos disponibles y la vulnerabilidad del problema para
que el proyecto sea factible. Recursos humanos, financiación y cronograma son ele
mentos imprescindibles a considerar a la hora de dimensionar un proyecto porque
definen lo que de hecho es posible hacer. Como iremos desarrollando de aquí en
adelante, porque es fundamental, la investigación solo puede realizarse si nos mo
vemos de modo estratégico entre los requisitos y los recursos.
19
r La in ve stigación co m o proceso
Podemos considerar como punto de partida un esquema mínimo de fases y ta
reas que comprende cualquier investigación. El modo de presentar estos «sende
ros» (O’Leary, 2014, 106] es tan numeroso como la literatura sobre investigación
social, pero la mayoría se parecen bastante. Basándonos, entre otros, en Cea D’An-
cona (2010 y 2012, 44), Ragin (2007,106-107) o Valles (1997, 82), presentamos un
listado sencillo de las principales fases o etapas que se suelen cubrir en un proceso
completo, así como de las tareas o trabajos más importantes que se incluyen en
cada una.
Cuadro 1.1: Fases y tareas de la investigación social.
FASES TAREAS
Planteamiento y delimitación Elección/delimitación del tema/preguntas de
investigación
(Fijación de la demanda)
Delimitación de ámbito, alcance y/o población/
es y/o participantes
Revisión teórica y antecedentes (estado del
arte/de la cuestión)
Establecimiento de objetivos e Formulación de objetivos generales y
hipótesis específicos o formulación del problema
Formulación de hipótesis o preguntas
específicas de investigación
Selección de estrategia Definición de población y selección de muestra
metodológica y diseño (si procede)
Selección de aspectos de la cuestión y/o de
variables (operacionalización)
Preparación de instrumentos de recogida de
información y posicionamiento ante el trabajo
de campo
Previsión del tipo de análisis
Ejecución del diseño: trabajo de Recogida de información, depuración, archivo
campo y análisis y codificación
Análisis (y reanálisis)
Conclusiones sobre objetivos, Reflexión, contrastación de hipótesis, detección
hipótesis o preguntas de de relaciones, reanálisis
investigación
Redacción de informes y presentaciones
Fuente: elaboración propia.
20
Proyectos de investigación
Lo que se refleja en el cuadro 1.1 es que el proceso consiste básicamente en de
limitar un problema o cuestión objeto de investigación, diseñar una estrategia para
abordarlo y llevarla a cabo para dar respuesta a las preguntas iniciales. En nuestro
esquema hemos diferenciado cinco grandes fases que incluyen una serie de tareas
o conjuntos de tareas que obviamente no requieren los mismos esfuerzos ni pre
sentan las mismas alternativas. Por otra parte, raramente el proceso es tan lineal
ni tan sistemático como necesitamos presentarlo. Lo usual es que, como todos los
elementos se relacionan entre sí, las decisiones que se van tomando o las delimi
taciones que se realizan vayan conformando las demás tareas o fases. Por ejemplo,
puede ser que a la vista de las dificultades del muestreo haya que volver a delimitar
las poblaciones sobre las que se investiga; también las cuestiones de operacionali-
zación de conceptos pueden llevar a tener que ampliar los objetivos iniciales, y en
muchas investigaciones también sucede que análisis y trabajo de campo tienen lu
gar a la vez, por lo que el «análisis» puede ubicarse en varias fases. En general, toda
investigación tiene que contar con un margen de flexibilidad en lo practicable o de
lo contrario no llegaría a producir ningún resultado. En última instancia, una de las
cosas más importantes es que haya coherencia entre objetivos y modo de afrontar
los, y a lo largo de este texto intentaremos acentuar las conexiones entre todas fases
y tareas de modo que se vea el proceso.
Como ya hemos señalado, el origen de la investigación puede ser de muy diverso
tipo, desde el interés académico más convencional hasta el encargo externo pro
fesional, y además pasando por finalidades o utilidades también distintas: desde
una averiguación descriptiva y actual sobre situaciones, grupos o hechos hasta las
secuelas (o replicación) de algunas otras investigaciones, la necesidad de comparar
resultados en otros contextos o el planteamiento de algún problema práctico muy
concreto. Las preguntas pueden ser una o muchas, con lo que en la fase primera
la necesidad de delimitar y concretar será más o menos amplia. Con relación a los
contenidos, hay que decir que en la práctica no puede investigarse nada que no
se haya definido, y tampoco algo tan radicalmente nuevo que no tenga referencia
ninguna entre el conocimiento acumulado existente. Por eso, una exploración pre
via del «problema» y la documentación sobre el mismo son muy importantes: solo
conociendo el estado de la cuestión y sus ramificaciones podemos contextualizar
nuestras decisiones de investigación.
Los objetivos (segunda fase) son la clave formal de toda investigación: partiendo
de una finalidad más general, centrar hasta dónde queremos llegar en la investiga
ción y con qué orientación debe ser formulada para que pueda llevarse a cabo. Y
además en los objetivos se decanta la orientación metodológica que deberá tener
la investigación y que se especifica posteriormente en el recurso a determinadas
técnicas de muestreo o selección de casos, técnicas de obtención de información y
técnicas de análisis. Básicamente en investigación social la estrategia metodológi
ca sitúa toda investigación entre la cuantitativa y la cualitativa. En este sentido, el
diseño concreto de cada investigación depende sobre todo del «qué» y del «para
21
La investigación como proceso
qué» antes definidos, pero, como siempre se desarrolla en condiciones limitadas,
también depende de los recursos (científicos, humanos, materiales e incluso tem
porales).
Hay diseños bastante estandarizados para ciertos estudios, que se basan en la
convención de que funcionan y que muchas veces se pueden adaptar para nuevas
investigaciones. Hay investigaciones que a priori admitirían más de un diseño e in
vestigaciones que pueden combinar diseños diferentes (en fases o por objetivos).
Hay diseños más y menos flexibles, es decir, que se pueden ir adaptando a las nece
sidades a lo largo del proyecto (estudios cualitativos), pero siempre dentro de un
contexto determinado.
1.3. Investigación cuantitativa y cualitativa. Algunos diseños
Para ver los aspectos principales de cómo se materializan estas posibilidades en
un proyecto factible de investigación, vamos a repasar primero algunos elementos
centrales de la investigación cuantitativa y cualitativa para posteriormente descri
bir diseños más concretos.
Traducir problemas, deman<!ras o ideas en investigaciones a realizar que sean
factibles implica alguna posición ontològica y epistemológica sobre el modo en que
vemos el mundo y creemos que se puede conocer, y esto se traduce en una orien
tación metodológica que tradicionalmente oscila entre la investigación cuantitativa
y la cualitativa. Queremos avanzar que, aunque el debate epistemológico y teóri
co es muy interesante y las cuestiones de la posible convergencia entre estos dos
extremos también, desde un punto de vista muy práctico es pertinente establecer
cuanto antes esta diferenciación, ya que, según nuestra experiencia, casi siempre
es una opción que hay que plantearse en cada investigación desde el principio. Por
lo mismo, conocer las características básicas de ambos enfoques y los principales
diseños aplicados que se suelen derivar de cada uno es un paso muy inicial, pero
imprescindible en una carrera investigadora.
Desde nuestro punto de vista, elegir una investigación cuantitativa o cualitativa
es clave:
«La elección de las estrategias cuantitativas o cualitativas deberá decidirse según
los modelos teóricos disponibles y las peculiaridades del objeto de estudio teniendo
en cuanta las reglas mencionadas anteriormente. Primero, debe haber una relación
de isomorfismo entre el juego del lenguaje o situación social experimental ensayada
para la producción de información y el juego de lenguaje o situación que espontánea
mente produce en la sociedad el fenómeno que vamos a investigar. Segundo, debe
haber una relación de coherencia entre la técnica y el método que utilicemos y las
propiedades de la acción social que nos interesan. Y, en tercer lugar, debe haber igual
mente una relación de coherencia entre la información que esperamos obtener y los
modelos teóricos que hemos decidido utilizar» (Bergua, 2011, 70-71).
22
Proyectos de investigación
Cuadro 1.2: Características de las investigaciones de orientación cuantitativa y cualitativa.
CUANTITATIVA CUALITATIVA
Posición Positivismo Teoría crítica
epistemológica (y La realidad está ahí fuera Hay múltiples realidades que son
teórica) (independiente) construcciones sociales (tipos)
Los hechos sociales Hay acciones sociales con
pueden tratarse como significados subjetivos
cosas
Objetivos Cuantificar dimensiones Comprender significados
Relacionar Interpretar en el contexto
Generalizar
Tipos de datos Contabilizadles Textuales, discursivos
generados (numéricos)
Tipo de análisis de Estadístico, cuantitativo Interpretativo
datos
Tipo de población y Máximo alcance Poblaciones reducidas y casos
acceso Muestreo probabilistico tipo
(o asimilado) Selección no probabilistica
Informadores-clave (muestreo
estratégico)
Alcance temático Dimensiones objetivas y Dimensiones subjetivas desde la
subjetivas (objetivadas) perspectiva del actor
Procedimientos de Estandarizados y Flexibles y dinámicos
medición homogéneos, aplicables a Específicos para cada caso
toda la población
En proceso
Previos y replicables
Criterios de calidad Validez, fiabilidad, Credibilidad, transferibilidad
representatividad confirmabilidad
Claves prácticas El problema es El problema no es cuantificable
cuantificable y hay acceso y/o hay que verlo desde dentro
a datos suficientes para
generalizar
Rol del investigador Fuera, neutral Dentro, inmerso, participando
Ajeno al objeto de Parte del objeto de estudio e
estudio incluso protocolo de recogida de
datos
Fuente: elaboración propia.
23
La investigación como proceso
¿Cómo resumir las claves de la diferenciación entre diseños cualitativos y cuantita
tivos y cómo desentrañar cuál es la metodología adecuada en cada situación?
La literatura sobre la dicotomía o separación, pero también simplemente sobre
la diversidad o pluralidad (Beltrán, 1985) o incluso complementariedad (Morgan,
2014) entre estas dos formas de llevar a cabo la investigación social, es extensísi
ma, ya que afecta a fundamentos muy básicos de la investigación y también de las
ciencias sociales en general. Se ha dicho tanto y se ha practicado tanto esta diferen
ciación que hasta en una época como esta, bastante ecléctica en la integración o en
la triangulación de métodos, o en la llamada a métodos mixtos, hay que aprender
sobre investigación identificando las características distintivas de estos dos modos
de realizar investigación. <■
Como idea más global suele decirse que, aplicada a los fenómenos sociales, la
investigación cuantitativa intenta reproducir al máximo el formato de investigación
y el modo de construcción de conocimiento científico propio de las ciencias natu
rales. Y así es en la medida en que representa una perspectiva positivista que ve los
hechos sociales como cosas externas que pueden y deben analizarse objetivamente.
Desde esta posición el conocimiento científico se construye aprehendiendo cual
quier realidad (la social en este caso) a partir de mediciones objetivas por parte
de individuos y grupos investigadores, que procuran ser neutrales y que pueden
demostrar la validez y fiabilidad de las evidencias con que trabajan. Las evidencias
sirven fundamentalmente para contrastar hipótesis deducidas de las teorías, por lo
que el fin último es la generalización de los hallazgos de cada investigación.
La investigación cuantitativa, por tanto, se aplica cuando los fenómenos o as
pectos de la realidad que interesan, tal y como se han definido, son cuantificables e
interesa su extensión: identificando a los sujetos a que aluden los fenómenos y las
características o dimensiones que hay que medir, las evidencias se consiguen apli
cando protocolos de medición y técnicas de obtención de información altamente
estandarizadas y estructuradas. Es el control y estandarización de la recogida de
datos y la intercambiabilidad de los sujetos lo que sustenta la validez, fiabilidad y
representatividad de las evidencias-datos que servirán para el análisis y la compro
bación de hipótesis. De ahí que las investigaciones cuantitativas tratan de captar
el mayor volumen de información a través de la selección probabilística de sujetos
que luego permitirá generalizaciones estadísticas de resultados. Todo ello implica
que la posición de quienes investigan es deliberadamente externa y neutral. Así, por
ejemplo, para averiguar el alcance de ciertas opiniones en la sociedad en un mo
mento determinado, una investigación cuantitativa por encuesta sería apropiada si
lo que interesa es saber concretamente cuántas personas sostienen unas opiniones
u otras, qué tipo de personas son en cada caso, qué características de las mismas
aparecen más conectadas a esas opiniones, etc. Así sería para «describir» (en un
sentido amplio) la incidencia de cualquier fenómeno en un contexto espacio-tem
poral determinado y también para «explicarlo» en cuanto a detectar conexiones
entre fenómenos o patrones generales de incidencia de los mismos. Muchos aspec-
24
Proyectos de investigación
tos de la vida social, política o institucional, y también de los fenómenos de comu
nicación de masas o del marketing, pueden y deben ser analizados de este modo si
la extensión de los fenómenos es central al enfoque necesario de la investigación.
La investigación cualitativa deriva de una visión de la realidad social que acen
túa los significados subjetivos de las acciones y, en consecuencia, la característica
distintiva de que la realidad social es socialmente construida. Esta forma de ver
la realidad social implica que hay que comprenderla e interpretarla, y para ello
el sujeto investigador se reconoce siempre dentro de la realidad, participando en
grados diversos. Las evidencias principales con las que se trabaja en investigación
cualitativa son discursos y el análisis recurre a distintas técnicas específicas para el
análisis interpretativo de esos discursos.
Este tipo de investigación puede surgir en diferentes contextos, tanto como pri
mera aproximación (exploratoria, frecuentemente) como directamente ante la de
finición de una cuestión, aspecto o problema que requiere de este tipo de profundi-
zación. Y su objetivo último, desde las teorías críticas en que se asientan, es también
un tipo de conocimiento que quiere ser descubridor y emancipador, conocimiento
para el cambio. Así, muchas investigaciones sociales deben centrarse en captar esos
sentidos subjetivos que los actores sociales dan a sus acciones y en comprenderlos
e interpretarlos: cómo entender el sentido compartido de pertenencia de un grupo
o una comunidad, comprender los códigos de elección de ciertos consumidores o
votantes, «re-construir» las trayectorias de algunas experiencias laborales comple
tamente nuevas, etc.
La investigación cualitativa es necesariamente dinámica y flexible porque la
comprensión e interpretación son también procesos abiertos que modifican el re
sultado mientras suceden. En términos prácticos, la inmersión del investigador o
la investigadora y la flexibilidad son características muy distintivas de la investiga
ción cualitativa y se traducen en prácticamente todas las fases y tareas del proceso
de investigación: quedan abiertos desde los objetivos, el diseño o la selección de
informantes-clave hasta la propia captación e interpretación de significados en las
que el/la investigador/a y quienes son investigados participan. También la atención
a un solo caso o la profundización exhaustiva en unos pocos casos es característica de
esta forma de investigar ciertas realidades. Todo esto, como veremos, dificulta pre
sentar un proyecto cerrado en cualquiera de sus dimensiones (temporal, espacial,
económica, etc.) y obliga a ver el esquema propuesto para la práctica del proceso de
investigación (cuadro 1.1) de este modo más flexible, más abierto o, como también se
ha mencionado, en la forma de «marcos analíticos fluidos» (Curtis y Curtis, 2012, 20).
Como la ausencia de estandarización no permite evaluar estas investigaciones
en los términos convencionales de fiabilidad o validez, la calidad del proceso surge
de la vigilancia técnica y metodológica (hacer explícitas las decisiones) que se tra
duce en credibilidad (general), y en transferibilidad y confirmabilidad (Denzin y
Lincoln, 2000; Guba y Lincoln, 1990) de resultados. Como dice Ragin:
25
La investigación como proceso
«los distintos fines de la investigación social favorecen estrategias de investigación
asombrosamente diferentes (...) Cada una de estas estrategias ofrece un enfoque d i
ferente sobre el manejo de las pruebas empíricas y cada una tiene procedimientos
principales distintos en relación con los datos que usan los investigadores cuando
construyen imágenes a partir de la evidencia disponible (...) Los procedimientos d i
fieren de una estrategia a otra porque la naturaleza de las pruebas empíricas y los
fines de la investigación puede variar mucho» (2007,139-140).
Además de reconocer la necesidad de una aproximación más bien cualitativa o
cuantitativa de nuestros objetivos concretos a estas descripciones anteriores, tam
bién podemos trabajar con las diferencias entre ambas orientaciones desde otras
aproximaciones pragmáticas: Curtis y Curtis (2012), recogiendo también a Ragin
(2007),desarrollan como eje la idea de que la aproximación cuantitativa implica
una investigación «centrada en variables ( variable-centric)», mientras que la cua
litativa se centra en los casos («case-centric»). Gracias a esto se podrían clasificar
las formas más detalladas en que se traduce la investigación social, como encues
tas, diseños experimentales, investigación secundaria (no reactiva), el análisis de
contenido, la investigación basada en entrevistas en profundidad o en grupos de
discusión, las historias de vida o la investigación etnográfica (y autoetnográfica).
Todos esos estudios pueden a jíiori ser descriptivos o explicativos, comparativos,
exploratorios, incluso longitudinales; esas especificaciones derivan de los objetivos
concretos.
En realidad, en este tipo de listados se reconocen a veces técnicas de recogida
de información (entrevista) o técnicas de análisis (análisis de contenido) y otras
veces más bien diseños completos (encuesta) e incluso orientaciones o campos de
investigación aún más generales (investigación etnográfica). Esto es muy habitual
e ilustra las dificultades de ordenar o clasificar tantos modos variados de llevar a
cabo el estudio científico de los mundos sociales.
Nosotras preferimos ahora presentar nuestra visión de algunos de los diseños
de investigación que consideramos más comunes o habituales en los diversos cam
pos de la investigación social. Usamos el término «diseño» para referirnos a la ar
ticulación metodológica básica que se necesita para llevar a cabo una investigación
concreta y, sobre todo, porque nuestra idea de diseño es pragmática y está muy
conectada con la elaboración del proyecto de investigación que nos sirve de hilo
conductor a la exposición del proceso. Como se van a seguir explicando sus aspec
tos más adelante y en los capítulos siguientes, vamos a identificar ahora unos cuan
tos diseños que consideramos de referencia obligada, pero sin intención de debatir
sobre clasificaciones ni de ser exhaustivas. Lo que se pretende es identificar de un
modo práctico los tipos de investigaciones que por utilidad y por experiencia más
suelen ajustarse a muchos estudios que habitualmente realizan los científicos so
ciales en muchos ámbitos.
En el cuadro 1.3 se pueden observar y reconocer estrategias de investigación
más o menos habituales o relevantes dentro de los ejes de las perspectivas cuanti-
26
P ro ye cto s de investigación
"1
Cuadro 1.3: Algunos diseños metodológicos extendidos en investigación social
CUANTITATIVOS CUALITATIVOS
Encuesta social Observación Análisis de discurso sobre
sistemática entrevistas en profundidad
Análisis secundario de datos/ Delphi Grupos de discusión y Focus
Desk research Groups
Experimentos Estudios basados en observación
(etnográfica)
Sociometría y análisis de redes Análisis secundario de
sociales documentos
Metodologías participad vas
(investigación-acción-
participación)
Triangulación
Fuente: elaboración propia.
tativa o cualitativa, pero realmente no son sencillas de listar porque no hay acuer
do sobre el alcance de algunas de estas formas de realizar investigación social. En
este caso nos hemos decidido por especificar algunos «subdiseños» que en realidad
podrían incluirse en apartados más generales (como los grupos de discusión res
pecto del análisis de discurso sobre entrevistas), así como también hemos incluido
diseños algo híbridos (como Delphi) y algunas técnicas como la observación, que
pueden incluso adaptarse hacia una orientación más bien cuantitativa o más bien
cualitativa, ya sea respecto a los modos de producción de información como a los
modos de análisis. En este epígrafe se va a dar una breve descripción de cada uno
de los diseños, pero en los capítulos siguientes solo vamos a desarrollar los que
consideramos más importantes y más inclusivos con vistas a trabajar la idea de
investigación como proceso.
- La encuesta es la estrategia de investigación social más conocida (para bien
o para mal) y se trata de un tipo de estudio de orientación cuantitativa para
la obtención de datos primarios mediante la aplicación de un instrumento
de medida muy estructurado, que son preguntas en un cuestionario en ge
neral a una muestra representativa de una población. Es un tipo de inves
tigación muy versátil, puede utilizarse para explorar, describir y también
para explicar fenómenos sociales en muchos campos, y puede aplicarse a
estudios seccionales o a estudios longitudinales. Siempre que se quiera ob-
27
La investigación como proceso
tener información directamente de los sujetos que la tienen y que no está
disponible de ninguna otra forma más que preguntándoselo y que los fines
de la investigación sean cuantitativos (generalizar), sería el primer diseño
a considerar.
- El análisis secundario de datos cuantitativos acoge un bloque amplio de ti
pos de estudios a los que a veces se denomina «investigación no reactiva»
(Webb et al., 1966) y puede compartir con la encuesta el tipo de técnicas de
análisis estadístico que se aplican, sobre todo cuando se trata de cubrir ob
jetivos descriptivos. La clave en este caso está en que la información central
se considera secundaria en tanto no ha sido producida de primera mano
o ex profeso para la investigación. En el capítulo 3 se aporta un recorrido
más amplio por las fuentes de información secundaria que pueden utilizar
se hoy en día como base de una investigación actual.
El experimento es el tipo «clásico» de investigación cuantitativa heredada
de las ciencias naturales. Se diferencia fundamentalmente de otros modos
de investigar con orientación cuantitativa porque en la recogida de datos se
produce la manipulación deliberada de la situación de medida a partir de la
introducción de algún estímulo controlado. Los diseños experimentales son
en sí mismos todo un campo de especialización en investigación (Campbell
y Russo, 1999), e incluso se han tomado como referencia para clasificar los
demás estudios cuantitativos que introducen esos controles de medición
(la encuesta, por ejemplo) como pre-experimentales. La experimentación
persigue la demostración de relaciones causales y la prueba de hipótesis
científicas muy concretas, pero las posibilidades de diseño son amplias y
hay experimentos muy complejos. En general, la clave consiste en actuar
sobre un colectivo/situación para medir las consecuencias de la interven
ción y compararlas con las de la situación de no intervención (pre-test/pos-
test). Concretamente esto implica la existencia de un llamado «grupo expe
rimental» al que se aplica un «tratamiento» para luego medir el efecto. El
efecto debe ser comparado con otra medición, para lo cual suelen darse dos
formatos: o la medición anterior o la medición del llamado «grupo de con
trol», que no ha recibido tratamiento (típica experimentación de laborato
rio, también denominada «contrafactual»). El estudio de las diferencias es
lo que demuestra la incidencia del tratamiento, si la selección de los indivi
duos se ha realizado aleatoriamente. A partir de este diseño, existen otros
considerados cuasi-experimentales si, aunque incluyen controles de medi
ción, no llegan a cumplir todos los requisitos y, en consecuencia, no permi
ten concluir directamente sobre los efectos investigados.
- Los experimentos no son realmente muy comunes hoy en ciencias socia
les (Alvira y Serrano, 2015), excepto en algunos campos como la psicolo
gía o los estudios en publicidad, comunicación y marketing en los que, ade
más, pueden llegar a tener cierta extensión o complementación cualitativa,
28
Proyectos de investigación
como sucede con los test de recuerdo de imágenes que combinan ambas
orientaciones.
Uno de los tipos de investigación que pueden considerarse entre los emer
gentes es el análisis de redes sociales (ARS), que se encuentra en un cam
po en intersección entre los análisis sociológicos y las investigaciones en
psicología social. Su base está en los análisis de tipo sociométrico que pre
tenden medir las relaciones (cercanía y distancia) entre los componentes
de un grupo pequeño y estable en el tiempo mediante preguntas directas a
sus miembros. En la actualidad este tipo de estudios se encuentra muy en
boga por las posibilidades de análisis de las relaciones a través de las nue
vas tecnologías en plataformas como Facebook, Twitter o Whatsapp, y tam
bién porque pueden tener aplicaciones puntuales o complementarias den
tro de otros diseños.
- Entre los diseños de orientación cualitativa, los estudios basados en técni
cas conversacionales como entrevistas en profundidad o en grupos de dis
cusión son probablemente los más habituales. En general, se entiende que
la entrevista en profundidad es una práctica para generar información pri
maria que también «pregunta», pero en un contexto conversacional, con lo
cual el entrevistador/a tiene un papel activo y la «técnica» se convierte en
una estrategia más completa de averiguación. Como el producto elemen
tal es una conversación, se considera que es pertinente para captar signifi
cados, más que hechos, y por ello se inscribe entre los diseños típicamen
te cualitativos. Normalmente se le aplican técnicas de análisis de contenido
o técnicas de análisis interpretativo de discurso que, como técnicas cuali
tativas, precisamente para la extracción de interpretaciones procedentes
de información «textual», son técnicas de decodificación de las narraciones
obtenidas. Los estudios cualitativos basados en entrevistas son también su
mamente versátiles y pueden desarrollarse además combinando distintos
tipos de entrevistas o en la dimensión temporal, realizando entrevistas su
cesivas a los mismos sujetos hasta llegar incluso a la forma de historias de
vida.
- Estudios con focusgroups o grupos de discusión, son una subforma de «en
trevista en grupo» semiestructurada que suele aplicarse cuando hay que in
vestigar un tema o problema muy concreto. Estas investigaciones se origi
naron en la forma concreta de «entrevista enfocada» y posteriormente se
han ido extendiendo bajo la denominación más amplia de «grupos de dis
cusión» para todas las entrevistas grupales. Se han desarrollado también en
algunos campos como el marketing o la publicidad (percepción de produc
tos) y otros que impliquen procesos de toma de decisiones (participación
ciudadana). Por lo general, se trata de una conversación entre varios acto
res (personas tipo o personas expertas) dirigida por una persona que actúa
como entrevistadora-moderadora, que a la vez extrae y analiza (en parte)
29
La investigación como proceso
la información de los discursos que se van creando de cara a extraer con
clusiones que permitan establecer interpretaciones e incluso pautas de ac
tuación.
Las técnicas de observación pueden formar parte y definir muchos tipos
de investigaciones dependiendo del tipo de observación y recogida de in
formación y, en consecuencia, del tipo de análisis pretendido. Los estudios
basados sobre todo en observación directa, participante y no participante,
han sido claves en el desarrollo de la investigación etnográfica y antropo
lógica, y sobre todo desde la perspectiva más cualitativa. Dependiendo del
grado de implicación de la persona que investiga observando y de la com
plejidad y /o extensión de lo observado, la recogida de información puede
llegar a ser muy laboriosa, lo que condiciona bastante la factibilidad y cos
te de estas investigaciones. Aunque la tecnología ha ampliado muchísimo
las posibilidades del registro de la información observable (textual o tam
bién conductual) y también ayuda a que esta información pueda codificar
se mejor, los diseños de investigación observacional, sobre todo de campo,
siguen siendo complejos.
- El análisis secundario de documentos comparte características con otros
diseños (secundario de^atos; observación cualitativa], ya que consiste en
un análisis de productos como textos, fotografías, vídeos, diarios u otros si
milares, elaborados con fines diferentes a los de una investigación concreta,
pero que permite captar la interpretación que los sujetos hacen de la reali
dad o el contexto en el que se desarrolla su vida o alguna faceta de ella. Este
tipo de estudio es reconocible por algunas importantes investigaciones clá
sicas (por ejemplo, Kl campesino polaco, de Thomas y Znaniecki), pero tam
bién, como veremos, en algunas investigaciones muy recientes.
- Las metodologías participativas, entre las que la modalidad más destaca
da es la investigación-acción participativa (1AP), suponen un diseño que in
tegra investigación e intervención a través de la inclusión de herramientas
que potencian la participación de los integrantes de la realidad a estudiar a
través de todo el proceso de investigación. Aunque es un diseño muy abier
to y puede combinar subestudios o etapas en las que se aplican técnicas
propiamente cuantitativas, trabaja la reflexividad desde una orientación
básicamente cualitativa.
- El llamado «método» Delphi se sitúa en un espacio intermedio entre los di
seños típicamente cuantitativos y cualitativos, entendido que es una espe
cie de híbrido entre encuesta y focusgroup. El Delphi es un estudio basado
en interrogación directa con formato de encuesta autoadministrada (e in
cluso con entrevistador/a) que se aplica solo con temas muy específicos y
encuestando solo a unos pocos sujetos informantes cualificados o expertos
(por ello, no se trabaja con muestras representativas). Aunque en general
no suele haber conversación directa, el cuestionario suele incluir pregun-
30
Proyectos de investigación
tas abiertas pero, sobre todo, se retroalimenta de las aportaciones y de la
reflexión de las personas participantes sobre los resultados intermedios. Se
repite en fases sucesivas hasta alcanzar un nivel de saturación informativa
adecuado como para obtener interpretaciones que permitan tomar decisio
nes basadas en estas aportaciones expertas.
- La observación sistemática también es, como hemos dicho, una técnica
de obtención de datos o información de otro tipo, por lo que dependien
do del formato concreto de las evidencias estas pueden ser objeto de análi
sis cuantitativo o de análisis cualitativo. Las investigaciones realizadas con
observación sistemática se caracterizan por el tipo de aspectos que se ob
servan. Es necesario que sean aspectos perfectamente definidos y medi
dles, recogidos mediante protocolos o plantillas de observación (a modo de
cuestionario), que permiten cuantificar los comportamientos y conductas,
a partir de un muestreo de personas, situaciones o momentos, para a partir
de su análisis obtener resultados en cierto modo generalizares al estilo de
la metodología cuantitativa. Con los actuales sistemas de registro audiovi
sual, no obstante, también se pueden realizar análisis interpretativos a par-
* tir del visionado y codificación posterior de las observaciones.
Finalmente, y volviendo sobre la cuestión apuntada de la integración o complemen-
tariedad entre las dos grandes perspectivas, hay también una ya larga tradición de
debate en las ciencias sociales sobre el reconocimiento consensuado de un pluralis
mo metodológico y las condiciones bajo las cuales debe operar realmente. Hablan
do desde el proceso de investigación concreto, la disyuntiva cualitativo-cuantitativo
nos enfrenta a tomar decisiones en cada plan específico de actividad que es una
investigación: usar «métodos» cuantitativos, cualitativos o alguna combinación de
ambos, tanto en la recogida de información como en el análisis, es clave para poder
seleccionar y planificar.
Desde una posición esencialmente pragmática (Tashakkori y Teddlie, 1998), si
guiendo la conocida clasificación de Bryman (1988) y también reelaborada por Be-
ricat (1998) y Morgan (2014), señalaremos que tanto en la investigación académica
como profesional cada vez más se producen trasvases metodológicos entre unos
tipos de diseños y otros. Por ello, reconocer y respetar las posibilidades de cada tipo
de orientación abre posibilidades de establecer al menos diseños mixtos o diseños
multimétodo. Es decir, investigaciones en las que se puede combinar la aplicación
de diseños de distinto tipo aunque con diverso alcance según el tipo de estrategia
de integración: «complementación, combinación o triangulación» (Bericat,1998,
37). Así, la más básica complementación multimétodo implica una investigación
suma de dos estudios, uno cualitativo y otro cuantitativo, que nos dan visiones com
plementarias de un mismo objeto centradas en aspectos diferenciados del mismo.
Es bastante común que, por ejemplo, estudios de actitudes o comportamientos de
la población combinen la cuantificación general (hasta dónde llega el fenómeno)
con el descubrimiento de los discursos que sustentan tales actitudes. A nivel instru-
31
La investigación como proceso
mental, nos referimos a los estudios que tienen una parte cuantitativa (vía encuesta
o análisis de datos secundarios, por ejemplo) y otra cualitativa (posiblemente me
diante entrevistas u observación participante).
La estrategia de combinación implica sobre todo convergencia de un método
hacia otro para superar debilidades; por ejemplo, es usual cuando se utilizan en
trevistas o grupos de discusión para ayudar en el diseño de un cuestionario o para
profundizar en algunos aspectos de especial interés detectados con la encuesta y, a
la inversa, cuando se utiliza una encuesta para generalizar los hallazgos obtenidos
en un estudio cualitativo sobre la misma población. En estos casos suele funcionar
de modo central el eje temporal a través de la aplicación de distintos diseños por
fases de la investigación y de modo subordinado. w
El modo de integración superior lo constituye la denominada triangulación,
que en realidad pretende la convergencia de resultados de investigación sobre un
mismo fenómeno, objeto o aspecto de la realidad partiendo de la ejecución de dos
diseños diferentes e independientes. Sin duda, la práctica de la triangulación exige
asumir que tal objetivo es metodológicamente posible y concretar aún más especí
ficamente cómo se llegarían a corroborar o validar resultados a través de diseños
distintos, que es de lo que se trata.
Recientemente otras aportaciones clarificadoras (Alvira y Serrano, 2015) tam
bién acentúan la combinación de la dimensión temporal (simultánea o secuencial)
y de los usos centrales de estos diseños mixtos para desentrañar los múltiples for
matos y posibilidades que pueden desarrollar estas investigaciones.
Einalmente, y como veremos al detallar más los diseños disponibles, las deci
siones sobre las orientaciones metodológicas más adecuadas están crecientemente
afectadas por los recursos y la tecnología disponible. Se dice en concreto (Arroyo y
Sádaba, 2012) que en estos últimos años se han desarrollado tanto algunas varian
tes tecnológicas en las técnicas de recogida y análisis de información que ya pueden
suponer una reorientación de los enfoques metodológicos de la investigación social
y, por extensión, en la misma idea de lo que consideramos el proceso de investiga
ción. Sin embargo, también hay que tener en cuenta que lo que importa es entender
que cada investigación es un proceso específico de toma de decisiones y que en
la práctica real de la investigación social aún hay muchas ocasiones en que, más
allá de las novedades técnicas, el cambio de contexto, escenario o medio no impide
recurrir a los mismos principios de adecuación entre objetivos y estrategias que
utilizamos para llegar a captar los aspectos de la realidad social.
1.4. Redacción del proyecto de investigación
El proyecto de investigación es, como ya hemos señalado al inicio, un plan esque
mático avanzado de lo que hay que hacer y cómo hacerlo en cada investigación con
creta. Se trata de describir, explicar y justificar cómo se va a llevar a cabo el proceso
32
Proyectos de investigación
y eso implica contemplar anticipadamente muchos aspectos del mismo previendo
lo que es deseable y factible. Hay que tener en cuenta que el proyecto se redacta no
tanto para uno/a mismo/a (aunque también), sino para otras personas, normal
mente entre la potencial clientela de las investigaciones, tribunales evaluadores o
profesorado que llevan las tutorías de investigación.
La realidad es que los mejores proyectos se realizan con mucha experiencia, ya
que la práctica de la investigación social es lo que permite comprender la coheren
cia del conjunto. A diferencia de otras ciencias que trabajan con estrategias metodo
lógicas y con técnicas mucho más rígidas, que se pueden aprender de un modo más
codificado, la diversidad metodológica (y teórica) en que deriva la complejidad de
las realidades sociales exige mucho tiempo y profundización para llegar a compren
der todas las implicaciones de las distintas alternativas prácticas de investigación.
Proyectar es un trabajo muy creativo y estratégico, aunque también es técnico.
Partiendo de los elementos básicos descritos en el cuadro 1.1 (fases y tareas)
vamos a intentar resumir el recorrido sobre el proceso de investigación que supone
el proyecto de una investigación y la tarea de redactarlo.
Es importante tener una idea seriamente pragmática del proyecto de investiga
ción por varios motivos. Cuando se trata de investigación académica, los proyectos
son filtrados por tribunales científicos de evaluación: hay tutores/as de máster y
doctorado que aceptan o no las propuestas de los y las investigadores/as noveles y
hay grupos de investigación en los que a veces pueden enmarcarse otros proyectos
individuales, ante los que un proyecto aspirante debe tener una serie de caracte
rísticas. Además, gran parte de la investigación científica institucionalizada solo es
posible con financiación pública. Tanto a nivel institucional (universidades, sobre
todo, pero también otros agentes de las redes de investigación científico-tecnológi
ca), como a nivel de administración local, autonómica y también estatal y europea,
existen programas de fomento y financiación de la investigación científica, desarro
llo tecnológico e innovación (l+D+i) que incluyen a las ciencias sociales. Los proyec
tos a presentar están obligados por unos formatos de «memoria científico-técnica»
cada vez más específicos y cuya evaluación considera con creciente intensidad el
conocimiento demostrado no solo de los contenidos relevantes en las áreas de co
nocimiento, sino también la competencia en llevar a cabo un proceso investigador.
A este respecto pueden consultarse, por poner un ejemplo actualizado, los formu
larios e instrucciones de la convocatoria 2016 de Proyectos I+D del Ministerio de
Economía y Competitividad dentro del Plan Estatal de Investigación Científica y
Técnica 2013-2016 (M1NECO, 2016).
Cuando se trata de investigaciones de encargo o profesionales igualmente exis
ten personas o instituciones actuando como clientes, que financian el trabajo y que
tienen unas necesidades y unas demandas concretas a las que hay que dar respues
ta. Lógicamente el proyecto es el núcleo del contrato, que debe establecer con quié
nes van a realizar la investigación y debe abarcar el máximo detalle de la prestación
de servicios de que se trata. Además, no se puede obviar que el proyecto debe ser
33
La investigación como proceso
pactado con el sector de la clientela, lo que en numerosas ocasiones exige incluir
modificaciones sobre lo inicialmente propuesto (sobre la población, el protocolo de
recogida de datos, los tiempos, etc.) antes de darlo por definitivo.
En definitiva, no se puede iniciar ninguna investigación sin una mínima planifi
cación y la redacción del proyecto ayuda en este sentido. Vamos a exponer las líneas
básicas de la reflexión y elaboración de proyectos como guía de las conexiones más
importantes en las que debemos pensar desde la perspectiva del proceso de inves
tigación. Para ello nos basaremos bastante en los formularios habitualmente utili
zados para las convocatorias públicas competitivas que financian la investigación.
Un proyecto debe incluir ante todo ideas realistas sobre cómo llegar a conseguir
resultados válidos sobre algún objetivo de investigación. Esto supone pensar de
modo anticipado acudiendo a nuestros conocimientos sobre soluciones técnicas y
metodológicas a ciertas cuestiones. Y también supone considerar con qué recursos
se podría contar y cómo administrarlos. Si en principio partimos de una estrategia
metodológica preferible para cada objetivo, luego hay que valorar los recursos: al
gunos tipos de encuestas, por ejemplo, requieren más recursos humanos y mate
riales y un organigrama para llevar la logística, ya que parte del trabajo es masivo y
obligadamente secuencial (Pons, 1993) e intervienen más personas en los grupos
investigadores desarrollando tíe a s específicas de encuestación o grabación.
Muchos diseños cualitativos, que además obligan al sujeto investigador a estar
más dentro, pueden llevarse de modo coordinado con menos recursos, pero no
siempre. La investigación-acción-participación (1AP), por ejemplo, requiere, desde
luego, previsiones organizativas importantes porque movilizan gente en su vida co
tidiana y durante cierto tiempo. Los modos de organizar y administrar los recursos
para la investigación son también condicionantes importantes para las decisiones
que se proponen en los proyectos sobre cómo llegar a dar respuesta a nuestros pro
blemas o necesidades de investigación.
Hay a priori muchas formas de presentar un proyecto de investigación, dados los
diferentes contextos en que surgen las investigaciones y, como hemos expresado al
inicio, tampoco cada proyecto es completamente original y nuevo. Todo proyecto
puede construirse sobre referencias a investigaciones anteriores dentro o fuera del
mismo equipo investigador. Pero curiosamente, el proyecto es casi el único pro
ducto material de las investigaciones que de algún modo «desaparece», al llevar a
cabo la propia investigación. No se suele publicar y, por tanto, los contenidos de los
proyectos reales, que serían la primera fuente documental para abordar la planifi
cación de una nueva investigación, raramente son accesibles.
Lo que podemos llegar a conocer de los proyectos en que se basaron las investi
gaciones que ya se han llevado a cabo es lo que quede especificado en los informes
de resultados y cualquier otro formato de divulgación o publicación de resultados.
A veces en los apartados metodológicos o en anexos de estos informes y presen
taciones constan algunas características del modo en que se planificó la investiga
ción, pero los proyectos propiamente dichos no suelen reaparecer. Vamos a pre-
34
Proyectos de investigación
sentar por tanto un guión para redactar proyectos de investigación que se basa en
los formularios académicos convencionales, aunque pretendemos que considere la
estructura general y completa, de un proyecto de investigación como el proceso que
hemos descrito. A través del guión del proyecto vamos a ir abriendo las diversas
fases y tareas del proceso en este y los siguientes capítulos.
Cuadro 1.4: Guión para redactar un proyecto de investigación.
Guión Especificaciones/ variantes
1. Título Autores/as, instituciones, clientes
Resumen, palabras clave
2. Introducción Resumen y estado de la cuestión
teórica (si procede)
2.1. Contexto y antecedentes
Especificaciones de demanda (si
2.2. Finalidad y orientación
procede)
3. Objetivos Preguntas de investigación
3.1. Objetivos generales y específicos Elementos: variables a considerar y
poblaciones y/o muestras
3.2. Hipótesis de investigación
4. Metodología Orientación cualitativa/cuantitativa
(o mixta)
4.1. Diseño
Plan de desarrollo de la recogida y
4.2. Técnicas y fuentes de información
análisis de información
Implicaciones éticas
5. Plan de trabajo Cronograma
Presupuesto
6. Plan de explotación y/o divulgación Secuelas de la investigación
de resultados
Fuente: elaboración propia.
1.4.1. Preliminares e introducción
La mayoría de los proyectos probablemente necesitan una contextualización de
contenido y finalidad que suele incluirse en algún epígrafe preliminar o introduc
torio. En este epígrafe debe especificarse el origen y contexto de la investigación,
antecedentes o estado de la cuestión, y finalidad y orientación de la propuesta que
hacemos.
35
La investigación como proceso
En cuanto al origen del proyecto (interés personal, encargo, concurso) y demás
cuestiones que tengan relación directa con ello, hay que dejarlo bien claro para que
se sepa a qué problema y /o a quiénes se está dando respuesta con el estudio. Sobre
todo, cuando se trata de un encargo, hay que justificar cómo se han traducido las
necesidades de los y las demandantes a cuestiones de investigación.
De alguna forma, la concreción de estos aspectos debería llegar a especificar
si se trata básicamente de un estudio exploratorio (averiguar hasta dónde llega el
tema, el fenómeno, la cuestión a investigar), de un estudio descriptivo (cuantifica o
cualifica las dimensiones o características del fenómeno) o de un estudio explicati
vo (que intenta desentrañar factores asociados que «explican» el fenómeno).
Con relación a lo que hemos denominado contexto y antecedentes, toda inves
tigación debe considerar cuáles son sus puntos de partida tanto prácticos como
teóricos (si procede). Aquí, lógicamente, la diferencia entre investigaciones acadé
micas y a demanda es bastante importante, ya que la contextualización es muy dis
tinta y requiere trabajos de distinto corte y envergadura. Como se ha mencionado,
ninguna investigación, por novedoso que sea el tema o por singular el problema
práctico que la origina, parte de cero. Y realizar un cierto análisis preliminar del
«estado de la cuestión» es muy portante para poder diseñar un proyecto específi
co. Este trabajo puede ser más complejo dependiendo de cada estudio concreto y la
trayectoria académica de su temática. En las investigaciones más formales (tesinas,
tesis), en las que habitualmente el punto de partida suele ser algo como «elegir un
tema e identificar un problema» (Alguacil, 2011, 39), los antecedentes a explorar
pueden ser realmente amplios, aunque en un proyecto que se va a presentar for
malmente (a evaluación para incorporarse a un equipo de investigación o por obte
ner financiación) deben centrarse y resumirse lo máximo posible. Si se parte de una
orientación teórica concreta, hay que especificarlo.
Respecto a la finalidad, debe claramente responder a la pregunta «¿para qué se
va a realizar esta investigación?», y entenderla o enmarcarla en un contexto deter
minado. Eso incluye la especificación de la demanda, cuando se trata de investiga
ciones de encargo y /o cuando la investigación forma parte de algún tipo de plan o
utilidad mayor en la que se inscribe. Por ejemplo, un análisis de la supuesta ma
nipulación informativa en uno o varios canales de televisión puede ser un estudio
académico o puede realizarse a instancias de un grupo político o sindical, y tendría
como finalidad última presentar algún tipo de denuncia o de iniciativa política de
control. Un estudio de hábitos de consumo en un cierto sector, por encargo de una
compañía que fabrica y vende un producto determinado, tendrá como finalidad ver
nichos de mercado para su producto, pero también puede ser simplemente una ac
tualización de información descriptiva si se realiza a instancias de la administra
ción pública, que en última instancia vigila cuestiones de seguridad alimentaria y
salud en general de la población. Otros estudios pueden tener también finalidades
transformadoras, participativas o simplemente tratan de hacer progresar el conoci
miento y contribuir a ciertas teorías en un campo científico concreto.
36
Proyectos de investigación
La finalidad tiene también mucho que ver con la consideración de la relación
beneficios/riesgos de la investigación, que luego trataremos en el apartado sobre
los aspectos éticos de la investigación.
En el cuadro 1.5 hay dos ejemplos de «introducciones» a la presentación de sen
das investigaciones que, a grandes rasgos, podrían haber aparecido en los respecti
vos proyectos. En cada caso aparece la finalidad de la investigación y el contexto en
el que se inició y realizó, así como la conexión entre planteamiento y metodología:
una investigación cuantitativa mediante encuesta (descriptiva y con finalidad de
gestión) y otra cualitativa mediante grupos de discusión (explicativa y académica).
En ambos casos queda claro de dónde «procede» la investigación y para qué se
realizó, los beneficios que se pretendían reconociendo el punto de partida en la
temática y su contexto.
Cuadro 1.5: Ejemplos de introducciones.
a) De un estudio de público en museos del Ministerio de Cultura:
«...una iniciativa surgida desde estas mismas instituciones cuyo objetivo principal es con
vertir la investigación sobre el público en una herramienta de gestión integrada en la
actividad habitual de los museos, que ayude a la planificación y programación teniendo
en cuenta los intereses y necesidades de sus visitantes. (...) El informe que aquí se avan
za corresponde a los primeros resultados de un estudio (...) cuya finalidad era tener un
conocimiento riguroso del perfil del público de los museos. (...) El análisis comparativo
entre los museos estudiados persigue revelar y analizar cómo las cualidades específicas
de cada centro, su contexto físico, sus servicios, las facilidades de la visita y las atenciones
al visitante influyen en las características del público, sus motivos, expectativas, intereses
y valoraciones. De los resultados de este análisis se deriva el conocimiento de los elemen
tos clave para lograr la excelencia en el servicio al visitante y una orientación más clara
de los museos hacia su función social.» (Laboratorio permanente de público de museos,
Ministerio de Cultura, 2011, 7).
b) De un estudio de valores en la escuela
«Por consiguiente, si los primeros pasos de nuestra investigación sobre el sentido, res
ponsabilidad y actuación de la escuela vasca en la transmisión de valores se dirigieron
al profesorado, los siguientes habían de ir encaminados a recoger el punto de vista del
alumnado y las familias (...) De un lado, se hace necesario comprender qué es lo que
captan los escolares a través de sus vivencias y relaciones. De otro, es relevante situar la
percepción que las familias tienen del sentido y acción de la escuela en la transmisión de
valores. (...)
37
La investigación como proceso
El relato de los docentes nos mostró una (...) escuela sola y débil. La pregunta que, a
modo de hipótesis general, se formula a partir de la experiencia de los docentes es si esta
escuela es la misma que perciben, experimentan, el alumnado y las familias.
Desde ese punto de vista y cediendo protagonismo a sus miradas y voces, la búsqueda
de respuestas se orienta en tres direcciones. La percepción que tienen de la escuela, de
su función y utilidad social, dando por supuesto que en ese contexto las relaciones con
el profesorado tienen un protagonismo central. La manera en que perciben, identifican y
vivencian la educación en valores en el territorio escolar, tanto en enfoque como en los
contenidos y su tratamiento. Y los límites, contradicciones y debilidades de la relación
escuela-familia y de la transmisión en valores, entre [Link] escolar y familiar.
Como lo que se persigue es captar el sentido o la interpretación de los fenómenos en los
términos de significado que las personas les otorgan (Denzin y Lincoln, 1994), en este
estudio empírico también se opta por una estrategia de investigación cualitativa y una
técnica que permita a los individuos describir, exponer, contar sus elecciones, sus estrate
gias, sus emociones a partir de algo que los une (...) Los grupos focalizados o de discusión
producen discursos y análisis espontáneos desde la interacción de los participantes que
comparten una situación social.» (Usategui y Del Valle, 2009,17).
____________________________ m -----------------------------------------------------------------------
Ciertamente, también hay proyectos que arrancan con menos especificaciones,
sobre todo si son de encargo y se desarrollan a demanda muy concreta de institu
ciones, empresas o personas tipo clientela. En estos casos no suele hacer falta más
introducción a los objetivos que la propia expresión de la solicitud efectuada y la
relevancia que tenga para quien es destinatario/a de la investigación.
Y, finalmente, en cuanto al título y resumen del proyecto, pueden ser lo último a
decidir, cuando se haya reflexionado sobre todos los demás aspectos y se tenga una
idea clara de cómo reflejar lo esencial del proceso y los resultados esperables. Hay
quienes defienden (Guinea-Martín y Gómez-Redondo, 2012) que, en los procesos
de evaluación de proyectos por parte de los organismos financiadores públicos, los
resúmenes son muy importantes y es central saber condensar los puntos fuertes
del proyecto en el resumen. Un título bien elegido también es una oportunidad de
atraer e interesar a la vez que sintetizar con precisión el núcleo de una investiga
ción concreta.
En cualquier caso, de nuevo, el objetivo (informe, publicación, etc.) y el destino
(tipo de investigación académica o por encargo) influirán en el modo de plantear
tanto las especificaciones como el resumen y título del proyecto.
1.4.2. Objetivos e hipótesis o preguntas de investigación
Una investigación puede tener uno o varios objetivos generales que, a su vez, suelen
desglosarse en más objetivos específicos. Los objetivos aluden al contenido de la in-
38
Proyectos de investigación
vestigación en el sentido genérico de «qué se quiere averiguar» sobre el tema/pro-
blema/cuestión y qué es lo que esta investigación aporta al campo de conocimiento
en que se inscribe o a la demanda de la que procede. Son «propósitos».
Los objetivos expresan en forma de «acción» en qué se manifiesta de forma par
ticular la idea de investigación en cada proyecto. En lugar del verbo «investigar»,
también suelen utilizarse otros como conocer, averiguar, descubrir, explorar o estu
diar, sobre todo para los objetivos más generales. Los objetivos específicos que se
derivan de los anteriores concretan la orientación del tratamiento de la cuestión,
por ejemplo, añadiendo la diferencia entre describir, explicar, comparar o predecir
aspectos del tema. También es frecuente que los objetivos específicos hagan refe
rencia a los distintos sectores de la población o poblaciones implicadas.
En el proyecto presentado en 2007 (Ispizuay Lavía] para una investigación bajo
contrato realizada a demanda del centro cultural municipal Alhóndiga Bilbao (hoy
Azkuna Zentroa), los objetivos iniciales fueron bastante genéricos, ya que se trataba
de abrir un primer paso hacia un Observatorio permanente sobre los hábitos de lec
tura de adolescentes «con vistas a adecuar la futura oferta cultural de la Alhóndiga
para este colectivo y, en última instancia, servir como una herramienta más de ges
tión de calidad». En este caso, se trataba de un estudio esencialmente descriptivo.
Así, en el proyecto aparecía:
«Como primer paso, esta investigación tiene como objetivo general la recogida y
análisis de la información básica necesaria para el Observatorio: conocer cuáles son
actualmente los hábitos de lectura de los adolescentes bilbaínos tanto desde una
perspectiva cuantitativa como cualitativa y dentro de su contexto sociodemográfico
y cultural. Es decir, se trata de conocer con la mayor profundidad posible la relación
entre los adolescentes y la lectura como actividad» (Ispizua y Lavía, 2007)
Otro ejemplo de una investigación bastante diferente podría ser el que extraemos
de la base de datos del Centro de Investigaciones Sociológicas (C1S, 2011): un estu
dio sobre corrupción política en España. El estudio se realizó mediante grupos de
discusión (estudio n.Q2.863) y en la ficha técnica publicada consta al inicio:
«Al objetivo principal mencionado, conocer las actitudes y percepciones de la pobla
ción española hacia la ética en el ámbito público y la corrupción, se añadió de forma
más específica indagar en la imagen de la política y los/as políticos/as, en el funcio
namiento y la calidad de la democracia y en el problema concreto de la corrupción,
para evaluar dónde parece estar el origen del problema, y cuáles los efectos (políti
cos) o sensaciones que genera sobre el ciudadano /a.» (GIS, 2011).
La redacción de objetivos que solemos especificar, al elaborar los informes de resul
tados, pueden y suelen ser más desarrollados que las de los proyectos originales, ya
que la investigación finalizada normalmente ya ha establecido el alcance de lo que
fue realmente factible. Sin embargo, al elaborar el proyecto es absolutamente cru
cial fijar mínimamente unos objetivos concretos porque sirve para posteriormente
39
La investigación como proceso
seguir especificando aspectos de interés a través de las hipótesis y /o de las pregun
tas de investigación. En las memorias científicas que se presentan a proyectos con
financiación pública siempre se especifica un apartado de objetivos de la investiga
ción en el que se advierte que deben ser concretos y relevantes.
Hipótesis y preguntas de investigación
Una hipótesis es una conjetura lógica acerca de algún aspecto de la realidad que
investigamos y formulada de modo que pueda ser comprobada. La formulación
de hipótesis suele aparecer casi siempre como parte del proceso de investigación
en la literatura metodológica aunque cada vez más se plantea como un «dilema»
(O'Leary, 2014,41): ¿necesito una hipótesis? Es cierto que las hipótesis de investi
gación como componentes formales necesarias de un proceso de investigación van
asociadas directamente con el paradigma positivista que sustenta muchas inves
tigaciones sociales cuantitativas y en ese sentido tienen un papel importante en
el planteamiento de muchos estudios sobre todo de orientación más académica
(Alguacil, 2011, 45-51).
Una hipótesis es una proposición provisional, una suposición que al ser forma
lizada para poder comprobarla también nos obliga a desarrollar aún más nuestros
objetivos de investigación y, sobre todo, en el plano de la operacionalización de con
ceptos. Las hipótesis nos llevan a pensar en términos de conceptos y variables y
relaciones entre variables. Si por ejemplo nos planteamos un estudio como el del
público de museos al que hemos aludido antes (Laboratorio permanente de públi
co de museos Ministerio de Cultura, 2011), y atendiendo al objetivo de «descubrir
el perfil de los visitantes de museos», probablemente tendremos alguna hipóte
sis acerca de la mayor presencia de personas de un determinado género, grupo de
edad, nivel educativo, etc. y probablemente también pensemos en ciertas motiva
ciones o expectativas asociadas a esos perfiles que compondrán hipótesis sobre la
relación entre tales variables. Así, por ejemplo, para afrontar ese objetivo lanza
ríamos la hipótesis de que los ciudadanos con mayor nivel de estudios acuden a
museos con mayor frecuencia que quienes poseen un nivel inferior o también la
hipótesis de que hay cierta relación entre la edad y el tipo de motivaciones por las
cuales los visitantes acuden a museos.
Sin embargo, el debate sobre las diferencias con los modos cualitativos de inves
tigar también incluye frecuentemente las llamadas a desligar la misma idea de un
proceso de investigación de ciertas fbrmalizaciones como las hipótesis. El carácter
abierto, flexible, y muy a menudo exploratorio de muchos estudios cualitativos im
plica que hay que dejar las suposiciones sobre la realidad en otro plano y en otros
momentos de la investigación. En las investigaciones cualitativas no se suelen for
malizar hipótesis, sino más bien se avanzan definiciones provisionales o «versio
nes» de los problemas (Morgan, 2014, 33), al hilo de la definición y redefinición de
las preguntas de investigación. Además, en muchos estudios cualitativos las hipó-
40
Proyectos de investigación
tesis como definiciones provisionales también surgen inductivamente del análisis
de las evidencias.
Otra forma de ver la utilidad de estas fases primeras de definición y redefinición
es plantearse la concreción de los objetivos de investigación en «preguntas de in
vestigación» más que en hipótesis:
«Una vez que estás pensando en términos de "puzzles" y explicaciones, será una
tarea relativamente fácil formular una serie de preguntas de investigación y estas
formarán la columna vertebral de tu diseño de investigación. Uso el término "pregun
ta de investigación” porque lo prefiero a, por ejemplo, "hipótesis" o "proposición”, en
parte porque las aproximaciones cualitativas habitualmente formulan preguntas que
se exploran y desarrollan en el proceso de investigación más que hipótesis que deban
ser testadas mediante la investigación empírica» (Masón, 2002,19).
lodo proceso de investigación comienza y termina con preguntas que se intentan
responder y que nos llevan a nuevas preguntas. Y de algún modo cualquier hipóte
sis puede traducirse en pregunta y al revés. En un estudio sobre internet y partici
pación política en España, se plantea como un objetivo de tipo temático «esclarecer
(...) el uso general que cada ciudadano hace -o no- de internet (teniendo en cuenta
aspectos como la frecuencia, el tipo de usos o el lugar de acceso)» (Anduiza et al.,
2010,7). A partir de aquí se formulan varias preguntas de investigación como:
«en qué medida los ciudadanos españoles utilizan internet con fines políticos (...)
hay diferencias significativas entre la participación política online y offline (...) si esta
participación que se produce en la esfera online tiene a reproducir los modos ya exis
tentes offline o, por el contrario, responde a una lógica diferente» (Anduiza et al.,
2010, 9).
Hay que tener claro que las hipótesis y las preguntas de investigación, cuanto más
sencillas, más ayudan. Por ejemplo, en una investigación sobre selección de mues
tras para encuestas se proponen tres hipótesis con cinco sub-hipótesis tan claras
como: «la localización de jóvenes (menores de 35 años) y de ocupados requiere vi
sitar un gran número de viviendas hasta encontrar el prototipo de persona ideal
a entrevistar» (Díaz de Rada, 2008, 218). Las relaciones multivariables amplias y
complejas, con muchas variables y muchas asociaciones parciales, son muy difíciles
de comprobar y evidentemente condicionan todo el diseño del proyecto y la inves
tigación. Así suele suceder con la tendencia a formular objetivos e hipótesis fuerte
mente causales que raramente se pueden comprobar en puridad, si no es a través de
diseños experimentales y /o aplicando técnicas estadísticas avanzadas precisamente
para el análisis causal. Aunque esta cuestión compleja de la causación en las ciencias
sociales (Golthorpe, 2010) supera el alcance de este texto, el debate acerca de la
utilidad y necesidad de la formulación de hipótesis está más ubicado en los dos ejes
prácticos de la diferenciación básica de investigaciones de los que venimos hablan
do: más bien académica frente al encargo externo y más cuantitativa que cualitativa.
41
La investigación como proceso
1.4.3. Selección del diseño de investigación: técnicas y fuentes
En el guión propuesto (cuadro 1.4) hay un apartado de Metodología en el que hay
que avanzar las líneas generales de «cóm o» va a llevarse a cabo la investigación y
que es donde se suele definir ya una orientación más bien cuantitativa o cualitativa
(o mixta), así como la elección sobre todo, de las fuentes y técnicas de recogida de
información, además del modo en que se llevará a cabo el análisis de las evidencias.
Ya hemos visto que los distintos diseños identificables de investigación se carac
terizan de modo central por estos elementos y los desarrollaremos en los capítulos
siguientes. En este momento, por tanto, debemosjsaber que para elegir un tipo de
diseño u otro podemos dar unas orientaciones generales, y para ello, y debido a las
especificidades que presenta cada investigación, hemos optado por presentar un
esquema (cuadro 1.6) que puede ayudar a elegir, de un modo tentativo, la técnica
concreta más adecuada. Para ello, determinando el enfoque, la orientación del ob
jetivo general, el modo de recogida de información, la población objeto de estudio
así como un acercamiento a los objetivos más concretos, podemos ver cuáles son las
opciones prácticas de diseño más habituales.
1.4.4. Plan de trabajo
1
Una vez anticipada una elección sobre cómo abordar los objetivos de investigación
en un diseño, en todo proyecto de investigación la combinación de una propuesta
mínima de fases y tareas dentro de un diseño metodológico concreto, y a la luz de
unos recursos (humanos y materiales) estimados o disponibles, debe permitir anti
cipar un plan de trabajo o cronograma.
El cronograma puede organizarse alrededor de las fases y tareas, o también so
bre hitos a alcanzar en relación a los objetivos de investigación. Esto depende de
los condicionantes que son más fuertes para el desarrollo del proyecto: materiales,
metodológicos o incluso de resultados.
A estos efectos, la diferencia entre investigaciones por su finalidad más o menos
académica o profesional es bastante importante, ya que afecta mucho a la necesaria
estimación de los recursos disponibles, que incluyen tanto los recursos humanos
como los materiales. Del mismo modo las limitaciones de tiempo para el desarrollo
de la investigación deben ser consideradas.
Así, por ejemplo, si hablamos de planificar la realización de una tesis doctoral
con financiación a través de una beéa predoctoral, podemos pensar en el desarro
llo de una investigación individual con dedicación a tiempo completo y corriendo
con todos los gastos materiales el/la investigador/a durante al menos tres años.
Cualquier trabajo de investigación menor, digamos «novel», como tesinas, trabajos
fin de grado (TFG) o trabajos fin de máster (TEM), que de entrada tienen un plazo
mucho menor de ejecución (y presentación) y a priori no cuentan con fuentes de
financiación, tienen que ser especialmente realistas en el diseño y particularmente
42
Proyectos de investigación
Cuadro 1.6: Criterios para elección de un diseño de investigación.
T3
> £ ro ro ro
Análisis de documentos
O -g c £ c u "o
Observación indirecta
"O m C
o.:2 TD ro ro E "6
_QJ 'c .2 - '! D- g C
-Q .5 di .2 ^ <_) LC u C 3
^ ro o -t->
3 E £ •ro
t di
O
p -
§ro =- o • e l
4—* c
o 4- » LO
o ro •— rCLo o L in
o . _Q_ o CL T3 Q . q _ vi vi C -t
o .0 di LO di C
OI
O
¡ c
-O ro TJ iQ
3 :2 £ :2 5 S §
2O üro tuo LO
O o o Ü ° m
S § ro 5 {S
> £ v¡
c ó
< TD ¿ m di >
° O _Q
^ Si
di
O O O O 0 c:
o "O ro di LO
4-» T3 di di
0)
i~ '€ C
o _dJ
LO C LO
o ü ro >LI f—
o
"u
_dl
ro
c l_
ro O
LO
o ro Q- di J= ro c l
u k
Q- r3o
CL t
ro di £ 2 di 2
o Q-
> ro
I>d<
di x
ro ro
•di
43 IN i M i-
-----4-» c 4^-1
L- CL
ro c — c U.
Ja o c QJ
O <
4-»
c
ro
TD O T3 O
ro ic ro ic
Documentos
CL Q .
c CL) ro O
E .P di
;0 E
0J . i cu
g- ■di° £Td .1 §■
‘G c — — <u
_ro T3 -M
'O C Q.
lo-P C CL
JO
o :2 o O ro
o £ :2 o
U Q_
Ql _Q
O
_ro 3
Q .
C 3
_Q ro 3
O jd O _o
Q_ o ÜD
CL. o
CL
di c
secundarios
-O o
ro 'o
Datos
-O ro
t>o E
Ou «O O ~ O 3 O .b
0» 'p
cc .E
LO i-T uT* C ro
O
> 5 05 l T 03 ü di ro s g
n *k_ U TÓ E di
“O
0^4=
Q_ LO ÍD QJ
O
ai
1/) ~o_ di * 3 di » - 3 C -T?
en V-
Pd) n ni -Q
lo * QJ X £
O O QJ CD CL
C
lo 3
LO
O
di CU di g
3 3
cr CT 13
o O \p O .-tí
n— —
C cro
IM c ro
Fuente: elaboración propia.
43
La investigación como proceso
en el acceso a la información necesaria. Para un TFM, por ejemplo, se debería pen
sar prioritariamente en la explotación de datos secundarios (sean cuantitativos o
cualitativos) y /o en acotar mucho el objeto de investigación para hacer accesible la
obtención de evidencias primarias.
Si la investigación también es académica, pero se inscribe en la línea de un grupo
de investigación, el equipo humano se amplía y tiene más experiencia. Probable
mente se trabaja con unos recursos materiales mínimos (institucionales) y toda la
organización depende más de las agendas del grupo y de los medios económicos es
pecíficos que requiera el diseño. En este formato, además, la planificación del pro
yecto va destinada a solicitar la financiación necesaria para poder llevarlo a cabo y
de su obtención (sin o con recorte respecto a la sólicitud) dependerá el desarrollo
real de la investigación.
En las investigaciones por encargo hay que presupuestar también el coste eco
nómico de todas y cada una de las actividades que se van a desarrollar, definir un
equipo de investigación y marcar plazos de entrega de resultados. En estos casos es
también frecuente que tras algunos contactos previos entre investigadores y clien
tes se haya prefijado un coste máximo o aproximado y se trabaje diseñando lo que
mejor se ajusta a la demanda m r esos recursos.
Por lo demás, el plan de trabajo mínimo se presenta en un típico diagrama de
Gantt como el que aparece en el cuadro 1.7, en que se cruzan las actividades o ta
reas a desarrollar con su duración y extensión en el tiempo, pudiéndose apreciar
también el solapamiento temporal de algunas tareas. Este ejemplo corresponde a
un trabajo de investigación académico de cierta duración (dos años para un proyec
to en equipo) y en realidad podría tener una organización muy diferente según la
orientación metodológica (cuantitativa o cualitativa) y el diseño concreto. Así, en un
estudio cualitativo, el análisis se desarrollaría a la vez que la ejecución del trabajo
de campo y la revisión teórica podría extenderse durante más tiempo; otros dise
ños pueden requerir una preparación metodológica de mayor duración o menor
que la que se expresa en el cuadro. En definitiva, cada diseño considera los grandes
grupos de tareas y las actividades concretas según sus características específicas.
Respecto a los recursos, hay que destacar que en los últimos años se están pro
duciendo cambios en la organización de las investigaciones como consecuencia de
la especial evolución de la relación entre tiempo y tecnología. Cada vez más el ac
ceso a la tecnología que agiliza diversas fases de la investigación está diferenciando
las posibilidades de investigar en ciencias sociales, ya que no es igual para todo tipo
de investigaciones e investigadores/ras.
Un caso concreto es el del software asociado a la recogida de información y
también al análisis: el dominio personal (o dentro del propio equipo investigador)
de ciertos programas informáticos que permiten almacenar, gestionar y analizar
nuestra propia información ha sido clave para la reorganización de los tiempos en
la ejecución de proyectos de investigación, permitiendo una conexión mucho más
directa entre el equipo investigador y sus evidencias. Por el contrario, también está
44
Proyectos de investigación
Cuadro 1.7: Ejemplo de cronograma de investigación basado en tareas (secuenciales) para
un estudio académico de dos años por trimestres.
AÑO 1 AÑO 2
Actividades/tareas TI 12 T3 T4 TI T2 T3 T4
Revisión teórica y construc
ción de un marco conceptual
y analítico
Diseño metodológico para es
tudio empírico y organización
del trabajo de campo
Ejecución del trabajo de cam
po: registro
Preparación y tratamiento de
la información (depuración,
organización)
Análisis e interpretación
Redacción de informe
Fuente: elaboración propia.
aumentando la brecha entre quienes investigan con o sin la última novedad técnica,
porque los cambios en este aspecto son veloces. Algunos de los retos tecnológicos
de la investigación los iremos abordando en los siguientes capítulos, no los vamos a
listar aquí, pero es pertinente apuntar ahora la conexión entre todos los elementos
de la planificación que se traducen en el proyecto de investigación y que vuelcan en
algún organigrama.
1.5. Aspectos éticos de la investigación social
Todo proceso de investigación en tanto que actividad profesional y científica impli
ca un compromiso con la verdad y en ese sentido también que los equipos investi
gadores tienen responsabilidades con aquello que es «investigado/s» tanto en un
plano normativo o legal como moral y ético. La reflexión y también las propuestas
de control sobre estos aspectos éticos de las investigaciones sociales se han ido
desarrollando en los últimos años hasta constituir hoy casi un checklist metodo
lógico paralelo de todo el proceso. Y también, en el caso específico de la investiga
ción social, en un modo de alerta sobre la función crítica y transformadora de toda
45
La investigación como proceso
investigación social relevante. Por todo ello, la reflexión sobre las consideraciones
éticas previas también puede ayudar a conformar un mejor modo de planificar y
desarrollar la investigación.
Ciertamente, la atención a los aspectos éticos de la investigación social procede
de un contexto y de un periodo histórico concretos, y se ha desarrollado especial
mente en el mundo anglosajón sin que haya calado tanto en nuestro ámbito más
cercano de actuación, al menos hasta fechas muy recientes. Proveniente específica
mente del conocimiento público y denuncia de maltrato y abusos manifiestos en la
investigación experimental biomédica con seres humanos (incluidos los crímenes
de guerra nazis en la Segunda Guerra Mundial), fue en Estados Unidos donde se
llevaron a cabo distintas iniciativas para la protección de los seres humanos como
sujetos de investigación. Desde entonces la cuestión de la ética de investigación se
inscribe en los países occidentales en el campo de los derechos humanos. En 1979,
una comisión específica elabora el Belmont Report, un informe que estableció tres
principios éticos para la protección de sujetos humanos en la investigación biomé
dica y del comportamiento: respeto hacia las personas (tratarlas como seres autóno
mos y proteger a los vulnerables), beneficencia (buscar maximización de beneficios
y minimización de riesgos) y^listicia en la aplicación de procedimientos. A partir
de estos principios generales se han ido desarrollando normativas específicas que
constituyen actualmente la política de referencia sobre códigos éticos aplicados a la
investigación. En España existe legislación nacional y también de las comunidades
autónomas al respecto, además de que también se siguen las normativas europeas
e internacionales que son de aplicación (se pueden consultar en la página web del
Centro Superior de Investigaciones Científicas).
Esta «formalización» de la ética de la investigación ha ido desde la investigación
biomédica a los demás campos de conocimiento (también las ciencias sociales) y
desde las instancias políticas y legislativas hacia las instituciones más profesional
mente ligadas a la investigación. Así, diversas asociaciones profesionales nacionales
e internacionales, y otras instituciones universitarias o de investigación, y comités
de evaluación de investigación, fijan normas y estándares y especifican códigos éti
cos que se ajustan a estos principios y que son de obligado cumplimiento para la
comunidad investigadora. En el campo de la sociología, por ejemplo, la Internatio
nal Sociological Association tiene su código ético (ISA, 2001), que también comparte
la Federación Española de Sociología (FES). También es muy conocido el Código
de la Cámara de Comercio Internacional ICC/ESOMAR para la práctica de la inves
tigación social y de mercados (ICC/ESOMAR 2007), pero en general cada campo
profesional puede adaptar algunos principios comunes generando muchos otros
conjuntos de estándares sobre ética de la investigación social.
Pero, más allá de lo preceptivo, subyace en estas normas un modo ético de de
sarrollar la investigación y que expondremos aquí en sus aspectos clave: proteger a
los sujetos de investigación; mantener la honestidad, transparencia e integridad de
46
Proyectos de investigación
la investigación; asegurarse llegar a resultados válidos; y proteger los usos y aplica
ciones de los resultados de la investigación (David y Sutton, 2011, 29-53).
a) Proteger a los sujetos sobre los que se investiga es la base central del de
sarrollo ético de una investigación social, y en general con seres humanos
como participantes. En sentido amplio, la investigación debería evitar o
controlar al máximo «daños» a los sujetos participantes que normalmente
actúan como personas informantes (encuestados/as, entrevistados/as) o
sujetos bajo observación.
Aunque la idea general parezca obvia, no siempre tiene una interpreta
ción sencilla y mucho menos un control completo. La idea de «daño» como
riesgo o molestia abarca desde efectos físicos manifiestos hasta posibles
daños psicológicos, pero también incluso las molestias ocasionadas por la
intromisión en la intimidad o por el uso del tiempo de las personas parti
cipantes. Prácticamente todos los diseños de investigación con elaboración
de los datos de primera mano generan un dilema a este nivel. Cualquier
contacto directo con personas puede implicar un disturbio emocional po
tencialmente dañino y no siempre es posible evitarlo o realizar una com
pensación o corrección posterior que anule estos efectos.
Una de las consecuencias prácticas de esta observación elemental es la
extensión de la necesidad de obtener consentimientos informados a la in
vestigación por parte de todos los sujetos participantes. Esto implica que el
sujeto es completa y honestamente informado de todos aquellos aspectos
de la investigación que le afectan, que los comprende y que, siendo compe
tente para ello, consiente voluntariamente en participar.
El consentimiento informado debe tener alguna forma documental es
pecífica y, en ese sentido, genera nuevos retos a los equipos investigadores
en relación con la presentación más completa y adecuada. Dependiendo
del tipo de investigación (experimental o no, cualitativa o cuantitativa, etc.)
puede tratarse de formularios incluso largos y exhaustivos que describen
partes relevantes del proceso de investigación tales como el muestreo, las
fases de encuestación o de realización de entrevistas personales o grupales.
También hay variantes relevantes según diseño: en los estudios cualitativos,
por ejemplo, el consentimiento y el alcance de la confidencialidad puede
necesitar revisión a la luz de nuevos participantes o de nuevas evidencias
y materializarse incluso en algún documento «post-entrevista» (Fawcett y
Pocket, 2015,140).
Desde el punto de vista legal, hay colectivos especialmente sensibles en
este aspecto y muy habituales en algunos campos de investigación social,
como los menores de edad, que solo pueden ser participantes con autori
zación legal de sus tutores (investigación educativa), y además todo tipo de
poblaciones especialmente vulnerables: personas con algún tipo de incapa-
47
La investigación como proceso
citación, institucionalizadas, en riesgo de exclusión social, etc. Todas estas
personas pueden tener incluso expectativas distorsionadas acerca de la in
vestigación (psicológica, sociológica) que condicionan su consentimiento
informado. Por lo que hay que estar particularmente alerta a que el proceso
de autorización sea claro y adecuado.
Otro aspecto derivado en la protección de las personas es el de evitar
el engaño, excepto bajo circunstancias muy excepcionales. Muchos experi
mentos clásicos incluyen como forma de participación el hecho de que las
muestras aleatoriamente seleccionadas no saben cuál es su papel exacto en
el desarrollo del experimento y tampoco a veces el alcance de los estímulos
o situaciones en que los sujetos se van a ver observados. La simulación for
ma parte de distintos diseños en muchos campos de investigación como la
psicología, el marketing, los estudios etnográficos, etc. En todos estos casos,
el daño potencial está presente y la explicación a posteriori o «debriefing»
puede minimizar riesgos, pero no siempre.
Una forma concreta adicional de proteger a los individuos en la inves
tigación social es mantener y garantizar de antemano que se respetará la
privacidad y confidencialidad de la información obtenida. En este sentido,
hay legislaciones muy concretas (Ley de Protección de Datos en España,
LOPD 15/1999 y su RD 1720/2007) e instituciones - agencias que se encar
gan de velar por su desarrollo (Agencia Española de Protección de Datos).
Pero además la práctica específica de estos principios debe planificarse
claramente en cada proyecto de investigación: cómo se va a garantizar el
anonimato de los sujetos informantes sea cual sea la técnica de obtención
de información, directa o indirecta.
b) La segunda gran cuestión ética se refiere en general a los compromisos de
la investigación con toda la comunidad científica: mantener la honestidad,
transparencia e integridad en el desarrollo, análisis y presentación de re
sultados implica que todo equipo investigador debe llevar un control ex
haustivo de cómo se ha desarrollado cada estudio y, cuando sea necesario,
dar información veraz y suficiente sobre ello. Esto implica normalmente
comprometerse a incluir apéndices metodológicos en las presentaciones
y publicaciones, y dejar información de contacto sobre la autoría. También
abordaremos estas cuestiones en los capítulos 2 y 3 al exponer la actuali
dad y relevancia de la metainformación y de los bancos y repositorios de
investigación.
A este respecto, la investigación profesional, más que la académica, in
cluye también especificaciones sobre los derechos de las clientelas o de las
personas y entidades que son fuentes de financiación a recibir información
exacta y objetiva sobre todo el proceso de la investigación. Pero también
muchos códigos éticos explicitan necesidad de mantener una posición de
rechazo a «financiación o contratos con condiciones específicas que sean
48
Proyectos de investigación
inconsistentes con su juicio científico de lo que es apropiado» (ISA, 2001,
2). Estas formas de subjetividad sesgada, vengan de donde vengan, deben
ser evitadas.
c) Llegar a resultados válidos. La validez es un principio esencial del conoci
miento científico y el principal criterio de evaluación de cualquier proceso
de investigación. La ética de la investigación incluye planificar que todo el
proceso tiene como fin conseguir resultados «verdaderos» e «insesgados»
sobre aquello que es objeto de investigación. Solo partiendo de ahí se puede
llegar a justificar la necesidad de la investigación.
La búsqueda de la validez atraviesa todos los aspectos del diseño meto
dológico de la investigación, aunque está más directamente conectada con
las decisiones sobre captación de evidencias empíricas: operacionalización
de conceptos y medición, como trataremos en el capítulo 4. Reconocien
do además que ninguna investigación concreta puede alcanzar la validez
en términos absolutos (toda la verdad), incluimos aquí la idea más amplia
de que un posicionamiento ético sobre la investigación significa planear e
introducir controles de sesgo en el desarrollo de todo el proceso de una
investigación hasta donde es posible.
d) Garantizar una aplicación apropiada. Los científicos e investigadores deben
considerar el uso que se va a dar a sus estudios específicamente si tienen
implicaciones prácticas muy claras o directas. También tienen que consi
derar que cuando se trata de estudios a demanda (por encargo), ciertas
cuestiones tienen que negociarse previamente en los contratos, ya que el
producto final es propiedad de quien lo encarga y costea.
Entre otras cuestiones emergentes con relación al uso final de las inves
tigaciones, pero también en general respecto a su planteamiento y desa
rrollo, están la reflexión ética y crítica acerca de las relaciones de poder en
que se inscribe todo proceso de investigación, así como de la introducción
específica de la perspectiva de género en los modos de abordarla. Siguiendo
el resumen reciente de Fawcett y Pocket (2015), pero también en O'Leary
(2014), la perspectiva de género en la investigación social implica cambios
o innovaciones que van desde hacer visibles a las mujeres que participan
con cualquier rol en investigación y que llegan hasta la concepción de la
actividad investigadora como una forma de praxis crítica con la sociedad
actual y de transformación social y política.
En este sentido se plantea incluso hasta un cambio general en la con
cepción y práctica del proceso de investigación que nos lleve a un estilo de
investigación más inclusiva, que proponga cambiar la relación entre sujetos
investigadores y sujetos investigados acentuando la «co-construcción» del
conocimiento. Inclusividad y participación desde la posición de quien lleva
a cabo la investigación y la definición de la misma investigación implican
49
La investigación como proceso
que se acabó el investigar «sobre o acerca de» sujetos y que más bien esta
mos en la era de investigar «con» otros participantes en la investigación. En
este aspecto, una posición ética asume que hay que tener presentes y sacar
a la luz los equilibrios de poder que supone el mismo proceso investigador.
Los comités de ética de la investigación
La formalización de la ética de la investigación se puede apreciar recientemente
en la cantidad creciente de comités de ética de la investigación que surgen en todo
tipo de agencias e instituciones privadas y públicas que tratan con investigación en
general y también con investigación social en particular. Estos comités evalúan los
aspectos éticos de los proyectos de investigación y sus dictámenes son condicio
nantes en los procesos de concurso a financiación pública y también en la acepta
ción de determinadas publicaciones.
En definitiva, los dilemas éticos en la investigación no solo descansan en con
seguir la aprobación de los comités de ética. Pero el trabajo desarrollado por estos
comités, centrando el foco en la materialización específica de los principios éticos
a lo largo de todo el p rocesóos muy valioso. Más concretamente, los comités de
ética revisan, aprueban y monitorizan proyectos e investigaciones para asegurarse
la integridad de la investigación y el bienestar, seguridad y derechos de los sujetos
participantes. Algunos son interdisciplinares, acentuando así la idea de que la in
vestigación también puede expresarse en lenguaje llano y que es competencia no
solo de personal técnico, sino de la sociedad en general.
Por su origen histórico, desde la investigación biomédica la mayor parte del tra
bajo de estos comités se ha desarrollado bajo la concepción de un único paradig
ma positivista de investigación científica, y así se reconoce en muchos indicadores
que se utilizan cuando los proyectos son sometidos a evaluación. Sin embargo, el
desarrollo de otras formas de investigación social (de orientación cualitativa, por
ejemplo) ha permitido ir ampliando y buscando analogías a los criterios éticos en
estas otras formas de investigar, con lo que el repaso completo a un proyecto de in
vestigación social puede verse casi como una lista de comprobación metodológica
de la propia investigación (O’Leary, 2014).
En el cuadro 1.6 aplicamos esta idea, basándonos en los ítems que aparecen en
algunos formularios de evaluación de los comités de ética de la investigación (CEI-
SH, 2015).
Como se aprecia, esta check-list, pregunta por la previsión de los aspectos éti
cos en diversos momentos de la investigación y, con ello, nos hace recorrer de otro
modo las fases y tareas del proceso de investigación que habíamos descrito en el
cuadro 1.1. Se plantean de nuevo los objetivos científicos y también la finalidad de
la investigación, los porqués, para qué y para quiénes investigar, desde la perspec
tiva de que la investigación se justifique porque produzca conocimiento válido y
relevante. Como mínimo, se trata de asegurar que la investigación no se confunde
50
Proyectos de investigación
Cuadro 1.8: Lista de comprobación del proyecto de investigación social desde la perspectiva
ética.
Elementos de ítems específicos
revisión ética
Valor y justifica La investigación es pertinente y aporta beneficios al conocimiento (hay
ción social del un «para qué» y se ha reflexionado sobre ello).
proyecto (finali
La necesidad de que haya personas participantes se justifica, dentro de
dad última)
un contexto realista y aprovechando los recursos disponibles al máximo.
Cualificación del La experiencia del equipo da garantía razonable de capacidad
equipo investi profesional para llegara resultados.
gador
Validez científica Especificación de la finalidad, objetivos y diseño metodológico completo
y metodológica de la investigación (está previsto que la investigación llegue a resultados
global del pro científicamente válidos).
yecto
Concreción del alcance y el tipo de «concurrencia» de seres humanos
como sujetos de investigación o sujetos participantes (por ejemplo:
entrevistas, encuestas, fotos, grabaciones, pruebas físicas, pruebas
psíquicas).
Proceso de Especificación de los procedimientos de muestreo o cualquier otra
«reclutamiento» forma de registro directo o indirecto y de las personas responsables del
de participantes equipo investigador.
Selección equitativa de los sujetos (si es posible, dentro de la aplicación
de cada proceso de muestro).
Si se han previsto posibles compensaciones o incentivos a la
participación hay que explicarlo y reflexionar sobre sus posibles efectos.
Privacidad y con Consideración de la protección del anonimato y la confidencialidad de
fidencialidad en los datos obtenidos.
el tratamiento de Previsión del destino de los datos (destrucción, cesión o custodia) al
datos obtenidos finalizar su registro y su uso para la investigación.
Evaluación Consideración de todos los riesgos (molestias) físicos o psicológicos,
riesgos/ desde la intromisión en la intimidad hasta el mero uso del tiempo de las
beneficios personas participantes.
Previsiones sobre cómo minimizar riesgos y/o compensar daños (si
hubiera).
Protección Previsiones específicas para la protección de grupos concretos como
de colectivos grupos de menores, incapacitados, institucionalizados, subordinados,
vulnerables subsidiados o personas en riesgo de exclusión social.
Información y Elaboración de formularios adaptados (a sus condiciones) de
obtención de consentimiento informado para personas participantes.
consentimientos
informados
Fuente: elaboración propia con base en Memoria MIO CEISH-UPV/EHU (2015)
51
La investigación como proceso
con otras actividades de mero registro de informaciones o de supuestos pulsos a la
realidad o hasta de ficticios experimentos sociales o comunicativos que no tienen
ninguna finalidad científica, sino más bien todo lo contrario.
En otro apartado, aunque al solicitar estos formularios un «diseño metodológico
completo» ya se alude a la elaboración de todo un proyecto de investigación, las
especificaciones sobre la concurrencia de los seres humanos participantes implican
detalles sobre la selección de una estrategia cuantitativa o cualitativa (o ambas), el
tipo de información o datos que se prevén obtener y también las técnicas de recogi
da a aplicar para ello. Evidentemente, la clave radica en poder concretar al máximo,
cosa que en ciertos diseños es más complicado que en otros. Por ejemplo, es razo
nable que si se va a realizar una encuesta, ya se haya pensado en una encuesta tele
fónica o en una encuesta online porque todas las previsiones de recursos dependen
de eso. Si se diseña una investigación que se basa en la explotación secundaria de
bases de datos estadísticas, también es factible que se hayan explorado mínima
mente las fuentes disponibles y el modo de acceso, aunque podría quedar algo más
abierto el buscar nuevas fuente si el análisis lo requiere. Sin embargo, como espe
cificaremos más adelante, un estudio cualitativo basado en información primaria
solo puede aportar una descrüjción provisional de lo que supondrá trabajar sobre
entrevistas en profundidad, por ejemplo.
La mayor parte de las comprobaciones se refieren al modo en que se debe in
teractuar con los sujetos participantes antes, durante y después de la recogida de
información. El «reclutamiento» y la solicitud de participación bajo condiciones in
formadas es la primera condición de control de los riesgos potenciales sobre los su
jetos a quienes preguntamos u observamos directa o indirectamente. Mediante los
formularios de consentimiento informado nos aseguramos de que quienes partici
pan lo hacen consciente y voluntariamente tras haber recibido todas las explicacio
nes que se consideren pertinentes sobre su participación. Estos formularios pue
den estar ya elaborados por ciertas instituciones o comités, o puede darse el caso
de que haya que crearlos ad hoc, que es lo más habitual para la investigación social,
ya que los «modos de colaboración/participación» son bastante diversos, y hasta
se recomienda, en la medida en que esta labor es responsabilidad de la dirección
de los equipos investigadores. Esquemáticamente el documento debe adaptarse al
lenguaje de aquellos colectivos a quienes esté dirigido y debe incluir:
- Descripción de la investigación y equipo investigador (con persona de con
tacto para cualquier duda).
De qué modo se propone intervenir a quien participa (entrevistas, grupos
de discusión, acceso a documentación personal, experimento, observación
o grabación en vídeo, etc.) con especificación de duración, condiciones y
riesgos (si hubiera).
Compromiso de confidencialidad, anonimidad y reconocimiento del dere
cho a abandonar la participación en cualquier momento.
52
Proyectos de investigación
Una forma final y personalizada en que el sujeto otorga literalmente su con
sentimiento a participar (algo como «doy mi consentimiento a...») bajo la
propuesta anterior o cualquier otra que se le haya especificado, reconocien
do que se le ha informado y comprende las condiciones.
En las encuestas pueden darse diversas circunstancias para conseguir un consen
timiento informado porque algunas veces la participación es completamente anó
nima o incluso a distancia, y en otras hay hasta un contacto cara a cara con la per
sona informante. En todo caso, en alguna «introducción» de la encuesta debe darse
información suficiente y relevante a los informantes (Cray, 2014,75). Los sujetos
encuestados pueden provenir de una selección al azar y haber recibido alguna in
formación previa o bien pueden verse ante una solicitud de participación sin avisar.
En definitiva, en cada caso hay que garantizar que se puede no participar y que, si se
participa, la información aportada solo recibirá un tratamiento agregado, sin desve
lar quiénes fueron los informantes. No obstante también, dependiendo además del
tipo concreto de población a encuestar, las decisiones son distintas. En muchas oca
siones (encuestas presenciales o telefónicas) son las personas que se encargan del
trabajo de campo quienes tienen que dar la información y conseguir la colaboración
en un tiempo muy limitado, por lo que el proyecto debe prever un entrenamiento
adecuado a estas personas y modo de supervisión eficaz de su trabajo
El documento descrito de consentimiento informado se ajusta mejor a un diseño
en que se vaya a trabajar con informantes de modo no masivo: experimentos, obser
vación en grupos pequeños, entrevistas individuales o grupales, 1AP y otros. Preci
samente, en algunos de estos casos, la necesaria ausencia de un diseño completa
mente cerrado a priori deja un poco más abierta la presencia de riesgos o molestias
a prever, situación ante la cual el documento tiene creciente importancia. También
hay una cuestión previa que no deja de ser debatida, como es la de los incentivos o
compensaciones materiales previamente acordadas como parte del reclutamiento
informado. Aunque es una práctica hasta común en ciertos tipos de investigaciones
(en el campo de la investigación comercial y también en la psicológica-experimen-
tal) y de ciertos tipos de poblaciones de potenciales participantes, no se sabe en
todas las circunstancias hasta qué punto influye en la calidad global de la inves
tigación. Pero sí lleva a reflexión el hecho de que haya estudios para los que sin
compensaciones no se podría conseguir la participación de los sujetos necesarios
(al menos, a tiempo, según el diseño previsto): los «gruperas» pseudoprofesionales
o las personas contactadas a través de intermediarios que ya han participado en
varias investigaciones del mismo tema por sus características específicas (personas
extranjeras, por ejemplo).
Respecto a la evaluación y control de riesgos durante la participación de los su
jetos, es evidente que es muy difícil anticipar hasta dónde afectará la experiencia y
que ello depende de cada interacción entre sujetos investigadores y sujetos inves
tigados, pero forma parte de la calidad metodológica de una investigación haber
reflexionado al máximo sobre esto e incluso reflejarlo a posteriori en los resultados.
53
La investigación como proceso
En la práctica, para cada técnica hay recomendaciones específicas sobre cómo lle
var a cabo el trabajo de campo reduciendo al máximo incomodidades (reconducir
una entrevista, permitir no responder a cuestiones sensibles, pausar las observa
ciones dado más tiempo, etc.), pero no solo porque afecta a la calidad final de la
información, sino porque representa el compromiso ético de la investigación social
sobre seres humanos.
Finalmente, mantener el anonimato y la confidencialidad de la información re
cibida es una parte muy importante del compromiso ético y que alude más bien a
las tareas y fases posteriores a la recogida de información. Este control se planifica
hasta «estandarizar» fórmulas de presentación de la situación de participación que
pueden conjugar la solicitud de colaboración, la-garantía de confidencialidad y el
uso de los datos solo para los fines de la investigación. En las encuestas, por ejem
plo, la presentación en el momento de la encuestación suele incluirlo todo, aunque
se haya realizado algún contacto previo anterior. Como hemos señalado, en otros
diseños este compromiso se podría formalizar a través del documento de consenti
miento informado o incluso recogerse en otros documentos «post-recogida» (Schu-
tt, 2015, 299).
No hay que ignorar que todas estas consideraciones pueden llegar a dificultar
tanto la redacción del proyectó como la realización de la investigación, ya que en
algunos diseños es complicado llegar a prever todas estas cuestiones con anticipa
ción y, aun así, puede no ser posible anticipar el modo concreto en que se puedan
abordar, llegado el caso. No obstante, en la práctica, esta dimensión ética debe ser
asumida por la comunidad científica en los campos de las ciencias sociales, al igual
que lo han sido desde el ámbito más vinculado al área biosanitaria. En una investi
gación proyectada hace unos años para un ayuntamiento, tuvimos la experiencia di
recta de no poder llevar a cabo el estudio solicitado, ya que no se había previsto que
habría que realizar una observación directa (no participante) en situación natural y
grabarla para poder realizar un análisis sobre los usos de los espacios públicos del
municipio.
Por otra parte, en muchos ámbitos de la investigación social ya se han ido pro
duciendo reflexiones metodológicas que tienen mucho que ver con el modo en que
la investigación sitúa a los sujetos o grupos humanos sobre los que se investiga.
Por ejemplo, sobre el «hartazgo a responder encuestas» y sus consecuencias so
bre la no respuesta total o parcial; sobre los perfiles de personas entrevistadoras o
moderadoras de grupos de discusión; sobre las tácticas comunicativas para llevar
a cabo entrevistas; sobre las mejores vías de acceso a las poblaciones para seleccio
nar casos y muestras, etc. Todas estas cuestiones pertenecen al entrenamiento me
todológico y técnico de las personas que se dedican a la investigación social pero,
además, deben integrar modos éticos en la toma de decisiones concretas dentro de
cada proceso de investigación.
54
2. ID E N T IF IC A N D O A LA P O B LA C IÓ N
A A N A LIZ A R . S E LE C C IO N A N D O A LOS
S U JE T O S , U N ID A D E S DE O B SER V A C IÓ N
Y A N Á L IS IS . P O B LA C IO N E S Y M U ESTR A S
Hemos defendido la idea de que una investigación en los campos de lo social pue
de esquematizarse como proceso que consiste fundamentalmente en especificar
qué queremos averiguar, diseñar una estrategia para conseguirlo con unos condi
cionantes prácticos, obtener información necesaria y analizarla. En el cuadro 1.1
propusimos una visión de las fases y tareas más básicas de toda investigación, que
incluye la «delimitación de población y muestras», es decir, el «sobre quién» in
vestigamos como una de las tareas más tempranas en la elaboración de proyectos
y en el desarrollo de la investigación, sobre todo porque condiciona muchas otras
tareas posteriores. La cuestión es que hay que centrar cuanto antes a quiénes hace
referencia lo que se vaya a investigar, quiénes son los sujetos y qué tipo de colectivo
componen. Tenemos que tener en cuenta que no todos los estudios sociales alu
den a diferencias a un nivel mínimo de individuos, sino que trabajan con unidades
colectivas o agregadas: empresas, ciudades, organizaciones, países, hogares, etc.
También hay investigaciones que trabajan sobre «casos» que pueden incluso ser
acontecimientos, procesos, objetos, textos, etc. El espectro de lo que puede definir
una población objeto de investigación es realmente muy amplio.
En este capítulo se abordan estas tareas de definición de poblaciones y selección
de muestras intentando acentuar su conexión con los demás elementos del diseño
de una investigación, desde los recursos materiales hasta los mismos objetivos. Hay
que señalar que, en contra de lo que suelen pensar quienes tienen menos expe
riencia de investigación, hay bastante que reflexionar acerca de estas cuestiones en
cada investigación. Por eso intentaremos también dar alguna idea al respecto.
La investigación como proceso
En la práctica, para cada técnica hay recomendaciones específicas sobre cómo lle
var a cabo el trabajo de campo reduciendo al máximo incomodidades (reconducir
una entrevista, permitir no responder a cuestiones sensibles, pausar las observa
ciones dado más tiempo, etc.], pero no solo porque afecta a la calidad final de la
información, sino porque representa el compromiso ético de la investigación social
sobre seres humanos.
Finalmente, mantener el anonimato y la confidencialidad de la información re
cibida es una parte muy importante del compromiso ético y que alude más bien a
las tareas y fases posteriores a la recogida de información. Este control se planifica
hasta «estandarizar» fórmulas de presentación de la situación de participación que
pueden conjugar la solicitud de colaboración, la garantía de confidencialidad y el
uso de los datos solo para los fines de la investigación. En las encuestas, por ejem
plo, la presentación en el momento de la encuestación suele incluirlo todo, aunque
se haya realizado algún contacto previo anterior. Como hemos señalado, en otros
diseños este compromiso se podría formalizar a través del documento de consenti
miento informado o incluso recogerse en otros documentos «post-recogida» (Schu-
tt, 2015,299).
No hay que ignorar que todas estas consideraciones pueden llegar a dificultar
tanto la redacción del proyectécom o la realización de la investigación, ya que en
algunos diseños es complicado llegar a prever todas estas cuestiones con anticipa
ción y, aun así, puede no ser posible anticipar el modo concreto en que se puedan
abordar, llegado el caso. No obstante, en la práctica, esta dimensión ética debe ser
asumida por la comunidad científica en los campos de las ciencias sociales, al igual
que lo han sido desde el ámbito más vinculado al área biosanitaria. En una investi
gación proyectada hace unos años para un ayuntamiento, tuvimos la experiencia di
recta de no poder llevar a cabo el estudio solicitado, ya que no se había previsto que
habría que realizar una observación directa (no participante) en situación natural y
grabarla para poder realizar un análisis sobre los usos de los espacios públicos del
municipio.
Por otra parte, en muchos ámbitos de la investigación social ya se han ido pro
duciendo reflexiones metodológicas que tienen mucho que ver con el modo en que
la investigación sitúa a los sujetos o grupos humanos sobre los que se investiga.
Por ejemplo, sobre el «hartazgo a responder encuestas» y sus consecuencias so
bre la no respuesta total o parcial; sobre los perfiles de personas entrevistadoras o
moderadoras de grupos de discusión; sobre las tácticas comunicativas para llevar
a cabo entrevistas; sobre las mejores vías de acceso a las poblaciones para seleccio
nar casos y muestras, etc. Todas estas cuestiones pertenecen al entrenamiento me
todológico y técnico de las personas que se dedican a la investigación social pero,
además, deben integrar modos éticos en la toma de decisiones concretas dentro de
cada proceso de investigación.
54
2. ID E N T IF IC A N D O A LA P O B LA C IÓ N
A A N A LIZ A R . S E LE C C IO N A N D O A LOS
S U JE T O S, U N ID A D E S DE O B SE R V A C IÓ N
Y A N Á LIS IS . P O B LA C IO N E S Y M U ESTR A S
liemos defendido la idea de que una investigación en los campos de lo social pue
de esquematizarse como proceso que consiste fundamentalmente en especificar
qué queremos averiguar, diseñar una estrategia para conseguirlo con unos condi
cionantes prácticos, obtener información necesaria y analizarla. En el cuadro 1.1
propusimos una visión de las fases y tareas más básicas de toda investigación, que
incluye la «delimitación de población y muestras», es decir, el «sobre quién» in
vestigamos como una de las tareas más tempranas en la elaboración de proyectos
y en el desarrollo de la investigación, sobre todo porque condiciona muchas otras
tareas posteriores. La cuestión es que hay que centrar cuanto antes a quiénes hace
referencia lo que se vaya a investigar, quiénes son los sujetos y qué tipo de colectivo
componen. Tenemos que tener en cuenta que no todos los estudios sociales alu
den a diferencias a un nivel mínimo de individuos, sino que trabajan con unidades
colectivas o agregadas: empresas, ciudades, organizaciones, países, hogares, etc.
También hay investigaciones que trabajan sobre «casos» que pueden incluso ser
acontecimientos, procesos, objetos, textos, etc. El espectro de lo que puede definir
una población objeto de investigación es realmente muy amplio.
En este capítulo se abordan estas tareas de definición de poblaciones y selección
de muestras intentando acentuar su conexión con los demás elementos del diseño
de una investigación, desde los recursos materiales hasta los mismos objetivos. Hay
que señalar que, en contra de lo que suelen pensar quienes tienen menos expe
riencia de investigación, hay bastante que reflexionar acerca de estas cuestiones en
cada investigación. Por eso intentaremos también dar alguna idea al respecto.
La investigación como proceso
Con relación a estas primeras «tareas» a plantear, una cosa es la definición de
la/s población/es a que aluden los objetivos de investigación y otra cosa es la de
cisión metodológica sobre cómo abordar la cuestión de conseguir la información
necesaria. Respecto a definir la población que es objeto de investigación y qué tipo
de unidades la componen, es tanto como redactar objetivos de investigación claros,
que tengan sujetos bien definidos y en un marco espacio-temporal concreto. H¿iy
bastante literatura (O’Leary, 2014, 38) que defiende que un buen modo de empe
zar y también una buena lista de comprobaciones sobre el proceso de investiga
ción debería constituirse de una serie de preguntas muy básicas: ¿qué?, ¿para qué?,
¿cuándo?, ¿dónde?, y también ¿sobre quién? o ¿de quién o quiénes?, previo incluso
al ¿cómo? Esto es así precisamente porque definir la población claramente dará
acceso a las fuentes de registro necesarias que nos ayudarán a decidir qué tipo de
investigación podemos realizar respecto a este punto: exhaustiva o muestral. Den
tro de lo teóricamente posible, además, por cuestiones de factibilidad en atención a
los recursos y tiempo disponible habrá que tomar una opción u otra.
Antes de especificar las opciones y algunos elementos relevantes a tomar en
consideración, volvemos a la importancia de la definición del «quién» a través de un
ejemplo muy claro referido a u^tema de investigación muy relevante en los últimos
años: la cuestión de las personas migrantes económicas extranjeras en España. Este
es un tema de investigación de gran alcance científico y práctico porque el fenóme
no tiene tradición sociológica como objeto de análisis en Europa y Estados Unidos y
porque tiene consecuencias demográficas, económicas y políticas importantes. So
bre este tema podemos encontrar muchos estudios entre los cuales vamos a prestar
atención a dos tipos de ellos, que se diferencian básicamente por la población a
que se refieren. Estas definiciones de la población objeto de estudio abren distin
tas posibilidades al enfoque metodológico con que se abordaron y a todo el diseño
de las investigaciones. Así, por tanto, en la introducción de uno de estos estudios,
publicado por el Centro de Investigaciones Sociológicas (Colectivo IOÉ, 2010), se
explica que el origen del ese trabajo de investigación fue complementar o discutir
otros estudios anteriores que también trataban de las opiniones y puntos de vista
de «la población» en torno a la inmigración extranjera, pero con nuevas evidencias,
las cuales vendrían de centrarse en el punto de vista de la propia población inmi
grante. Más concretamente:
El objetivo general establecido para el estudio fue el de proporcionar un panorama
interpretativo en torno a las representaciones, actitudes, opiniones y expectativas de
los segmentos más relevantes de la población inmigrante respecto a su participación
en la vida social, económica y política en España, así como un análisis de las percep
ciones de los propios migrantes sobre las actitudes de la población nativa en relación a
ellos (Colectivo IOÉ, 2010, 9).
Este estudio reconoce precisamente que muchos otros estudios relevantes ante
riores como los de Cea D'Ancona y también con Valles (por ejemplo, 2011 y 2015)
56
Identificando a la población a analizar
sobre el racismo y la xenofobia en España trataron el tema desde la perspectiva de
la población autóctona.
En definitiva, encontramos dos investigaciones sobre el mismo tema, dos inves
tigaciones que en general analizan el fenómeno de las actitudes ante el hecho de la
inmigración extranjera, pero en dos poblaciones distintas: la inmigrante en un caso
y la autóctona en el otro. El cambio de población implica además una diferencia de
diseño, más bien cuantitativo en un caso y claramente cualitativo en el otro. Los
estudios de Cea DAncona y Valles (2011, 2015) trabajan sobre todo la medición del
racismo y xenofobia en la población autóctona y han llegado a combinar evidencias
procedentes de estudios cuantitativos (encuestas) y de otros cualitativos (entre
vistas abiertas, grupos de discusión y otros recursos etnográficos). Aunque en los
estudios cualitativos también han venido incluyendo tanto «población autóctona
como de origen inmigrante» (Cea DAncona y Valles, 2015,13), en el conjunto tiene
mucho peso la vertiente cuantitativa de análisis de las actitudes de la población au
tóctona al haber constituido ya series temporales con los datos de varias encuestas.
En el caso del estudio del Colectivo 10É, al centrar la cuestión exclusivamente sobre
el colectivo extranjero, el foco gira hacia las representaciones de los inmigrantes
respecto a su propia experiencia y, en consecuencia, el estudio recibe una orien
tación claramente cualitativa a la búsqueda de los discursos de sus protagonistas.
En cualquier caso, lo que queremos destacar ahora es la importancia de definir
claramente, y desde el principio, a quién o a quiénes alude la investigación: pobla
ción española autóctona o población extranjera residente en España sería una di
ferencia básica tanto para comenzar a explorar qué información previa podrá estar
disponible como para tomar decisiones consecuentes para un proyecto de investi
gación. A partir de una identificación básica, la especificación es clave. En los ejem
plos que hemos puesto antes se realiza una definición muy específica del alcance
de las poblaciones. Por ejemplo, en la ficha técnica de las encuestas mencionadas se
describe la población que es objeto de encuesta como «población residente y nacida
en España de ambos sexos de 18 años y más» (Cea DAncona, 2014,12). También el
estudio cualitativo tiene uno de los primeros epígrafes dedicado explícitamente a la
«delimitación y caracterización de la población estudiada» (Colectivo IOE, 2010, 9)
que analiza precisamente las dificultades de identificar en los registros administra
tivos el concepto de migrante residente (en España) de origen extranjero y decide
finalmente incluir como población a los extranjeros con y sin permiso de residencia,
así como a españoles de nacionalidad retornados del extranjero y descendientes de
extranjeros que han nacido en España, cualquiera que sea su nacionalidad (Colecti
vo I0É, 2010, 12). Hay que poner estas decisiones en relación con todos los demás
recursos disponibles para una investigación. Con esta misma primera definición de
población (inmigrantes extranjeros en España), en otro estudio con menos medios,
quizás haya que recurrir a una definición práctica más restrictiva, por ejemplo, la
población mayor de edad de nacionalidad extranjera empadronada en todo el te
rritorio nacional. En todo caso, la especificación, como decíamos, tiene que ser la
57
La investigación como proceso
máxima posible, particularmente si el análisis de la información tiene que realizar
se al nivel mínimo de unidad de análisis (individual).
Por tanto, las primeras decisiones que se derivan de definir la población que
es objeto de investigación aluden a su naturaleza (personas, instituciones, objetos,
hechos) y unidad mínima de observación (individual o agregada), dentro de unos
límites espacio-temporales y conceptuales. Por ejemplo, jóvenes madrileños/as re
sidentes de entre 18 y 25 años que en 2014 viven con sus padres; anuncios de TV
sobre juguetes emitidos en un canal de televisión durante el último trimestre del
año 2015; población mayor de edad y de nacionalidad española excepto residentes
en Ceuta y Melilla; plantilla de una empresa a 31 de diciembre de 2014; municipios
de la Comunidad Autónoma Vasca en el año 2000; delitos denunciados en una pro
vincia durante el año 2014 que constan en los registros del Ministerio de Justicia;
población de internautas en España según el Estudio General de Medios (EGM), etc.
A la luz de tal definición, un primer análisis de factibilidad para el diseño de la
investigación tiene que ver con el hecho de que la población completa tal y como se
ha especificado sea abarcable como fuente de información fiable, bien sea de prime
ra mano o a través de registros. Si nos preguntamos quién tiene la información para
responder a las preguntas de^nvestigación y nos planteamos la diferencia entre
recurrir a la población entera, o bien tratar de encontrar informantes-clave o casos
adecuados (O'Leary, 2014,181), encontraremos que hay objetivos de investigación
tan diversos que a veces incluso se podrán combinar varias estrategias de selección
de informantes. En cualquier caso, sea en una sola fase o en varias, en algún mo
mento al elaborar el proyecto de investigación hay que afrontar la decisión entre
realizar una investigación exhaustiva, que abarque a toda la población definida, o
una investigación muestral.
2.1. Estudios exhaustivos vs. estudios muéstrales
2.1.1. Estudios exhaustivos
Estudios o investigaciones exhaustivas son aquellas en las que se analiza informa
ción de la población completa que es objeto de investigación. La población com
pleta o universo de la investigación es el conjunto de elementos sobre los que se
plantean las preguntas de investigación a una escala espacio-temporal específica.
Aunque en investigación social lo más común es que las poblaciones que son obje
to de investigación se compongan de personas (individuos) o grupos (agregados),
también pueden ser poblaciones de hechos o acontecimientos (políticos, deporti
vos, educativos), de instituciones (organizaciones, empresas) o de objetos (produc
tos culturales, noticias, periódicos). Como se deduce también del ejemplo expuesto
antes, un conjunto de individuos con unas características muy concretas puede ser
la población entera de una investigación específica y ser también solo parte de una
población más amplia para otra investigación diferente (población residente ex-
58
Identificando a la población a analizar
tranjera frente a población residente de cualquier nacionalidad). Es decir, la defini
ción técnica de población objeto de investigación no tiene que ver con la naturaleza
ni el tamaño, ni la extensión material de los individuos (u otro tipo de elementos)
sobre cuyas realidades investigamos, sino sobre el hecho de que las abarcamos di
recta o indirectamente pero de modo completo en la propia investigación.
Las investigaciones exhaustivas en ciencias sociales son francamente difíciles
de llevar a cabo salvo que se trate de poblaciones muy pequeñas, accesibles y con
troladas, y /o que existan buenos registros (completos, amplios y actualizados) de
muchas características pertinentes de estas poblaciones. Esto es muy infrecuente y
hay pocos temas de investigación social que se adapten a tal posibilidad, excepto si
podemos o elegimos trabajar a nivel agregado. Por otra parte, es evidente que tam
bién depende de quién o quiénes sean los equipos investigadores. Si se trata de in
vestigación institucional, desarrollada por las propias agencias administrativas que
crean, registran y gestionan o custodian la información, entonces es posible. Pero
hablando, como venimos haciendo, desde la perspectiva de un sujeto investigador
académico o de un sujeto profesional que realiza investigación social bajo encargo,
la investigación exhaustiva es rara salvo en el caso que hemos mencionado como
diseño de análisis secundario (cuantitativo, sobre todo).
Por otro lado, puede darse también el caso de que, siendo una población per
fectamente accesible a la investigación, el estudio final no pueda considerarse ex
haustivo porque no se haya podido recoger información relativa a todos sus com
ponentes. Por ejemplo, una encuesta interna al profesorado de una universidad
(población acotada y accesible) que no recibe respuesta de todo el personal docen
te (información no completa).
La cuestión de los estudios basados en información secundaria y que pueden
ser exhaustivos se desarrollán más en el capítulo siguiente. De momento, hay que
apuntar que es casi exclusivamente trabajando con fuentes secundarias de carácter
censal o en registros administrativos completos cuando se pueden diseñar y llevar
a cabo investigaciones exhaustivas. Es imprescindible que las fuentes tengan regis
tros muy concretos sobre aquellas características de las poblaciones que intere
san a la investigación y, como se suele destacar, el uso (casi siempre estadístico) de
registros administrativos completos requiere atención particular a ciertos aspec
tos específicos «en cuanto a su calidad, representatividad, grado de actualización
y posibilidades de difusión (...) acceso (...) periodicidad (...) visibilidad» (Miyar,
2012,181-182). Pero además, como también hemos visto en el capítulo anterior
sobre proyectos, hay otra serie de cuestiones que hacen de las investigaciones ex
haustivas un diseño cada vez más difícil. Nos referimos a los crecientes problemas
prácticos de accesibilidad derivados de las legislaciones de protección de datos per
sonales y los cambios en los marcos jurídicos de relación entre administración y
ciudadanos.
De hecho, la misma construcción del Censo decenal de población y viviendas
en España ya ha pasado a reflejar las dificultades enormes de un conteo completo
59
La investigación como proceso
de poblaciones y viviendas, de modo que el líltimo censo de 2011 se llevó a cabo
combinando tres grandes operaciones censales: el trabajo de campo de censar edi
ficios georreferenciados, la actualización cruzada del Padrón con otros registros
administrativos oficiales para componer un gran fichero precensal, y una impor
tante encuesta por muestreo. Este diseño se enmarca en recomendaciones meto
dológicas internacionales que, según el Instituto Nacional de Estadística, implican
un mayor aprovechamiento de información disponible y de las nuevas tecnologías
para conseguir más calidad y eficiencia en toda la operación (1NE, 2011, 4-5). En
su momento, se calculó que el coste económico de implementar este diseño sería
de menos de la mitad que el que habría que presupuestar para repetir la operación
censal inmediatamente anterior, el Censo de 2001.
2.1.2. Estudios muéstrales
Gran parte de los diseños que hemos descrito y que son más comunes en la in
vestigación social, tanto académica como profesional, son, de algún modo, estudios
basados en muestras. Esto significa que para alcanzar los objetivos de la investiga
ción la información que se analiza no es referente a toda la población o universo en
estudio, sino solo a una selección de la misma.
Una muestra es, por definición, una parte de la población a la que representa. Y
en la representatividad de la muestra se basa el principio de generalización que per
mite establecer conclusiones pertinentes basándonos en los resultados muéstrales.
Es decir, todo el trabajo de muestreo pivota alrededor de la idea de que esa parte del
universo que de hecho observamos y analizamos sea representativa en un sentido
suficiente para los objetivos de la investigación. La selección de muestras (mues
treo) es por tanto un aspecto muy importante de la investigación social. Cuando
nuestros intereses de investigación por lo general aluden a poblaciones o «socieda
des» que pueden ser de tamaño importante y extensas, es evidente que la posibi
lidad de conseguir resultados representativos analizando solo una parte (además
pequeña) de la población es una ventaja. Pero, además, el argumento fundamental
a favor del muestreo es la combinación de necesidad (poblaciones inabarcables) y
ventajas prácticas (ahorro de medios). Aunque fuera posible en un momento dado
plantearse un estudio exhaustivo, no sería posible sin mayor coste y dificultades. Es
decir, trabajamos con muestras porque en la práctica es materialmente imposible
trabajar con poblaciones para llegar a nuestros objetivos de investigación.
Secundariamente, hay también argumentos que tienen que ver directamente
con la orientación metodológica de1las investigaciones y especialmente en la es
trategia cualitativa. Si realmente los objetivos de la investigación inclinan el diseño
a un estudio más bien cualitativo, buscamos tal flexibilidad y tal flujo de informa
ción-análisis que es prácticamente imposible hacerlo sobre un conjunto poblacional
completo, por pequeño que fuera. En el otro extremo, la naturaleza más estructura
da de la investigación cuantitativa condiciona un proceso de búsqueda de fuentes
de información y registro sobre el volumen y características de la población que es
60
Identificando a la población a analizar
objeto de investigación, así como la selección de unidades últimas «informantes»;
es decir, las que aportan la información que realmente se va a analizar en el estudio.
En este capítulo se repasan algunas claves prácticas para abordar las cuestiones
de selección de unidades de información y muestras en diversas investigaciones,
partiendo de las diferencias entre estudios cuantitativos y cualitativos. No se trata
de ver exhaustivamente cómo se realiza todo tipo de muéstreos, sino de orientar las
decisiones en aquellos aspectos que más frecuentemente podremos llevar a cabo en
investigaciones tanto académicas como bajo demanda.
Como veremos, estas tareas están en principio mucho más estandarizadas en las
investigaciones cuantitativas que en las cualitativas. Por lo que en general es más
difícil establecer recomendaciones útiles muy específicas sobre el muestreo cuali
tativo. No obstante, hay reflexiones que definen precisamente los estudios cualita
tivos como centrados en «casos», frente a los cuantitativos que están centrados en
«variables» (Curtís y Curtís, 2012, 5), lo que parece que daría un papel preeminente
«i la selección de sujetos en los primeros. Teniendo todo en cuenta, hay que decir
que en ambos tipos de investigaciones, la selección de las unidades muéstrales y /o
de los elementos muéstrales finales de los que se va a obtener la información per
tinente puede llegar a ser una cuestión técnica de elevada complejidad, así como
una competencia que requiere bastante oficio por parte de los investigadores. En
cualquier caso, y por lo apuntado antes, toda muestra tiene cierto componente es
tratégico puesto que hay que tomar decisiones entre lo que es factible.
2.2. Muestreo para estudios cuantitativos
En general, el mismo término muestreo alude directamente a las investigaciones
cuantitativas por la casi identificación del muestreo en general con el muestreo es
tadístico o probabilistico, que es el ideal de los estudios cuantitativos.
Cuando se decide que un estudio cuantitativo se realizará sobre una muestra,
hay que contemplar los diferentes métodos de muestreo a partir de la diferencia bá
sica entre probabilistico o no probabilistico. Esta diferencia es bastante conocida:
en el muestreo probabilistico se conoce la probabilidad que tiene cada unidad de la
población de ser seleccionada para la muestra y se tiene en cuenta en todo el proce
so de selección de unidades, que debe ser aleatorio. Es la aleatoriedad del muestreo
l.i que permite controlar el error muestral y, a partir de eso, aplicar procedimientos
estadísticos de inferencia para generalizar o extrapolar resultados obtenidos en las
muestras hacia las poblaciones de las que proceden y, en esta medida, representan.
Por ello, las muestras resultantes son las conocidas también como muestras esta
dísticas. Los métodos de muestreo probabilistico incluyen los muéstreos aleatorios
simple, sistemático, estratificado, por conglomerados y por rutas aleatorias.
En el muestreo no probabilistico no se conocen tales probabilidades, de manera
que las unidades que componen la muestra se seleccionan con arreglo a otros cri-
61
La investigación como proceso
terios, de modo estratégico o por conveniencia, pero en general de modo dirigido
por el investigador. Este tipo incluye los muéstreos por cuotas, bola de nieve, las
muestras opináticas a criterio del investigador y las accidentales.
Hay literatura específica (desde los clásicos de Kish 11965J hasta Rodríguez
Osuna, [1991 y 1993|), que son referencias ya obligadas en español) sobre cómo
llevar a cabo paso a paso cada tipo posible de muestra estadística, sus condiciones,
ventajas e inconvenientes. Yendo a lo más básico, es evidente que si deseamos o ne
cesitamos hacer inferencias estadísticas precisas desde la muestra hacia la pobla
ción a la que representa necesitamos una muestra estadística (esto es, probabilísti-
ca) y también es claro que con una muestra no probabilística la «representatividad
estadística» no se plantea, aunque sería posible una «representatividad» de conte
nido, que de hecho suele interesar en otro tipo de investigaciones (cualitativas). Las
operaciones estadísticas oficiales que realizan las agencias estadísticas regionales,
nacionales o internacionales, por ejemplo, cuando se basan en encuestas, utilizan
solo muestras aleatorias porque los resultados que tienen que ofrecer son estima
ciones de alta probabilidad de valores verdaderos como tasas de paro, número de
personas inactivas, volumen de los ingresos familiares, etc.
También hay unos pocos éftudios sociológicos muy potentes que pueden per
mitirse muestras aleatorias, como la Encuesta Mundial de Valores o la Encuesta
Social Europea (ESE, 2015), que es un estudio bienal en el que participan desde
2002 un mínimo de 24 países europeos y hasta 34 en la última oleada (2014). Se
trata de una encuesta a domicilio para población residente de 15 y más años que en
el caso de España ha trabajado con una muestra de 2.868 individuos. La muestra se
construye en dos etapas, seleccionando primero secciones censales representativas
de la estructura de la población por tamaño del hábitat y comunidad autónoma
y seleccionando luego individuos dentro de las secciones elegidas. En los detalles
sobre muestreo se especifica que debe tener un diseño estrictamente aleatorio con
búsqueda rigurosa de los sujetos entrevistados seleccionados:
«Las muestras deben ser representativas de todas las personas de 15 años y más (sin
límite de edad superior) residentes en hogares de cada país, independientemente de
su nacionalidad, idioma y estatus legal. Los individuos se seleccionan por métodos
probabilísticos estrictamente aleatorios en cada fase. (...) No se permite el muestreo
por cuotas en ninguna etapa. No se permite la sustitución de quienes no responden
(rechazos, no contacto o inelegibles) en ninguna etapa» ([Link], 2015).
Suele destacarse que la elección de unos métodos u otros está condicionada
prácticamente por todos los elementos del proyecto de investigación (Díaz de Rada,
2004, 46), y es cierto, pero hay algunos que son realmente determinantes en la
investigación aplicada real. Concretamente, y además de los recursos habituales
disponibles, las posibilidades de un acceso directo y completo al marco muestral
o base de sondeo es posiblemente el más importante. Si no se cuenta con base de
62
Identificando a la población a analizar
sondeo, es imposible realizar una selección aleatoria y, en consecuencia, una mues
tra probabilística «pura».
El marco muestral o base de sondeo es un listado completo de todos los elemen
tos de la población a muestrear con información suficiente para su identificación
y /o localización (domicilio y /o teléfono, para poblaciones generales). En la prácti
ca, los marcos muéstrales incluyen mapas, planos, fotografías, cualquier informa
ción que complemente el conocimiento de la población. De ahí que, investigando
poblaciones pequeñas y /o bien delimitadas en tiempo y espacio (estudiantes ma
triculados en una universidad durante un curso; plantilla de una empresa en un mo
mento determinado), ese listado al menos será posible y puede que hasta accesible.
Sin embargo, trabajando sobre poblaciones grandes y /o generales (españoles
mayores de edad en todo el territorio nacional; adolescentes escolarizados en una
comunidad autónoma), la disponibilidad por parte del equipo investigador de un
marco muestral adecuado a cada investigación es muy reducida, ya que hablamos
de tener a todos y cada uno de los sujetos plenamente identificados y localizados.
Esos registros, cuando existen, pueden no ser totalmente completos; y además, sue-
len ser de carácter administrativo (censal) o también privados, pero en cualquier
caso están protegidos por las leyes de protección de datos de carácter personal o
por normas internas de confidencialidad de las empresas o instituciones. Así que
para disponer de esta información imprescindible se mezclan dos dificultades, la de
la propia exhaustividad del registro y la del acceso a la información.
Por todo esto, cada vez es más frecuente hacer referencia a la «elaboración del
marco» como tarea previa o inicial a la del muestreo en sí. Esta construcción de un
marco muestral pasa por supuesto por identificar primero claramente la población
objeto de estudio y acotarla al máximo en un contexto espacio-temporal y práctico
(¿a quiénes exactamente vamos a considerar personas «paradas»?) y, después, hay
que conseguir identificar y listar todos sus componentes. A raíz de la dificultad de
llevar a cabo la construcción de un marco inequívoco es como se empiezan a acotar
más y más los marcos. Si no puede ser absolutamente toda la población inicialmen
te prevista, igual puede ser la población disponible, de la que se tiene información
mínima suficiente.
Pero incluso restringiendo y adaptando las poblaciones a aquellas definiciones
útiles de las que se dispone de información completa, el problema suele ser la ausen
cia de registro real de todos los componentes, la falta de listados completos de ele
mentos identificables. De ahí que casi siempre la construcción de marcos muéstrales
solo consigue marcos agregados, marcos compuestos de conjuntos de elementos de
Lis poblaciones objeto de estudio de las que sí conoceremos su tamaño y algunas ca
racterísticas agregadas: unidades geográficas (comunidades autónomas, municipios,
distritos y secciones censales) y su total de población por edad y sexo, por ejemplo.
La consecuencia es que con estos marcos y otras condiciones adicionales de las
que iremos hablando, con frecuencia hay que recurrir a combinar diversos métodos
de muestreo, en general por etapas sucesivas (polietápicos). Se suele comenzar se-
63
La investigación como proceso
leccionando aleatoriamente estas unidades agregadas para terminar seleccionando
dentro de ellas a los elementos de la muestra (individuos o familias) con algún pro
cedimiento no probabilístico (cuotas, casi siempre).
Otro caso específico en investigación social es la construcción de marcos mués
trales para acceso telefónico a la población (normalmente para encuestas telefóni
cas). Hace ya unos años que esta vía de selección muestral está en un punto crucial,
dado que los listados telefónicos no son un marco cuasi exhaustivo de hogares con
teléfono por la extensión de la telefonía móvil. Además del uso de directorios tele
fónicos (con bases comerciales asociadas), se han ido incorporando las líneas mó
viles a las bases de sondeo también gracias a avances tecnológicos como el Random
Digit Dialing (RDD), que son sistemas de generación aleatoria de números telefóni
cos que permiten crear bases más amplias de contactos telefónicos para construir
marcos muéstrales (Pasadas del Amo et al., 2011 y 2015). También hay que cuidar
especialmente las repeticiones que provienen del hecho de que las personas tengan
más de un teléfono.
Más aún, la construcción de los marcos muéstrales para seleccionar (creciente
mente) muestras en internet es muy interesante porque obliga primero a redefinir
la población además como una «e-población», que es internauta. Y en este caso la
construcción del marco para «enlazar los elementos de la población con unidades
del muestreo que sean los más identificables posibles» (Cubiles et al., 2002, 289)
está aun más condicionada por el medio (internet) porque la definición de la po
blación también lo está. Para poder construir un marco hay que diferenciar el tipo
de población saturada en internet (cuando el 80% o más de elementos constituye
e-población), diferenciando por ejemplo las poblaciones «audiencia» (las que son
localizables por acceder a un sitio web concreto en un periodo dado) de las pobla
ciones «precisadas», que son las que además de ser internautas están listadas de
algún modo, o de las «poblaciones internet» de internautas en general (navegantes)
(Cubiles etal., 2002). Hn cada caso hay que analizar el modo de acceso, la asiduidad
y la información adicional de estas poblaciones para definirlas (también pueden ser
incluso poblaciones de visitantes o de visitas a internet) y ver así cómo construir los
marcos muéstrales necesarios.
Rn cualquier caso, no deja de ser pertinente dejar destacado que la calidad de
todo el diseño muestral y el control de un primer tipo de sesgo de cobertura proce
de de la calidad de los marcos de donde extraemos las muestras. Cuanto más com
pleto, actualizado y asequible el marco muestral, más alternativas para el diseño y
mejor calidad final de la muestra seleccionada.
Antes de entrar en otras claves prácticas de la fase de diseño de muestras vamos
a repasar brevemente en qué consisten los distintos tipos de muestras. Posterior
mente plantearemos algunas cuestiones más específicas dentro de la práctica real
de la investigación social con muestras, bien sea cuantitativa o cualitativa, que se
traducen en las preguntas habituales: ¿cuánta muestra necesito? y ¿es representa
tiva de la población?
64
Identificando a la población a analizar
2.2.1. Métodos probabilísticos
a) Muéstreos aleatorios simple y sistemático
El muestreo aleatorio simple (MAS) es efectivamente el más sencillo pero también
el menos utilizado en investigación social como diseño muestral único (en una sola
etapa, de una vez, para la muestra final), precisamente porque requiere una base de
sondeo de unidades últimas (listado de individuos). Teniendo un listado de todos
los elementos de la población, consiste en un «sorteo» al azar que va seleccionando
uno a uno los que van a formar parte de la muestra hasta una cantidad determinada
previamente como tamaño de muestra. Por ejemplo, seleccionar una muestra de
100 estudiantes de un grado en una universidad concreta en un curso determinado
utilizando la lista completa de estudiantes matriculados: los 100 individuos concre
tos que hayan salido del sorteo serán la muestra.
Esto se puede realizar mediante una urna real o virtual, con la ayuda de una
tabla de números aleatorios, o simplemente usando cualquier software de análisis
estadístico como el SPSS (SAS, STATA y otros muchos), que ya incluye la opción de
selección aleatoria de muestras. La clave radica en que conociendo el tamaño de
la población y fijando un tamaño de muestra se conoce la probabilidad de cada
elemento de formar parte de esta última, en este caso, la misma probabilidad (si se
realiza con reemplazamiento).
El muestreo sistemático es prácticamente una variante del anterior. Difiere en
que selecciona los componentes muéstrales calculando y luego utilizando un coefi
ciente de elevación que resulta de dividir el tamaño de la población entre el tamaño
de la muestra necesaria. El coeficiente de elevación (a veces también denominado
intervalo de selección) nos indica cada cuántos elementos de la población debe
mos seleccionar uno que forme parte de la muestra. Por ejemplo, para una muestra
de 1.000 elementos sobre una población de 10.000 el coeficiente será de 10, con
lo que la muestra se compondrá de cada décimo elemento del marco a partir de
un primero (punto de arranque) seleccionado aleatoriamente. Si fuera para otra
muestra de estudiantes como en el caso anterior, con la misma lista de estudiantes
matriculados sortearíamos un primer elemento que podría ser el 2 y sumando con
secutivamente el coeficiente de 10, compondrían la muestra el 2 ,12,22, 3 2,42, y así
sucesivamente hasta completar el tamaño prefijado de 1.000.
La única condición necesaria que garantiza totalmente la aleatoriedad de este
muestreo es que la base de sondeo no esté ordenada de ningún modo periódico
que pueda conllevar sesgo y en cuyo caso hay que anular previamente este efecto
(desordenar o aleatorizar la base). En la práctica este tipo de muestreo también se
suele automatizar mediante software informático.
b) Muestreo aleatorio estratificado
El muestreo estratificado parte de la división previa de la población en subcon
juntos o estratos en los que se puede muestrear de forma independiente y diver-
65
La investigación como proceso
sa, mejorando ciertos aspectos de representatividad e incluso con el fin de realizar
estimaciones separadas para cada subpoblación. La estratificación trata de paliar
los problemas derivados de la variabilidad y /o la dispersión física y característica
de las poblaciones grandes. Se entiende que los estratos dividen a la población por
alguna o algunas características relevantes que hacen que dentro de los mismos la
población sea más homogénea, lo cual reduce cierta variabilidad en la muestra si se
selecciona dentro de los estratos, a la vez que permite cubrir perfiles característicos
que por puro azar es menos probable que llegaran a formar parte de una muestra
global. Por todo ello mejora la precisión de las estimaciones poblacionales realiza
das con la misma.
El muestreo estratificado define primero los estratos (número y tamaño y si
existe información, varianza interna), luego reparte la muestra entre ellos median
te algún procedimiento de afijación y finalmente selecciona las unidades últimas de
forma aleatoria (simple o sistemática).
Los modos de afijación posible son tres: simple, proporcional y óptimo. El sim
ple reparte la muestra entre el número de estratos, resultando por tanto la misma
cantidad de muestra en cada uno. El proporcional considera el peso de cada estrato
en el conjunto de la población y lo reproduce en la muestra. Y la afijación óptima
considera a la vez el peso de 1$; estratos y su grado de homogeneidad interno que
previamente debe conocerse o estimarse como dato de varianza poblacional. El
modo de cálculo específico no lo vamos a desarrollar y se puede consultar en Cea
D'Aneo na (2012,307-308).
Cuadro 2.1: Ejemplo [ficticio) de muestreo estratificado con distintas afijaciones.
Muestra n = 384* según afijación
Varianza
ESTRATO POBLACIÓN % Pob. Simple Proporcional Óptima (supuesta)
A 50.000 22,2 128 85 72 40
B 75.000 33,3 128 128 149 55
C 100.000 44,4 128 171 163 45
Total 225.000 100 384 384 384
*n global calculada para p- ■ 5% con NC95%
m
h
■c
Fuente: elaboración propia.
Como se aprecia en el ejemplo del cuadro 2.1, el estrato A presenta la parte me
nor de la muestra tanto en la afijación proporcional como en la óptima porque ade-
66
Identificando a la población a analizar
más de ser el estrato más pequeño es el de menor varianza. El estrato C, que es el
mayor, pero no el de mayor varianza, es el que absorbe la parte mayor de mues
tra, pero con- mayor distancia respecto del estrato B en el supuesto proporcional
(44,5% en C respecto de 33% de muestra para el B) que mediante afijación óptima
(163 comparado con 149, que es el 42% frente a 39%).
En los diseños reales las estratificaciones más habituales suelen ser geográficas
(comunidades autónomas, provincias, municipios, barrios, grupos de tamaño del
hábitat) porque la dispersión territorial es el tipo más básico de desequilibrio entre
poblaciones generales. También se utilizan mucho las estratificaciones sociodemo-
gráficas cuando se relaciona directamente con el tema de investigación (grupos de
edad y /o sexo). Las estratificaciones pueden realizarse una vez o varias veces den
tro del diseño de la misma muestra, por lo general, en etapas sucesivas (muéstreos
polietápicos). Si el número de estratos es alto serán mucho más homogéneos, pero
al final la muestra volverá a implicar dispersión, con lo que no se recomienda que
en una sola etapa se trabaje con demasiados estratos.
No obstante, la principal dificultad de fondo para llevar a cabo muestras estra
tificadas en la investigación real sigue siendo la misma: falta de información sobre
la distribución de la población a muestrear en aquellas características que garan
tizarían la mayor homogeneidad de los estratos con relación a la investigación, y
particularmente el desconocimiento de la variabilidad general de la población de
cada estrato.
c) Muestreo aleatorio por conglomerados
El muestreo por conglomerados también parte de la organización de una pobla
ción en grupos relevantes de elementos (conglomerados), pero en este caso, y a
diferencia de los estratos, se entiende que los conglomerados son similares entre
sí aunque internamente heterogéneos, de manera que todos o cualquiera reflejan
internamente la variedad de la población aunque entre ellos, como conjuntos, sean
muy parecidos.
El muestro por conglomerados compone una muestra de elementos de la pobla
ción seleccionando aleatoriamente conglomerados enteros de la misma. Normal
mente, los conglomerados son geográficos o institucionales, como mesas electora
les, hospitales, aulas, zonas, etc.
En diseños polietápicos, como veremos luego, es bastante común recurrir al mé
todo por conglomerados en primeras fases para seleccionar muestras en poblacio
nes amplias porque reduce dispersión geográfica. Como variante para los conglo
merados territoriales, el también llamado «muestreo aleatorio de áreas» es similar,
pero normalmente trabajando sobre planos, de manera que las áreas y subáreas
pueden delimitarse atendiendo a otros criterios y controlando previamente el ta
maño, características y homogeneidad.
67
La investigación como proceso
Menos común es la utilización directa del muestreo por conglomerados en una
fase salvo para muestrear poblaciones muy accesibles como grupo, a veces casi cau
tivas y siempre que el tamaño de los conglomerados no sea muy grande, bn estos
casos, para seleccionar una muestra de conglomerados, basta con tener un lista
do de los conglomerados que existen y seleccionar aleatoriamente una muestra de
ellos. La selección aleatoria puede ser simple, sistemática y también estratificada
(por alguna característica relevante).
bn una investigación propia sobre hábitos lectores de los adolescentes bilbaínos
aplicamos este diseño; se definió un universo de trabajo para una encuesta como
los jóvenes de 12 a 16 años estudiantes de bSO escolarizados en centros educativos
de Bilbao, ya que se contaba con colaboración institucional para encuestar en los
centros. Así que la muestra final se seleccionó como conglomerados de aulas pre
viamente estratificadas de modo proporcional al número de aulas por titularidad
del centro (público/privado) y modelo lingüístico (3 modelos): en total, se encuesto
a 62 aulas completas, lo que generó una muestra de 1.321 adolescentes (Ispizua y
Lavía, 2007).
d) Muestreo de rutas aleatorias
Las llamadas rutas aleatorias son unos itinerarios que sirven para localizar unida
des finales de muestra durante el trabajo de campo (presencial), y que se constru
yen de modo que la selección final de la localización (normalmente una vivienda)
sea aleatoria.
Las rutas no siempre se consideran un método de selección probabilística pro
piamente dicho, puesto que no son un método de muestreo directo, sino que for
man parte de los diseños polietápicos de muestreo para seleccionar individuos o
grupos en viviendas o cualquier otro tipo de localización fija que previamente se
ha definido como unidad muestral en una etapa anterior, bl uso de las rutas alea
torias se suele combinar con la selección final por cuotas (que son un método no
probabilístico), de manera que la combinación de ambas estrategias durante la fase
final del trabajo de campo elimina el sesgo de dejar la selección final a las personas
reclutadoras o entrevistadoras (para encuesta, normalmente).
Las rutas aleatorias son un conjunto detallado de instrucciones sobre cómo bus
car las localizaciones de una cantidad determinada de sujetos dentro de un área
previamente seleccionada, siguiendo un itinerario que se va organizando sobre de
cisiones secuenciales. bl objetivo final es garantizar equiprobabilidad en la selec
ción de las localizaciones manteniendo a la vez la proporcionalidad de las cuotas.
Las rutas se construyen tras un estudio detallado de la estructura residencial de
cada área y lo que contienen es una aleatorización de cada decisión que haya que to
mar al ir desde un punto de partida a lo largo de la ruta eligiendo viviendas, bl modo
concreto de hacerlo depende de la cantidad de información disponible para dise
ñarlo y también de los recursos existentes para llevar a cabo un trabajo de campo
68
Identificando a la población a analizar
más exigente. Una explicación detallada puede encontrarse en Cea D'Ancona (2012,
322-328) y en Díaz de Rada (2008 y 2015).
2.2.2. Muestreo no probabilístico
Las muestras no probabilísticas son aquellas construidas de tal modo que no se
conoce la probabilidad de los elementos de la población de formar parte de una
muestra. Por todo lo expuesto anteriormente, los muéstreos no probabilísticos en
estudios cuantitativos son la última opción. De hecho, alguno se aplica muy habi
tualmente como fase o etapa final de los diseños polietápicos porque, en realidad,
es la única opción. A efectos prácticos, una muestra no probabilística podría llegar
a dar buenos resultados reflejando a escala a la población pero, simplemente, no se
puede medir su adecuación.
Las muestras no probabilísticas para estudios cuantitativos en principio son
sencillas de diseñar porque no están sujetas a más normas que la oportunidad, los
recursos y /o la intención. Lógicamente, al no intervenir el azar, no hay probabilidad
conocida de ser parte de la muestra para ningún elemento de la población, con lo
que la muestra final es una parte de la población que puede tener características
parecidas o no al conjunto.
En este sentido, todas las muestras no probabilísticas pueden a priori estar ses
gadas, aunque tampoco pueda saberse cuánto y cómo afecta a los datos que se va
yan a recoger de ellas. Por otra parte, con poblaciones pequeñas, en las que solo
podemos trabajar con muestras también pequeñas, incluso puede ser necesario
recurrir a estos métodos. Y sobre todo, las muestras no probabilísticas en estudios
cuantitativos responden a la situación de ausencia total de base de muestreo.
Entre los tipos de muestras no probabilísticas se encuentran las muestras acci
dentales, intencionales, bola de nieve y por cuotas.
a) Muestreo accidental o de conveniencia
Consiste en ir seleccionando elementos de una población a medida que los vamos
encontrando o según van surgiendo (en tiempo o espacio) hasta un número prefi
jado como tamaño de muestra. Por ejemplo, los primeros cien usuarios que acuden
a un servicio.
En muchas ocasiones para intentar captar más variedad de la población se plani
fica cierto grado de dispersión en la recogida de información (distintos días u horas;
distintos puntos físicos de muestreo repartidos en una ciudad). Ejemplos reconoci
bles de estas muestras autoselectivas son las resultantes de encuestas de servicios
en un hotel: la empresa deja cuestionarios para que sean contestados en todas las
habitaciones cada día (o cada vez que cambian los hospedados), pero en realidad
solo responden aquellos huéspedes que desean hacerlo. O bien cuando en un centro
69
La investigación como proceso
comercial un encuestador se posiciona en la entrada y encuesta a personas hasta
completar el tamaño de muestra que le han encargado. El tipo de encuestados de
penderá del tipo de personas que entren en esas ocasiones y de su aparente mejor
disposición para contestar (personas sin prisa, sonrientes, sin paquetes ni niños,
etc.). Cuanto más se planifica y más variables se introducen para seleccionar com
ponentes muéstrales en el muestreo accidental, más se controla y, por tanto, más
se asemeja al muestreo opinático. Como es a priori la peor estrategia de muestro
desde un punto de vista metodológico, se suele indicar solo para usos muy explo
ratorios, en estudios piloto para probar cuestionarios, por ejemplo. Actualmente
también podemos encontrar este método de muestreo en algunos «sondeos por
internet»: si no hay ningún otro control anterior o posterior, quienes responden
voluntariamente a un cuestionario alojado en una web simplemente se autoselec-
cionan como muestra.
b) Muestreo intencional, de juicio u opinático
Este muestreo se basa en una selección concreta y personal de los elementos de la
muestra por parte del equipo investigador. Esto por lo general responde a una situa
ción en que la población es accesible y se conocen a fondo sus características en lo
que es más relevante para la investigación. Por ejemplo, en investigación educativa
se pueden seleccionar estudiantes conocidos con los que se trabaja habitualmente
(alumnado de Psicología o Sociología que colabora en investigaciones dirigidas por
su profesorado) para llevar a cabo un estudio concreto. Siendo así, el investigador
puede seleccionar un subconjunto de elementos que pueden «representar» a la po
blación completa porque se compone en cantidades adecuadas de casos «típicos»
o que se sabe que disponen de la información pertinente. En otras situaciones, sin
embargo, se plantea en ausencia de base de sondeo e incluso a modo exploratorio,
cuando la selección completamente aleatoria es farragosa o muy costosa.
Un muestreo de este tipo se utilizó en una investigación sobre usuarios de po-
lideportivos municipales de Bilbao para la que no se contaba con base de sondeo,
es decir, con un listado completo de usuarios (Ispizua, 1989). Se trataba de recoger
información de las personas que acudían a alguno de los cuatro polideportivos pú
blicos en funcionamiento en aquel momento con el objetivo de averiguar qué perfi
les de usuarios accedían y cuándo, al objeto de realizar una mejor planificación de
los servicios. Para intentar captar esa diversidad de usuarios se seleccionaron dos
semanas concretas en dos periodos distintos del año (verano e invierno) y se esta
blecieron seis franjas horarias de uso (entre las 9 y las 21 horas) para todos los días
de la semana. Se decidió encuestar a las primeras 10 personas usuarias (15 para
sábados y domingos) que accedieran a las instalaciones en cada polideportivo y en
tres franjas horarias alternas seleccionadas para cada día de la semana durante las
semanas en que se procedió a la recogida de la información.
70
Identificando a la población a analizar
Cuadro 2.2: Ejemplo de muestra intencional: distribución de encuestas en cada polideportivo
por días y franjas horarias en dos semanas.
12 Semana 2- Semana
Hora/día L M X J V S D L M X J V S D
9-11 10 10 10 15 10 10 15
11-13 10 10 15 10 10 10 15
13-15 10 10 10 15 10 10 15
15-17 10 10 15 10 10 10 15
17-19 10 10 10 15 10 10 15
19-21 10 10 15 10 10 10 15
Total 30 30 30 30 30 45 45 30 30 30 30 30 45 45
Fuente: Ispizua, 1989.
Bste diseño intentaba evitar diversos condicionantes (por ejemplo, la climatolo
gía) que pudieran sesgar la muestra distribuyéndola por periodos distintos. Tam
bién pretendía abrir lo suficiente la selección de momentos para dar opciones de
recibir información de todo tipo de perfiles sociodemográficos de usuarios, que era
su objetivo, precisamente. E\ cuadro 2.2 muestra la distribución de los 240 cuestio
narios realizados cada semana de un periodo, alternado el reparto de días/horas.
Otro ejemplo en el que se utilizó este tipo de muestreo fue en un estudio so
bre el Tratamiento de las noticias deportivas en prensa realizado en el año 2011
para el Comité Vasco contra la violencia en el deporte (Kirolalde, 2011). bn esta
investigación, y con el propósito de comprobar el efecto que las noticias publica
das en prensa escrita tienen sobre los comportamientos violentos en espectáculos
deportivos, se realizó una investigación que, mediante la utilización de la técnica de
análisis de contenido, presentaba como objetivo observar el tratamiento que se da
a determinados eventos deportivos en la prensa vasca (principalmente) y analizar
la presencia real que los términos y expresiones con connotaciones «violentas y /o
sexistas» tienen en los artículos publicados. La información recogida alude al perio
do comprendido entre los meses de octubre de 2010 y octubre de 2011, y se refiere
a diferentes modalidades deportivas tratadas en diversos medios escritos. Concre
tamente, se analizaron noticias aparecidas en cuatro periódicos generalistas [El
Correo, Deia, Gara y Diario Vasco) y dos deportivos ( Marca y Mundo Deportivo), las
cuales fueron seleccionadas de modo dirigido, también con vistas a cubrir aquellos
espectros de información en los que a priori se podía encontrar más información y
más variada sobre la cuestión a investigar.
71
La investigación como proceso
La selección (y análisis) de la muestra de noticias analizadas se llevó a cabo
considerando que el fenómeno de interés no se sabe a priori las dimensiones que
puede tener ni cuándo o dónde aparecerá. Por ello se intentó cubrir la obtención de
información a tres niveles diferentes: en el primero, se estudiaron los titulares de
todas las noticias deportivas de todos los lunes de octubre, enero y abril (principio,
mitad y final de temporada); en el segundo, se analizaron las noticias referidas a
una serie de eventos deportivos de relevancia relativos a deportes con caracterís
ticas diferenciadas (fútbol, baloncesto, pelota mano y remo), de manera que se se
leccionaron las noticias publicadas el día del evento así como los dos días previos y
posteriores; y a un tercer nivel, se realizó otra selección de noticias sobre eventos
deportivos en los que hubieran tenido lugar hechos violentos, así como los días pre
vios a dichos acontecimientos. Con todo ello, finalmente se consiguió una muestra
de 1.490 noticias.
c) Muestreo «bola de nieve»
Este es un procedimiento de generar muestras voluntarias o autoseleccionadas que
parte de un primero o varios A m en tos seleccionados por el investigador, a partir
de los cuales se sigue identificando y reclutando a otros elementos que cumplan
con los requisitos predefinidos de pertenencia a la población y que sean accesibles.
Los elementos de la muestra se van incorporando por llamada del anterior, con lo
que el resultado final a efectos de representatividad o credibilidad es en cada caso
una combinación de oportunidad, accesibilidad y otros varios criterios.
Es un tipo de muestreo con bastantes fuentes de sesgo, pero casi siempre res
ponde a la necesidad de recabar información de poblaciones desconocidas, ocultas,
difíciles de localizar y de hacer colaboradoras en la investigación: poblaciones es
tigmatizadas, marginadas o vulnerables, no localizables físicamente en domicilios
fijos, etc.
Por ejemplo, se aplicó este procedimiento como fase final de un muestreo por
etapas para seleccionar «líderes locales» en una investigación sobre democracia y
gobernabilidad local (García Cabeza et al., 1995). Para conseguir una muestra pre
viamente calculada de 450 líderes locales, se realizó en primera fase una selección
probabilística de 30 municipios españoles dentro de las 15 comunidades autóno
mas peninsulares, con lo que en cada municipio debían seleccionarse 15 líderes.
Considerando las personas que encabezaban las listas de los primeros partidos con
representación en cada ayuntamiento como «líderes locales natos» (sujetos elegi
dos por la población), se seleccionaron en cada municipio los primeros cinco líde
res. Estos incluían a alcaldesas y alcaldes y principales representantes municipales
tanto del partido en el gobierno como de otras opciones, procurando además cierta
cobertura en cuanto a opciones políticas representadas. Para esta primera selec
ción se utilizaron como marco muestral o base de sondeo los registros del Ministe
rio de Administraciones Públicas.
72
Identificando a la población a analizar
A continuación, a estas personas (líderes natos) se les pedía el nombre de otras
10 personas que en su opinión pudieran recibir la consideración de líderes locales
(también en el campo de la política o bien de la acción vecinal, representantes sin
dicales, representantes de comercios, cultos religiosos, etc.). Obtenidas esas listas
se cruzaban los nombres aportados por todos los sujetos «líderes natos» de cada
municipio, y así se llegó a seleccionar en cada caso a las quince personas con poder
local. En este caso, la aplicación del muestreo bola de nieve parte de la definición
inicial muy abierta de la población a muestrear, así como del hecho de que la inves
tigación contenía tanto un estudio cuantitativo como otro cualitativo, con lo que
para la selección era muy importante asegurar la profundidad de la información a
obtener.
d) Muestreo por cuotas
Este muestreo se adapta a la situación en que se tiene cierta información sobre la
población, pero no hay una base de sondeo. Por este método se eligen elementos de
la muestra entre los disponibles o accesibles, pero con unos requisitos previos
de reparto que normalmente tienen que ver con la estructura de la población obje
to de estudio. Estos requisitos son las cuotas, de manera que la muestra será de un
tamaño adecuado y reflejará la estructura de la población a través de esas cuotas.
Como las cuotas deben ser pocas para que el muestreo sea factible, a más cuotas
más intensidad en la definición del individuo a encuestar y, por tanto, más difícil es
dar con una persona de esas características. Cuantas menos cuotas, más extensa
será la definición del individuo, y por tanto más fácil de encontrar. En la práctica, y
para poblaciones generales, suelen ser cuotas de edad y género (y frecuentemente
también de recuerdo de voto en estudios electorales o políticos). Por ejemplo, si en
la población hay un 10% de mujeres de entre 18 y 29 años, en una muestra de 400
sujetos deberá haber 40 mujeres de esas edades. Así se calculará para todos los cru
ces (cuotas) de género y grupo de edad. Es decir, el «tamaño» de muestra se reparte
proporcionalmente entre subgrupos de edad/género de modo equivalente a como
se reparte la población, pero no hay selección aleatoria de qué sujetos concretos
que cumplen las cuotas en cada subgrupo deben formar parte de la muestra.
El método de cuotas tiene una importante tradición en el desarrollo de las in
vestigaciones por encuesta. Es de los más utilizados por las empresas de estudios
de mercado y opinión para las encuestas tanto presenciales como telefónicas por
que es muy ágil, simplifica el trabajo de campo y abarata costes. También hay otros
estudios en que por las características especiales de las poblaciones y el diseño de
investigación es una opción relevante. Este es el caso de un estudio periódico que
viene realizando el Real Instituto Elcano (2015), que es el Barómetro de la Imagen
de España (BIE), y cuya población es la de los países del mundo que se consideran
ámbito de estudio en cada oleada (poblaciones con la nacionalidad del país y resi
dentes entre 18 y 70 años). Su ficha técnica define un estudio cuantitativo mediante
encuesta online en unos países y telefónica en otros. Para las encuestas online la
73
La investigación como proceso
muestra debe seleccionarse entre internautas y para las telefónicas (que fue por
dispositivos móviles en dos países con altísima tasa de penetración de móviles)
entre usuarios de móviles. Como consecuencia, las aproximadamente 400 unida
des muéstrales en cada país se seleccionan simplemente mediante cuotas por edad,
sexo y zona geográfica de residencia.
No obstante, y de forma mucho más generalizada, el muestreo de cuotas es uti
lizado como método para seleccionar unidades últimas en muchos diseños polie-
tápicos porque, aunque no hay consenso total al respecto, se ha estudiado que si en
etapas anteriores se han aplicado métodos probabilísticos, los resultados de incluir
cuotas en la selección última son aceptables (Osuna, 1991,45) bajo ciertas con
diciones: «el método de cuotas -utilizado tras urt"sistema de rutas aleatorias que
identifica las viviendas donde realizar las entrevistas- proporciona una adecuada
representatividad del universo en relación a la edad, el sexo, la actividad económica
y la situación profesional» (Díaz de Rada, 2008, 240).
2.2.3. El tamaño de la muestra y el muestreo aleatorio como base para su cálculo
¿Cuánta muestra necesito? C o^ ) se ha mencionado antes, la idea de «representati
vidad» muestral desde la perspectiva estadística incluye una muestra de tamaño su
ficiente y cuyos elementos sean seleccionados de forma completamente aleatoria; es
decir, más concretamente, una muestra aleatoria simple (MAS) del tamaño necesario.
El tamaño de la muestra necesaria, por tanto, se calcula de acuerdo con las condicio
nes necesarias para realizar inferencias probabilísticas desde las muestras con que
trabajamos hacia las poblaciones a las que representan y que son objeto de investi
gación. Las fórmulas de cálculo del tamaño de la muestra que aparecen en el cuadro
2.3 se consignan solo para indicar qué tipo de cuestiones se incluyen en el cálculo y
cómo se relacionan. El resultado de aplicar estas fórmulas se expresa muy a menudo
en unas «tablas de tamaños» ya preparadas, que veremos un poco más adelante. En
un capítulo posterior referido al análisis estadístico de datos (capítulo 5) volveremos
al tema de la inferencia estadística aplicada. Aquí intentaremos realizar una aproxi
mación mínima para aclarar la importancia de lo que se puede considerar tamaño de
muestra adecuado o suficiente.
Para calcular el tamaño de muestra necesario deben manejarse dos tipos de
elementos: alguna información sobre la población (tamaño y grado de heteroge
neidad) y unas condiciones para las estimaciones inferenciales deseadas: nivel de
confianza y error muestral máximo (EM). La combinación de estos cuatro elemen
tos permite calcular la muestra (n) hecesaria en cada caso.
a) Tamaño y heterogeneidad de la población
Si el tamaño de la población (N en las fórmulas del cuadro 2.3) es conocido, se uti
lizan las fórmulas de cálculo para poblaciones «finitas», que es como se denominan
74
Identificando a la población a analizar
Cuadro 2.3: Fórmulas para el cálculo de tamaños de muestra.
Población finita. Población finita.
Inferencia sobre medias Inferencia sobre proporciones
NZ2a 2 NZ2PQ
z 2o 2+ e m 2( n - l) z 2p q + e m 2( n - i )
Población infinita. Población infinita.
Inferencia sobre medias Inferencia sobre proporciones
Z2(j2 Z 2PQ
n = -------- n = --------
EM2 EM2
Fuente: elaboración propia con base en Osuna (1991).
cuando se considera este factor. Para las poblaciones de las que se desconoce su
tamaño o para las poblaciones «infinitas» (más de 100.000 elementos), el cálculo
del tamaño de muestra se simplifica bastante, como se ve en el cuadro 2.3. En la
práctica, se puede decir que el tamaño de la población afecta relativamente poco al
cálculo de muestras, porque en investigación social a menudo se trabaja con pobla
ciones grandes.
Sin embargo, trabajando con poblaciones muy pequeñas, el muestreo se verá
afectado por las dimensiones de la población, de tal manera que prácticamente hay
que seleccionar partes muy amplias de la población para tener una muestra esta
dísticamente suficiente. Hay que tener en cuenta que la teoría de las probabilidades
en que se sustenta el muestreo asume poblaciones «abstractas» e infinitas de ele
mentos. Precisamente por ello, los universos «suficientemente grandes» se pueden
definir a posteriori como aquellos en cuyo muestreo no afecta esta relación entre
tamaño de muestra y tamaño de población, y que en ocasiones se ha especificado
con la condición de que la fracción de muestreo (relación entre tamaño de muestra
y tamaño de población, n/N) sea menor de un 10% o un 5% (Osuna, 1991, 64).
El grado de heterogeneidad de la población o varianza poblacional es otro dato
que hay que conocer e incluir en el cálculo de la muestra necesaria, y que afecta
bastante más al resultado. Lógicamente, las poblaciones más homogéneas necesi
tan menos muestra para ser representadas y las más heterogéneas, más muestra.
De ahí que haya que saber o estimar cuantitativamente la varianza poblacional para
poder calcular el tamaño muestral. Este dato se expresa en las fórmulas de dos for-
75
La investigación como proceso
mas alternativas: como varianza de una variable numérica [o2] o como varianza de
una variable dicotómica con proporciones P y Q (o 1-P), que es el producto PQ.
El problema radica en que se asume que se está hablando de «la» varianza po-
blacional en una característica o variable que es sobre la que se desean realizar esti
maciones inferenciales con la muestra y que, si se trata de una variable cuantitativa,
se harán inferencias acerca de la media, mientras que si se trata de una variable
categórica se harán estimaciones sobre la proporción de interés P. La realidad es
que la varianza entonces es un dato distinto para cada variable que pudiéramos
contemplar, que es imposible conocer de antemano o estimar todas esas varianzas,
y que en investigación social nadie selecciona una muestra para analizar una sola
variable, sino muchas.
Por todo ello, lo habitual es considerar el cálculo en el supuesto de varianza
mayor, ya que si la muestra sirve para la población más heterogénea, servirá para
todas. Es lo que a veces aparece en las fichas técnicas como «el peor supuesto» o
«supuesto de máxima indeterminación»; es decir, si la población fuera en todas sus
características P=Q=0,5 (50%).
b) Error muestral y nivel de confianza
El error muestral máximo (EM) es el criterio central para el diseño y cálculo del
tamaño de muestra estadísticamente representativa de una población. El error
muestral como concepto es la diferencia cuantitativa concreta entre un parámetro
verdadero en la población y su estimador a nivel muestral, que se denomina esta
dístico. Dependiendo de qué parámetro y estadístico hablamos, se expresa en unas
unidades u otras. Si pensamos en una variable sencilla, con dos categorías, el error
muestral es la diferencia entre un porcentaje obtenido en la muestra y el que hubié
ramos obtenido en la población de referencia. Por tanto, toda la idea de la precisión
de una estimación basada en muestras se basa en poder reducir al máximo el error
muestral en cualquier estimación.
En este sentido, una muestra representativa es aquella que genera estimadores
muéstrales lo suficientemente precisos; es decir, de la que se puede avanzar que no
superará una determinada cantidad de error muestral máximo en cualquier estima
ción. Y esta cantidad es la que se pone como criterio general al calcular el tamaño
de muestra. Como la teoría de las probabilidades ha estudiado cómo se comportan
los estimadores muéstrales respecto de los parámetros a los que pretenden repre
sentar en función del tamaño de las muestras de que proceden, sabemos que el
error muestral desciende al aumentar el tamaño de muestra. Y en consecuencia, si
pretendemos como criterio en el diseño muestral garantizar menos error máximo a
priori, el tamaño que necesitamos es mayor (aunque no con un incremento lineal).
La relación entre tamaño y error máximo es tal que, por lo general, se conside
ran aceptables diseños planteados con errores máximos de hasta un 5%. Pero hay
que tener en cuenta que, por ejemplo, para reducir el error a la mitad (2,5%) en
76
Identificando a la población a analizar
igualdad del resto de factores, una muestra mínima (5% de EM) de 400 unidades en
una población infinita se multiplicaría por cuatro, alcanzando las 1.600 unidades y,
solo reducir en un punto porcentual el error máximo (4%) aumentaría la muestra
una vez y media hasta un tamaño de 625 unidades. Por otra parte, esta relación
entre error y tamaño apunta aun rendimiento decreciente en el muestreo: aumen
tar la muestra reduce el error muestral, pero a partir de un punto determinado no
tanto como para justificar el incremento del coste.
En cuanto al nivel de confianza (NC), es otro criterio que se fija previamente
para el cálculo del tamaño de muestra necesario y que alude al tipo de estimaciones
inferenciales que se van a realizar con los datos de la muestra. Más concretamen
te, el nivel de confianza es la probabilidad de acierto atribuida a las estimaciones
a realizar; la cual se puede definir en virtud del comportamiento conocido de los
estimadores respecto a sus parámetros y que sigue un tipo de distribución proba-
bilística (en general, normal). Como se trata de una probabilidad que atribuimos a
buenas estimaciones, estas deberán ser de alta probabilidad, así que los niveles de
confianza con los que se considera estadísticamente aceptable trabajar son al me
nos del 95%, y también es convencional utilizar algunos como el 95,5% o el 99% y
hasta el 99,7%.
En las fórmulas de cálculo, el tactor nivel de confianza se traduce en una puntua
ción normal tipificada zeta (Z) que delimita esas áreas de mayor probabilidad en las
distribuciones normales: para el nivel de confianza mínimo es de 1,96 (NC 95%),
para el NC 95,5% es de Z=2 y para el NC 99,7% sería de Z=3. Por esto, los niveles de
confianza también se identifican a veces por las expresiones 1,96 sigmas o 2 sigmas
o 3 sigmas : siendo sigma la variabilidad esperada de los indicadores muéstrales
(error típico), zeta veces el error típico equivale al error muestral máximo para ese
porcentaje de muestras. El efecto de seleccionar un nivel de confianza más alto es
el incremento de la muestra necesaria para cubrir tales expectativas en las inferen
cias que se vayan a realizar. Si se quiere aumentar la probabilidad de éxito en las
estimaciones (entendiendo el éxito dentro del margen de error muestral prefijado),
se necesitan muestras más numerosas.
De la combinación de los mencionados cuatro factores resulta el cálculo de un
tamaño de muestra, como se especifica habitualmente en las fichas técnicas de los
estudios cuantitativos muéstrales indicando, por ejemplo, que con una muestra di
señada de 2.500 entrevistas a población española de 18 años y más «para un nivel
de confianza del 95,5% (dos sigmas) y P=Q, el error real es de ±2,0% para el conjun
to de la muestra y en el supuesto de muestreo aleatorio simple» (GIS, 2015, Ficha
Técnica del Barómetro de noviembre), que es exactamente lo que resulta de aplicar
la fórmula de cálculo correspondiente.
Si en general se puede calcular así el tamaño de muestra mínimamente acep
table, también es uso común conseguir la mayor muestra que podamos abordar
con los recursos disponibles de una investigación. En general, cuanto mayor sea la
muestra (aleatoria), mejor la precisión de las estimaciones posibles y en ese senti-
77
La investigación como proceso
do más representativa de la población. También hay otros factores a considerar por
los que merece la pena explorar distintas posibilidades en el cálculo del tamaño
muestral, como es el alcance de los análisis estadísticos que se quieran realizar,
ya que determinados análisis estadísticos más complejos (análisis multivariantes
y análisis verificatorios) requieren de mayores tamaños muéstrales para ser apli
cados.
Cuadro 2.4: Tamaños de muestras calculados.
Nivel de confianza
EM%
95% 95,5% 99% 99,7%
5 384 400 666 900
4,5 474 494 822 1.111
4 600 625 1.040 1.406
3,5 784 816 1.358 1.837
3 1.067 1.111 1.849 2.500
2,5 1.537 1.600 2.663 3.600
2 2.401 2.500 4.160 5.625
1,5 4.268 4.444 7.396 10.000
9.604 10.000 16.641 22.500
1
Para poblaciones infinitas y P=Q=50%
Fuente: elaboración propia.
En los textos de estadística aplicada suelen aparecer algunas tablas ya prepara
das que resumen las combinaciones de factores que pueden ser de interés con el
tamaño de muestra resultante. De todas ellas, en el cuadro 2.4 presentamos algu
nas de las variaciones más utilizadas porque incluyen dos condiciones previas muy
habituales en investigación social: el cálculo para poblaciones infinitas (grandes)
y bajo el supuesto P=Q=50% para estimar cualquier tipo de parámetro. Como se
deduce de las comparaciones, las diferencias importantes suceden al intentar pasar
de un nivel de confianza del 95,5% al 99% en las estimaciones y, sobre todo, al pre
ver que se garantice menor error muestral.
Una alternativa actualizada es buscar en internet una «calculadora de tamaños
muéstrales» como las que ofrecen algunos departamentos universitarios y también
empresas de estudios de mercado, siempre que se pueda valorar que la fuente es
78
Identificando a la población a analizar
fiable. Por ejemplo, la empresa Netquest la ofrece ([Link]
panel/calculadora-muestras/[Link]), también la empresa
Raosoft ([Link] el National Statistical Service
de Australia ([Link]
2.2.4. Diseños polietápicos
Como hemos visto, la construcción de muestras para estudios cuantitativos viene
definida por la combinación de calcular un tamaño suficiente y elegir un método o
métodos adecuados que garanticen la representatividad estadística de la población.
El problema es que, aunque pudiera realizarse esto de una sola vez (contando con
marcos muéstrales completos), el coste de implementar ese diseño muestral es ina-
sumible en muchas investigaciones sociales que trabajan con poblaciones grandes
y extensas, y especialmente en los diseños de encuesta. Por este motivo son tam
bién comunes los diseños muéstrales polietápicos, que ya aparecían hace muchos
años en la literatura, sobre todo la norteamericana clásica de muestreo estadístico
(Kish, 1965), y entre ellos, por ejemplo, muchos estudios del CIS (Osuna, 1991).
En el muestreo polietápico se realiza la selección de una muestra por etapas,
que va estableciendo una jerarquía de diferentes tipos de unidades hasta llegar a
las unidades últimas, las que componen la muestra de la que se recoge información.
Las unidades se van denominando desde primarias, de segunda etapa, tercera, etc.,
y suelen ser unidades agregadas, por lo que básicamente se realizan varias etapas
de muestreo por conglomerados. Los diversos conglomerados se seleccionan de
forma aleatoria y frecuentemente bajo previa estratificación. La idea clave es redu
cir la cantidad de información necesaria para seleccionar unidades en cada etapa,
sobre todo en lo relativo a los marcos muéstrales necesarios, lo cual es una ventaja
indudable. Si en cada etapa se requiere un marco concreto, este es cada vez más
reducido conforme se consideran etapas.
Por ejemplo, los barómetros del CIS que hemos venido mencionado, con una
muestra de 2.500 unidades para ser encuestadas cara a cara, representando a la
población española de 18 y más años utilizando un diseño de este tipo seleccio
nando primero municipios (entendidos como conglomerados) de forma aleatoria y
proporcional a su estratificación por comunidad autónoma y tamaño del hábitat. Es
decir, en una primera etapa, teniendo los municipios agrupados en estratos, se pue
de asignar a cada estrato una cantidad de muestra proporcional a la población del
estrato. En una segunda fase, se calculan el número de secciones censales (o puntos
de muestreo) que hay que seleccionar en cada estrato tras haber fijado un número
aproximado de sujetos por sección. Las secciones concretas se seleccionan de modo
aleatorio proporcional a su población considerando los municipios que hay en cada
estrato. Una vez seleccionadas las secciones concretas se puede aplicar la combina
ción de rutas aleatorias y cuotas para proceder a la selección final de componentes
individuales de la muestra en las viviendas.
79
La investigación como proceso
Cuadro 2.5: Ficha técnica completa de un barómetro CIS.
ESTUDIO CIS N5 3118
BARÓMETRO DE NOVIEMBRE
FICHA TÉCNICA
Ámbito: Nacional.
Universo: Población española de ambos sexos de 18 años y más.
Tamaño de la muestra:
Diseñada: 2.500 entrevistas.
Realizada: 2.476 entrevistas. w
Afijación: Proporcional.
Ponderación: No procede.
Puntos de Muestreo: 256 municipios y 49 provincias.
Procedimiento de muestreo: Polietápico, estratificado por conglomerados, con
elección de las unidades primarias de muestreo (municipios) y de las unidades
secundarias (secciones) de forma aleatoria proporcional, y de las unidades últimas
(individuos) por rutas aleatorias y cuotas de sexo y edad.
Los estratos se han formado por el cruce de las 17 comunidades autónomas con el
tamaño de hábitat, dividido en 7 categorías: menor o igual a 2.000 habitantes; de
2.001 a 10.000; de 10.001 a 50.000; de 50.001 a 100.000; de 100.001 a 400.000; de
400.001 a 1.000.000, y más de 1.000.000 habitantes.
Los cuestionarios se han aplicado mediante entrevista personal en los domicilios.
Error muestral: Para un nivel de confianza del 95,5% (dos sigmas) y P=Q, el error
real es de ±2,0% para el conjunto de la muestra y en el supuesto de muestreo
aleatorio simple.
Fecha de realización: Del 30 de octubre al 9 de noviembre de 2015.
Fuente: B aró m etro de N o viem b re (CIS, 2015).
Ciertamente, no todos los sujetos y equipos investigadores pueden tampoco ac
ceder a la información necesaria para realizar un diseño como este y, además, en
caso de poder llegar a diseñarlo, al llevarlo a cabo el factor de dispersión geográfica
en el trabajo de campo aún afectaría mucho al coste de la investigación.
Una aplicación algo más sencilla de muestreo polietápico es el caso antes men
cionado de la investigación en la que participamos activamente sobre «Democra
cia y gobernabilidad local». En ella se calculó una muestra de 450 líderes locales
(municipales) en todas las comunidades autónomas peninsulares (para un nivel
de confianza del 95% y P=Q=50%, el error muestral previsto de 4,6% era más que
aceptable). La primera fase consistió en la selección probabilística de municipios; la
80
Identificando a la población a analizar
segunda, en una selección no probabilística de líderes mediante «bola de nieve», El
diseño se enmarcaba en un proyecto de ámbito europeo y se siguieron directrices
generales en todos los países en los que se llevó a cabo.
La selección de municipios se diseñó como un muestreo estratificado por co
munidad autónoma y tamaño de los municipios, previa delimitación operativa del
«ámbito local» a poblaciones entre 25.000 y 200.000 habitantes. Según los datos del
1NE, el universo se componía de 171 municipios, de los cuales había que seleccionar
30 para cubrir el reparto de 15 líderes (unidades últimas) en cada municipio. Con
la condición de seleccionar al menos un municipio en cada comunidad autónoma
y una representación proporcional a la población de cada estrato, los municipios
aleatoriamente seleccionados fueron los que aparecen en el cuadro 2.6.
2.2.5. Submuestras, muestreo no proporcionado y ponderación
Es muy frecuente que en las investigaciones muéstrales sobre poblaciones amplias
se busque no solo una muestra global que sea representativa de la población de
referencia, sino que también se pretenda realizar algún análisis más desagregado
sobre partes relevantes de la población. Por ejemplo, a un nivel geográfico o admi
nistrativo menor, como de una muestra de población de un municipio, serían suba
nálisis por barrios; o de una comunidad autónoma, por cada una de sus provincias.
Las muestras estratificadas no generan automáticamente submuestras repre
sentativas de las subpoblaciones que constituyen los estratos, ya que partiendo de
un tamaño de muestra global aceptable (desde 400 casos mínimos, como hemos
visto, y hasta muestras habituales de 1.000) en muchas ocasiones la afijación pro
porcional o no proporcional (simple u óptima) dejan algunos estratos con partes de
muestras que (aunque seleccionadas aleatoriamente) son de tamaño insuficiente
para realizar análisis específicos y menos aún estimaciones a ese nivel de desagre
gación. Esto sucede cuando los estratos son de tamaño diferente y la población se
reparte de modo muy desigual entre ellos.
Si se pretende representatividad muestral al nivel de cada estrato para poder
analizar más en detalle esas subpoblaciones o realizar en ellas estimaciones infe-
renciales específicas, hay que proceder diseñando submuestras concretas y, por
tanto, muéstreos desproporcionados al nivel global. Esta es, de todas formas, una
estrategia habitual incluso sin llegar a conseguir que todas las submuestras de to
dos los estratos cumplan los requisitos técnicos estrictos de representatividad esta
dística (errores muéstrales asociados menores del 5% para estimaciones al menos
a un nivel de confianza del 95%).
Todo esto puede incrementar de forma importante el tamaño de la muestra final,
por lo que hay que considerar las opciones atendiendo al tipo de representatividad
que se busca, pero también de acuerdo con los recursos prácticos (económicos, hu
manos y en tiempo) de cada investigación. Hay diferentes formas de diseñar estas
muestras que contienen submuestras. Lo habitual es fijar un mínimo de muestra
81
La investigación como proceso
Cuadro 2.6: Ejemplo de muestra polietápica. Distribución de puntos de muestreo (municipios)
seleccionados aleatoriamente en primera fase dentro de los estratos de comunidad autónoma y
tamaño del hábitat.
Comunidad De De De De Total Puntos
autónoma 25.000 a 50.001 a 100.001 a 150.001 a Población muestreo
50.000 100.000 150.000 200.000
Estepona Linares Cádiz 6.875.628 5
Andalucía Lucena
Lebrija
Barberá El Prat de Sta. Tarrasa 5.977.008 4
Cataluña del Vallés Llobregat Coloma de
Gramanet
Torrejón Alcalá de Móstoles 4.854.616 3
Madrid de Ardoz Henares
Comunidad Benidorm S a g ^ to Castellón 3.772.611 3
Valenciana de la Plana
Galicia Lugo Orense 2.785.394 2
Castilla León León Salamanca 2.600.000 2
Eibar Santurtzi Vitoria- 2.133.002 3
País Vasco Gasteiz
Castilla La Albacete 1.665.029 1
Mancha
Aragón Teruel 1.214.729 1
Asturias Mieres 1.114.115 1
Extremadura Cáceres 1.088.543 1
Murcia Cartagena 1.014.285 1
Cantabria Santander 524.670 1
Navarra Tudela 512.676 1
La Rioja Logroño 262.611 1
Total 3.728.562 3.773.817 2.198.500 2.122.100
Población
Puntos 8 8 7 7 30
Muestreo
Fuente: García Cabeza et al. (1995)
82
Id en tifica n d o a la p ob lació n a an alizar
suficiente para el estrato menor y afijar el resto proporcionalmente a su tamaño. A
veces también se aplica una combinación de afijación simple y proporcional para
cada mitad de la muestra, de modo que a una base fija mínima para todos los estratos
se le suma otra parte de muestra que ha sido calculada por afijación proporcional.
En cualquier caso, si se trabaja con técnicas de afijación no proporcional, cuan
do se quieren realizar explotaciones globales de los datos, hay que proceder a la
ponderación para devolver a cada estrato o subpoblación la proporción que le co
rresponde realmente. Los coeficientes de ponderación son pesos que se calculan
dividiendo la proporción del estrato en la población entre la proporción del estrato
en la muestra: los coeficientes son menores de 1, cuando la muestra del estrato es
mayor de lo que le correspondería, y son mayores de 1, cuando la parte de la mues
tra es menor de lo que en proporción poblacional sería. En el tratamiento final de
los datos, al multiplicar cada elemento de un estrato por su coeficiente de ponde
ración se pueden agregar los datos de los estratos de modo que la muestra tenga el
tamaño definido.
Las operaciones de ponderación son sencillas, pero no hay que ignorar que afec
tan a los resultados y, en consecuencia, no es recomendable trabajar con pondera
ciones excesivas porque reducen y pueden distorsionar la variabilidad real de los
datos conseguidos.
Para un estudio sobre vivienda en el País Vasco (Ispizua y Unceta, 2014; Unceta,
Ispizua y Guerra, 2012], se diseñó una encuesta (telefónica) de opinión para pobla
ción residente de entre 18 y 70 años. La muestra global se fijó en 1.800 unidades, lo
que asegura representatividad estadística más que aceptable (error muestral máxi
mo 2,36% al 95,5% de nivel de confianza en el supuesto P=Q=50%). La muestra
debía estratificarse por provincias (territorios históricos) y especialmente, dado
el tema, se deseaban submuestras representativas en cada territorio. Debido a los
desequilibrios territoriales en el reparto de la población, una afijación proporcio
nal de la muestra hubiera dejado al territorio menos poblado (Álava) con solo 250
unidades muéstrales, que no cubrirían los criterios mínimos de representatividad
estadística, y el territorio vizcaíno claramente sobre-representado.
Una de las opciones posibles hubiera sido construir tres submuestras de 600
unidades y ponderar la muestra global. Pero la ponderación hubiera sido algo ex
cesiva en los estratos extremos (coeficiente 0,41 para Álava y coeficiente 1,61 para
Bizkaia). Finalmente se diseñó, como se ve en el cuadro 2.7, un reparto despropor
cionado que casi era el equivalente de asegurar una submuestra representativa mí
nima de 400 unidades en cada estrato a la que se sumaría el reparto de las otras 600
unidades de modo casi perfectamente proporcional. De este modo se repartiría la
muestra asegurando que el factor de ponderación en ningún caso superara el 1,5 ni
fuera menor que el 0,5.
Además de la estratificación, se aplicó un reparto final de la muestra por cuotas
de sexo, edad y comarca de residencia, diferenciando únicamente a los residentes
en cada comarca-capital de los residentes en otras comarcas de cada territorio. El
83
La investigación como proceso
Cuadro 2.7: Ejemplo de submuestras no proporcionales y ponderación. Encuesta en el País
Vasco estratificada por territorios históricos.
M uestra M uestra no Factor de Error
Población
proporcional proporcional ponderación m uestral
a aplicar final
Abs. % Abs. Abs. %
Álava 203.279 13,87 250 470 0,26 0,53 4,61
Gipuzkoa 471.614 32,18 580 580 0,32 1 4,15
Bizkaia 790.816 53,95 971 750 0,42 1,29 6,35
Total 1.465.709 100,00 1.800 1.800 1,00 2,36
Fuente: Unceta, Ispizua y Guerra (2012).
reparto por sexo se realizó como una afijación simple al 50% y el reparto de las
submuestras de cada estrato tíriton a l por cuotas de edad y comarca resultó como
se refleja en el cuadro 2.8.
2.2.6. Otras consideraciones prácticas sobre muestreo para estudios
cuantitativos
a) Sobre muestreo aleatorio simple
En poblaciones no muy grandes con elementos plenamente identificables, localiza-
bles y no muy dispersos, debería utilizarse el muestreo aleatorio simple, que es el
estadísticamente ideal. Es el prototipo para calcular los errores de muestreo que es
necesario conocer para realizar inferencias precisas desde los resultados muéstra
les a las poblaciones de referencia. Además, como dice Rodríguez Osuna, «es el pa
trón para medir la eficacia de los muéstreos estratificados y por conglomerados ya
que a través del "efecto del diseño" se establece la comparación entre estos y aquel»
(1991, 25). Sin embargo, el muestreo probabilístico en la teoría no contempla que
para las poblaciones con que solemos trabajar la heterogeneidad en características
relevantes para la investigación no es plenamente «intercambiable». Por lo que la
representatividad final de las muestras está también muy condicionada por la cali
dad del trabajo de campo posterior de cualquier diseño cuantitativo, como veremos
más adelante.
b) Problemas de cobertura con el marco muestral
El único modo realista de aplicar procedimientos aleatorios es con acceso directo a
una base de sondeo aceptable (o marco muestral), lo cual afecta fuertemente tanto
84
Identificando a la población a analizar
Cuadro 2.8: Ejemplo de submuestras no proporcionales y reparto de cuotas. Encuesta en el
País Vasco estratificada por territorios históricos.
LO
ro
*o-> L_u
</> TO LO LO LO T—1 T—| LO rsl o
QJ E en en en en no rn en rsl CM CM en
OC
o
u
03
00 m (N t-H en r* st en O o
Q. rvj m no en rN rsl rsl rsi T—1 CM rsi
o 03
u O
580
rsl sí 00 00 en T—1
LO lo LO LO LO LO st
o
o o
169
- t-J
LO 00 CTi O LO St CM m
O) *—i *—1 rN rsl rsl t—i T—1 rH t—1 H
OC
O
o
03
581
4-J
*3- Oí LO LO LO LO en CM 00
*CL LO co LO LO LO LO LO si
O 03
u U
750
rsl 00 LO LO m T—1 en T—i
00 00 00 00 00 r" r- LO LO CD
o
to
10
11
11
11
11
93
LO en en 00 r^
QJ
OC
O
u
_>
ro to
03
en LO st rsl 00 rsi LO
'< E CL s i s i si- séj- m no en CM rsi n-
o ro
m
Muestra n total = 1.800
u u
en en LO LO m LO O rH LO o
LT) LO LO LO LD ■si sí s i m en
si- en s i en en Sí en en _i
rsi rN en m si- LO LO KD LO £
Ó
CM
un
rN
Ò
en
LO
en
ó LO
st
cb
LO
LO
LO
Ó
<£>
LO
LO
o
h-
Fuente: Unceta, Ispizua y Guerra (2012).
85
La investigación como proceso
los diseños muéstrales monoetápicos como polietápicos. Son por esto frecuentes los
diseños bietápicos sencillos, pero con recurso final a cuotas, los que habitualmente
realizan muchas empresas para sondeos generales de opinión. Por ejemplo, 1.000
entrevistas telefónicas a una muestra nacional de personas mayores de 18 años,
estratificadas por la intersección hábitat/comunidad autónoma y repartidas pro
porcionalmente por los estratos, con cuotas de sexo y edad para elegir la unidad
última (sondeo de Metroscopia de octubre 2014 para k l País). Cuando es necesa
rio planificar y ejecutar una muestra propia sin marco muestral completo, estos
formatos son bastante habituales. Si el trabajo de campo es presencial, las cuotas
pueden combinarse con rutas aleatorias previas. Como hemos señalado, los marcos
muéstrales telefónicos presentan también sus problemas específicos como conse
cuencia de la expansión de la telefonía móvil además o en sustitución de las líneas
fijas, aunque también hay otros requerimientos tecnológicos que circunscriben las
investigaciones con estas muestras a un contexto más profesional (empresas, insti
tutos de investigación, etc.).
c) Muestras online (e-muestr^>)
Otra de las novedades importantes respecto al muestreo para estudios cuantitati
vos es la procedente de las investigaciones realizadas sobre poblaciones captadas
en internet. Aunque internet como vía de contacto con las poblaciones para obtener
de ellas información con vistas a investigación es un medio sin duda ventajoso a
priori en velocidad y coste, no hay que confundir un muestreo diseñado con la se
lección no aleatoria e incluso la autoselección sesgada que implica basaise solo en
internet para seleccionar muestras.
Muchas empresas recurren crecientemente a estos medios e incluso los han con
vertido en parte de su área de negocio: la venta de paneles de potenciales partici
pantes (sujetos para entrevistas, encuestas o experimentos) previamente recluta-
dos y dispuestos se divulga como un servicio equivalente al de construir un marco
muestral. Por lo general estos paneles son muy amplios (de varias decenas de mi
les), a veces con extensión internacional, y suelen presentarse segmentados respec
to a características específicas de la población (que se consideran de interés o que
se sabe que tienen demanda), incluso por cuotas sociodemográficas que incluyen
las de mayor interés: geográficas, edad y sexo, nivel de estudios, etc. Estos paneles
se van construyendo y fidelizando a través de diversos canales y como parte de los
propios estudios que realizan las empresas, con lo que las empresas cada vez sim
plifican más la tarea de seleccionar muestras para sus propios estudios y pueden
ofrecer las bases para otros.
A este respecto hay en el mercado oferta de mayor y menor calidad. Por lo que
hay que asegurarse de ello cuando se recurre a la utilización de paneles de infor
madores pre-reclutados. Pero, sobre todo, no hay que confundir la respuesta vo
luntaria obtenida de este tipo de fuente con una muestra realmente controlada y,
86
Identificando a la población a analizar
mucho menos, con una muestra probabilística. En un estudio realizado por el C1S
(precisamente sobre la actitud hacia las encuestas) en 2007, se combinaron varios
modos de administración (presencial, telefónico y por internet) para poder compa
rar resultados. Para la encuesta por internet se recurrió a un panel proporcionado
por una empresa en el que constaban hasta 35.000 individuos que cubrían requi
sitos mínimos de edad y a los que se invitó a participar. La muestra (final) de 530
individuos era una muestra de cuotas basadas en los perfiles de edad/sexo de los
internautas tal como se establecía en las conclusiones más cercanas del Estudio Ge
neral de Medios (EGM). Dados los objetivos del estudio y la posibilidad de realizar
ponderaciones posteriores para las comparaciones, la muestra puede ser útil en este
caso (Díaz de Rada, 2010), pero no es una muestra aleatoria ya que quienes respon
den, aun cumpliendo unos requisitos, se autoseleccionan (CIS, estudio 2.676).
En definitiva, cuando la recogida de datos para investigación (normalmente en
cuestas) se realiza por internet, nos encontramos en la misma situación en que nos
encontramos al hacerlo por otro medio: podemos contar o no con base de sondeo y,
por lo tanto, podemos realizar muéstreos estadísticos de carácter probabilísimo o
realizar muéstreos de corte no probabilístico.
Los muéstreos probabilísticos a través de internet también existen (Ackland,
2013, 27) y pueden ser tan sencillos como un aleatorio simple, cuando hay listado
completo de componentes de la e-población con acceso a internet. También, como
hemos señalado antes, los paneles pre-reclutados pueden servir para seleccionar
muestras probabilísimas.
Otros tipos son los Pop up surveys, para encuestas web, que siguiendo un mues-
treo sistemático se presentan una de cada 10 veces (por ejemplo) que se visita una
página de internet concreta, y son las personas que entran en esa página quienes
deciden si forman parte de la muestra.
Entre los muéstreos no probabilísticos destacan también dos posibles tipos: los
que utilizan harvested email lists o listas de correo producidas o elaboradas a par
tir de personas que participan o entran en webs y que son vendidas para otros
fines (con el correspondiente riesgo ético al usarlas); y aquellos otros que alojan
encuestas en web de libre acceso, abiertas al público y en las que cualquiera puede
participar.
2.3. M uestreo cualitativo
IJna de las cuestiones más espinosas de los diseños de investigación cualitativos es
precisamente la del muestreo: cómo proyectar y llevar a cabo una selección de «in
formantes» que abarque la amplitud y profundidad de los discursos o interacciones
que se quieren captar. Es decir, se trata de cómo acercar la idea de representativi-
dad no estadística, pero sí sustancial o de contenido, a los diseños muéstrales de
estos estudios. La cuestión diferencial respecto de los estudios cuantitativos es tal
87
La investigación como proceso
que hay quienes simplemente evitan los términos muestra y muestreo al referirse
a ello (Morgan, 2013,125).
Una primera cuestión importante es que la variedad de diseños cualitativos (in
dividuales o grupales; observando o conversando) es tan grande que los tipos de
sujetos o casos que componen las poblaciones y muestras sobre las que se investiga
también requieren una definición e identificación previa. Hstas unidades de análisis
pueden ser sujetos individuales, pero también grupos de individuos u otras enti
dades: instituciones, acontecimientos, programas, procesos, documentos, o incluso
momentos concretos, como veremos en el caso de la observación. La identificación
del universo del que obtener las muestras tampoco es siempre sencilla y mucho
menos lo es en términos de marco muestral. Vienfe dada por las definiciones pre
vias y por los objetivos de la investigación. También la perspectiva teórica concreta
desde la que se orienta una investigación cualitativa condiciona el enfoque para de
finir poblaciones y seleccionar muestras, así como a todo el proceso en su conjunto
(Flick, 2014).
En general se puede decir que el muestreo cualitativo, de algún modo, siempre
es del tipo no probabilísimo y en concreto, estratégico o «intencional» (purposeful
o purposive], ya que es el sujet^investigador (y el proceso de investigación) quien
decide cuántos elementos y cuáles formarán parte de las muestras definitivas. No
obstante, también es fácil y hasta recomendable que se combinen estrategias en
las que intervienen algunas selecciones de otro tipo, como el uso de cuotas o el
muestreo de bola de nieve. Básicamente, se trata de conseguir los casos o peí sonas
informantes suficientes (en número y composición) como para llegar a alcanzar
(al final) la saturación informativa que requiere el análisis. Y ese es, por tanto, un
muestreo en que son los conceptos sobre los que se trabaja los que guían las deci
siones muéstrales y el investigador tiene que colocarse en la situación que mejoi le
permita llegar a desentrañarlos (Ruiz Olabuenaga e Ispizua, 1989, 64-65).
Como consecuencia, el muestreo cualitativo es evidentemente flexible, tentativo
y hasta provisional. Tiene un diseño inicial aproximado que debe estar listo para
ser alterado si es necesario: pueden seleccionarse unidades no previstas o com
pletar el muestreo con casos de confirmación, casos críticos o casos desviantes, o
puede cerrarse o restringirse el muestreo tanto en casos como en dimensiones.
Aunque este tipo de selección muestral parece a priori más sencilla, cerrar un
diseño muestral cualitativo no necesariamente es más manejable. Gran parte de los
problemas que atraviesa el muestreo cuantitativo también se plantean en el mues
treo cualitativo porque todos los demás aspectos de la investigación condicionan
estas fases y tareas. El grado de experiencia profesional necesaria para realizar un
diseño competente puede ser también un factor decisivo y los recursos centrales.
Aquí también esa diferencia entre la investigación bajo demanda frente a la investi
gación más académica suele ser muy importante.
Los estudios cualitativos llevados a cabo de modo más personal por un sujeto
investigador, más comunes en el uso académico, obligan a diseños muéstrales más
88
Identificando a la población a analizar
reducidos en dimensiones pero más dilatados en el tiempo. Otra cuestión muy liga
da a la selección muestral es el tipo concreto de diseño: las opciones son distintas,
y el proceso también, cuando se trata de una investigación documental o mediante
entrevistas o mediante observación, y algunas de estas especificidades las veremos
en el capítulo de creación de información. También la proximidad necesaria para el
análisis cualitativo hace muy complicado separar las tareas de muestreo de las de
análisis, por lo que la implicación del sujeto investigador en el muestreo debe ser en
principio más constante a lo largo del proceso de investigación. Esta separación de
tareas puede resultar hasta inconveniente, ya que en numerosos estudios cualitati
vos no se fija a priori la muestra de informantes, sino que esta se va conformando a
medida que se va recabando y analizando la información por la necesidad de nuevas
búsquedas de información o de ampliar y profundizar en esta con la incorporación
de nuevas fuentes de información (individuos, documentos, etc.). Más adelante se
verán de nuevo modos de muestreo concretos para diseños cualitativos específicos.
2.3.1. Estrategias y criterios de selección muestral
Recientemente, Fatton (2015, 264) ha revisado su lista de estrategias concretas de
muestreo para investigación cualitativa y considera hasta cuarenta distintas que
van desde los estudios de caso único hasta los estudios multimétodo que anida» las
muestras cualitativas en las cuantitativas. Esta exhaustiva clasificación contempla
todo tipo de investigaciones en muchos campos científicos y algunas de orientación
muy específica (las evaluativas, sobre todo), pero precisamente refleja lo abierto
de la cuestión y la enorme cantidad de factores que contribuyen a decidir el tipo de
selección muestral conveniente a cada investigación.
Pensando en los diseños cualitativos más habituales en investigaciones sociales
(por entrevistas individuales o grupales, observación y análisis de documentos), se
reconocen sobre todo los muéstreos «por características grupales», como el men
cionado muestreo de cuotas o la selección de informantes-clave, o de casos típicos,
pero también se expone la utilidad de seleccionar muestras compuestas a base de
maximizar la heterogeneidad de los elementos, o bien de lo contrario, las muestras
que acentúan la similitud u homogeneidad de los casos.
La diversidad de las estrategias expuestas refleja una de las componentes críti
cas dentro de los estudios cualitativos, que consiste en elegir entre amplitud y pro
fundidad. Podemos analizar muchos casos en menos aspectos o menos casos con
mayor profundidad. Según esto, la riqueza de la información que buscamos y tam
bién el tipo de unidad de análisis nos llevará a unos diseños muéstrales o a otros.
Otro grupo de estrategias importantes son las del muestreo teórico y conceptual
que busca seleccionar casos que ilustren algún constructo teórico de interés. En
una orientación más deductiva de este muestreo, primero se elige el concepto (den
tro de una orientación teórica), luego se analiza en qué tipo de unidad de análisis
tiene sus manifestaciones observables, y sobre ese tipo de población se seleccionan
89
La investigación como proceso
casos. La versión inductiva es lo que la teorización de la grounded theory (Thorn-
berg y Charmaz, 2014, 155) definen como muestrear sobre la base de conceptos y
teorías emergentes para primero explorar cómo varían y seguir muestreando para
mantener las comparaciones necesarias y la verificación de la teoría emergente. Es
un trabajo de campo permanentemente abierto dentro de su método de compara
ción constante.
En este mismo sentido de apertura y provisionalidad se sitúan también otras
estrategias de muestreo interesantes donde la muestra se va construyendo durante
el trabajo de campo: bola de nieve, muestreo de oportunidad, de fenómenos emer
gentes, etc. Como dice Patton:
«el tipo de muestra que se seleccione debería ser resultado de y respaldar la investi
gación sobre las preguntas que se plantean. El propósito de una muestra intencional
es centrar la selección de casos estratégicamente, en línea con el objetivo de investi
gación, las preguntas iniciales y los datos que se recojan» (Patton, 2015, 265).
Partiendo de la base de que todo muestreo cualitativo sigue básicamente alguna
forma intencional de método de muestreo, Valles recapitula las principales conside
raciones acerca de las decisiones muéstrales a través de varios «criterios maestros»
para el muestreo cualitativo (Valles, 2000, 66) de los que destaca como principales
«la heterogeneidad y la economía». En principio, una muestra cualitativa debe aten
der sobre todo a reflejar la variedad de miradas, discursos, posiciones, aspectos, etc.,
de los objetos de investigación. Sin embargo, en la práctica no es posible (y tampoco
necesariamente deseable) intentar captar toda la heterogeneidad pensable, así que
otros criterios relacionados con la utilidad previsible de la información a obtener
deben orientar también las decisiones. Entre estas, las cuestiones realmente prag
máticas relativas a recursos, pero también la accesibilidad o disponibilidad de las
unidades a seleccionar, así como el grado de competencia narrativa atribuido o la
apertura a la investigación. La idea base sería que, dentro de lo posible, es preferible
elegir aquellos sujetos informantes/casos que tienen información más rica y están
en mejor disposición práctica para ofrecerla.
La flexibilidad como característica básica del muestreo cualitativo se traduce
tanto en el diseño (abierto y flexible) como en la ejecución (continua), con lo cual el
criterio fuerte de las decisiones muéstrales debe ser conceptual. El principio de sa
turación teórica extendido desde la grounded theory (Glaser y Strauss, 1967) refleja
esa idea de que son la extensión, calidad y profundidad de la información recabada
las que guían el alcance de una muestra. Si solo se deja de muestrear cuando se ha
alcanzado la riqueza de información, estamos ante un muestreo secuencial, iterati
vo o emergente.
A efectos prácticos, no obstante, casi nunca es posible dejar de planificar el
muestreo y por eso hay que concretar algo factible en términos de representati-
vidad. La meta sería conseguir con la muestra una representación tipológica de la
población, coherente con los objetivos de la investigación. En principio hay que di-
90
Identificando a la población a analizar
señarla intentando prever que la muestra recoja las variaciones suficientes como
para reflejar la mayor riqueza de contenidos posible en aquello que es relevante
para la investigación. Para ello, se propone algún tipo de clasificación característica
que luego se traslada a un «casillero tipológico» donde se ubican los elementos de
la muestra (Valles, 1997, 93).
Elegir casos debe basarse en un compromiso entre la variación y la tipicidad,
que pasa por conocer algunas características de las poblaciones y los casos mues-
treables. Si se trata de poblaciones más generales (poblaciones objeto de estudio
por género/edad o lugar de residencia) o poblaciones más específicas (sujetos con
sumidores de un producto, profesionales de una actividad, personas afectadas por
un problema, etc.), necesitaremos informantes con mayor o menor cualificación e
incluso con un nivel mayor o menor de «implicación» con la investigación.
En un estudio sobre los procesos de innovación tecnológica en las pequeñas y
medianas empresas industriales (Olazaran, Albizu y Otero, 2008) se seleccionó una
muestra de 47 pymes guipuzcoanas donde se llevaron a cabo otras tantas entre
vistas en profundidad semi-estructuradas con directores de 1+D u oficina técnica
y gerentes. La muestra se constituyó «tomando como referencia cómo es la pyme
industrial estándar guipuzcoana» (2008, 65), y a tal efecto se consideraron criterios
iniciales como la pertenencia a los sectores más representativos de esta industria
o la accesibilidad identificada a través de contactos previos del grupo de investiga
ción. A partir de aquí se exploró la variabilidad abarcable en diversas característi
cas y la representatividad tipológica clave surgió del cruce de los tamaños con el
nivel tecnológico de la actividad de la empresa, como se recoge a continuación en
el cuadro 2.9.
*
Cuadro 2.9: Un ejemplo de muestra cualitativa para entrevistas individuales.
Casillero tipológico de una muestra de pymes industriales
Tamaño (n.^ empleados)
51- 151-
Hasta 50 150 249 Total
Alto 1 2 1 4
..... .... .......................
Nivel Medio-alto 12 12 5 29
tecnológico
Medio-bajo y
bajo 5 6 3 14
Total 18 20 9 47
Fuente: Olazaran, Albizu y Otero (2008)
91
La investigación como proceso
Otras reflexiones relevantes sobre el muestreo cualitativo aluden a otras carac
terísticas de los estudios que inciden directamente en la selección muestra, como
es la pregunta «¿cuántas veces? ». Es decir, en muchas ocasiones no se trata solo de
pensar en las unidades a captar, sino en cómo se pretende llevar a cabo el proceso
de obtener de estas la información o el discurso suficientemente rico. Si al final la
re-observación se considera un aumento de muestra, hay que tenerlo en cuenta en
la selección, y esto es bastante habitual en estudios etnográficos y fenomenológicos.
Otro caso que ilustra la selección cualitativa y considera algunos factores dife
rentes de captación de la diversidad y profundidad puede ser el de la muestra para
un estudio bajo un diseño Delphi. En un estudio sobre violencia en el deporte (Is-
pizua, 2014; Ispizua y Campelo, 2014) desde la perspectiva de «personal experto»
de los distintos ámbitos del mundo de deporte en el País Vasco, hubo que abrir bas
tante la selección a los varios escenarios desde los que las experiencias se podían
considerar pertinentes. Así a priori se establecieron tres grandes categorías de po
tenciales informantes: deportistas o ex deportistas, periodistas especializados/as
en deporte de diferentes medios de comunicación y sujetos entrenadores, árbitros
o técnicos. Dentro de esta clasificación se fijó que hubiera representación de ambos
sexos, y en los casos de deportistas y personal técnico, que hubiera representación
de diferentes deportes (colectivos e individuales) y categorías (profesionales, se
gunda división, comarcales, juveniles, etc.).
Esta muestra de sujetos expertos se construyó sobre una amplia variedad de
deportes (artes marciales, atletismo, baloncesto, balonmano, béisbol, ciclismo, fut-
bito, fútbol, hockey hierba y patines, pádel, pelota, piragüismo, remo, rugby, tenis,
waterpolo y deporte adaptado), aunque con una buscada sobre-representación de
individuos jugadores de fútbol, por ser este el deporte más mediático, al que los
medios dedican más espacio y en el que en opinión de la población vasca se dan
más acontecimientos violentos a todos los niveles: desde el escolar hasta el de élite.
También se abarcaron casi todos los niveles de práctica deportiva, desde amateur
hasta las primeras divisiones nacionales (de fútbol, hockey, artes marciales) e in
cluso contando con personas que habían llegado a competir en mundiales, otros
encuentros internacionales y olimpiadas.
Una característica singular de este muestreo fue que las personas seleccionadas
eran capaces de contribuir a la vez desde diferentes perspectivas, lo cual ayudaba
a cubrir los campos y escenarios pensados inicialmente: las personas relacionadas
con el mundo del deporte normalmente lo están desde diferentes ámbitos, simultá
neamente o en diferentes momentos vitales. De este modo, personas que han sido
deportistas de élite después trabajan en puestos técnicos o como comentaristas de
medios de comunicación, o personas que practican deporte a alto o medio nivel a la
vez entrenan a equipos de categorías inferiores o se dedican al arbitraje.
En los Delphi, los contactos con las personas accesibles que cumplen con los
requisitos básicos se pueden ir realizando por distintas vías, pero en este caso se
solicitó la colaboración por conversación personal con el equipo investigador y pos-
92
Identificando a la población a analizar
teriormente se enviaron los protocolos de recogida de datos por correo electróni
co. Tras comenzar con una lista de 100 personas como potenciales informantes se
pudo enviar el cuestionario a 75 de ellas, y tras cuatro intentos sucesivos, se consi
guió una muestra de 50 individuos expertos representantes del mundo del deporte,
con los cuales se completó el estudio sobre violencia en el deporte (Ispizua, 2014;
Ispizua y Campelo, 2014).
Otro ejemplo interesante puede ser el de algunas investigaciones realizadas por
el C1S con grupos de discusión y cuyo diseño muestral se explica en las fichas técni
cas y en las notas metodológicas también accesibles. En la ficha técnica del estudio
2.863 sobre la corrupción política en España de 2011 se detalla la composición de
los siete grupos de discusión que se realizaron para
«conocer las actitudes y percepciones de la población española hacia la ética en el
ámbito público y la corrupción (...) la imagen de la política y los/as políticos/as, en
el funcionamiento y la calidad de la democracia y en el problema concreto de la co
rrupción, para evaluar dónde parece estar el origen del problema, y cuáles los efectos
(políticos) o sensaciones que genera sobre el ciudadano/a» (C1S, 2011).
La composición de estos grupos ilustra la combinación secuencial de criterios de
accesibilidad y heterogeneidad tanto a los contextos como a los casos:
«se llevaron a cabo siete reuniones de grupo atendiendo a varios criterios. Por un
lado, que se tratase de una gran ciudad, por encima del medio millón de habitantes;
y por otro, que en los últimos años hubiera tenido algún acontecimiento o caso de
corrupción política en ámbitos cercanos. Asimismo, se intentó que estuvieran estruc
turalmente representadas las posicione^más relevantes de los sectores medios de la
sociedad española» (GIS, 2011).
En consecuencia, cada grupo se consigna por la ciudad (Madrid, Barcelona, Valencia
o Málaga), el segmento de edad (con variaciones entre los 20 y 65 años) y por la
condición socio-ocupacional, como se refleja en el cuadro 2.10.
No hay otro modo de practicar el muestreo cualitativo que aprender de ejemplos
disponibles y de la reflexión que conllevan. Para ello es imprescindible explicitar al
máximo el «proceso» por el que se llega en cada caso a diseñar un muestreo u otro.
Cuanto más sepamos cómo se conectan los objetivos de una investigación cualitati
va con la definición de la población o poblaciones y su accesibilidad en un contexto
de investigación determinado, mejor entenderemos las decisiones muéstrales que
se pueden tomar. Como trataremos con algo más de detalle en el próximo capítulo,
el Centro de Investigaciones Sociológicas ha incorporado también a su oferta abier
ta de datos las transcripciones de entrevistas individuales y grupos de discusión
realizadas para diversos estudios cualitativos, en algunos casos con unos informes
metodológicos más o menos breves en que se comentan incidencias de diseño y
ejecución, así como algunos resultados.
93
La investigación como proceso
Cuadro 2.10: Un ejemplo de muestra cualitativa para grupos de discusión.
Reuniones de grupo para estudio La corrupción política en España (CIS, 2011). Ficha
técnica:
«Reunión de grupo 1 (RG1): Grupo de amas de casa, 50 años a 60 (compañeras de
empleados y funcionarios con empleados bajo su responsabilidad, de técnicos medios).
Lugar de realización: Valencia.
RG2: Grupo de jóvenes ya licenciados, ocupados (primer empleo, becas, etc.; la mitad, al
menos, en empleos precarios) de 25 a 35 años. Lugar de realización: Madrid.
RG3: Grupo con un carácter "funcionarial", clases medias funcionariales: empleados-
técnicos medios de grandes empresas: banca, seguros, etc.), excluyendo empleados de las
administraciones públicas. Edad entre 35 y 45 años. Lugar de realización: Málaga.
RG4: Grupo de jóvenes estudiantes de Universidad (mitad de participantes de ciencias,
mitad de participantes de humanidades) de 20 a 26 años (algunos tengan becas y
compatibilicen con alguna ocupación). Quedaron excluidos estudiantes de sociología,
ciencias políticas o psicología. Lugar de realización: Valencia.
RG5: Grupo dedicado al sector servicios (pequeña burguesía patrimonialista: pequeños
empresarios tradicionales, poseedores de comercio, etc.) de 55 a 65 años de edad. Lugar
de realización: Madrid.
RG6: Obreros sector industrial (metal, químicas) (la mitad de los participantes empleados
por grandes empresas, la otra mitad de los participantes autónomos dependientes en el
sector) de 30 a 40 años de edad. Lugar de realización: Barcelona.
RG7: Profesionales liberales ya asentados (abogados, economistas, médicos), de 45 a
55 años de edad, con la excepción de sociólogos, politólogos o psicólogos. Lugar de
realización: Barcelona»
Fuente: CIS (2011).
2.3.2. El tamaño de la muestra
Se suele decir que las muestras cualitativas son relativamente pequeñas, pero en
realidad esto solo parece así si se comparan con las muestras de los estudios cuan
titativos que buscan representatividad estadística y generalización de resultados.
Todo el diseño de las investigaciones cualitativas se organiza alrededor de la bús
queda de variedad y riqueza suficiente en términos de información como para lle
var a cabo el análisis que requieren los objetivos. Por otra parte, normalmente hay
que tratar de cerca y en profundidad cada elemento de la muestra y dentro además
de un diseño abierto, lo que supone un trabajo intenso. Por todo ello, más muestra
no siempre mejora la comprensión y la interpretación de los fenómenos que se es
tudian, pero ciertamente consume recursos. En investigación cualitativa se suele
trabajar con menos sujetos/casos de los que constituirían una muestra estadística,
si la población objeto de estudio fuera la misma.
94
Identificando a la población a analizar I
El hecho es que no solo no hay fórmula para calcularlo, sino que «no hay re
glas para el tamaño de muestra en la investigación cualitativa» (Patton, 2015, 311).
Como es fácil experimentar, si a los equipos investigadores cualitativos más exper
tos se les pregunta cómo saber cuánta muestra se necesita para un estudio cuali
tativo, lo normal es que respondan algo como «depende» (Baker y Edwards, 2012,
3). Y ciertamente depende de muchos elementos, internos y externos, de la inves
tigación. Por supuesto, de las preguntas de investigación, del tipo y extensión de la
población a muestrear, de las técnicas de recogida de datos previstas. Pero también
de los recursos disponibles y hasta de la experiencia de los investigadores, ya que
estos pueden entender de distinto modo cuándo se ha alcanzado la saturación in
formativa y se puede dejar de muestrear.
Por ejemplo, los estudios mediante entrevistas individuales en profundidad pre
sentan más alternativas de planificación que los basados en grupos de discusión,
ya que estos últimos requieren más trabajo previo de organización. Si se trata de
informantes-clave o informantes pertinentes, se puede entrevistar a menos por
que previsiblemente se alcanzará antes la saturación, pero también, al ser de algún
modo expertos o imprescindibles, pueden resultar de más difícil acceso. Otros dise
ños que condicionan mucho las decisiones muéstrales son los que incluyen tomar
medidas repetidas a los mismos sujetos (estudios longitudinales): observaciones
sistemáticas o entrevistas individuales en un periodo de tiempo permiten selec
cionar a priori menos casos, ya que se prevé obtener más información de cada uno.
También la diferenciación de ámbitos científicos es importante porque las prác
ticas pueden variar bastante. En el campo de los estudios de mercado, por ejemplo,
hay menos ambigüedad a la hora de decidir diseños, y de hecho pueden clasificar
los estudios por las muestras cualitativas como investigaciones pequeñas, de ta
maño medio o a gran escala (Martínez, 2008). Si se trata, por ejemplo, de estudios
basados en entrevista individual, el tamaño medio suele ser de entre 20 y 30, y si
hablamos de grupos de discusión, de siete u ocho personas, la investigación-tipo
sería de muestra algo mayor con entre cuatro y seis grupos. En un estudio (cuanti
tativo) sobre 560 tesis doctorales cualitativas, Masón (2010) descubre muestras de
entre 1 y 95 casos con tamaño medio 31, y las más comunes de 20 o de 30 unidades,
y recapitula otras diversas propuestas de concretar tamaños de muestras.
En la investigación académica, acogerse al principio de flexibilidad en el diseño
muestral afecta no solo al método de muestreo, sino al tamaño final de la muestra.
Esto presenta problemas importantes para solicitar y conseguir financiación. Tam
bién implica consecuencias para la evaluación ética de los proyectos: dejar muy
abierto con qué perfil de sujetos se va a trabajar y cómo se van a ir seleccionando,
encontrando o descartando no suele ser bien recibido por los comités de ética de
la investigación.
Patton también habla de varios estudios con «muestras cualitativas grandes»
(2015, 313) de entre 60 y 100 casos, aunque también dice que hay mayores. Pero
sobre todo recomienda proyectar una muestra mínima de partida y dejar el pro-
95
La investigación como proceso
ceso lo suficientemente abierto como para poder tomar las decisiones muéstrales
pertinentes a la luz de las evidencias conseguidas: ampliar la muestra inicial, si no
se ha conseguido información suficiente, o recortarla si se han alcanzado antes los
objetivos.
En un estudio en que se parte un diseño completamente abierto se puede llegar
a una muestra considerablemente extensa
«se optó por realizar entrevistas en profundidad a mujeres marroquíes que hubieran
conseguido (satisfactoriamente] su inserción en la comunidad (...) No se partió de
ninguna muestra previa, al seguir los parámetros del muestreo teórico, de manera
que se estuvo recogiendo información hasta alcanzar la saturación teórica. La bús
queda era constante y guiada por un objetivo: hallar regularidades y diferencias en
torno a las biografías de las mujeres marroquíes que habían conseguido la inserción
en el espacio (...) El proceso de saturación teórica concluyó con la realización y aná
lisis de un centenar de entrevistas y con la construcción de seis historias de vida»
(Soriano, 2006,174-175).
En otra investigación también académica se dio más importancia a las cuestiones
prácticas de accesibilidad, jun^j con una especificación más clara de la tipología a
representar, dado un mayor conocimiento previo del contexto. La investigación con
tinuaba un estudio anterior sobre la transmisión de valores en el contexto escolar, y
se realizó mediante un estudio concreto sobre las percepciones del alumnado y sus
familias acerca de este proceso de transmisión de valores en la escuela (Usategui
y Del Valle, 2009). Para este estudio se definieron dos universos: uno, el alumnado
de Educación Primaria (5S y 6e) y de la ESO matriculados en centros educativos de
Vitoria-Gasteiz en 2008; el otro, sus progenitores. Las percepciones analizadas se
obtuvieron mediante la realización de grupos de discusión: 12 grupos de alumnado
desarrollados en otros tantos centros escolares (con la participación final de 96
estudiantes) y otros cinco grupos (con siete personas por grupo) de padres y /o ma
dres. En la elección y composición final de ambas muestras y en la organización de
los grupos de discusión se atendió a las características de los centros, niveles edu
cativos y modelos lingüísticos, así como a características de las poblaciones como
el equilibrio por género (en ambas) y el nivel de participación en las asociaciones
de madres y padres de alumnos (para la muestra de progenitores). En el caso de la
muestra de estudiantes, se puede decir que la primera selección fue la de centros,
los cuales pasaron a ser casos, mientras que para la muestra de padres y madres,
se realizó una contactación directa a través de una empresa que proporcionó los
perfiles diseñados.
Entendido como un proceso abierto y flexible de selección muestral, incluso se
pueden combinar muchas estrategias diversas a lo largo de la vida de un proyec
to, como lo describe Rapley en un ejercicio muy interesante (2014): comenzar casi
como un estudio de caso único (intenso, típico o crítico), pasar por comparaciones
intermedias, dejar que los conceptos, los acontecimientos o factores externos apor-
96
Identificando a la población a analizar
ten nuevas facetas y participantes hasta completar la que teórica y conceptualmen
te puede ser una muestra cualitativa que aporte información rica y de calidad a los
objetivos de investigación propuestos.
2.3.3. Credibilidad y transferibilidad
«Sencillamente, el muestreo importa de verdad (...) Sobre todo, el muestreo nunca
debe ser producto de decisiones ad hoc ni dejado exclusivamente al azar. Necesita
ser meditado y riguroso» (Rapley, 2014, 49). En definitiva, el muestreo cualitativo
es siempre problemático en la medida en que tiene que contener flexibilidad su
ficiente y a la vez ser mínimamente planificable con vistas a prever cierta calidad
de las evidencias conseguidas en términos de «representatividad». Como hemos
señalado, tampoco en estudios cuantitativos la representatividad de las muestras
es una cuestión absoluta, sino todo lo contrario. Además, es todo el desarrollo del
proceso de investigación el que redefine hasta qué punto una muestra final puede
considerarse cabalmente representativa de una población y con arreglo a unos ob
jetivos de investigación.
En los diseños cualitativos, la representatividad conecta más con la credibili
dad de todo el diseño y con la calidad de la información que con la posibilidad de
generalizar resultados más allá de la evidencia empírica conseguida. Estos son al
gunos de los elementos básicos de la consistencia científica de los diseños cualita
tivos. El término «transferibilidad» extendido por Guba y Lincoln (1989) alude a
la capacidad del diseño muestral generado de producir resultados de algún modo
transferibles más allá del estudio concreto que sirvió para generarlos. Por ejemplo,
las muestras del estudio de valores no son propiamente representativas de las po
blaciones concretas de alumnados y progenitores de las que se obtuvieron, pero el
estudio de las evidencias que proporcionaron puede aportar conocimiento sobre
otros contextos escolares equivalentes. Sin entrar en las diferencias que proceden
de aproximaciones teóricas diversas, se puede entender que, al razonar y justificar
al detalle cómo se ha llegado a construir la muestra con que se ha trabajado, se
sientan las bases mínimas para establecer si los hallazgos que aporta un estudio
son aplicables o extensibles a otros casos. La reflexión constante acerca de cómo
seleccionamos y cómo accedemos no solo a poblaciones, sino a contextos, aconteci
mientos, procesos, debe contribuir a la credibilidad de todo el diseño.
La credibilidad de la investigación cualitativa (en sentido amplio) se sostiene en
todos sus diversos aspectos pero, vista desde esta cuestión de la selección mues
tral, algunos controles importantes serían: reconocer la propia subjetividad como
potencial fuente de sesgo en la selección y explicitar todas las decisiones metodo
lógicas de selección de casos que permitan a otros investigadores ver cómo pudo
llegarse a conclusiones.
97
3. E X P LO R A N D O LA IN FO R M A C IÓ N
E X IS T E N T E
Después de haber especificado las cuestiones relativas al muestreo de poblaciones
p.u <i investigaciones en las que la información principal ha de obtenerse de primera
mano, volvemos a unas fases de decisión que pueden ser incluso anteriores, para
abordar un tema de importancia creciente en la investigación social: el uso de infor
mación secundaria como componente básica y /o complementaria de la estrategia
y diseño de la investigación.
La información secundaria como componente básica de una investigación nos
lleva a un tipo de diseño específico (análisis secundarios o desk research) que,
aunque de larga tradición en la investigación social, está adquiriendo relevancia
creciente gracias a las posibilidades que le dan las nuevas tecnologías en cuanto
a acceso a información diversa y en cuanto a su tratamiento masivo. Por otra par
te, el recurso a la información secundaria como auxiliar o contextual en las fases
pieparatorias de la investigación forma parte también del propio proceso de in
vestigación (véase cuadro 1.1), tanto en las investigaciones académicas como en las
investigaciones bajo demanda. Al abordar toda nueva investigación es pertinente
conocer el «estado de la cuestión», ya sea desde una perspectiva más teórica como
más aplicada, según sea necesario. Como hemos expresado anteriormente, no hay
t< mas o diseños de investigación tan nuevos que no haya referencia de conocimien
to ninguna en que basarse para centrar otra investigación.
Lstu doble vertiente justifica intentar abordar algunas cuestiones prácticas con
relación a la información secundaria en las investigaciones sociales ya que, en de-
La investigación como proceso
finitiva, se trata de un recurso imprescindible en todo tipo de investigación, sea
cual sea su orientación metodológica y características concretas. En este capítulo
se mencionan los principales tipos de fuentes de información secundaria y se desa
rrollan particularmente los usos secundarios de las fuentes bibliográficas y de los
bancos de datos.
loda investigación conlleva un trabajo sistemático y riguroso de obtención de
información necesaria y suficiente sobre los diversos aspectos de cada objeto de es
tudio, así como del contexto en el que se desarrolla. «Conviene tener claro qué tipo
de información necesitamos para afrontar el análisis de la realidad, qué caminos to
mamos para buscarla, cómo la recogemos y cómo la producimos (...) El investigador
solo dispone de dos formas de obtener datos: o bien los recoge, o bien los produce»
(Alguacil, 2011, 57).
Hay ocasiones en que no existe información lo suficientemente extensa y /o vá
lida para describir o interpretar una realidad directamente a partir de ella y, sin
embargo, encontramos que otros equipos investigadores han elaborado o disponen
de información útil para explicar, interpretar o comprender nuestro objeto de in
vestigación. En este segundo caso, se trata de realizar un acercamiento que permita
recoger y analizar los datos y portaciones tomados de investigaciones o publica
ciones realizados por otras personas y equipos de investigación.
En este momento, información y datos son dos términos equivalentes que pue
den servir para cubrir el espectro amplio de búsqueda de evidencias y de resulta
dos que pueden ser relevantes para llevar a cabo un proyecto de investigación. Pero
ahora nos fijamos en la información a la que solemos referirnos como «datos secun
darios» y que en principio es la que ha sido construida de modo ajeno a una inves
tigación concreta, no por los propios sujetos investigadores. En principio, por tanto,
información secundaria en cada investigación es simplemente información que no
ha sido «creada» ex-profeso por quienes realizan esta investigación en concreto,
sino que es información que «existe» aparte e independientemente de que interese
a la investigación o al equipo investigador. Aunque el término «secundarios» es el
más extendido, también se les han denominado datos «situacionales» o «indirec
tos» (O'Leary, 2014, 243), o bien «no interactivos» (Curtis y Curtís, 2012, 224), en la
medida en que el sujeto investigador no crea los datos, sino que los (literalmente)
recoge, puesto que han sido creados y almacenados por otras personas.
A priori, mencionar así la información potencialmente disponible o existente
para una investigación es tanto como decir toda la información. Por eso, para po
der centrar los aspectos de interés practico respecto al uso de información y fuen
tes secundarias en la investigación social, deberemos apuntar brevemente algunas
cuestiones sobre la procedencia y la construcción de datos en general, volviendo a
la misma finalidad de la investigación y a la visión del proceso completo. Es impor
tante entender que los datos se construyen y que pueden crearse de diferente modo
dependiendo del sujeto investigador, pero fundamentalmente de los objetivos del
pioyecto, de la población objeto de estudio, del modo en que se ha planificado ac-
100
Explorando la información existente
ceder a las evidencias y, en general, casi de cualquier aspecto de la investigación
((juinea-Martín, 2012). En el capítulo 4 volveremos de modo más concreto sobre
estas cuestiones de operacionalización y medición para la construcción de la infor
mación.
Considerando la información secundaria en toda su extensión, este tipo de evi
dencia empírica tiene en principio unas utilidades amplísimas. Puede ser desde un
recurso para la descripción de un estado de la cuestión que investigamos (resulta
dos de estudios anteriores), pasando por una fuente imprescindible para estudiar
las poblaciones o seleccionar muestras (bases de sondeo y bases complementa
rias), hasta llegar a ser el fundamento de un tipo de diseño completo en investiga
ción social. Por todo ello será fundamental resolver cuestiones relativas a la conve
niencia del uso de información secundaria en cada investigación, considerando que
parte de la decisión de qué información buscar y utilizar dependerá del tema y la
finalidad de la investigación, así como del punto de partida teórico y los recursos
disponibles.
De hecho, toda la información existente referente al tema de estudio resulta de
gran utilidad e importancia en las fases iniciales de cualquier investigación (tanto
como base teórica como aportando información cuantitativa que permita la des
cripción del fenómeno y población a analizar). También resulta especialmente inte
resante la posibilidad de realizar nuevos análisis e investigaciones sobre los datos
ya existentes que han sido analizados por otros equipos investigadores, incluso con
distinta finalidad.
Si bien el re-análisis de datos como replicación de otras investigaciones no es
demasiado frecuente, el análisis secundario de datos y documentos no creados de
primera mano es muy habitual en muchas áreas de la investigación social gracias,
sobre todo, a las crecientes mejoras en el acceso a la información. Por ejemplo, se
puede apreciar el uso de series temporales de datos procedentes de encuestas y
barómetros del CIS o de otras fuentes equivalentes que los ofrecen de modo abierto
en los resultados de investigación reflejados en muchos artículos científicos. Por
seleccionar un caso, estas series del CIS, junto con la comparación internacional a
través de datos de varias oleadas de la Encuesta Social Europea, sirven para realizar
análisis estadísticos propios al objeto de responder a la pregunta «¿cuáles son las
opiniones y actitudes de los ciudadanos españoles sobre la educación y el siste
ma de enseñanza?» (Caínzos, 2015, 121). Además de tratar su objetivo temático,
este artículo alude a la selección y la evaluación metodológica de la adecuación de
los datos ajenos a las necesidades del análisis propio, y con ello abarca cuestiones
centrales sobre los datos secundarios: continuidad de las series temporales, efec
tos de diseño de cuestionario o «efecto encuestador» y, lo que es más importante,
la construcción de indicadores distintos para los mismos conceptos y su posible
comparabilidad. Es por todo esto que la utilización de datos secundarios requiere
una atención especial en la planificación de cualquier investigación: «los datos son
siempre el resultado de una recolección activa y dirigida, que los condiciona y da
101
La investigación como proceso
forma, y la interpretación está siempre condicionada por los conocimientos y las
experiencias previas del investigador» (Mezo, 2015, 508).
A lo largo de toda la historia de la investigación social han existido datos creados
por unos grupos científicos en ciencias sociales y que han sido puestos a disposi
ción o han podido ser utilizados por otros sujetos investigadores. Es conocido el he
cho de que hasta el siglo XIX la mayoría de las investigaciones sociales se realizaban
mediante la utilización de datos secundarios, siendo la mayor parte de estos datos
administrativos oficiales, recogidos por diferentes instancias de la administración
(claro ejemplo de esto lo constituye el estudio El Suicidio realizado por Émile Dur-
kheim). Es en el pasado siglo XX, y sobre todo a partir de la Segunda Guerra Mun
dial, cuando comienzan a completarse los datos oficiales con encuestas realizadas
por empresas. Estas encuestas trataban sobre todo de incluir información prima
ria de los aspectos más personales y subjetivos no recogidos hasta entonces. Pero
en realidad la aparición de estas encuestas privadas facilitó aún más la utilización
de datos secundarios, puesto que se comenzaron a generar archivos en los que se
guardaban tanto los resultados como las especificaciones metodológicas, así como
los datos originales para su utilización por otros equipos de investigación.
De hecho, además de los prqpios datos, muchas cuestiones metodológicas relati
vas a las encuestas también quedaban recogidas y a disposición de los investigado
res (cuestionarios, procesos de construcción de muestras, explicación de indicado
res, e incluso datos agregados del entorno en el que se desarrolló la investigación).
La gran ventaja de todos estos archivos fue que permitían realizar explotaciones
comparadas y, sobre todo, la replicación completa de las investigaciones.
Pero la relevancia del conocimiento y manejo experto de la información secun
daria es hoy día especial dada la evolución que ha seguido la producción y, en gran
medida, debido al fácil acceso a la información que permiten y promueven las nue
vas tecnologías, teniendo estas gran repercusión tanto en lo referente a la cons
trucción como al análisis o la transmisión de la información. Lógicamente todo esto
hace que los datos secundarios presenten grandes ventajas, como son la posibilidad
de comparar datos actuales con datos del pasado, así como comparar los resultados
de nuestra investigación con grupos y sociedades no directamente accesibles.
Un ejemplo de utilización complementaria de fuentes secundarias de diverso
tipo es el estudio sociológico dirigido por Víctor Pérez-Díaz y )uan Carlos Rodríguez
para la fundación Europea Sociedad y Educación (2013) acerca de las percepcio
nes sociales sobre E l prestigio de la profesión docente en España. La investigación
se basa en una encuesta telefónica específica realizada en 2012 a una muestra de
población general residente en España (mayores de edad). En el informe final de la
investigación hay un primer capítulo de «contexto» en el que se especifica el estado
de la cuestión sobre el tema de la investigación mediante el habitual esquema de
análisis secundario, seleccionando, relacionando y comparando aquellos datos e
informaciones de interés. En ese capítulo se utilizan diversos tipos de documentos
publicados y fuentes de datos estadísticos de organismos nacionales e internacio-
102
Explorando la información existente
nales, barómetros del CIS, informes de la Comisión Europea, ejemplares del Diario
Oficial de la Unión Europea, informes de Eurostat, datos y estadísticas del INE, in
formes estadísticos del Ministerio de Educación, Informes de la OCDE (incluyendo
los informes PISA y otros) y de la UNESCO, así como de otras agencias. También se
utilizan resultados de otras investigaciones realizadas en el ámbito académico, pero
también firmados por empresas de estudios de opinión y mercado.
Aunque el grueso del informe de investigación está dedicado al análisis e inter
pretación de los datos primarios de la encuesta, es interesante que en las referen
cias finales aparece precisamente una distinción entre «referencias bibliográficas,
fuentes primarias de datos y fuentes secundarias de datos» (Pérez-Díaz y Rodrí
guez, 2013, 101-103). Entre las fuentes primarias los autores cuentan con la en
cuesta realizada ad hoc, pero también con otras encuestas realizadas por el mismo
equipo y con las bases de datos de encuestas disponibles para explotación directa.
Las fuentes secundarias también incluyen distintos tipos de formatos (desde es
tudios del CIS y publicaciones de la OCDE o del INE u otras instancias e investiga
dores), con lo que ilustran claramente cómo el carácter secundario de unos datos
viene del uso que se haya hecho de las fuentes y la información que contienen en el
estudio en cuestión.
Ejemplos de investigación secundaria total son muchos informes de análisis tan
to comerciales como académicos que trabajan exclusivamente sobre los datos ya re
cabados por las empresas que los contratan, o procedentes de fuentes estadísticas o
encuestas y estudios ajenos. El Informe socioeconómico de la Comunidad Autónoma
de Euskadi 2012 (Eustat, 2012) es uno de estos últimos en que, con la participa
ción de varios investigadores e investigadoras del ámbito universitario, se lleva
ron a cabo hasta 16 diagnósticos temáticos (demografía, educación, capital social,
mercado de trabajo, vivienda, sociedad de la información, etc.) para presentar una
panorámica sobre la realidad social y económica de la sociedad vasca, con especial
atención al análisis de la evolución reciente. Todos los análisis se basaron en infor
mación de fuentes estadísticas, las del propio Instituto Vasco de Estadística (Eustat)
y también en información del INE y otras fuentes europeas. Este tipo de estudios
empíricos de «tendencias sociales» y de otras comparaciones espacio-temporales
serían imposibles sin recurrir a datos secundarios, como también se ha demostrado
recientemente con la última edición de Estructura social de España (CIS, 2015).
Ahora bien, la cantidad de información existente, así como el cada vez más fácil
acceso a ella, puede resultar un problema a la hora de establecer límites. Es impor
tante planificar la búsqueda de la información procurando que sea completa, pero
siendo conscientes de que es difícil llegar a una cobertura exhaustiva. La cada vez
mayor disposición de información de fácil acceso puede hacernos perder nuestro
objetivo principal y dispersar nuestros esfuerzos. Buscar de forma eficaz requiere
una sistematización y concreción de la búsqueda de información (Bell, 2002, 79).
Aun teniendo experiencia e ideas claras sobre la información que necesitamos, no
es fácil resolver estas cuestiones. Cuanto más avanzada sea la investigación, lógica-
103
La investigación como proceso
mente más tiempo y esfuerzo deberemos dedicar a la búsqueda de información se
cundaria, bien como base de nuestra investigación bien como complemento de ella.
Antes de entrar en otras especificaciones sobre el trabajo con datos secundarios,
recordaremos que la idea de «adecuación» de los datos tiene que ver directamente
con los procesos de creación de los mismos. Todos los datos se crean, y por datos
en investigación social entendemos cualquier tipo de información numérica, tex
tual o de otra forma material (imágenes) que puedan ser evidencia para un análisis
científico, 'lodos los datos se «crean» mediante la secuencia de operacionalización
y medición (véase cuadro 1.1). Básicamente se trata de identificar y definir aquello
que se quiere medir (los conceptos), acotarlo, descomponerlo en sus aspectos (si es
complejo o multidimensional) y traducirlo a indicadores finales que puedan apli
carse a la realidad y que generen así medidas (datos) sobre esos conceptos. Estos
procesos, sin embargo, no son en absoluto sencillos ni mecánicos en investigación
social, puesto que las realidades y fenómenos con que trabajamos son complejas
y muchas veces no son directamente observables ni, por tanto, mensurables. Como
hemos ido viendo en los capítulos precedentes, investigamos sobre actitudes (racis
mo), comportamientos (satisfacción visitando museos), percepciones (transmisión
de valores en la escuela), opiniones (sobre corrupción), experiencias (integración
de mujeres extranjeras) y todo eso no es «medible» de modo indiscutido. Por otra
parte, los distintos modos de aproximación a la realidad que representan las orien
taciones metodológicas entre lo cuantitativo y cualitativo también tocan de raíz la
consideración de las formas adecuadas de «medir» una realidad que no es externa
al mismo sujeto investigador.
Por lo general, el proceso de operacionalización de variables está bastante defi
nido o estandarizado, cuando se trata de medir en una aproximación cuantitativa,
porque siguiendo una tradición importante (Lazarsfeld, 1973; Stevens, 1946) se
recurre a la traducción empírica de los conceptos a unos pocos niveles de medida
distintos: nominal, ordinal, de intervalo y razón. Este sistema cubre los criterios de
medir en cada caso con exhaustividad, mutua exclusión y máxima precisión posible
según la naturaleza cualitativa o cuantitativa de las variables y, por tanto, de los
aspectos de la realidad a los que representan.
Este proceso ha de ser pensado, decidido y llevado a cabo cada vez que se quiere
medir algún aspecto de cualquier realidad social y, en ese sentido, genera datos
que, por tanto, se entiende que son creados. Son la operacionalización y medición
concretas en cada caso las que generan unos u otros datos y además en un contexto
determinado que también influye en las decisiones sobre medición (modos de apli
cación, tipo de población, recursos).
Esta aclaración previa es importante porque define los criterios de calidad por los
que se juzga la medición y los datos resultantes, que son los mismos que deben guiar
la búsqueda y utilización de datos creados por otros cuando se trabaja con informa
ción secundaria. Como también volveremos a ver en el próximo capítulo, fiabilidad y
validez, junto con la adecuación (en diversos sentidos) de la información secundaria
104
Exp lo ran d o la in fo rm ació n e xistente
a los objetivos de la investigación, son claves. La fiabilidad de los datos secundarios
reconoce que los indicadores de medida son consistentes y su validez reconoce que
los datos miden lo que realmente queremos medir.
¿Y la medición en las aproximaciones cualitativas? Una parte importante del im
pulso metodológico de la investigación cualitativa ha ido precisamente en la línea
del debate sobre cómo distanciarse de estos cánones cuantitativos y de proponer
otros caminos para asumir criterios de calidad en los procesos de generación de
conceptos. Como resume Valles (2005), estas no solo son cuestiones no definiti
vamente resueltas, sino que se manifiestan de modo recurrente en distintas apor
taciones: alguna forma de adecuación (validez), reproducibilidad (fiabilidad) y, en
definitiva, grado de credibilidad del acercamiento empírico a la realidad debe tener
la evidencia cualitativa, aunque no haya acuerdo sobre los modos específicos en que
debe manifestarse y evaluarse.
Por todo ello, en este capítulo vamos a repasar algunas clasificaciones y a reali
zar un recorrido práctico por las fuentes de información secundaria más útiles para
los investigadores sociales, tanto académicos como profesionales, fijándonos fun
damentalmente en los datos secundarios cuantitativos, aunque se haga referencia
también a fuentes secundarias de carácter cualitativo o documental.
3.1. Principales tipos de fuentes de información secundaria
Normalmente, cuando se trabaja con datos ya creados por otras instancias y con
tiñes diferentes a los que nos hemos podido fijar para una investigación concreta, se
habla de información de carácter secundario. Cuando un equipo investigador cons
truye sus propios datos, se habla de estudios con fuentes de información primarias
(o fuentes directas), creadas para la ocasión, para una investigación concreta. In
cluso, en este sentido más amplio, «se denomina análisis secundario a todo análisis
posterior del conjunto de datos existentes cuyas interpretaciones, conclusiones y
conocimientos adicionales son, o bien complementarios, o bien diferentes de los
que aparecen en el primer informe o en los principales resultados de la información
terminada» (Hakim, 1982, 1). Qué se entienda por «datos existentes» es la clave
para identificar las fuentes de información secundaria:
«Se considera que el investigador recoge los datos cuando estos están disponibles.
En este caso se trata de fuentes indirectas o secundarias, las cuales se refieren a todo
tipo de información elaborada por otros, sean investigadores o instituciones. Se trata,
por tanto, de todo tipo de bibliografía, documentos, registros, archivos o estadísticas,
tanto de naturaleza cuantitativa como de carácter cualitativo» (Alguacil, 2011, 58).
Como hemos expuesto en nuestro esquema general de tareas y fases (cuadro 1.1),
en prácticamente todas las investigaciones sociales, incluso en aquellas muy nove
dosas en las que el sujeto investigador tiene obligatoriamente que crear datos ad
105
La investigación como proceso
hoc, se plantea en las fases preliminares de exploración y diseño de la investigación
una búsqueda de información previa o contextual que puede llevar a la explotación
de información previamente existente en registros de distinto tipo. Se puede decir
incluso que cuando el uso de estas fuentes es exhaustivo o intensivo (para plantear
hipótesis o describir la población objeto de estudio) podríamos hablar de investiga
ciones de carácter «mixto», en cuanto al origen de las fuentes de información: que
utiliza tanto fuentes de datos primarias, creadas ex-profeso para la investigación,
como secundarias, creadas con anterioridad por otras personas o instituciones con
otros fines.
Como ya hemos afirmado anteriormente, la información proveniente de fuentes
secundarias puede ser tanto de carácter cualitativo (documentos) como cuantita
tivo (de tipo numérico), y además también suele clasificarse de diferentes modos,
haciendo referencia a diversas características que en cada estudio serán más o me
nos relevantes con vistas a su localización y uso. Vamos a repasar primero algunas
de estas clasificaciones para luego detenernos en la utilización práctica de algunos
de estos recursos.
3.1.1. Registros internos [Link]
En principio, al referirnos a fuentes secundarias asumimos algún grado de gestión
organizada de la información que incluyen, y por tanto, podemos ver la información
desde la perspectiva de quien la crea, recoge y gestiona. Según esto, podríamos ha
cer referencia a registros internos como:
Cualquier conjunto de informaciones que una institución u organización
genera como parte de su actividad (memorias, anuarios, estadísticas, infor
mes). Este tipo de información normalmente no suele ser información bru
ta, sino que se encuentra elaborada en diversos formatos, según convenga
a los fines de la propia entidad, pero frecuentemente o es pública o es acce
sible en alguna medida al sujeto investigador externo. Incluso las mismas
páginas web de las organizaciones contienen datos secundarios que no es
tán en otro formato.
También hay datos internos a las organizaciones que no son públicos (y me
nos accesibles) sobre actividades o personas (expedientes académicos de
estudiantes, fichas de personal de una empresa). En este capítulo también
pueden entrar los registros de comunicaciones internas (mensajes, agen
das, archivos de imágenes, etc.)
También se alude a registros «externos» que son, por lo general, a los que más se
recurre desde la perspectiva de una investigación concreta:
Informes de investigación que incluyen datos elaborados (presentados en
tablas), que solo pueden ser consultados tal como se ofrecen. Esto puede
10 6
Explorando la información existente
abarcar toda la producción de información elaborada como resultado de
actividades de análisis de las instituciones u organismos que producen es
tos datos.
Datos archivados gestionados en bancos de datos por organizaciones es
pecializadas. Estas son las más conocidas como fuentes «estadísticas» que
precisamente se dedican a la producción de información para su análisis
científico.
En este grupo entrarían todas las agencias nacionales e internacionales
de producción estadística de datos (como el Instituto Nacional de Estadís
tica, Eurostat, pero también ONU, OCDE, OIT, etc.), así como instituciones
oficiales dedicadas a la investigación científica como actividad principal (el
Centro de Investigaciones Sociológicas y sus equivalentes ) y también pro
yectos y grupos de investigación que tienen como misión central proporcio
nar series de datos de encuestas comparables en el tiempo y entre países
(Encuesta Social Europea o Encuesta Mundial de Valores, por ejemplo).
3.1.2. Documentos de acceso público y documentos privados
Hay también otras aportaciones (Scott, 2006) que, centrándose en la investigación
documental, clasifican los datos secundarios considerando la naturaleza de la in
formación, pero sobre todo poniendo el acento en el acceso y el control necesario
desde la perspectiva de quien investiga. Así, por ejemplo, se podrían abarcar los
diversos tipos de informaciones secundarias diferenciando entre (Curtis y Curtís,
2012, 220):
- Textos publicados (fuentes bibliográficas), medios de comunicación y ci-
ber-documentos.
Documentos personales privados (cartas, autobiografías, diarios, fotogra
fías, etc.).
Registros oficiales, informes y estadísticas.
Si nos referimos a textos publicados, la clave es la relevancia: debemos tener en
cuenta que no toda la información publicada tiene el mismo valor y que entre las
diferentes evidencias se da una cierta jerarquía (Greener, 2011). Si la información
proviene de una fuente reconocida científicamente (fuentes bibliográficas), es pro
bable que sea buena, aunque esto no suponga una garantía total. No podemos con
formarnos con utilizar publicaciones que no cuenten con validez científica reco
nocida, aunque resulten de más fácil acceso (por ejemplo, un artículo de prensa, o
Wikipedia, en la cual se desconoce la autoría de las diferentes entradas), sino que
habrá que ser exigente con la información de que partimos. Lógicamente, los artí
culos en revistas científicas indexadas (por cumplir criterios de control de calidad),
los libros publicados por editoriales de prestigio,o cualesquiera documentos utili-
107
La investigación como proceso
zados y citados recurrentemente por autores y autoras de prestigio contarán con
mucho mayor valor.
Los documentos personales son una fuente muy rica de información, sobre todo
para la investigación cualitativa. A los más tradicionales, cartas, diarios y fotografías
con que se desarrollaron muchos estudios etnográficos, hay que ir añadiendo otros
como vídeos, mensajes de móvil, emails o blogs personales, aunque el carácter bá
sicamente privado de los mismos obliga a tener especial cuidado con las cuestiones
de confidencialidad y también de autenticidad.
También hay otros textos que pueden analizarse de modo similar a los ante
riores y que pueden considerarse «productos sociales y huellas sociales» (O’Leary,
2014, 245-246] producidos muchas veces en situaciones de interacción, como las
comunicaciones y participaciones a través de redes sociales.
Los ciberdocumentos (todo acceso a través de webs) y documentos producidos
por medios de comunicación (o de entretenimiento) también son datos para la in
vestigación social que pueden recolectarse para ser analizados: películas, progra
mas de televisión, anuncios publicitarios, artículos de periódicos y revistas y, sobre
todo, vídeos.
El análisis secundario de documentos (privados o públicos) exige ser también
muy organizados en la selección y ordenación de materiales: hacer copias, confirmar
la autenticidad y credibilidad del texto, explorar la historia detrás del documento
(¿quién lo produce?, ¿con qué fines?, ¿en qué situación o bajo qué circunstancias?).
«Necesitarás pensar sobre qué tipo de documentos vas a considerar como tu marco
de estudios potenciales: cuáles son los que quieres y cómo planeas hacerte con ellos.
Y como en cualquier otro método que trata con participantes humanos, también tie
nes que considerar tus sesgos y tus recursos; qué es lo que realmente buscas; cómo
vas a asegurar la credibilidad de datos que no has recolectado por ti misma y cómo te
preparas para lo inesperado» (O'Leary, 2014, 247).
Si nos referimos a la información de registros oficiales y otras «estadísticas», al tra
tarse como información secundaria se deben seleccionar también con garantías de
calidad suficiente en su creación y almacenamiento y además en función de su ade
cuación o utilidad a nuestros objetivos de investigación. En general, se trata de re
currir a aquellas fuentes que nos puedan aportar datos de calidad porque el diseño
de la creación de los datos que tengamos en consideración sea metodológicamente
correcto, que se haya controlado en todas sus fases y que los resultados hayan sido
bien organizados y /o analizados (si se hubieran elaborado).
Otro buen ejemplo de uso intensivo y selectivo de fuentes de información secun
daria es la investigación de Alfonso Echazarra sobre La delincuencia en los barrios
(2014). Este trabajo está realizado exclusivamente con datos secundarios y de muy
diversa fuente y tipos: datos estadísticos sobre población en general (INE), datos
electorales (Instituto de Estadística de Madrid), encuestas de opinión del C1S, en
cuestas de actitudes hacia la inmigración del banco de datos ASEF/JDS, estadísticas
108
Explorando la información existente
de la OCDE y del Banco Mundial, así como datos específicos sobre personas encar
celadas o delitos, datos procedentes de registros de las policías o fiscalías en el
Ministerio del Interior y hasta alguna encuesta sobre victimización.
En el estudio se realiza una valoración de la situación de las fuentes de informa
ción:
«se presenta una evaluación de las estadísticas sobre delincuencia disponibles en
España, con el fin de informar al lector de las limitaciones estadísticas del presen
te estudio (...) los estudios crim inológicos cuantitativos son escasos y de naturaleza
descriptiva (véase la tabla 2.1), en gran medida a consecuencia de la inexistencia de
datos tanto individuales como nacionales y relativos a las comunidades locales, o de
su escasa calidad» (Echazarra, 2014,70-71).
Se destaca así la diferencia entre mediciones de actividad delictiva real o delincuen
cia registrada y las percepciones tanto sociales como de víctimas y de delitos (au-
toinformes). El autor incide en los problemas de confidencialidad que limitan el
acceso a algunos microdatos, así como la falta directa de datos a niveles de desagre
gación local, pero también destaca, por ejemplo, que España es el único país cuyo
censo pregunta por la percepción del nivel de delincuencia y vandalismo a nivel re
sidencial menor (zona/barrio), lo cual permite algunas explotaciones importantes
sobre la base de una recogida (censal) fiable (Echazarra, 2014, 72-73).
Como hemos mencionado al inicio, a continuación abordaremos algunas cues
tiones relevantes sobre dos tipos concretos de información secundaria: textos pu
blicados (fuentes bibliográficas) y bancos de datos que contienen datos secunda
rios sean estos cuantitativos (registros o estadísticas) o cualitativos (documentos
personales de una u otra índole).
3.2. Sobre las fuentes bibliográficas
La detección de la literatura científica que interesa a una investigación es evidente
mente un tema amplísimo que depende en primera instancia del campo o área cien
tífica concreta en que se desarrolle la investigación. Por otra parte, el recurso a los
trabajos precedentes en cada proceso de investigación puede atravesar diversas fases
o aspectos. Por lo general, no obstante, la consulta bibliográfica se sitúa en las fa
ses primeras, tanto si se trata de una consulta de situación, contexto y antecedentes
(el estado de la cuestión), como si se utiliza como fuente principal (comparativa,
teórica) del diseño de la investigación.
En este aspecto, otra distinción capital es la orientación de la investigación en un
plano más o menos académico. En el caso de la investigación formalmente acadé
mica, la búsqueda de bibliografía relevante es un criterio de evaluación muy impor
tante del trabajo final y debe realizarse de modo sistemático y, sobre todo, riguroso
respecto a cobertura y relevancia científica para el proyecto.
109
La investigación como proceso
La detección de las aportaciones de otros autores a nuestro campo de estudio
debe comenzar por las obras de referencia, que serán materiales básicos e impres
cindibles en nuestra área, pero también de aquellos novedosos que nos puedan
servir de referencia y punto de partida. Se trata pues de encontrar y leer aquella
literatura científica relevante recogida principalmente en libros (monografías y
compilaciones) y en artículos de revistas científicas, pero también secundariamen
te otro tipo de documentos, informes de trabajo o papers de instituciones, organiza
ciones, o provenientes de otros investigadores o grupos de investigación.
Todos estos documentos bibliográficos pueden obtenerse en bibliotecas clásicas
y «esa es una primera vía práctica, porque se podrán consultar las publicaciones
rápidamente, pero es una alternativa que no garantiza que se acceda a las publica
ciones más relevantes» (Jurado, 2012, 95) o también crecientemente se desarrolla
como búsquedas online a través de internet mediante el acceso a bases de datos
bibliográficas. Las tecnologías informáticas (motores de búsqueda) y la extensión
de internet como canal de acceso y divulgación de todo tipo de información han
permitido precisamente que las búsquedas bibliográficas sean potencialmente mu
cho más rápidas, extensas y sencillas.
Algunos de los recursos cercanos que nos parecen principales para búsquedas
bibliográficas en ciencias sociales son: el portal Dialnet ([Link]
es), la base de datos bibliográficos del Centro Superior de Investigaciones Cientí
ficas (CSIC) denominada ISOC ([Link]
el buscador Google Académico o las bases de datos del ISBN ([Link]
[Link]/cultura-mecd/areas-cultura/libro/[Link]) y la base
DICE ([Link] con medición de calidad de las revistas españolas
en humanidades y ciencias sociales.
También hay muchos organismos nacionales o internacionales que a través de
sus páginas web dan acceso a bases bibliográficas. Destacamos, por ejemplo, la del
Banco Mundial ([Link] que incluye un repositorio, el
Open Knowledge Repository, que a inicios del año 2016 contaba con entrada a más
de 20.437 publicaciones sobre temas tan variados como desarrollo, educación, sa
lud, nutrición, pobreza, o desigualdad, así como acceso a su banco de datos.
La lectura y el análisis crítico de la bibliografía existente permiten reelaborar
el tema desde una nueva perspectiva, desde la visión de los equipos investigado
res, exigiendo un ejercicio de reflexión y síntesis que permita nuevas aportaciones
referentes al tema de estudio. Para ello se requiere un grado importante de orga
nización y planificación que permita gestionar la información obtenida de la biblio
grafía recopilada.
i*
Tomar decisiones respecto a qué interesa y qué no, además del modo de enfocar
el tema de investigación, permitirá establecer puntos de partida, objetivos, hipó
tesis, contextualizar el tema dentro de la teoría propia de la disciplina, seleccionar
los puntos en los que debemos incidir, así como tomar decisiones de carácter me
todológico que permitan resolver los problemas de investigación planteados en un
inicio, así como aplicar los conocimientos teóricos a la práctica.
lio
Explorando la información existente
Lógicamente en el desarrollo de cualquier investigación original deberá reco
nocerse que se ha recurrido a determinados textos, informes o datos, y cualquier
referencia a ellos sea literal o no, deberá ser señalada. Toda la bibliografía utilizada
deberá recogerse, bien al final del capítulo, bien al final de la investigación en un
capítulo ex-profeso para ello, señalándose autor, año de edición, título de la obra,
editorial y ciudad de edición. En el caso de tomar partes literales de otro autor
éstas deberán ir claramente identificadas en el texto (entrecomilladas, normalmen
te), especificándose a continuación la obra (autor y año de referencia), así como la
página de esta de la cual ha sido tomada la cita. Todas estas convenciones de reco
nocimiento de autoría científica se traducen en protocolos de citación extendidos.
Para las ciencias sociales un sistema habitual y comúnmente aceptado de citación
es el conocido como APA de la American Psichological Association ([Link]
[Link]). Otros también utilizados son el manual de estilo de la editorial de la
universidad de Chicago ([Link] o las normas IEEE
([Link]
3.3. Bancos de datos y datos secundarios
Un banco de datos es un conjunto de informaciones agrupadas y ordenadas en un
mismo soporte de manera que se pueda acceder a ellas de una manera fácil. La in
formación se encuentra clasificada de un modo sistemático y basado en diferentes
parámetros, de manera que puede ser solicitada y ordenada con diferentes fines se
gún se demande su uso. Existen diferentes tipos de bancos de datos. Por ejemplo, el
fichero de una biblioteca puede considerarse como tal, pero, hoy en día, en general,
cuando se habla de bancos de datos se suele estar haciendo referencia a archivos in
formáticos que guardan información referente a diversos temas y generada a partir
de diferentes investigaciones, y que permiten a los usuarios acceder a dichos datos
con diferentes fines: replicar investigaciones completas, realizar nuevos análisis so
bre los datos existentes, describir poblaciones y elaborar muestras, etc.
Así, por ejemplo, y como se ha mencionado, un banco de datos como el del Banco
Mundial es una herramienta de análisis y visualización que contiene colecciones de
datos de series cronológicas sobre diversos temas, y permite a los investigadores
crear sus propias consultas y análisis generando tablas, cuadros o gráficos (http://
[Link]).
Cuando nos referimos a bancos de datos podemos distinguirlos en función del
tipo de datos que albergan (las características de las bases de datos), y aun siendo
conscientes de que no se trata de una categorización exhaustiva ni excluyente, po
demos hablar de:
- Bancos (bases) de datos cuantitativos: en los que se incluyen datos pro
venientes de censos, estadísticas elaboradas a partir de registros adminis
trativos (estadísticas de la enseñanza, estadísticas sanitarias, estadísticas
electorales y otras) o de encuestas oficiales (Encuesta de Población Activa
m
La investigación como proceso
|EPA|, Encuesta Nacional de Salud, barómetros del CIS), y también encues
tas privadas.
Estos bancos de datos tienen diferentes niveles de acceso: por un lado
facilitan datos ya procesados (resúmenes en tablas, gráficos) y por otro
pueden llegar, tal como veremos, a permitir el acceso a datos de cada uno de
los registros últimos o unidad mínima de información (microdatos). Ejem
plo: banco de datos del CIS, banco del Banco Mundial.
Bancos (bases) de datos documentales. En este tipo de bases de datos se in
cluyen tanto libros, artículos y documentos científicos de todo tipo y ámbi
to, así como también otro tipo de documentos escritos públicos (prensa) o
privados (cartas, diarios, mapas, etc.). En general, se trata de bibliotecas.
Sistemas de información geográfica (SIG o GIS): en general se trata de ba
ses de datos que incluyen información, tanto cuantitativa como cualitativa,
referida a un territorio concreto. Este tipo de archivos desarrollados a par
tir del uso de información cartográfica, unida a la aportación de datos, ge
neralmente cuantitativos pero también de carácter más cualitativo (fotos o
fichas de servicios, bienes o equipamientos), permiten la gestión de datos
referenciándolos espacjalmente y permiten su visualización mediante ma
pas. Ejemplo: el Instituto Vasco de Estadística (Eustat) ofrece una aplica
ción ( LurData) para la difusión estadística con GIS que permite obtener in
formación a un nivel local ( [Link]
Bancos (bases) de datos de imágenes: Archivan textos o documentos en formato
de imagen o como ilustraciones. Un ejemplo típico de este tipo de bases lo cons
tituyen las hemerotecas, con la ventaja de que muchas de ellas en la actualidad
se encuentran disponibles en red. Pero también otro tipo de archivos que reúnen
imágenes o fotografías referidas a un tema, lugar o periodo concreto. En cuan
to al uso de fotografías para la investigación social, existen diferentes ejemplos
(fotobiografías, historias de vida familiar, etc.) para la reconstrucción de histo
rias de vida, de la interpretación de una realidad concreta, etc.
Ejemplo: el Archivo Fotográfico de la Delegación de Propaganda y Pren
sa de Madrid durante la Guerra Civil española [Link]
tograficoDelegacionPropaganda/[Link].
Bancos (bases) de datos multimedia. Estos bancos suelen archivar produc
tos documentales que combinan sonidos, datos e imágenes con movimien
to. Este tipo de archivos están cobrando cada vez más importancia a medi
da que el uso de las nuevas tecnologías de la información y la comunicación
permiten mejor acceso y más fácil explotación de las informaciones mul
timedia. Entre otros, el Archivo histórico de Radiotelevisión Española RTVE
([Link] o el Proyecto Mujer y Memoria
([Link].) son buenos ejemplos de archivos abiertos a
testimonios personales y acontecimientos históricos que constituyen fuen
tes valiosas para posible uso secundario.
Explorando la información existente
En la investigación social, las grabaciones sonoras (entrevistas, princi
palmente) han sido tradicionalmente materia prima para estudios de lin
güística, investigaciones sobre historia oral y otros estudios de carácter
etnográfico, siendo normalmente consideradas siempre material de prime
ra mano, a recoger por el personal investigador. Hasta hace relativamente
poco tiempo, los únicos datos disponibles para su uso secundario solían ser
directamente los informes de investigación o bien las interpretaciones de
la información recogida, junto con algunos extractos literales transcritos de
las entrevistas.
Hoy en día, ya hay instituciones como el CIS que, como hemos apuntado
en el capítulo anterior sobre muestreo, facilitan el acceso online y descar
ga libre de las transcripciones de las entrevistas (individuales o grupales)
de algunas investigaciones cualitativas, que pasan a ampliar su tradicional
banco de microdatos cuantitativos. Además, las nuevas tecnologías hacen
que cada vez más frecuentemente las grabaciones no sean únicamente so
noras, sino que incluyan archivos multimedia (imagen más sonido), lo que
permite disponer de datos con mucha mayor riqueza informativa (informa
ción de tipo cinésico y gestual).
En general, en los bancos de datos se archivan grandes volúmenes de información,
de gran diversidad temática y procedente de diversas fuentes. Normalmente es
necesario transformarla para su utilización, y además suelen conllevar diferentes
formas de presentación. Obviamente, la información disponible en cada uno de los
diferentes tipos de bases de datos citados debe ser «investigada» en sí misma para
conocer el proceso por el cual la información ha sido elaborada. Cuando un equipo
investigador opta por utilizar información proveniente de un banco de datos, es
necesario que compruebe si esta lleva aparejada lo que se conoce por metainfor-
mación o metadatos.
La metainformación se refiere a la «información sobre la información»; esto
es, información sobre cómo la información disponible ha sido construida, a qué se
refiere exactamente y cómo ha sido elaborada. Más concretamente y con vistas al
mejor control metodológico de una explotación secundaria de estos datos, hay que
considerar que la metainformación incluya:
- Significado de las variables (definiciones, preguntas).
Características técnicas relacionadas con la producción de los datos (ámbi
to, muestra).
Cambios metodológicos que se hubieran producido a lo largo del tiempo en
las mismas series.
Otra información de interés (fuentes, referencias, valoraciones realizadas
por otros investigadores).
Con la metainformación suficiente es como realmente se puede hacer un análisis
«crítico» de las fuentes secundarias disponibles, como se realiza con las fuentes
11 3
La investigación como proceso
estadísticas de consumo alimentario en España (Díaz Méndez et al., 2005] para des
tacar sus limitaciones y utilidades con vista a la investigación sociológica en este
campo.
Recientemente Valles (2015) realiza un recorrido muy completo por las aún es
casas prácticas pioneras de archivo de «materiales de trastienda» investigadoras de
orientación cualitativa en España, sobre todo en comparación con proyectos euro
peos más consolidados como el británico Qualidata ([Link]
[Link]/get-data/key-data/qualitative-and-mixed-methods-data). Se concluye que
las características de la información disponible todavía son algo limitadas y que de
hecho faltan sobre todo sistematicidad y exactitud, en parte también por las dificul
tades propias de «preservación, transferencia y reutilización» (Valles, 2015, 186)
asociadas al material cualitativo.
Si nos fijamos específicamente en las bases de datos cuantitativos, una de las
cuestiones clave para su utilización con vistas al análisis secundario es el tipo de
datos que ofrecen respecto de la unidad mínima de análisis, así como el nivel de
desagregación que permiten en la consulta o explotación. En este sentido, las bases
pueden contener datos individuales o colectivos. Si son colectivos, pueden ser cons
truidas por agregación o síntesj^ de información individual o directamente referi
das a «agregados» sociales, institucionales, etc.
—- Individuales
• Furamente individuales (se refieren a cada individuo, con independencia
de los demás).
• De relación (se refieren a cada individuo en relación a los demás).
- Colectivos
• Agregados (resumen los datos de los individuos de un colectivo).
• Externos (se refieren a un colectivo, pero son ajenos a los individuos que
lo componen).
Cuando la unidad mínima de recogida de la información es individual, los datos
individuales también se llaman microdatos, y se archivan en lo que se conoce como
fichero de microdatos, que no es más que un conjunto de registros individuales con
veniente y sistemáticamente organizados. Este fichero puede incluir datos de iden
tificación directa (o identificantes). Para poder difundirlos es necesario anonimizar
dichos datos, de manera que no pueda identificarse a ningún sujeto (por ejemplo,
en el caso de datos de encuesta, en vez de incluirse el nombre del sujeto encuestado
o su número de teléfono, se introduce un número que permita identificar el cuestio
nario, pero no a la persona que responde).
Debido a las mejoras técnicas y a las nuevas tecnologías de acceso a la informa
ción, las instituciones cada vez facilitan más el acceso a sus bancos de datos y a los
114
Explorando la información existente
ficheros de microdatos, existiendo diferentes modos para ello. Para algunos bancos
de datos tan solo es posible el acceso in situ o una conexión en línea, pero solo desde
las instalaciones de la institución (secure place)] en otros casos, da acceso mediante
copia de los datos en soporte físico, como un pendrive o CD. Lo menos frecuente
pero cada vez más es la posibilidad de acceso remoto online. Por otro lado, nos en
contramos con bases de datos de acceso libre (a disposición de toda la población) o
con acceso limitado (por ejemplo, solo investigadores vinculados a una institución
como la universidad) e incluso con diferentes niveles de acceso, dependiendo de la
finalidad (y de quién encargue o realice) de la investigación.
No todos los bancos de datos facilitan el acceso a la información de sujetos in
dividuales (como lo hace el CIS, por ejemplo), sino que muchos de ellos solo faci
litan la información con carácter agregado. La explotación secundaria que puede
realizarse por los investigadores que se sirven de estas fuentes es completamente
diferente cuando solo se cuenta con información agregada. Lógicamente, las posi
bilidades que ofrece el acceso a microdatos completos (anonimizados) se controla
muchas veces mediante solicitudes específicas y aun así generalmente no es posible
acceder a toda la información.
Como se ha mencionado en el capítulo primero, esta es una cuestión que enlaza
directamente con las dimensiones éticas de la investigación y las buenas prácticas
profesionales. La Ley de Protección de Datos de Carácter Personal (Ley Orgánica
15/1999, de 13 de diciembre) obliga a los productores de datos a garantizar la con
fidencialidad y la seguridad de la información que producen, aunque paralelamente
sean conscientes de que la demanda de datos más desagregados se incrementa
cada día.
También el recurso a datos secundarios en forma de agregados es muy común.
Estos datos proceden de la síntesis de datos individuales, mediante acumulación
o alguna otra elaboración estadística, y pueden presentarse de diferentes formas
(tablas simples de frecuencias o tablas cruzadas). También pueden ser:
- Transversales, cuando la información se refiere a un momento del tiempo y
a una o también a varias poblaciones diferentes.
- Cronológicos, también conocidos como series temporales. Este tipo de da
tos refleja cada variable relativa a una misma población en varios momen
tos diferentes del tiempo. Los datos cronológicos se diferencian como:
• Periódicos, si su finalidad es medir la evolución en unos determinados
tramos temporales concretos (mensual, trimestral, anual, quinquenal) y
basándose en una metodología común de obtención de datos. Por ejem
plo, los mismos censos de población y viviendas del INE y muchas otras
operaciones estadísticas oficiales generan series cronológicas periódi
cas, pero también estudios por encuesta que se realizan por «oleadas»,
con periodicidad programada, como la Encuesta Social Europea (que es
bienal).
115
La investigación como proceso
• Aperiódicos, que se definen por la no continuidad o no periodicidad del
fenómeno que miden. Los datos se recogen en más de una ocasión y con
los mismos instrumentos de medida, pero sin una frecuencia determina
da o previamente establecida.
3.4. Ventajas, limitaciones y retos del uso de fuentes secundarias
para la investigación
Como se ha ido señalando, las fuentes de datos secundarias son tan variadas en
contenido y características que a priori cuentan commultitud de usos para la inves
tigación social. La misma denominación de la información ya existente como «no
reactiva» o «no intrusiva» alude al ahorro de esfuerzos y recursos en el trabajo de
construcción de medidas ad h ocy directamente de las fuentes informantes u obser
vables. Pero, además, se puede decir que el recurso a la información secundaria es
especialmente adecuado bajo ciertas condiciones o necesidades de investigación:
los estudios comparativos (espacio y tiempo: series temporales), los estudios des
criptivos de poblaciones amplias (con la utilización de datos agregados y globales),
estudios piloto (experimentales^y para el establecimiento de poblaciones y selec
ción de muestras, por ejemplo.
A pesar de las grandes ventajas que presenta la utilización de datos existentes
para la investigación, no podemos obviar que a la hora de utilizar fuentes de datos
secundarios podemos encontrar ciertas limitaciones. La primera puede ser la falta
de adecuación total a nuestros objetivos de investigación, lógicamente porque los
datos se han «creado» con finalidad diferente a la de nuestra propia investigación
y es fácil que las definiciones de conceptos, variables y categorías no coincida con
lo que interesa puntualmente o no se haya medido al nivel de agregación pertinen
te, como hemos expresado antes desde el trabajo sobre delincuencia (Echazarra,
2014). Otras cuestiones que pueden ser problemáticas son las variaciones en la for
ma de los datos a lo largo del tiempo (diferentes definiciones y posibles imprecisio
nes en la recogida de información) o, simplemente, la falta de una ficha metodoló
gica completa (metainformación) que nos permita saber hasta dónde es pertinente
utilizar una fuente concreta. Por todo ello, a la hora de analizar los datos extraídos
de bancos de datos, debemos tener en cuenta todos los aspectos que tienen que ver
en general con la calidad técnica de la fuente, así como con la adecuación a los fines
de la investigación.
También hay que destacar que lps datos secundarios presentan una serie de
ventajas a tener en cuenta cuando se planifica un estudio, ya que son más baratos,
se obtienen en menos tiempo y además hay muchos que resultan más precisos, ya
que son de carácter censal y este tipo de creación es inviable realizarla para cada
investigación.
Sin embargo, debemos de tener en cuenta una serie de consideraciones referen
tes a los datos construidos por otros equipos investigadores, por ejemplo, tener en
116
Explorando la información existente
cuenta la fuente de la que proviene la información; es decir, si los datos provienen
de registros administrativos o de encuesta; si se han tomado de estudios exhausti
vos o muéstrales (para en este caso tomar en consideración el nivel de representa-
tividad de la muestra). Del mismo modo, por su diferente utilidad, también debe
remos tener en cuenta si se trata de estudios de opinión o tienen un carácter más
factual (tipo censo).
También es importante resaltar la antigüedad o no de los datos (cuanto más
antiguos sean, menos valor suelen tener para la investigación actual, excepto en
el caso de estudios evolutivos), así como la idoneidad o no de su utilización para
nuestro estudio (problema de replicabilidad, de misma medida, mismas catego
rías, de si se trata de la misma definición de la población o de su adecuación a
nuestra población objeto de estudio). Por ejemplo, si en nuestra investigación se
define la población joven, adulta o anciana de igual modo.
No podemos dejar de considerar, en caso de tratarse de datos cronológicos, si se
han dado cambios metodológicos en la producción de los datos (hecho más habi
tual de lo que se suele pensar, incluso en encuestas oficiales) que algunas veces no
están avisados, pero son detectadles cuando en una serie temporal se ven grandes
cambios de datos no explicables por algún factor externo.
Aunque normalmente todas estas decisiones no suelen trasladarse a los infor
mes finales de investigación, cuando solo se trata de utilizar información secun
daria de contexto, las investigaciones basadas en un diseño de análisis secunda
rio deberían reflejar en sus apartados metodológicos la valoración de las fuentes
secundarias utilizadas y las «traducciones» de la oferta de datos a la explotación
concreta realizada.
Hay una última cuestión con relación a los retos actuales y futuros en la explota
ción de información secundaria y que es la emergencia de los big data (datos masi
vos). Este término, acuñado en los años 90 por un informático, alude a toda la infor
mación cuantificable que se genera a nivel planetario y que no puede gestionarse
con medios tradicionales. La existencia de esos datos ha derivado prácticamente en
una disciplina que se encarga de dar herramientas para el almacenamiento, gestión
y explotación de esos datos. En realidad esta es una cuestión de tecnologías de la
información, sobre todo, pero en la medida en que pueden tener también utilidades
para la investigación social se está extendiendo la imagen de que son un tipo de
fuente secundaria a considerar.
Las características distintivas de los big data son las llamadas tres uves: volu
men enorme, velocidad de acumulación y variedad (todo tipo de datos). Esto im
plica que casi cualquier huella de actividad humana que pueda registrarse digital
mente pasa a generar datos y que potencialmente muchos de estos datos podrían
ser de interés para la investigación social. Algunos de estos datos que ya se están
analizando se refieren precisamente a las actitudes y usos de la población respecto
a las nuevas tecnologías (redes sociales, sobre todo) y, sin duda, de modo intensivo
con fines comerciales. Son las empresas las que más interés han mostrado desde
117
La investigación como proceso
el principio por las posibilidades de los bigdata, e
permite conocer más y más rápido los perfiles de clientela o poblaciones consumi
doras o la imagen de sus productos y tomar decisiones adaptándolas en tiempo rea
(Galbraith, 2014).
En general, la monitorización de muchos fenómenos a través de big data exige
un cierto nivel de desarrollo tecnológico (software específico), por lo que tampoco
está al alcance directo de todos los sujetos que se dedican a la investigación social,
aunque cada vez más con la formación adecuada. También se suele asociar con
técnicas de análisis estadístico algo específicas (data rruning o minería de da os)
que están especialmente pensadas para trabajar con estos volúmenes de datos di
versos. Sin embargo, hay que ser conscientes de que el reto mas importante del i
futuro papel de los big data en la investigación social no es tanto el técnico, sino
las cuestiones básicas de calidad sobre las que se debe reflexionar ante cualquier
información que se vaya a considerar fuente secundaria: ¿de donde proceden os
datos?, ¿cómo se han construido?, ¿son realmente exhaustivos?, ¿son relevantes
;se adecúan a los conceptos que queremos medir? Medir la vida social es d ifici,
pero no todo lo que se puede medir es pertinente y relevante, y menos para la in
vestigación científica. &
De todas formas, como dice un informe de la ONU, estamos en medio de una «re
volución de datos» a nivel mundial tanto en términos de demanda como de oferta.
«Una explosión en el volumen de datos, la velocidad con que los datos se producen,
el número de productores de datos, la diseminación de los datos y el rango de cosas
sobre las que hay datos, que vienen de las nuevas tecnologías como los telefonos
móviles y el "internet de las cosas", y de otras fuentes, como datos cualitativos, datos
generados por la ciudadanía y datos de percepciones» (ONU, 2014, 6).
Y eso obliga a procurar mayor y mayor rigor en la selección y en los modos de acce
so y utilización de los datos e informaciones tanto en la intervención social como en
la investigación, de modo que revolución de datos también es:
«La integración de estos nuevos datos con los datos tradicionales para producir infor
mación de alta calidad que sea más detallada, puntual y relevante para muchos usos
y personas usuarias (...) El aumento de la utilidad de los datos a través de un muc o
mayor grado de apertura y transparencia, evitando la invasión de la privacidad y e
abuso de los derechos humanos por un mal uso de los datos sobre individuos y gru
pos, y m inimizando las desigualdades en la producción, acceso y uso de los datos»
(ONU, 2014, 6).
3.5. Organismos productores de datos e información secundaria
Realmente son numerosísimas las agencias, organismos e instituciones públicas o
privadas que «producen» información que, en un momento dado, pueda ser con-
11 8
Explorando la información existente I
siderada fuente secundaria para una investigación social. Al final de este capitulo
ofrecemos una lista de direcciones web que, sin ningún afán de exhaustmdad, pue-
den ser de utilidad. , .
En el campo de las investigaciones sociales, entre las fuentes mas importantes
en la práctica podríamos señalar:
_ Todos los organismos de los gobiernos y las administraciones públicas lo
cales, regionales, nacionales y supranacionales, en la medida en que reali
zan registros de datos y también documentales sobre las poblaciones o ac-
tividades de su competencia.
- Todas las agencias (también de diverso alcance territorial) ^ se de ‘‘
can principalmente a la producción de datos estadísticos, como el y
institutos estadísticos autonómicos, y la oficina de la Comisión Europea-
Eurostat. Estas agencias colaboran entre ellas dentro de sus legislaciones
de referencia de manera que los datos suelen nutrir las agregaciones terri
toriales (de cada autonomía al IN E y de 1NE a Eurostat, por e|emplo).
_ otras agencias internacionales que cuentan con actividad de producción de
datos, como la OCDE, la ONU, el Banco Mundial, la OMS o la OIT.
- Instituciones públicas dedicadas a la investigación científica (como el CSIC)
y sobre todo a la investigación social (como el CIS). También los grupos de
investigación vinculados a universidades y centros de investigación públi
cos, cuando comparten datos, resultados o metodologías, podrían entrar en
esta clasificación.
- Instituciones privadas, ONGs y fundaciones que también ofrecen informa
ción, investigaciones o cuentan con bancos propios de datos o repositorios
pueden ser fuente relevante de información secundaria. En España se pue
den destacar la Fundación BBVA, la Fundación Juan March, la Obra Social La
Caixa y, en el apartado concreto de producción directa y repositorio de da
tos, especialmente la empresa ASEP/JDS.
Ibdas estas fuentes son fácilmente localizables y tienen páginas web, queesiel1modo
de exploración de las fuentes y sus datos actualmente mas común. Lo h a b itú a es
que mediante la exploración bibliográfica y documental previa de cada investiga
ción^e vaya conformando una idea realista de las fuentes de datos secundar os
que nos podrían interesar en cada caso concreto. Esto tiene que ver con el tema y
alcance de la investigación, por lo que las posibilidades son muy amplias. Como no
se puede describir la oferta de cada una (y de otras equivalentes a las que se podría
recurrir), a continuación vamos a realizar solamente algunas d“ cr'Pcmn^
uue nos parece que es más útil conocer de dos fuentes principales, INE y CIS, que
representan dos clases de fuentes «prototípicas» de datos secundarios y median e
cuyo conocimiento cualquiera puede desenvolverse en estos recursos de investiga-
ción similar en este o en otros ámbitos, incluso internacionales.
119
La investigación como proceso
3.5.1. Las fuentes estadísticas oficiales: Instituto Nacional de Estadística (INE)
y equivalentes
El Instituto Nacional de Estadística es un organismo autónomo adscrito al Minis
terio de Economía y Competitividad (antes Economía y Hacienda), y su cometido
principal (como consta en su web) es elaborar estadísticas públicas, que son estu
dios oficiales sobre la situación y evolución de la población, la economía y a la so
ciedad de España, poniendo a disposición pública los resultados de sus estudios. El
INE coordina las estadísticas que realizan las diferentes administraciones públicas
de España, cuando tienen departamentos de estadística propios para el desempeño
de sus actividades: departamentos ministeriales de estadística y de las diferentes
comunidades autónomas. La información procedente de algunos registros adminis
trativos de ámbito municipal (padrón y registros civiles) revierte en las estadísticas
del INE.
El INE elabora el Flan Estadístico Nacional (con otros departamentos) y contri
buye también a la construcción de las estadísticas oficiales de la Unión Europea a
través de su oficina estadística, Eurostat. En general, el INE abarca un repertorio de
operaciones estadísticas muy amplias, que se pueden consultar con arreglo a dife
rentes criterios: temáticos, por la ffrma de recogida de datos, por desagregación
territorial, por periodicidad, etc., y se encarga particularmente de las que se consi
deran operaciones estadísticas de gran envergadura, como el mantenimiento de las
estadísticas demográficas y sociales, del mercado de trabajo, cuentas económicas,
directorios y estadísticas de empresas, estadísticas de los sectores económicos y
muchas otras. En concreto, la realización de los censos de población y viviendas y la
formación del censo electoral son algunas de las tareas destacadas del INE.
El Censo de Población y Viviendas es una de las fuentes secundarias más am
pliamente utilizadas en la investigación social, tanto para la descripción de las po
blaciones que suelen ser objeto de estudio como para la contextualización de las
investigaciones y, en el caso de estudios cuantitativos, también es necesario para la
construcción de muestras representativas.
La evolución de las metodologías censales es también un indicador interesante
de la oferta del INE para la investigación social. Siendo los censos registros exhaus
tivos que se realizan cada 10 años, la recogida y procesamiento de la información
ha sido tradicionalmente laboriosa y en los periodos intercensales la información
actualizada sobre la población provenía del padrón (municipal) continuo que, aun
que es dinámico, contiene menos información sobre los individuos. Desde el Censo
de 2011 esta operación (el censo) incorpora varias innovaciones que hacen que la
recogida de información sea más ágil y eficaz y, en consecuencia, el acceso de los
usuarios como datos secundarios también es más amplio y versátil.
Concretamente, por primera vez se combinó en la recogida de datos, y por tanto
en su propia elaboración, el uso de otros registros administrativos con la recogida
directa de información actualizada a través del trabajo de campo. Otro cambio adi
120
Explorando la información existente
cional fue la cumplimentación de la actualización censal por internet. Por lo que se
consiguió una recogida de datos más rápida, eficiente y económica.
Respecto al acceso a los datos del INE como datos secundarios, es posible la
consulta en diversos formatos y con distintos niveles de detalle o agregación. Como
sucede con todos los institutos oficiales de estadística, la difusión de la información
que producen y gestionan forma parte de sus objetivos, como se señala por ejemplo
en el Plan Estadístico Nacional 2013-2016. Para ello, entre las líneas estratégicas
que se marca el 1NE, está el «aprovechamiento de las posibilidades de las nuevas
tecnologías de información y comunicación» (Objetivos INE 2015, 2). El acceso a los
datos a través de la web es actualmente lo más común, aunque también se pueden
consultar publicaciones en papel y realizar consultas o demandas específicas. Den
tro del acceso web hay resultados ya preparados, pero también existe la posibilidad
de realizar explotaciones Online con aplicaciones interactivas bastante sencillas, lo
que aumenta el acceso por parte de la comunidad investigadora y de la población
en general.
De modo equivalente, tanto los de las comunidades autónomas como los insti
tutos estadísticos oficiales de otros países o de instancias supranacionales constru
yen su oferta de datos públicos que responden a las respectivas necesidades a cada
nivel o ámbito. De cara a la investigación social, cada agencia tiene su inventario de
«operaciones estadísticas» disponibles y suele procurar la mayor y mejor accesibi
lidad a ellos como parte de sus parámetros de calidad.
Como hemos señalado, el acceso directo a microdatos a través de las web de
estos institutos estadísticos es probablemente la innovación más decisiva de los
últimos tiempos en el acceso a información secundaria de las estadísticas oficiales.
Pero hay otras líneas de actuación en que, con las tecnologías actuales, los institutos
de estadística oficial pueden contribuir a la investigación, como es la producción de
datos sobre áreas emergentes en las que es difícil obtener información de primera
mano (discapacidad, desarrollo sostenible, globalización) y también en el desarro
llo normalizado de los metadatos, como es recomendación de la Comisión Europea
(Diario Oficial de la UE 30/06/2009).
Como sea mencionado, la Secretaría General de la ONU encargó a un grupo de
profesionales expertos/as independientes un informe sobre las necesidades, posi
bilidades y retos de la «revolución» de los datos masivos para el desarrollo sosteni
ble del planeta y en el que la integración de la información pública con otras fuentes
tiene un papel preeminente.
3.5.2. Centro de Investigaciones Sociológicas (CIS) y los repositorios de datos
de investigación
El Centro de Investigaciones Sociológicas (CIS) es un organismo autónomo depen
diente del Ministerio de la Presidencia cuya función principal es contribuir al cono
cimiento científico de la sociedad española. Para ello «recoge los datos necesarios
121
La investigación como proceso
para la investigación en ámbitos muy diversos» y «es responsable de llevar a cabo
estudios que proporcionen diagnósticos precisos» (web del CIS) sobre la realidad
social española. El CIS es, por tanto, un instituto donde se realiza investigación pro
pia, investigación encomendada por otros organismos y en colaboración con otras
instancias públicas o de investigación. Como fuente secundaria para la investiga
ción, el CIS es un gran productor de datos a través de la realización de encuestas (su
labor más conocida) y, aunque menos, de estudios cualitativos. El trabajo de difu
sión de la investigación a través de sus publicaciones es muy conocido e importante.
Tomando como referencia, por ejemplo, la Memoria de Actividades 2014, la dis
ponible más reciente (CIS, 2015), vemos la actividad organizada en tres grandes
áreas: publicaciones, investigación y banco de datos. En el área de investigación
se especifican los estudios llevados a cabo en un año, 39 en total, que incluyen 11
barómetros (mensuales, excepto en agosto), 14 estudios monográficos, 2 estudios
electorales (preelectoral y postelectoral) y 12 estudios mediante convenios de co
laboración. En este año todos los estudios son cuantitativos por encuesta. El último
estudio cualitativo se realizó en 2012. Los estudios cubren un espectro amplísimo
de temas, desde el pulso general a la opinión pública sobre la percepción de la situa
ción social, política y económicqphasta temas como la corresponsabilidad familiar,
hábitos de consumo, prácticas de ocio y deportivas, opiniones sobre política fiscal,
actitudes hacia la inmigración, opiniones sobre violencia de género, vivienda, ser
vicios públicos y otros.
Todos los datos que ha generado el CIS desde 1963 a través de sus estudios que
dan archivados en el Banco de datos, que es una fuente de información secundaria
muy importante para cualquier sujeto investigador en ciencias sociales, ya que to
dos los datos del CIS son de dominio público. El banco de datos tenía 2.008 estudios
a finales de 2014 (el 96% cuantitativos), a los que se puede acceder directamente
a través de la web especificando cuestionario, ficha técnica y datos. En el caso de
los estudios cualitativos, también hay una ficha técnica y las transcripciones de las
entrevistas y, en algunos casos, un informe metodológico.
Para quienes investigamos, el acceso web permite obtener la información ne
cesaria de varios modos y con distinto grado de elaboración. Para cada encuesta o
estudio se ofrecen resultados ya procesados (tablas de frecuencias y algunos cruces
de variables) sobre el conjunto del cuestionario. Pero además, recientemente se ha
puesto a disposición del público una plataforma de análisis online que permite ana
lizar estudios, preguntas o series temporales (desde 1994). El software es sencillo y
se pueden realizar búsquedas con criterios amplios. Los resultados se ven en forma
numérica y gráfica y son directamente exportables a formatos de hoja de cálculo o
texto.
Pero, sobre todo, desde que en 2009 se abrió la posibilidad de descarga directa
de ficheros de microdatos, esta es la forma creciente en que se accede a los estudios
con vistas al análisis secundario. La rapidez con que se puede explorar toda esta
información, y el hecho de contar con encuestas completas basadas en muestras
12 2
Explorando la información existente
de calidad, cubre un espacio importantísimo en el planteamiento de los diseños de
investigación, que en muchas ocasiones hacen innecesario pensar en llevar a cabo
una recogida de información ah hoc.
Otra cuestión de interés para el ámbito de la investigación, y especialmente la
investigación académica, es la apertura por el C1S del proyecto ARCES (Archivo de
Estudios Sociales), que es un repositorio institucional de datos de investigación so
cial que recopila, conserva y difunde datos de estudios realizados por todo tipo de
organismos y grupos de investigación en ciencias sociales en España.
Los repositorios institucionales son un modo de archivo y acceso a material de
investigación que se enmarca en el movimiento Open Data Access, impulsado desde
las instituciones europeas para preservar los datos de investigación y ponerlos a
disposición de la sociedad. La idea es que todos los datos procedentes de inves
tigaciones financiadas con dinero público se pongan a disposición del resto de la
comunidad científica (y público en general), depositándolos precisamente en es
tos repositorios que así irán conformando bases de conocimiento compartido. Y
no solo los datos cuantitativos o textuales, datos brutos o datos analizados, sino
también los metadatos.
A efectos muy inmediatos y como fuente de datos secundarios para la investi
gación, este tipo de repositorios, además de preservar la producción científica, se
entiende que favorecen la difusión de la investigación y reducen costes al evitar que
se dupliquen esfuerzos en la generación de información primaria.
También hay otras instancias o centros que tienen semejanzas con lo que ofrece
el CIS a nivel de información secundaria, bien sea porque realizan y ofrecen datos
de investigación cada vez más abiertos o por participar de programas de investiga
ción grandes que incluyen una difusión y acceso abierto importante. En este sector
caben desde agencias oficiales como el Centro Superior de Investigaciones Científi
cas (CS1C), que tiene un repositorio digital registrado internacionalmente (FECYT,
2012), hasta empresas privadas como ASEF/JDS, que cuenta con una base de datos
de investigaciones periódicas y específicas de más de 30 años. Está especializada en
grandes barómetros y estudios comparados y participa en varios consorcios inter
nacionales de estudios importantes, como la Encuesta Mundial de Valores.
Lógicamente en este sector a nivel internacional hay un número elevado de po
sibles fuentes de información secundaria, que es imposible listar también porque
muchas de ellas están especializadas y son temáticas.
Finalmente, sin ningún ánimo de prioridad ni exhaustividad, listamos algunas
páginas web interesantes que incluyen acceso a bancos de datos o documentales:
ASEP/JDS: [Link]
Banco Mundial: [Link]
Centro de Estudios Políticos y Constitucionales: [Link]
CIS: [Link]
Consejo Económico y Social: [Link]
123
La investigación como proceso
CSIC: [Link]
Encuesta Social Europea: [Link]/ess/
Estudio General de Medios (EGM): [Link]
Eurobarómetro: [Link]
Eurostat: [Link]
Eustat: [Link]
Foessa: [Link]
Fundación BBVA: [Link]
Fundación Juan March (CEACS): [Link]/ceáfcs
1NE: [Link]
Informe sobre desarrollo humano: [Link]
hom e/librarypage/hdr/[Link]
Iniciativa Devinfo ONU: [Link]
Instituto de Estadística de Cataluña: [Link]
Instituto de la Juventud: [Link]
Instituto de la Mujer: [Link]
Instituto Elcano: [Link]
I
La Caixa: [Link]
Ministerio de Educación, Cultura y Deporte: [Link]
Ministerio de Sanidad, Servicios Sociales e igualdad: [Link]
ONU Habitat: [Link]
ONU: [Link]
Repositorio digital CSIC: [Link]
Sistema de información geoestadística de Andalucía: [Link]/
institutodeestadisticaycartografia
TNS: [Link]
UN1CEF: [Link]
124
4. C R E A N D O N U EST R A P R O P IA
IN FO R M A C IÓ N
Una de las decisiones fundamentales en cualquier investigación social es la elección
del método o técnica de recogida de datos que vamos a emplear en nuestro estudio,
ya que de ello dependerán en gran medida los resultados a obtener, así como las
posibles conclusiones.
La elección del diseño de investigación concreto se deberá realizar en función
del objeto de estudio (población y aspectos) y de los objetivos (e hipótesis) que
nos hayamos propuesto. Pero también de la perspectiva teórica de la que partamos
y de otras consideraciones más «materiales» que no podemos obviar, como son el
tiempo y los recursos económicos de que dispongamos y las posibilidades de acce
so a la población a estudiar. Recordemos que muchas veces podemos considerar la
utilización de dos o más métodos simultáneamente, aunque esto será una decisión
que tendremos que tomar dependiendo de una larga serie de factores.
En términos muy pragmáticos, supongamos que un organismo o institución
determinada nos plantea realizar un estudio sobre las prácticas deportivas de la
población. Ante este tema de estudio podemos realizar diferentes abordajes: plan
tear el análisis de los hábitos deportivos de la población en general a partir de una
encuesta a esa misma población; realizar un estudio a partir de las licencias federa
tivas; analizar solo la práctica de deporte formal; observar la práctica en polidepor-
tivos o incluso en las calles de la ciudad; o podemos estudiar la práctica de aquellas
personas que acuden a diferentes equipamientos o instalaciones deportivas (pú
blicas o privadas), o pedir a la población que colabore en grupos participativos de
manera que sea posible interpretar las causas y el valor que se da al deporte (iden
tificación nacional, pertenencia a un grupo u otros).