BLOQUE II.
ENFOQUE CUANTITATIVO, LA ENCUESTA Y
EL DISEÑO MUESTRAL
UNIDAD 5
¿A través de qué proceso podemos conocer la realidad empírica? ¿De dónde procede la
información? ¿Qué caracteriza a las fuentes secundarias?
La observación inicial o diagnóstica de la realidad es el proceso que nos permite en ciencias
Sociales obtener la información necesaria para establecer el marco teórico que nos permita
identificar el problema.
Esta obtención de la información suele proceder básicamente de fuentes secundarias, y se
puede realizar básicamente bajo 2 enfoques: cuantitativo y cualitativo, y a través de la
aplicación de diferentes técnicas e instrumentos de investigación
La información puede proceder fundamentalmente de las siguientes fuentes de información:
FUENTES PRIMARIAS: Generadas expresamente para la investigación en cuestión
y como consecuencia directa del mismo.
FUENTES SECUNDARIAS: Contienen información elaborada antes del proceso de
investigación y relativa al tema objeto de estudio.
Relevancia de las fuentes secundarias
✓Antes de llevar a cabo el proceso de investigación empírica, hay que conocer toda la
información existente acerca del tema de objeto de estudio, por lo que el análisis de las
fuentes secundarias es indispensable para cualquier proceso de investigación.
✓ Una de las principales razones de esta RELEVANCIA de las fuentes secundarias se basa
en la necesidad de economizar en esfuerzo y recursos; ya que no tiene sentido investigar algo
que ya está estudiado.
✓ Así mismo las fuentes secundarias al final de la investigación son precisas a la hora de
interpretar los resultados obtenidos, y también de cara a poder comparar, si fuera necesario,
tales resultados con los derivados en otras investigaciones.
Fuentes estadísticas secundarias o datos preexistentes: el enfoque cuantitativo
La aplicación de la Estadística al estudio de ciencias sociales se centra sobre todo en las
poblaciones humanas.
Poblaciones de hecho ( residentes como no residentes censados)
Población de derecho (residentes, aunque no fueran censados).
La ciencia que se ocupa de dichas poblaciones es la Demografía y tiene su base empírica en
las denominadas estadísticas demográficas.
El origen de estas estadísticas se encuentra en el recuento de población humana a través de
los “censos”
¿Qué es un censo de población?
Es un instrumento de recogida de información sobre zonas pequeñas y grupos de población
que permite generar estadísticas, con errores nulos o mínimos.
Según Naciones Unidas las características esenciales de un censo de población son:
Enumeración individual se investiga uno a uno y se registran las características de
cada uno de los individuos de la población.
Universalidad dentro de un territorio, ya que la recogida debe incluir a todas las
personas que estén presentes en ese territorio en el momento que se realice el censo.
Simultaneidad, los datos se recogen en un mismo periodo de tiempo.
Periodicidad definida, la información se actualiza periódicamente.
En España los censos vienen elaborándose desde finales siglo XVIII con referencia a las 12
de la noche de los años terminados en 0. A partir del siglo XXI son los años terminados en1 .
En la actualidad el responsable es el INE y se realiza cada 10 años.
El Censo de Población, por tratarse de una operación estadística, no tiene limitación en las
variables que pueda recoger. Los datos que recoge están amparados por el secreto estadístico.
Los censos no deben confundirse con los padrones (listas o relaciones del patrono, señor o
rey). Estos son mucho más antiguos y su elaboración corresponde a los municipios, pero no
tiene carácter estadístico.
El empadronamiento es una prueba de la residencia y del domicilio en el término municipal;
tiene un carácter de documento público y fehaciente a todos los efectos administrativos.
La residencia y el domicilio son el principal motivo del Padrón municipal, por ello los únicos
datos que contiene son, además de los referentes a su domicilio, los que permiten identificar a
la persona: nombre y apellidos, sexo, lugar y fecha de nacimiento, nacionalidad y D.N.I (o
tratándose de extranjeros, del documento que lo sustituya), y nivel de estudios (este último
dato declarativo).
Con estos datos son muy limitadas las características demográficas que pueden estudiarse
estadísticamente.
¿Para qué sirve un censo?
El objetivo esencial de los censos es conocer la estática de las poblaciones humanas, a través
de sus características en un momento dado.
Un segundo objetivo es conocer las dinámicas de las poblaciones humanas, a partir de:
estadísticas vitales o de movimiento natural (nacimientos y defunciones,
matrimonios...)
movimientos sociales ( migraciones cambios de sector profesional...)
Estática de las poblaciones: características de la población y principales estadísticas
demográficas
Para conocer la estática de las poblaciones, se analizan los siguientes aspectos:
- Características biológicas/antropológicas:
Sexo
Edad
Talla
Color piel
Discapacidades....
- Localización de la población atendiendo a:
Zona rural o urbana
Densidad o número de habitantes por km2
Dispersión o distribución de los municipios y de sus habitantes
Tamaño de los municipios
- Características sociales:
Lugar de nacimiento / residencia
Nacionalidad
Estado civil
Nº de hijos
Nivel de estudios
Religión…
- Características económicas:
Población activa por sectores y ramas de actividad
Situación laboral
Categoría profesional
Nivel de ingresos
Tipo de contrato…
En relación a las características antropológicas o biológicas, las estadísticas más básicas
hacen relación al: Sexo y Edad
Los términos de clasificación del sexo en España son mujer/varón, mientras que en el resto de
países son femenino/ masculino; por lo que las iniciales a nivel internacional son F o M.
Las principales fuentes de datos estadísticos biológicos son: Anuario demográfico de
Naciones Unidas/ Instituto Nacional de Estadística
En relación a la edad, siempre es mayor la fiabilidad si el dato procede de un registro que
cuando es declarativa, ya que se tiende a redondear en 0 y en 5.
Las estadísticas de edades suelen representarse en tablas de distribución de frecuencias de
tipo discreto, donde la variable edad suele tomas los valores mínimos desde 0 hasta 84 con
dos clases finales 85 y más o desconocida.
Las frecuencias se presentan desagregadas, pero en ocasiones se agrupan los valores en
intervalos de clase.
Se representa gráficamente por pirámides de edad.
Otras estadísticas biológicas básicas son también:
Tasa de crecimiento anual o proporción media que aumenta la población de un país
respecto a la del anterior
Densidad de población, número de habitantes por km cuadrado. Mide la
concentración o dispersión en el interior de un país
En relación con las características de localización de la población:
Zona rural y zona urbana: distinción entre ambas zonas no tiene una definición
precisa ya que varía según el lugar.
En España se distingue entre:
- Zona urbana: + de 10.000 habitantes
- Zona semiurbana: entre 2.011 y 10.000
- Zona rural: - de 2.001
Dinámicas de las poblaciones
A. Estadísticas vitales (movimiento natural de población):
Naciones Unidas en 1970 estableció como hechos vitales los:
- Nacimientos: adopciones, reconocimientos y legitimaciones
- Matrimonios: tanto legales como no legales, divorcios, anulaciones, separaciones
judiciales
- Defunciones
Principal fuente de información en los países es el registro civil, aunque no está generalizado
en todo el mundo.
En estos registros de población, a cada persona por nacimiento o inmigración se le otorga un
número de identificación que le acompaña en cuantas anotaciones originen no solo sus
hechos vitales, sino otros sociales como escolaridad, y de carácter económico como
contratos. La existencia de ese no de identificación facilita enormemente la generación de
estadísticas.
Además de las fechas en las que se producen los hechos vitales, Naciones Unidas recomienda
que se recoja información adicional, entre la que se puede destacar:
- Lugar.
- Tipo de nacimiento (Parto natural o cesárea) / causa de la defunción.
- Características del nacido: sexo, peso, periodo gestación y legitimación/
características del fallecido: edad sexo estado civil.
- Características de la madre: No hijos legítimos...
Las publicaciones de estadísticas vitales se presentan como:
Recuentos de los hechos por características (volumen)
Tasas brutas o no de hechos ocurridos por cada 1000 habitantes (%).
Tasas de natalidad: nacidos vivos por cada 1.000 habitantes.
Tasas de mortalidad, no de defunciones por cada 1.000 hab.
Tasas de fecundidad ( no de nacidos por cada 1.000 mujeres)
Tasas de mortalidad infantil no de defunciones antes del 1er año de edad por cada 1.000
nacidos vivos
Esperanza de vida al nacer: no medio de años de vida de la población.
Estadísticas estáticas de procesos electorales:
Posicionamiento político.
Intención del voto.
INEbase/ Sociedad / Procesos electorales
B. Estadísticas de movimiento social (población activa/empleo y migraciones):
ESTADÍSTICAS DE MOVIMIENTO DE EMPLEO. Existen diversas fuentes para la
realización de las estadísticas de empleo de carácter registral como son los datos procedentes
del:
Servicio Público de Empleo Estatal (datos paro registrado)
Seguridad Social (No de afiliaciones)
Junto a estas fuentes de carácter registral se encuentran otras de carácter muestral tales como:
Encuesta trimestral de coste laboral (INE)
Encuesta de estructura salarial (INE)
Encuesta de población activa –EPA- (INE) Esta última es una de las principales
fuentes de movimientos de empleo.
La Encuesta de Población Activa (EPA) es una investigación continua y de periodicidad
trimestral dirigida a las familias que viene realizándose desde 1964 por el Instituto Nacional
de Estadística. Su finalidad principal es obtener datos de la población en relación con el
mercado de trabajo: ocupados, activos, parados e inactivos.
La EPA se realiza sobre una muestra de 65.000 familias al trimestre o, lo que es lo mismo,
unas 200.000 personas. La primera encuesta que se realiza a cada familia se hace de forma
personal por entrevistadores fijos del INE. Las sucesivas encuestas se pueden realizar por
teléfono o de forma personal.
El periodo de referencia de la información es la semana anterior a la entrevista. Los
resultados de la EPA se obtienen un mes y medio después de finalizar el trabajo de campo
- Población activa integrada por la población dedicada a la producción de bienes y servicios
(empleados) o disponibles para ello (desempleados en búsqueda de empleo).
- Población no activa: población de más de 16 años que son.
Jubilados/prejubilados, retirados o pensionistas
Estudiantes (No en situación de búsqueda de empleo)
Personas dedicadas a las labores del hogar
Actividades benéficas o Voluntarias
Estadísticas de empleo: el concepto Nini
La tasa de ‘ninis’ (jóvenes de entre 15 y 24 años que ni estudian ni trabajan) se situó en
España en el 12,4% en 2018, cifra similar a la del año 2000, que fue del 12,2%, después de
llegar a techos del 18,6% en 2012, en plena crisis.
De hecho, si se desglosa el concepto ‘nini’ como la suma de los jóvenes parados y los jóvenes
inactivos, se aprecia que:
- La tasa de parados “es sensible al ciclo económico”, pues llegan a una tasa del 13,3%
en los peores años de la crisis, siendo el elemento dinámico del concepto; mientras
que
- La tasa de inactivos, que son los que “ni estudian, ni trabajan, ni quieren” o ni pueden
(por cuestiones de salud, trabajo informal, artistas... por ejemplo), se mantiene
“constante” en torno al 5% y es muy parecida en todos los países de la OCDE”.
Otras Estadísticas de movimiento social
Clasificación Nacional de actividades económicas (CNAE 2009) de acuerdo a las
especificaciones del (NACE Rev.2)
Clasificación Nacional de ocupaciones (CNO)
ESCO. Clasificación europea de capacidades, competencias, cualificaciones y
ocupaciones.
ESCO es la clasificación europea de capacidades, competencias, cualificaciones y
ocupaciones, y forma parte de la estrategia Europa 2020. Determina y categoriza las
capacidades, competencias, cualificaciones y ocupaciones pertinentes para el mercado
laboral y la educación y formación en la UE. Muestra, de manera sistemática, las
relaciones existentes entre los distintos conceptos.
Movilidad interprovincial
Clasificación Nacional de actividades económicas (CNAE 2009) de acuerdo a las
especificaciones del (NACE Rev.2)
Clasificación Nacional de ocupaciones (CNO)
ESTADÍSTICA DE MIGRACIONES. Entendiéndose Migración como el movimiento de
población que consiste en dejar el lugar de residencia para establecerse en otro país
(migración internacional) o región (migración interna).
Cuando el movimiento de población es de llegada a un país/región se denomina inmigración
y si es de salida emigración.
Estadísticas de migraciones internacionales:
Según las causas que motivan estos movimientos : refugiados, migrantes económicos,
migrantes por desplazamientos cambio climático, reagrupamiento familiar, educación
y formación.
Según las Zona de origen/Zona de destino: – Tasas netas de migración
La Tasa de Migración Neta se define como la diferencia entre el número de inmigrantes y
emigrantes en un área determinada durante un periodo concreto, relacionada con población
media de dicha área en dicho periodo.
Principales fuentes estadísticas internacionales:
- https://migrationdataportal.org/es?i=stock_abs_&t=2019
- https://ec.europa.eu/eurostat/statistics-explained/index.php?
title=Migration_and_migrant_population _statistics/es
Principales fuentes estadísticas nacionales:
- http://extranjeros.mitramiss.gob.es/es/Estadisticas/index.html
- https://www.ine.es/dyngs/INEbase/es/operacion.htm?
c=Estadistica_C&cid=1254736177000&menu=ultiDatos&idp=1254 735573002
Estadísticas de migraciones internas:
Cuando las migraciones se realizan entre regiones de un mismo país o estado, son
migraciones internas.
En España el Instituto Nacional de Estadística recoge información sobre las migraciones
internas, diferenciando entre: migraciones interautonómicas y migraciones
interprovinciales.
Estadísticas oficiales o públicas: Son realizadas por administraciones públicas a partir de :
✓ Recogida directa de Datos generados por la actividad administrativa normal del Estado
✓ Recogida indirecta Datos obtenidos expresamente con una finalidad determinada.
El uso de datos administrativos para elaborar estadísticas que nos permiten conocer mejor la
sociedad no es generable a todas las sociedades actuales. Es una tradición típica de estados
europeos (S. XIX) con aparatos de gobierno centralizados.
Otra limitación viene dada por la naturaleza del hecho social que no se puede incluir en
ningún tipo de acto administrativo: inmigración ilegal, delitos no denunciados, torturas,
economía sumergida...
Distribución de los datos a través de organismos oficiales:
La informatización de la información y de la gestión administrativa ha hecho que el número
de estadísticas oficiales se incremente en ocasiones excesivamente con cierto grado de
dispersión, a pesar de ello en muchos países se tiende a utilizar un criterio único para la
distribución de resultados a través de publicaciones de referencia.
Ministerios
Comunidades Autónomas: la Ley de la Función Estadística Pública ha supuesto por
parte de las CC.AA asunción de competencias en materia de estadísticas y creación de
institutos oficiales.
Corporaciones locales y ayuntamientos de las principales ciudades españolas suelen
contar con departamentos de estadísticas.
Universidades públicas
Todos estos datos suelen estar disponibles en internet.
A escala de Unión Europea se encuentra la oficina de EUROSTAT
www.Europa.eu.int/comm/eurostat
Recoge datos producidos por las agencias nacionales y armoniza para facilitar su uso
a escala global.
Provee estadísticas al público en general a a través de publicaciones
Ofrece cooperación técnica con países que no forman parte de la UE
Series temporales
Una de las posibilidades más importantes que aporta la estadística a los investigadores RR.II.
Es la de elaborar series temporales o cronológicas.
Son series de datos estadísticos de 2 o más variables (bivariables o multivariables)
relacionadas entre sí y en la que una de ellas es el tiempo.
Cuando abordamos el marco temporal debemos distinguir claramente el momento al que se
refiere la variable:
Perspectiva estática: variables fondo ( momento determinado)
Perspectiva dinámica: variables flujo ( la unidad es un periodo temporal)
Las series temporales en la que el tiempo es una variable independiente son un instrumento
estadístico muy útil para conocer no sólo la evolución de una variable, sino también para
predecir su comportamiento futuro, establecer tendencias.
TIPOLOGIA:
Serie temporal en las que las variaciones son evolutivas, el valora medio de la
variable experimenta cambios o alteraciones a lo largo del tiempo.
Serie temporal en las que las variaciones son estacionarias, lo que significa que el
valor medio de la variable permanece constante o casi constante a lo largo del tiempo.
En ambos casos, los valores de la variable fluctuan a lo largo del tiempo, pero en unas estas
fluctuaciones provocan cambios en la tendencia de la variable dependiente y en otras no.
Variaciones temporales de la variable dependiente son resultante de 4 factores:
1. La tendencia principal o secular (T)
2. El componente cíclico(C)
3. El componente estacional(E)
4. El componente aleatorio accidental(A)
TENDENCIA PRINCIPAL muestra la fluctuación de los valores a largo plazo ( mínimo 1
década). Con ella se puede determinar si el movimiento es persistente ya sea de crecimiento,
de decrecimiento, cíclico* o estacionario .
*Las tendencias cíclicas se repiten a medio plazo ( por ejemplo 5 años)
VARIABLES ESTACIONALES reflejan los movimientos que experimentan los valores
de la variable a corto plazo y que se repiten de forma periódica. ( el periodo habitual es el año
pero no necesariamente: trimestres, trienios... Cuanto mayor sea el periodo de repetición de la
fluctuación más fuerte es la tendencia cíclica.
VARIABLES ALEATORIAS provocadas por factores ocasionales pero que por su
envergadura afectan a los valores de la variable. Estas variaciones tienden a diluirse en el
análisis de la tendencia principal, pero afectan significativamente a los valores en series
temporales más cortas.
Se aconseja prescindir de datos que arrojan aquellos periodos anormales influidos por
factores esporádicos
Principales indicadores / índices de Relaciones Internacionales
- Índice de desarrollo humano (IDH)
Elaborado por el PNUD en 1990
Surgió con la intención de establecer un indicador que permitiese valorar la
multidimensionalidad del fenómeno del desarrollo humano, superando su excesivo enfoque
económico.
La definición operativa del desarrollo humano resulta de la agregación de otras 3 definiciones
operativas secundarias:
Longevidad: Esperanza media de vida al nacer
Nivel educacional: Tasa de alfabetización de adultos. Tasa bruta de matriculación
combinada primaria, secundaria y terciaria
Nivel de vida: Pib real per cápita en Paridad del Poder adquisitivo en dólares.
El resultado es un número que se sitúa entre el 0 y el 1, siendo 0 el menor grado de desarrollo
y 1 el máximo.
A partir del IDH los países se clasifican en :
Países de desarrollo humano alto: De 0,8 a 1
Países de desarrollo humano medio: De 0,5 a 7,99
Países de desarrollo humano bajo: De 0 a 0,499
En sus inicios (primeros 15 años) experimentó numerosas modificaciones en su cálculo
estadístico que han incidido en el valor final atribuido a cada país y dificulta establecer una
serie temporal.
La introducción de este índice supuso un salto cualitativo en la investigación del fenómeno
del desarrollo al ofrecer datos cuantificados que facilitaban el análisis comparado, entre
países o temporal respecto de un mismo país, abriendo el camino para la investigación de:
- Las causas generadoras de las desigualdades en el desarrollo humano
- Eficacia de políticas nacionales o internacionales adoptadas.
LE CONFIRIÓ UNA MÍNIMA BASE EMPÍRICA MULTIDIMENSIONAL
Sin embargo, el IHD adolece de omitir la dimensión política como una de las variables
esenciales del desarrollo humano. Esta omisión se debe a la incapacidad de operacionalizar el
concepto teórico de desarrollo político en términos cuantificables.
La ausencia del índice de DESARROLLO POLÍTICO en los últimos años se está intentando
cubrir por diferentes índices desarrollados por instituciones tanto públicas como privadas.
- Otros indicadores parciales:
Índice de libertad humana: (ILH)
Instituto norteamericano Freedom House (1972)
Dirigido a medir el grado de libertad y democracia en la mayoría de paises, y territorios
dependientes. Contempla 2 categorías de variables:
o Derechos políticos
o Libertades civiles
Carece de definición operativa del concepto libertad; así como tras secundarias relativas a
derechos políticos y civiles.
Esta falta de definición se palia trabajando con cuestionarios que guían la investigación
en cada país.
Índice de pobreza humana de los países en desarrollo:
Índice de pobreza humana de los países industrialziados
Índice de desarrollo relacionado con la mujer
Índice de potenciación de la mujer
Índice de desarrollo relativo al género
Índice de potenciación del género
UNIDAD 6
TÉCNICAS DE INVESTIGACIÓN SOCIAL CUANTITATIVAS: LA
ENCUESTA
Definición y caracterización de la encuesta
DEFINICIÓN: la encuesta en investigación social se considera principalmente como una
técnica cuantitativa de recogida de datos, a través de la interrogación a los sujetos
anónimos de una población o muestra.
FINALIDAD: obtener sistemáticamente medidas sobre determinados conceptos que se
plantean a partir de una problemática de investigación, construida anteriormente.
INSTRUMENTO: el instrumento para la recogida de los datos que se utiliza es el
cuestionario.
CARACTERÍSTICAS:
La encuesta como instrumento de recogida de información se basa en la observación
INDIRECTA de los hechos, a través del diálogo entre personas: la que construye el
cuestionario y la que responde al mismo; es por ello que se le denomina técnica
dialógica.
El interés del investigador no es el sujeto concreto que responde el cuestionario, sino
la POBLACIÓN a la que pertenece, de ahí la importancia de que la muestra sobre la
que se aplica sea REPRESENTATIVA.
La información se recoge de forma ESTANDARIZADA y ESTRUCTURADA, con
instrucciones iguales para todos los sujetos, idéntica formulación de preguntas lo que
permite las comparaciones intergrupales.
Una vez diseñado el cuestionario por el investigador, es decir diseñado el
CONTEXTO a través del cual se interpretará la realidad social, la influencia entre el
entrevistado y entrevistador se reducen a la mínima expresión y se establece un canal
de comunicación UNIDIRECCIONAL.
La SIGNIFICATIVIDAD O CALIDAD de la información captada depende de la
existencia o no de errores durante el desarrollo de la encuesta:
- Errores de muestreo
- Errores de cobertura
- Errores de no respuesta
- Errores observación: Errores en el diseño del cuestionario y en su
administración. Sesgos introducidos por la respuesta del entrevistado si no
aporta información veraz. Sesgos introducidos por el entrevistador en la
formulación y orden de las preguntas. Error en el procedimiento de recogida
de información
- Errores de recodificación, depuración y tratamiento e interpretación de la
información recibida
Tipos de encuesta
a) Según como se administren:
PERSONALES: con entrevistador coincidiendo espacio y tiempo, hay un alto grado
de respuesta, permite que sea más larga y compleja ya que el entrevistador puede
interactuar. La disponibilidad de los datos es inmediata. Su coste es elevado. La
información es menos anónima. (BUENAS)
POR TELÉFONO: con entrevistador en el mismo tiempo, pero no espacio. Permite el
acceso a un mayor número de lugares, la obtención de la información es rápida e
inmediata, su coste es bajo. Se suelen gestionar a través del Sistema CATI. Las
respuestas deben ser sencillas, el cuestionario corto porque tiene mayor posibilidad de
interrumpirse la encuesta (RÁPIDAS)
POR CORREO POSTAL O ELECTRÓNICO: no existe encuestador. Las más
económicas. Da tiempo al encuestado para contestar, siendo la respuesta y
disponibilidad de información no inmediata, así mismo tienen un alto grado de no
respuesta. El cuestionario debe ser corto y las preguntas sencillas. El control sobre el
proceso es escaso. ( BARATAS)
b) Según su temporalidad:
SINCRÓNICA O SECCIONAL: referidas a un momento concreto en el tiempo
dirigidas a reflejar un fenómeno en un momento dado
DIACRÓNICA O LONGITUDINAL: implica el estudio de uno o varios fenómenos a
lo largo del tiempo. Incluye los estudios panel o la encuesta utilizada en el método
Delphi. EPA.
c) Según la muestra seleccionada:
CENSALES: Dirigidas a la población en su conjunto
MUESTRALES: Se dirigen a una muestra de la población
d) Según naturaleza de las preguntas:
Encuestas de hechos
Encuestas de opinión
Encuestas de actitud
e) Según la temática:
Existen numerosas categorías entre las que destacan: general de opinión, población activa,
condiciones de vida/de trabajo, salud, dependencia, movilidad, consumo, electoral,
satisfacción….
Fases de la encuesta
La investigación con encuesta por su importancia se ha convertido por sí en un método de
investigación social que incluye un conjunto diverso de técnicas combinadas que se orientan
hacia la producción de información científica de calidad. Entre estas técnicas se encuentran:
Las etapas de la encuesta en el proceso de investigación, a partir de la formulación del
problema y la especificación de los objetivos de la investigación, son las siguientes:
- Delimitación del universo: diseño de la muestra y definición de tipo de encuesta
(presencial, telefónica...)
- Elección y construcción de las técnicas de observación: diseño del cuestionario.
- Trabajo de campo: administración del cuestionario y captación de los datos.
- Análisis de resultados: Codificación de preguntas abiertas, depuración de
cuestionarios, procesamiento de los datos.
- Redacción del Informe de resultados.
Diseño del cuestionario
El cuestionario es el instrumento de recogida de información de forma ESTANDARIZADA,
a través de preguntas que se formulan de manera ORDENADA Y SISTEMÁTICA, y donde
se consignan las respuestas mediante un registro sencillo.
Formulación de las preguntas:
Las respuestas son las distintas categorías de las variables, se derivan de la
operacionalización de los objetivos de la investigación (diseño de indicadores), y deben
cumplir dos condiciones: ser EXHAUSTIVAS Y EXCLUYENTES.
Las preguntas deben FORMULARSE SIN SESGO, es decir:
✓ No deben ejercer influencia en el sentido de la respuesta
✓ No deben inducir a una respuesta inexacta.
Ejemplo:
¿Considera que la formación on line es peor que la formación presencial?
¿No es verdad que los osos son animales muy agresivos? ¿Qué te gusta más la pizza de
napolitana, la cuatro estaciones o la vegetariana?
Si se tiene en cuenta las respuestas a las que dan lugar las preguntas se pueden clasificar en
Cerradas y Abiertas.
Abiertas: LAS RESPUESTAS NO ESTÁN PREDETERMINADAS, se da libertad al
encuestado para que conteste con sus propias palabras. Proporciona mucha información sin
embargo presenta dificultades a la hora de codificarlas y un mayor esfuerzo al encuestado. ➢
Ejemplo:
¿Qué opina de la gestión de la crisis sanitaria?----------------------------------------------------
---------------------------------------------------------------------------------------------------
¿Cuántos días ha estado hospitalizado?-------------------------------------------------------------
--------------------------------------------------------------------------------------------------------
Cerradas: LAS RESPUESTAS ESTÁN PRECODIFICADAS, el investigador previamente
determina las opciones de respuesta.
a) Dicotómicas: El encuestado debe elegir entre 2 OPCIONES: Si/No, Verdadero/Falso.
Son de fácil respuesta y codificación, pero la información que ofrecen es limitada.
Ejemplo:
¿Le ha gustado el espectáculo? SI No
b) Opción múltiple: El encuestado debe elegir entre UNA VARIEDAD DE RESPUESTAS
PARA ELEGIR.
Respuesta única: Solo permiten seleccionar una respuesta.
Respuesta múltiple: Seleccionar todas las respuestas que considere pertinentes dentro de una
opción de respuestas
c) De escala: cuando en lugar de hechos, las preguntas hacen referencia a opiniones
objetivas o niveles de satisfacción, nos encontramos con este tipo de preguntas que además
de la actitud permiten conocer la intensidad de la misma a través de la GRADACIÓN DE
LAS RESPUESTAS. Existen diversos procedimientos escalares, a continuación, se
exponen los principales:
Escala de puntuación: Se podría pedir a los encuestados de que califiquen la satisfacción o
preferencia tomando como referencia una escala del 1 al 10. Indicando que número
corresponde al polo negativo y cual al positivo).
Este tipo de preguntas en una encuesta permite medir la evolución a lo largo del tiempo. Si se
envía al mismo grupo una escala varias veces en un lapso concreto se puede medir si el
sentimiento tiene una tendencia negativa o positiva.
Ejemplo: escala semántica diferencial
¿Cómo calificarías tu experiencia?:
Excelente
Muy buena
Buena
Ni buena ni mala
Mala
Muy mala
Pésima
Otros tipos de escala:
1) Escala de THURSTONE y escalograma de GUTTMAN: las categorías de respuesta
son dicotómicas: DE ACUERDO/ EN DESACUERDO.Son escalas poco habituales y las
respuestas tienden al acuerdo.
2) El diferencial semántico de Osgood: Este procedimiento escalar los encuestados deben
marcar una de las posiciones (normalmente 7), siendo 1 la respuesta más negativa y 7 la
más positiva. La puntuación global es el promedio de todas las respuestas.
Ejemplo: ¿Cómo definiría a sus jefes?
Autoritarios _______________ No autoritarios
Cooperativos _______________ No cooperativos
Comunicativos _______________Poco comunicativos
Incompetentes ________________ Competentes
3) Escala de LIKERT. En lugar de ser dicotómica se le ofrece al encuestado varias
categorías de respuesta que normalmente suelen ser entre 3 y 10.
Muy probable
Poco Probable
Nada Probable
Muy de acuerdo
De acuerdo
Indiferente
Poco de acuerdo
Muy en desacuerdo
d) De ordenación, clasificación o ranking. De mayor a menor de la inversa. En este tipo de
preguntas se pide a los encuestados que clasifiquen una variedad de opciones de respuesta
diferentes, en términos de prioridad relativa o importancia para ellos. Este tipo de preguntas
brindan retroalimenación cualitativa sobre el grupo de encuestados pero no especifican los
porqués
Ejemplos: Ordena de mayor a menor tu interés por los siguientes temas, siendo 1 el que más
te interesa y 4 el que menos:
Defensa
Cooperación
Comercio Internacional
Medioambiente
Según la naturaleza de su contenido:
Tipología diversa: las preguntas pueden plantearse sobre cuestiones concretas de distinta
índole, sobre intenciones, opiniones, razones, y sobre la identificación de los sujetos (sexo,
edad, estado civil, ...)
Según su función:
• Preguntas filtro: dirigidas a seleccionar a una parte de los encuestados para realizarles
posteriormente preguntas solo indicadas para ellos.
Ejem: P.1.- ¿Está Vd. trabajando actualmente? 1 Si 2 No P.1.A.- Solo en el caso de que Vd.
esté trabajando ¿Cuál es su tipo de contrato?
• Preguntas de control: tienen como objetivo determinar la VERACIDAD de las respuestas,
para ello existen varias opciones:
✓ Se duplica una pregunta con distinta redacción y se sitúa espaciada respecto de la pregunta
inicial, con el fin de confirmar que las respuestas de ambas preguntas son consistentes.
✓ Se incorpora una información falsa como una opinión sobre un personaje ficticio, o un
hecho inexistente
Formulación de preguntas
Así mismo y en relación a la formulación de las preguntas a continuación, se exponen
algunas reglas:
- SENCILLEZ Y BREVEDAD: El enunciado debe ser sencillo y si es posible con enunciados
cortos, con una sola sentencia lógica.
- CLARIDAD: Debe plantearse sin ambigüedades ni dobles sentidos (si es necesario se puede
aclarar el significado de lo que se quiere decir).
- LOS ENUNCIADOS DEBEN SER POSITIVOS: Hay que evitar la doble negación
-NEUTRALIDAD: Las preguntas deben formularse sin sesgo, no deben realizar valoraciones
ni hacer indicaciones sobre el sentido de la respuesta, es decir
• No deben ejercer influencia en el sentido de la respuesta
• No deben inducir a una respuesta inexacta.
- PERSONALIZACIÓN: La pregunta debe ser expresada en un lenguaje comprensible para
el entrevistado; así mismo de una forma próxima a su experiencia personal, a su realidad en
relación al tema planteado.
- AUSENCIA DE CARGA EMOCIONAL Y DISCRECIÓN: Las preguntas no deben ser
indiscretas innecesariamente, muyprivadas porque en ese caso la respuesta estará
condicionada.
- CÁLCULOS SENCILLOS: El enunciado no debe obligar a hacer esfuerzos de
memorización o cálculo complejo
- PREGUNTAS CERRADAS: Preferiblemente las preguntas serán cerradas dando lugar a
una respuesta inmediata con un número categorías de respuesta. Así las opciones de repuesta
deben ser exhaustivas y prever en cada caso las categorías “ No sabe / No contesta (NS/NC)”.
Orden y extensión
El número de preguntas debe ser el adecuado, SIN PREGUNTAS INNECESARIAS NI
REDUNDANTES, simplificando siempre que sea posible.
La secuencia de las preguntas en el cuestionario es importante y debe seguir un ORDEN
LÓGICO.
Las primeras preguntas deben ser SENCILLAS Y MOTIVADORAS.
Se puede iniciar con PREGUNTAS INTRODUCTORIAS relativas a la IDENTIFICACIÓN
Se EMPIEZA CON PREGUNTAS SENCILLAS para ir introduciendo progresivamente las
más complejas. Esta regla se puede seguir también en cada uno de los bloques.
Debe existir una TRANSICIÓN de un bloque a otro de preguntas y si es necesario se
realizará una pequeña introducción.
Se deben EVITAR LAS PREGUNTAS REPETITIVAS sobre cuestiones similares para no
inducir a la respuesta automática poco reflexiva.
Es importante la consideración de la UBICACIÓN de las preguntas filtro y su ubicación para
orientar los temas y los colectivos que deben responder.
Pro-test y proyecto piloto
Un cuestionario debe probarse antes de su aplicación definitiva sobre una pequeña muestra de
individuos SEMEJANTES a los de la población objeto de estudio, que NO tiene porque ser
REPRESENTATIVA necesariamente, con el fin de comprobar:
- Que las preguntas han sido correctamente comprendidas por todos los sujetos
- Si ha producido rechazo hacia alguna pregunta
- Si la extensión y duración de las preguntas son adecuadas
- Que no hay preguntas donde todos los resultados se concentren en una sola
variable(todo o nada), ya que la información proporcionada no ayuda a
discriminar
- Si una pregunta concentra un alto porcentaje de no sabe/no contesta
- Si más de un 5% de los encuestados no contestan a todo el cuestionario en su
totalidad
- Si la categorización y la codificación es correcta y la secuencia lógica
adecuada
FORMATO DEFINITIVO
Los cuestionarios deben incluir siempre unas instrucciones sencillas para su correcta
cumplimentación que también deben comprobarse en el pre test.
Después del pre test se deben incluir las oportunas correcciones y elaborar el cuestionario
definitivo que debe incluir:
Identificación del Organismo que lleva a cabo la investigación
Título completo del estudio en el que se enmarca la encuesta
Declaración explícita de que el cuestionario es anónimo y que la información
recabada se va a tratar con la máxima confidencialidad
Fecha de cumplimentación del cuestionario
Instrucciones para la correcta cumplimentación
Fórmula de agradecimiento al encuestado por su colaboración.
Diseño muestral
La aproximación a la realidad a través de encuestas por muestreo en uno de los ejes
centrales de la investigación empírica.
El diseño muestral por tanto se configura como una herramienta fundamental a la hora de
reducir los errores, asegurando la representatividad y precisión de la información obtenida
con el fin de que de los datos sea posible realizar una inferencia desde la muestra hacia la
población.
Las muestras cuyos resultados vienen avalados por la teoría son las muestras probabilísticas:
Aseguran que las estimaciones no sean sesgadas.
Podemos calcular el error .
¿Qué significa que una estimación se insesgada o no sesgada y precisa?
Un estadístico de la muestra es un estimador insesgado si, en promedio, los valores de
estadístico obtenido en la muestra realmente son iguales al parámetro. Es decir los valores
estimados están en el entorno de los valores reales.
La precisión hace referencia a la concentración de valores en el muestreo, es decir a la poca
variabilidad: su posible desviación de los mismos es pequeña.
a) Probabilístico:
- A la hora de seleccionar la muestra. Muestreo aleatorio simple, aleatorio
estratificado y por conglomerados.
- A la hora de recoger la información
b) Preciso
- Tamaño de la muestra o número de elementos del universo que es necesario
seleccionar para extraer información que se pueda generalizar.
- A medida que aumenta la precisión el estimador del intervalo de confianza se
hace menor
- El estimador de precisión se mide por el error del muestreo, la desviación
típica del estimador que refleja su dispersión.
Pasos a tener en cuenta:
Acotar o determinar correctamente el universo que constituye el marco muestral.
Ejemplo: si queremos realizar una encuesta a hogares del una determinada población que en
los último años ha recibido un alto porcentaje de inmigración y para ello partimos del último
padrón. Introduciremos un sesgo porque un importante número de la población,
fundamentalmente inmigrante no se tendrá en cuenta en el estudio
Dificultades para obtener el listado de elementos que constituye la población, afectarían para
garantizar la cobertura de la muestra.
Encuesta filtro
UNIDAD 7
DISEÑO MUESTRAL
Concepto
Mientras que la estadística descriptiva el objetivo es describir las características o ítems
observados en un grupo de individuos, en la estadística INFERENCIAL el objetivo se dirige
a obtener, a partir del estudio de las características de una muestra extraída de una población
o universo, generalizaciones estadísticas para el conjunto de esa población.
Estadística inferencial: técnicas
Las técnicas estadísticas son las mismas en la estadística descriptiva y la inferencial, las
diferencias residen en la manera como se utilizan.
Mientras que en la estadística descriptiva las técnicas se utilizan para resumir o describir
datos, en la estadística inferencial se utilizan para estimar parámetros de una población a
partir de los cálculos realizados a los datos de una muestra.
Cuando nos refiramos a características de una población hablaremos de PARÁMETROS,y
para representarlos se utilizan letras griegas.
Si nos referimos a características de una muestra tendremos indicadores ESTADÍSTICOS, o
simplemente estadísticos y para su representación se utiliza el abecedario latino.
Teoría de las probabilidades
La estimación de parámetros de una población a partir de los indicadores estadísticos se basa
en la teoría de las probabilidades y la teoría del muestreo.
PROBABILIDAD: El concepto de probabilidad que ha sido más usado hasta la formalización
de la estadística, es la definición de Laplace que establece que la probabilidad de un suceso
como el número de casos favorables dividido por el número de casos posibles.
Ejemplo: al arrojar un dado la probabilidad de Obtener un número par es de acuerdo con esta
Definición es: 3/6 = 0,5
La definición anterior supone que todos los casos sean igualmente probables, pero sin
embargo si en una urna tenemos 10 bolas: 2 azules, 3 amarillas y 5 rojas.
La probabilidad de que la primera bola extraída al azar sea azul será P= 2/10, que sea amarilla
P= 3/10 y que sea roja P=5/10.
La probabilidad igual a 1 P=1 sería certeza del suceso.
La probabilidad igual a 0 P=0 sería certeza de no ocurrencia
Bajo esta fórmula, las probabilidades se establecen a priori según la naturaleza y lógica del
suceso, en lugar de la experiencia o experimentación, pero esto no ocurre en la mayoría de los
fenómenos sociales por lo que se debe recurrir al método de probabilidades empíricas
Probabilidad empírica
La probabilidad empírica se basa en el supuesto de que la proporción de aparición de los
sucesos observados en el pasado persistirá en el futuro.
Según Boris Parl: “las probabilidades empíricas son tan sólo estimaciones de las
probabilidades verdaderas, pero cuanto mayor sea el número de casos observados más precisa
será la estimación”.
No permite obtener la probabilidad verdadera de un suceso, ahora bien, apoyándose en la
experiencia previa es posible obtener buenas estimaciones de los sucesos.
Obtención de la muestra
La obtención de la muestra es una de las fases más importantes de la estadística inferencial
porque las características de la muestra que se extraiga de la población va a condicionar la
validez o no de la inferencia que se realice.
No vale cualquier muestra, la muestra que se obtenga debe tender a ser lo más representativa
posible de la población.
Ejemplo:
Si queremos obtener la media de estatura de la población española, ante el coste de preguntar
a toda la población cuanto mide se procede a trabajar sobre una muestra.
Para obtener la muestra podríamos visitar un Polideportivo baloncesto o una escuela infantil
o un convento de monjas e ir entrevistando a las personas que vayan entrando o saliendo,
pero esas muestras no serían válidas ya que no son representativas de la población en su
conjunto. Para garantizar la representatividad es necesario aplicar un MÉTODO DE
MUESTREO
Si queremos conocer la proporción o porcentaje de personas mayores de 14 años residentes
en Madrid que fuman o no fuman, al no ser posible realizar una encuesta a todos y cada uno
de los integrantes de la población ( por razones de coste y de tiempo de dificultad para
localizar a la población...) el investigador preguntará solamente a una parte de la población.
Si el investigador no conoce los métodos de muestreo seleccionará según su criterio subjetivo
el número de personas que considera necesario entrevistar. Por ejemplo 100 habitantes,
obteniendo unos resultados de que el 40% de ellos fuman y el 60% no fuma.
Si el investigador conoce los métodos de muestreo la selección la habrá realizado con una
serie de objetivos y criterios. Puede que finalmente haya entrevistado también a 100 personas
y un 40 % de ellas haya contestado que no fuma, inferiendo que el 40% de la población no
fuma.
¿Cuál es la diferencia entre ambos resultados?
Con el mismo resultado, en el primer caso no podemos encontrar alguna medida que
nos informe sobre que confianza nos ofrecen estos resultados, ni que error pueden
presentar los mismos.
El segundo caso al haber aplicado las técnicas de muestreo, el resultado es un
indicador estadístico y el resultado pude presentarse en los siguientes términos:
La proporción de fumadores es P= 0,40
Error de muestreo: 0,13
Coeficiente de confianza: 0,95
Como 0,40-0,13= 0,27 y 0,40 + 0,13 = 0,53 podríamos interpretar
Si se realizaran 100 encuestas muestrales en las mismas condiciones que la realizada, en 95
de ellas (Nivel de Confianza) el % de fumadores de la población SE ESTIMA que estará
comprendido entre los valores 0,27 y 0,53, es decir entre un 27% y un 53%.
Muestreo probabilístico/aleatorio simple
El muestreo aleatorio es un proceso que permite obtener una muestra sobre una población,
basada en una determinada probabilidad de elección de los individuos que la conforman.
Este tipo de muestreo es uno de los más utilizados en el método científico. Las razones son
varias, pero las más relevantes serían las siguientes:
En primer lugar, es el único que permite hacer análisis confirmatorios
e inferencia estadística. De hecho, la segunda se realiza también en muestreos no aleatorios,
pero no podremos confirmar los resultados. En este caso, la investigación es de tipo
exploratorio.
Por otro lado, relacionado con el apartado anterior, este método reduce el sesgo. Es decir, al
tener cierta probabilidad (conocida) de escoger un determinado individuo de la población,
evitamos la subjetividad inherente en la selección no aleatoria.
Por último, permite utilizar muestras de pequeño tamaño en poblaciones grandes. Eso sí, hay
fórmulas para calcular esas muestras mínimas con poblaciones conocidas o desconocidas.
Se parte del listado de elementos de la población y se selecciona aleatoriamente N elementos
para formar con ellos una muestra.No es un método que se pueda hacer de cualquier manera,
sino que debe garantizar:
a) Cada elemento de la población debe tener las mismas posibilidades de ser incluido en
la muestra
b) Cada posible combinación de N elementos debe tener la misma probabilidad de
constituir la muestra.
Este proceso de muestreo sería equivalente a hacer un sorteo entre los individuos/ elementos
del universo.
Este proceso de muestreo sería equivalente a hacer un sorteo entre los individuos/ elementos
del universo:
Se asigna a cada individuo/elemento del universo un boleto con un número.
Se introducen todos los números en un bombo y se empiezan a extraer números al
azar.
Todos los individuos/elementos de la población que tengan un boleto numerado con
un número extraído del bombo forman parte de la muestra.
a) Si los individuos pueden ser seleccionados más de una vez en la muestra hablaremos de
Muestreo aleatorio simple con reposición. Una reposición implica reintroducir el boleto
extraído de nuevo en el bombo y qué entre otra vez en el sorteo, es decir que un individuo
elemento pueda formar parte de la muestra varias veces.
b) Si los individuos solo pueden ser seleccionados una vez, nos encontramos con un
Muestreo aleatorio sin reposición. Una vez que el número ha sido extraído no se vuelve a
incorporar ese boleto al bombo.
¿Qué es mejor, usar o no usar reposición?
CON REPOSICIÓN: Si la población N es muy grande (más de 100.000 individuos) y la
muestra que queremos extraer es mucho menor, es muy poco probable obtener una muestra n
en la que aparezca repetido un elemento más de 1 vez.
SIN REPOSICIÓN: Si la población N es muy grande o infinita, no cambia absolutamente
nada. Pero si la población es pequeña, el muestreo sin reposición es ventajoso.
Ejemplo:
Partimos de un universo de 650 alumnos que cursan primero de Gestión y Administración
Pública, la selección se debe hacer con las premisas enunciadas anteriormente.
Primero se ordenan los 650 elementos del universo numerándolos de 1 a 650.
Para realizar la selección aleatoria se suelen utilizar las tablas de números aleatorios
que simplifican enormementeel proceso. En la actualidad se dispone de programas
informáticos que generan estos procesos.
Tablas de números aleatorios
Las tablas presentan múltiples combinaciones de números extraídos al azar, dispuestos en
filas y columnas, y de cualquier fila o columna, se toman tantos números consecutivos, como
el de elementos de la muestra. En este caso como la muestra es 650 se tomarán 3 números.
Los números sacados al azar: 310, 118, 340, 455, 020, 053, 035, 149, 398, 062, 366, 353 ,358
,221...se incorporan a la muestra e indican la posición del elemento a seleccionar sobre el
universo numerado, y que por tanto deben ser encuestados.
Errores de muestreo
Suponemos que aplicando el procedimiento aleatorio simple se ha extraído una muestra de n
unidades. El margen de error o error muestral, o precisión, se refiere a la diferencia entre la
media muestral y la media poblacional que estamos dispuestos a tolerar.
Suele adoptarse el 3% e= 0,03, aunque es elección del investigador, teniendo en cuenta este a
la hora de interpretar los datos.
Cada muestra de tamaño n que se extraiga de la población N dará una estimador de
proporción p diferente del anterior, que viene determinado porque se trabaja sobre una
muestra y no sobre la población.
La desviación típica de todos los estimadores de proporción posibles es lo que se denomina
ERROR DE MUESTREO y se representa con la siguiente fórmula error de muestreo =
donde q es igual a 1-p.
Cuando no se nos proporciona el valor de P , el valor es de 0,5 para p y q es decir se plantea
el escenario más diverso y por tanto el que requiere mayor tamaño de muestra
Decimos que se extrae una buena muestra de la población cuando el error de muestreo es el
más pequeño posible, para que el estimador sea tanto más preciso.
Los errores del muestreo: Del tamaño de la muestra
Para determinar el tamaño de la muestra con el fin de que esta sea representativa depende de
distintos factores:
Del valor de la DESVIACIÓN TIPICA de la población, que cuanto menor sea, menor
tiene que ser la muestra, porque indica mayor homogeneidad de los datos.
Del valor de la PROPORCIÓN de p de la población. Si la p es pequeña, el tamaño de
la _______ deberá ser más grande.
Del tipo de distribución de la población. No es lo mismo que siga una distribución
NORMAL , que desconocer cómo se distribuye. En el primer caso la muestra será
menor.
Del tamaño N de la población. A medida que aumenta N, el tamaño de la muestra
también aumenta, pero en menor proporción.
Intervalos de confianza
Cuando se habla en estadística del nivel de confianza se hace referencia a la probabilidad de
acertar, o a que una estimación, en ausencia de sesgos, se ajuste a la realidad.
determinado intervalo de probabilidad 𝑝 − 𝑧𝑆, 𝑝 + 𝑧𝑆 que vendrá definido por el valor de
Se llaman así porque el valor del error que tratamos de estimar se encuentra en un
Z.
Para muchas variables aleatorias la distribución de la probabilidad es una curva específica y
bien delineada que recibe el nombre de CURVA NORMAL O DE GAUSS, que es la base
sobre la que se realizan los cálculos de dicha probabilidad.
LA DISTRIBUCIÓN NORMAL. Para operar con ella se utilizan unas tablas que dan
directamente el área que queda por debajo de la curva normal. Con independencia de los
valores que tomen la media y la desviación típica de una Curva normal cualquiera, siempre
habrá un área o proporción de casos constante, entre la media y una ordenada que se
encuentra a una distancia dada con respecto a la media, en términos de unidades de
desviación típica
En general en Ciencias Sociales se suele trabajar con un nivel de confianza del 0,9544 que es
el que se corresponde con la probabilidad de la curva acotada por +-2 desviaciones estándar.
Determinación del tamaño de la muestra
Así, el TAMAÑO DE LA MUESTRA hace referencia al número de elementos del universo
que se van a seleccionar y por tanto a la concreción numérica del nivel de precisión de las
estimaciones.
A partir del conocimiento del error absoluto prefijado, el margen de probabilidad deseado (Z)
y el valor de p*, es posible determinar el tamaño de la muestra n en una población de tamaño
N conocido. *(Cuando P no está determinado se asume el caso más desfavorable 0,5)