3.
Investigación sobre los componentes de una investigación
estadística
INTRODUCCIÓN
En este ensayo se planea hablar sobre los componentes de una investigación
científica y su uso en la estadística inferencial, primero debemos saber qué es la
estadística inferencial, es la ciencia que utiliza datos numéricos para obtener
inferencias basadas en el cálculo de probabilidades. Ahora que sabemos en qué
consiste la materia en la que se implica la investigación, también debemos saber qué
es una investigación, es considerada una actividad humana orientada a la obtención
de nuevos conocimientos y su aplicación para la solución de problemas o
interrogantes de carácter científico.
Con esto dicho podemos decir que la investigación estadística se utiliza para obtener
conocimientos o respuestas a interrogantes de carácter estadístico por medio del
cálculo de probabilidades y llegar a inferencias estadísticas. El estudio estadístico de
una situación con propósitos inferenciales se centra en dos conceptos
fundamentales: población y muestra, en donde la población es el conjunto formado
por todos los valores posibles que puede asumir la variable objeto de estudio y la
muestra es cualquier subconjunto de la población, escogido al seguir ciertos criterios
de selección. Ambos conceptos tienen dos connotaciones que son dos maneras de
interpretar cuando se hace un estudio estadístico o investigación estadística, la
primera es la interpretación propia en el análisis estadístico, que corresponde a la ya
presentada y la segunda como el conjunto de objetos sobre los cuales actúa la
variable considerada.
La inferencia estadística se orienta a sacar conclusiones acerca del parámetro o
parámetros poblacionales con base en el valor de un estimador obtenido a partir de
los datos muestrales extraídos de esa población; para llegar a ese objetivo se debe
seguir un proceso racional y eficaz que está compuesto por varios pasos que se
explicarán en el desarrollo de este ensayo.
DESARROLLO
La estadística es una ciencia, con su propio campo de estudio, y también un
instrumento (conjunto de técnicas) que utilizan ampliamente otras ciencias. Es una
rama de la matemática aplicada, cuyo objeto de estudio es el comportamiento de las
variables que pueden asociarse a una o más poblaciones. En tal caso, “población” es
sinónimo de “universo”, un conjunto bien definido de personas o de objetos, a los que
es posible asociar variables medibles o cualidades. La estadística como ciencia se
basa en la teoría de las probabilidades, cuyo origen se remonta al siglo XVIII (“Teoría
de los juegos de azar”). Recién a comienzos del siglo XX la estadística se estructuró
como ciencia formal a partir de los axiomas de Kolmogorov.
En otro orden, la estadística es una ciencia auxiliar, un instrumento para el avance de
otras ciencias, desde que las técnicas estadísticas forman parte del método
científico. Entre estas técnicas pueden mencionarse los métodos de resumen de
datos, tanto numéricos como gráficos, la comprobación de hipótesis y las técnicas de
muestreo.
Ahora una investigación conlleva a un método científico que es un proceso que
permite incrementar el conocimiento y generar conocimiento nuevo. Si se sigue la
lógica del método científico, entonces el producto obtenido se denomina
“conocimiento científico”. Si los nuevos conocimientos pueden organizarse en un
cuerpo coherente, que permite explicar hechos ya ocurridos y predecir hechos que
habrán de ocurrir, entonces el método científico (la investigación científica) conduce
a la formación de nuevas teorías, y también a modificar las teorías existentes o a
destruirlas.
En lo que se enfoca la estadística inferencial son las teorías que surgen de la
investigación estadística. La teoría es un conjunto de proposiciones lógicamente
articuladas que tiene por fin la explicación y predicción de resultados en un área
determinada de fenómenos. A partir de la teoría se extraen una o varias hipótesis.
Estas representan predicciones o respuestas probables a las preguntas que se
formula el investigador. Las hipótesis estadísticas suelen formularse como
proposiciones en las que se realizan afirmaciones respecto de una variable o
respecto a las relaciones entre dos o más variables, y las mismas deben ser el reflejo
de la teoría que las sustenta y sólo tiene sentido si pueden someterse a prueba.
La estadística inferencial es la que se encarga de las teorías e hipótesis estadísticas,
en lo que se conoce como “contraste de hipótesis” que nos conduce a aceptar
provisionalmente las hipótesis o a rechazarlas. En el primer caso se dirá que la
evidencia empírica no contradice la teoría, y ésta permanecerá firme en tanto no
aparezca nueva evidencia en contra. En el segundo caso, la teoría dejará de formar
parte del conocimiento científico y será necesario elaborar nuevas teorías.
Para la creación de teorías, hipótesis y el contraste de hipótesis lo primero que se
debe hacer es la investigación estadística, y una investigación de cualquier índole
debe de tener algunos atributos para considerarse de calidad y ser útil para una
teoría. Según Neil J. Salkind, una investigación de calidad debe tener los siguientes
atributos:
a) La investigación es una actividad que puede repetirse
b) La investigación puede generalizarse a otras situaciones
c) La investigación se basa en el razonamiento lógico y está vinculada a una
teoría.
d) La investigación genera nuevas preguntas y es de naturaleza cíclica
e) La investigación es incremental
f) La investigación es una actividad que debe emprenderse con el fin de mejorar
la sociedad.
Una investigación se puede denominar “estadística” cuando las hipótesis son del tipo
definido más arriba: afirmaciones relativas a la distribución de una o más variables
aleatorias. En estas investigaciones pueden identificarse, entre otros, los siguientes
componentes:
Un universo: Conjunto de entidades respecto de los cuales se desea conocer
alguna o algunas de sus características.
Variables: Características medibles que poseen todas las unidades del universo.
Objeto de investigación: No consiste en identificar las entidades del universo con
ciertas características, sino que se trata de resumir información acerca de la
distribución de dichas características en la población.
Procedimiento de recolección: es posible conocer, mediante un procedimiento
adecuado, el valor de la o las variables de algunas o de todas las entidades del
universo.
Restricciones: En cuanto a los recursos disponibles (humanos, técnicos
financieros) y en cuanto a la oportunidad en que deben darse a conocer los
resultados de la investigación, lo que obliga a elegir, entre varias estrategias
alternativas, la que resulte más eficiente.
Una investigación estadística puede fracasar cuando no ha sido adecuadamente
planificada, cuando el presupuesto es insuficiente o no se asigna en forma
equilibrada entre las diferentes actividades, cuando no se dispone de personal
capacitado o cuando se cometen errores graves en la ejecución de las tareas o en el
procesamiento de la información. La materia prima de la investigación estadística son
los datos. La clave del éxito de la investigación está relacionada con los
procedimientos que se siguen para la selección, la recolección y el tratamiento de los
datos. Las actividades que involucra una investigación estadística pueden
clasificarse con arreglo a diversos criterios. Uno de ellos se relaciona con el orden
cronológico en que deben ser realizadas. En este sentido, puede hablarse de tres
grandes etapas o fases:
Planificación
Ejecución y procesamiento
Análisis y divulgación
La división en tres fases es totalmente convencional. En muchas investigaciones
estadísticas las mismas personas trabajan en todas o la mayor parte de las
actividades, las cuales se solapan tanto como es posible para ganar en oportunidad.
La división en fases se realiza exclusivamente para facilitar la presentación de los
conceptos involucrados.
FASE 1: PLANIFICACIÓN
1. Objetivos de la investigación
Los objetivos refieren al propósito, al por qué de la propuesta de investigación. El
propósito está relacionado con ciertas hipótesis, ciertas necesidades de información
en el marco de una teoría.
- Ejemplo: Encuesta de población en edad escolar. Los objetivos apuntan a conocer
cuántas personas en edad escolar asisten al sistema educativo. Podrían agregarse
como objetivos adicionales:
Conocer el perfil de los hogares de los niños que no asisten.
Conocer los motivos que argumentan los padres para no matricular a sus hijos
en el sistema educativo.
Conocer los motivos de la deserción.
2. Universo, unidad a investigar y unidad de observación
El universo refiere a la población que se desea investigar. La unidad a investigar es
cada individuo del universo. La unidad de observación puede o no coincidir con la
unidad a investigar. La unidad de observación es a la que se dirige el investigador
para indagar por la unidad a investigar. Población e individuo se utilizarán aquí en un
sentido amplio: la “población” es el conjunto de entidades que definen el universo e
“individuo” es cada una de las entidades.
Ejemplo 1: Encuesta de hogares
Universo: Hogares particulares residentes en el país en el año 2019.
Unidades a investigar: Hogar particular y sus miembros.
Unidad de observación: Todas las viviendas particulares del país.
Ejemplo 2: Encuesta de población en edad escolar.
Universo: Población de niños de 6 a 12 años.
Unidades a investigar: Niños de 6 a 12 años.
Unidad de observación: Hogares particulares y colectivos.
3. Procedimientos de recolección
Los procedimientos de recolección más comunes son:
Censo
Muestreo
Explotación estadística de registro administrativo
Experimentación
En una investigación estadística habitualmente se utiliza un solo procedimiento, pero
en ocasiones se suelen combinar dos o más procedimientos para hacer una mejor
utilización de la información existente.
Censo: Es una investigación estadística en la que se intenta obtener información de
la totalidad de las unidades que componen el universo. Por ser una investigación
estadística, la información se obtiene tal como se necesita para fines estadísticos.
Ventajas: Desventajas:
La información obtenida puede Es necesaria una compleja
desagregarse y publicarse por organización que abarque todo el
cualquier criterio de clasificación. universo a investigar, evitando
Constituye un punto de referencia omisiones y duplicaciones.
para la preparación de las Exige el empleo de mayor cantidad
estadísticas continuas. de recursos.
Los antecedentes obtenidos son La información que se obtiene
de ayuda para el diseño de puede ser menos precisa que la
muestras. que se lograría mediante una
Es el único tipo de investigación muestra. Por los errores
utilizable para obtener información producidos en la recolección y
de fenómenos de poca frecuencia. procesamiento del censo, pueden
La credibilidad en las estadísticas superar a los de la muestra con el
es mayor. error de muestreo.
Muestreo: Es un proceso de investigación estadística que pretende estudiar el
universo de interés con base en la información que se obtiene de una parte de las
unidades que componen dicho universo.
Al igual que en el censo, mediante este procedimiento de recolección la información
se obtiene tal como se necesita para fines estadísticos. Aunque se reducen los
errores ajenos al muestreo respecto del procedimiento censal. Las limitaciones al uso
del muestreo se refieren a que la precisión de los resultados puede no ser adecuada
para pequeñas subpoblaciones o para fenómenos que se producen con poca
frecuencia.
Registro administrativo: Es un directorio de unidades (personas, viviendas,
empresas) creado exclusivamente para fines administrativos: de registro, de
recaudación, de fiscalización o de contralor. Si se cumplen ciertos requisitos, estos
registros pueden servir a los fines estadísticos.
Ventajas:
Es el procedimiento más económico
No requiere de ninguna organización especial.
Si el registro es completo, entonces se trabaja con todos los datos de la
población.
Desventajas:
La información se obtiene como un subproducto de la gestión administrativa.
Los cambios en los resultados de la gestión administrativa pueden influir en la
calidad de la información que se utilice con fines estadísticos.
Experimentación: Es un método de investigación estadística que se utiliza con el
propósito de determinar la existencia de relaciones causales (relaciones causa-
efecto) entre variables. Se trata de conocer el efecto que produce un cierto
tratamiento en un grupo de individuos en una cierta variable. Para ello se trabaja
frecuentemente con dos (o más) grupos. A uno o más de los grupos se aplica el
tratamiento (grupos experimentales) y otro u otros no reciben tratamiento (grupos de
control). Supuesto que los grupos son equivalentes al inicio (sin diferencias en
cuanto a las variables a investigar), cualquier diferencia observada al final del
experimento debe ser consecuencia del tratamiento.
Ventaja:
El procedimiento ha sido diseñado cuidadosamente para obtener información
relevante para lo que se está estudiando y si el experimento ha sido controlado
(validez interna) y se han utilizado mecanismos aleatorios en la conformación de
los grupos, con tamaños de muestra los suficientemente grandes, los resultados
de la muestra pueden generalizarse al universo con alta confiabilidad (validez
externa).
Desventajas:
Se requiere mucha información previa y una rigurosa planificación.
No es posible asignar aleatoriamente los individuos a los grupos de tratamiento y
de control, porque las circunstancias no las define el investigador, sino que ya
vienen dadas o porque los grupos vienen definidos con anterioridad.
Cuando el tratamiento tiene cierta duración en el tiempo, existe el riesgo que
algunos individuos abandonen el experimento.
4. Métodos de recolección
Los métodos de recolección están íntimamente ligados a los instrumentos de captura
de la información. Los métodos de recolección más frecuentes son:
Entrevista personal
Correo
Entrega personal
Teléfono
Telefax
Correo electrónico
Internet
La elección de método dependerá de los resultados de un balance de las ventajas y
desventajas de los diferentes métodos en relación a las condiciones particulares de
la investigación. Se deberá tratar de maximizar las ventajas, y en lo posible, eliminar
las desventajas. Se puede utilizar un solo método de recolección, pero en algunos
casos, puede ser que resulte más eficiente la combinación de dos o tres métodos.
Entrevista personal: Una persona llamada entrevistador o encuestador formula
oralmente las preguntas contenidas en el cuestionario al informante y registra sus
respuestas. Este método es el más completo y con más ventajas utilizables en un
mayor número de encuestas, especialmente en las investigaciones en que el nivel
cultural del informante es bajo o al menos, no es satisfactorio en relación a la
complejidad de los conceptos y preguntas utilizados en el cuestionario.
Correo: Es el método más económico y cómodo para los organizadores de la
encuesta. Exige como requisitos básicos antes de estudiar su adopción:
Que no haya entre los informantes un número de analfabetos que pueda producir
un porcentaje de omisión que afecte la precisión que se requiere de la
información.
Que el funcionamiento del sistema postal esté dentro de márgenes de eficiencia
aceptables.
Entre las ventajas del método del correo, se destaca el hecho de ser el más
económico. El costo de enviar un cuestionario por correo es mucho menor que enviar
un encuestador. Otorga algunas comodidades al informante, como la de poder
contestar el cuestionario cuando dispone de tranquilidad y tiempo.
Entre las desventajas del método del correo debe mencionarse que dificulta la
aclaración de las dudas que se le puedan plantear al entrevistado. Esta dificultad se
puede disminuir considerablemente, si se establece un centro de informaciones con
el que sea fácil comunicarse.
Entrega personal: El método consiste en que un agente o funcionario lleva y
entrega el cuestionario al informante y posteriormente lo retira. Si el agente sólo se
limita a entregar y retirar, sería similar al método del correo, ganándose solamente un
poco de tiempo en la devolución del cuestionario por la presión que se puede ejercer
sobre el informante para que lo complete y lo entregue.
Teléfono: El método del teléfono consiste en una entrevista que, en lugar de ser
cara a cara, se realiza mediante el contacto telefónico. Esta forma de entrevista no
es posible en todos los casos, porque no todas las unidades de la muestra tienen
teléfono necesariamente. Mayormente, la encuesta está dirigida exclusivamente al
universo de personas con teléfono. En este caso, las secuencias de las preguntas se
realizarán automáticamente y el encuestador ahorrará tiempo y molestias al
entrevistado.
La ventaja principal de este método es el costo, cuando se lo compara con la
entrevista personal (no es necesario pagar pasajes ni viáticos). Puede utilizarse un
horario más extenso que en el caso de la entrevista personal. Algunas personas
puedan sentirse más cómodas para responder al no tener enfrente a un
entrevistador. En cuanto a las desventajas del método, la más relevante tiene que
ver con los sesgos de respuesta que origina el teléfono como instrumento de captura.
Muchas personas se sienten menos comprometidas a decir la verdad frente al
teléfono que cuando están frente a la presencia de una persona.
Telefax: Cuando los entrevistados poseen telefax, y sus números son conocidos por
los organizadores de la encuesta, el cuestionario puede enviarse por este medio y
las respuestas pueden recibirse por el mismo método. El envío del cuestionario por
fax debería estar precedido de un contacto telefónico advirtiendo de la llegada del
mismo. Entre las ventajas del método cabe destacar su reducido costo, el hecho que
los faxes pueden enviarse en cualquier momento, incluso fuera de los horarios de
oficina, y que el envío puede hacerse automáticamente desde la computadora. Los
mayores inconvenientes del telefax como método de recolección son que no todas
las personas que deben responder poseen telefax y no garantiza ni el llenado, ni la
devolución en plazo ni tampoco la devolución del cuestionario.
Correo electrónico: Cuando la encuesta puede realizarse por correo electrónico, el
ahorro no se realiza sólo con los encuestadores, sino también con la impresión de
cuestionarios y su envío, y con el procesamiento de los datos. Se tiene la certeza de
que el cuestionario llega a todos los destinatarios. El retorno del cuestionario con los
datos se realiza por el mismo método, y de los cuestionarios devueltos es muy fácil
hacer el control administrativo e identificar a los que han demorado la devolución.
Internet: Cuando no se conoce la dirección electrónica de los entrevistados,
entonces se les puede pedir (por correo o por teléfono) que visiten una página de
Internet donde hemos colocado el cuestionario, y que respondan cargando sus datos
en la misma página. Este método todavía no es de uso muy frecuente. Actualmente
lo utilizan ciertas firmas comerciales para conocer la opinión de sus clientes sobre las
características de los productos. Pero estas investigaciones no pueden garantizar la
representatividad de la muestra, por cuanto quienes responden al cuestionario
difícilmente se comporten en promedio como los que no responden.
5. Instrumentos de captura
El instrumento de captura es el elemento físico o virtual que sirve para registrar los
datos individuales necesarios para la investigación. El instrumento de captura a
utilizar está básicamente condicionado por el método de recolección elegido. Así, se
puede establecer la siguiente correspondencia.
Método de Instrumento de captura
recolección
Entrevista personal Cuestionario para el
encuestador
Correo Cuestionario de autollenado
Entrega personal Cuestionario de autollenado
Teléfono Cuestionario para el
encuestador
Telefax Cuestionario de autollenado
Correo electrónico Cuestionario electrónico
Internet Cuestionario electrónico
Los instrumentos pueden clasificarse en dos grandes grupos: los que están
estructurados hasta el más mínimo detalle y los que no lo están. Entre los primeros
se encuentran los cuestionarios de autollenado, para el encuestador y electrónico. En
estos casos se especifica con todo cuidado cada una de las preguntas, siguiendo un
orden lógico, muchas veces con opciones de respuesta en el mismo cuestionario
(preguntas cerradas) y en algunos casos con aclaraciones y comentarios que
permiten al informante o al encuestador comprender cabalmente el alcance de las
preguntas.
6. Calendario de operaciones
El planeamiento y ejecución de una investigación estadística se divide en una serie
de fases y operaciones que dan respuesta a los múltiples problemas de organización
y control, de modo que los resultados puedan ponerse a disposición de los usuarios
en un plazo razonable. Para lograrlo, es necesario distribuir cronológicamente la
realización de las operaciones, de manera que la última operación se haya terminado
al cumplirse el plazo establecido. Esta distribución en el tiempo se llama “calendario
de operaciones”. Para establecer el calendario es necesario conocer:
Lista de actividades
Relaciones entre las actividades (previaturas)
Fecha de comienzo
Fecha de finalización
7. Presupuesto
El presupuesto de una investigación estadística es un documento que contiene, en
forma detallada, el costo de cada actividad de la investigación, con los recursos
necesarios para llevarlas adelante. El presupuesto utiliza como insumos las
necesidades de recursos y sus costos unitarios, y proporciona como resultados los
costos por actividad y el costo total de la investigación. El control de los gastos a
través del presupuesto permite garantizar que todas las tareas necesarias serán
realizadas efectivamente. De lo contrario, la falta de presupuesto para alguna
actividad, puede afectar la calidad de los resultados de la investigación.
8. Marco de muestreo
Cuando el procedimiento de selección por el que se ha optado es el muestreo, la
selección de la muestra puede realizarse de dos maneras: mediante selección al
azar o probabilística o mediante muestreo no probabilístico. Siempre que sea
posible, el primer método es el recomendado, porque permite extrapolar los
resultados de la muestra al universo, y proporcionar una medida del error de
muestreo.
Aunque parezca paradójico, para realizar muestreo es necesario tener información
del universo, a los efectos de asignar probabilidades de selección. Sería conveniente
que la unidad de muestreo coincidiera con la unidad investigada, aunque esto no
siempre es posible. El marco de muestreo ideal es la lista de unidades del universo.
En tal caso el muestrista podrá asignar probabilidades iguales de selección, o
probabilidades desiguales con arreglo a algún criterio (por ejemplo: el tamaño de las
unidades). Cuando no se dispone de una lista completa de las unidades del universo,
se suele trabajar con dos o más etapas de selección. En la primera se pueden elegir
áreas geográficas. En tal caso, el marco de muestreo es una lista de áreas
geográficas.
Propiedades deseables de un marco de muestreo:
a) Completitud
b) Actualización
c) Depuración de posibles duplicaciones
d) No inclusión de unidades extrañas
e) Inclusión de datos complementarios sobre ubicación
f) Inclusión de información auxiliar para estratificación
g) Fácil acceso
9. Diseño muestral
Un diseño muestral es tanto más eficiente cuanto mayor es la información previa que
utiliza sobre el universo y los temas a investigar. Aquí “eficiencia” se utiliza en dos
sentidos. Por un lado, se refiere a la posibilidad de obtener la información requerida
al menor costo y, por otro lado, refiere al concepto estadístico de eficiencia: obtener
estadísticos con el menor error de muestreo posible. La elección del diseño muestral
depende no sólo del tipo de información disponible sino también de su calidad.
10. Variables de relevamiento
Son las variables que se quiere investigar. Se llaman variables porque sus valores
varían de persona a persona del universo. Las variables pueden ser cuantitativas
(edad, ingresos, número de integrantes del hogar) o cualitativas (sexo, estado civil,
nacionalidad). A veces las variables pueden investigarse a través de una única
pregunta (sexo, edad) y otras veces se requieren varias para componerla.
11. El cuestionario
Es el documento en que se registran las informaciones referentes a las unidades
investigadas. Para preparar el cuestionario es necesario que se hayan definido con
precisión los siguientes elementos:
Objetivo de la investigación
Características del informante
Tiempo disponible para efectuar la recolección
Método de recolección
Procedimiento de recolección
Los aspectos formales que se deben considerar en el diseño del cuestionario son:
forma y tamaño, calidad del papel, tipo de impresión, color de la impresión y del
papel.
La preparación de las preguntas que se incluirán en el cuestionario presenta
múltiples problemas y variadas alternativas de solución. Las soluciones que se elijan,
deben llevar a obtener información precisa y completa, a mantener la cooperación y
voluntad del informante y facilitar las operaciones de procesamiento. En cuanto al
contenido de las preguntas es necesario realizar las siguientes operaciones con cada
una:
Verificar si la pregunta es necesaria para la investigación.
Verificar si es necesario incluir preguntas previas o acercar al informante un
marco de referencia.
Analizar si todos los posibles entrevistados estarán en condiciones de entender
lo que se pregunta.
Evaluar en qué medida lo que se pregunta y la forma en que se pregunta no
harán reaccionar al entrevistado en el sentido de no querer contestar.
Las preguntas se pueden clasificar en dos categorías, dependiendo de si las
alternativas de respuesta se incluyen o no en el mismo cuestionario.
Se denominan preguntas cerradas o estructuradas aquellas que admiten un número
pequeño y conocido de respuestas posibles, siendo por ello conveniente incluirlas en
el cuestionario y, además, presentarlas en forma precodificada con el fin de facilitar
el procesamiento posterior. Las preguntas abiertas son aquellas que admiten muchas
respuestas posibles, siendo por ello necesario dejar espacio suficiente para el
registro de la respuesta y del código.
A continuación, se plantean algunas pautas para la redacción y contenido de las
preguntas del cuestionario:
1. Incluir solamente preguntas que sean estrictamente necesarias para:
Satisfacer el objetivo
Establecer controles de consistencia en las respuestas del informante
Individualizar al informante
2. Un cuestionario no es mejor que otro por ser más completo o extenso. Por el
contrario, es mejor cuanto más conciso. Existe una relación inversa entre la
longitud del cuestionario y la cantidad y calidad de la respuesta.
3. Incluir preguntas para las cuales se espera que el informante recuerde o tenga
registrada la respuesta.
4. Evitar la inclusión de preguntas que obliguen al informante a efectuar cálculos en
los cuales pueda cometer errores.
5. Las preguntas deben ser redactadas de acuerdo al nivel del informante. Las
personas encargadas de la redacción del cuestionario muchas veces utilizan
términos técnicos que pueden ser desconocidos por los informantes.
6. Evitar el uso de palabras que admitan diferentes interpretaciones.
7. Emplear en la redacción de las preguntas una forma clara y directa.
8. La pregunta no debe sugerir la respuesta. Este tipo de preguntas se conocen
corrientemente con el nombre de “preguntas cargadas”. El informante puede, en
sus respuestas, ser influenciado por sentimientos tales como el deseo de
prestigio, o el temor de que la respuesta pueda producirle algún prejuicio.
La inclusión de instrucciones en el cuestionario tiene por objetivo ayudar al
informante a comprender claramente el contenido de las preguntas. La regla básica
es que si las instrucciones se incluyen en el cuestionario es porque se requiere sean
leídas al entrevistado. Debe cuidarse que su lectura no canse al informante. Para ello
es conveniente tener presentes las siguientes recomendaciones:
Las instrucciones deben ser breves, claras y completas.
Las instrucciones correspondientes a todo el cuestionario o a todo un capítulo,
deben ser ubicadas al comienzo del cuestionario o del respectivo capítulo.
Las instrucciones que expliquen cada pregunta en particular, deben en lo
posible colocarse a continuación de la pregunta que aclaran.
A continuación, se detallan otros elementos que no pueden faltar en el cuestionario:
Nombre de la institución que realiza la investigación.
Denominación de la encuesta.
Señalar la fecha o período de referencia de la información.
Indicar brevemente por qué se realiza la encuesta.
Hacer referencia a la normativa legal relacionada con la investigación.
Identificación del informante.
Identificación del cuestionario.
Identificación del encuestador, del supervisor, y si corresponde, del codificador.
Dejar espacio para observaciones
12. Tamaño de la muestra
Para determinar el tamaño de la muestra en una investigación estadística se sigue
habitualmente uno de los dos procedimientos siguientes:
a) A partir de la precisión y seguridad deseadas
b) A partir del presupuesto
En el primer caso, el presupuesto es consecuencia del tamaño de la muestra. En el
segundo caso se da a la inversa.
Elementos que inciden en el tamaño de la muestra:
Tiempo y recursos disponibles.
Diseño muestral por el que se ha optado.
Los niveles de desagregación deseados.
La variabilidad de la población respecto de las principales variables.
Precisión y seguridad deseadas.
13. Determinación de la muestra
Se refiere a un conjunto de tareas que consisten en seleccionar, del universo, las
unidades que integran la muestra, y luego agruparlas de forma de facilitar los
trabajos de campo. La selección de las unidades, cuando se realiza por muestreo
probabilístico, puede requerir un trabajo especial de acondicionamiento del marco.
También la estratificación previa requiere de un trabajo de acondicionamiento del
marco, para establecer inequívocamente a qué estrato corresponde cada unidad del
marco.
Para el sorteo de la muestra, el idear es disponer del marco en medios magnéticos y
utilizar para la selección un procedimiento automático, mediante programación ad
hoc o utilizando paquetes estadísticos. Una vez que la muestra ha sido sorteada, es
necesario identificar cada unidad de la muestra y agrupar dichas unidades (por
ejemplo, por proximidad geográfica) para facilitar los trabajos de campo (armado de
“hojas de ruta” para los encuestadores).
14. Prueba piloto
Consiste en reproducir, a escala, las condiciones que se habrán de presentar a los
encuestadores en el campo, para detectar errores o problemas relacionados con los
procedimientos en el campo y, la forma y el contenido de los cuestionarios.
La prueba piloto no se suele hacer al azar, sino que se eligen zonas o entrevistados
donde se podrían presentar problemas especiales. El número de entrevistados de la
prueba piloto es pequeño, a los efectos de poder evaluar rápidamente la bondad del
instrumento y de los procedimientos de la encuesta.
15. Evaluación de la prueba piloto
Como resultado de la evaluación de la prueba piloto se conocerá si es necesario
modificar la redacción de algunas preguntas, si es necesario agregar nuevas
categorías de respuesta para las preguntas cerradas, si la secuencia lógica del
cuestionario es adecuada, si la duración de la entrevista concuerda con la planeada y
si los procedimientos establecidos para la entrevista resultaron eficaces.
16. Ajuste del presupuesto y del calendario de operaciones
Si por ejemplo se decidió acortar el cuestionario, entonces las entrevistas tendrán
una menor duración, también las etapas de crítica, codificación e ingreso de datos.
En consecuencia, deberán revisarse el presupuesto y los tiempos asignados a cada
actividad en el calendario de operaciones. Este ajuste puede implicar la contratación
de un menor número de personas en cada una de las tareas de la encuesta.
En el cálculo del número de ejemplares a reproducir se deberán tener presente los
desperdicios y los cuestionarios que se pierden o malogran, y en caso de encuestas
que se prolongan en el tiempo y las deserciones.
17. Plan de promoción de la encuesta
La promoción de la encuesta se realiza con el objeto de facilitar las tareas de campo.
Si la población muestreada conoce las características de la investigación, es más
probable que esté dispuesta a colaborar con la Encuesta. Para realizar la promoción
existen diversos mecanismos alternativos, que pueden combinarse
convenientemente:
Propaganda por los medios masivos de comunicación (prensa oral, escrita o
televisiva)
Comunicados o conferencias de prensa
Entrevistas o artículos periodísticos
Afiches y trípticos a entregar en lugares de concentración o paso del público
Pancartas y carteles callejeros
Cartas dirigidas a las unidades de muestreo
Vestimenta identificatoria (visible) para encuestadores y supervisores
FASE 2: EJECUCIÓN Y PROCESAMIENTO
1. Cartografía
En ciertos casos, es necesario realizar trabajos de completamiento del marco
muestral, para lo cual se requiere de la actualización cartográfica. Estos trabajos son
necesarios para tener buena cobertura a la hora de sortear la muestra, y facilitar el
direccionamiento de los encuestadores y supervisores en la etapa de los trabajos de
campo. Como resultado de los trabajos de cartografía, en el momento de la salida a
campo el Encuestador, éste puede contar con un mapa donde aparecen señalizadas
las unidades de muestreo a las que debe encuestar.
2. Equipos de encuestadores y supervisores
Una forma de organizar los trabajos de campo es a partir de equipos de
encuestadores a cargo de supervisores. A veces estos equipos permanecen en el
campo durante períodos semanales, o aún más extensos, para lo cual se requiere un
importante grado de afinidad entre sus integrantes.
Una segunda forma de organizar los trabajos de campo consiste en que los
encuestadores realizan salidas individuales con supervisión posterior, con rotación
permanente de la relación encuestador-supervisor. A este último le corresponde una
carga diaria de re-entrevistas (al azar o no), con independencia de los encuestadores
que realizaron las entrevistas. Este método es más efectivo para controlar posibles
fraudes del encuestador en acuerdo con el supervisor.
3. Asignación de cargas de trabajo y distribución del material
Esta tarea debe realizarse desde la oficina central en forma periódica. La asignación
de las cargas puede contemplar las preferencias de los encuestadores por ciertas
áreas geográficas, aunque a veces, en virtud del tipo de preguntas del cuestionario
es conveniente que no haya conocimiento previo entre los entrevistados y el
encuestador. La tarea de campo del encuestador es probablemente la actividad más
costosa de la encuesta, razón por la cual se debe tratar de no entorpecerla
asignando las cantidades de materiales y las cargas de trabajo adecuadas al período
de tiempo que el encuestador permanece en el campo.
4. Manejo de los cuestionarios
Existen dos formas de organizar el fluir de los cuestionarios:
a) Los cuestionarios parten del archivo hacia el campo y luego siguen una
secuencia que implica su pasaje por diversas secciones de la encuesta, en cada
una de las cuales se registra su recepción, se les realiza un tratamiento y se los
entrega a otra sección para cumplir con la etapa siguiente.
b) Los cuestionarios parten del archivo hacia el campo, y luego hacia otras
secciones de la encuesta, pero una vez cumplida cada etapa vuelven al archivo
para que allí se registre la secuencia por la que van pasando, las fechas de
entrega y recepción, hasta el archivo definitivo y posterior destrucción. En una
planilla electrónica que lleva al efecto el encargado del archivo se puede conocer
en cualquier momento en qué lugar se encuentra cada cuestionario y se pueden
hacer estadísticas sobre el número de cuestionarios que han cumplido con cierta
etapa del proceso.
5. Realización de las encuestas
El encargado de esta tarea es el encuestador. Sólo por excepción esta tarea puede
ser realizada por el supervisor.
6. Control administrativo de los trabajos de campo
Esta etapa es necesaria por dos motivos principales:
a) Para garantizar que la muestra sorteada es la que se realiza en el campo.
b) Para liquidar correctamente los viáticos, pasajes y salario que corresponden a
cada encuestador
7. Programación para el ingreso de datos
Es recomendable, para esta tarea, la utilización de paquetes de computación que
facilitan el ingreso masivo de datos, el control de rangos, de consistencia y de la
lógica del cuestionario. Si se introduce un diccionario, la codificación de preguntas
abiertas puede realizarse en forma interactiva por parte del digitador que ingresa los
datos.
8. Programación para la tabulación
El cruzamiento de variables y la elaboración de tablas puede realizarse cada vez
más con paquetes amigables (SPSS para Windows, Excel con planillas dinámicas y
el módulo de funciones estadísticas), de manera que la tarea de la tabulación puede
realizarla el especialista en la materia de la encuesta.
9. Crítica y codificación
Esta tarea, tradicionalmente manual, puede realizarse actualmente en forma
automática o semi-automática utilizando la programación. La crítica procura detectar
(para luego depurar) los errores en los datos provenientes de:
Errores y omisiones de respuesta
Errores de registro por parte del encuestador
Errores de digitación (cuando la crítica es posterior al ingreso de los datos).
Los métodos utilizados más comúnmente para detectar estos errores son:
Control de rangos (de valores válidos)
Control de secuencias (secuencias lógicas)
Relaciones de consistencia (si la persona está casada, no puede tener 5 años).
10. Ingreso de datos
El ingreso masivo de datos se realiza principalmente por digitación, aunque en
muchos casos se utiliza la lectura óptica. Son excepcionales todavía los trabajos
estadísticos en los que se realiza lectura de imágenes (marcas, números
preimpresos, números escritos por el encuestador, palabras escritas por el
encuestador). En este último caso el computador lee imágenes (dibujos) y los
compara con un diccionario de números, palabras y hasta expresiones con pocas
palabras. Si reconoce las expresiones, las transforma en códigos numéricos, para su
posterior tabulación.
11. Concentración de la información
Si el ingreso de datos se realiza en forma descentralizada geográficamente, aún si se
realiza en forma centralizada, pero sin un entorno de red, entonces cada digitador
trabaja con un subconjunto de la muestra. Es preciso pues reunir todos los
cuestionarios ingresados en una base de datos única, sin duplicaciones ni omisiones,
como paso previo a la depuración final.
FASE 3: ANÁLISIS Y DIVULGACIÓN
1. Consistencia interna y de completitud
El proceso de crítica pudo permitir que los cuestionarios con algunos datos faltantes
siguieran su curso. Esta es la etapa en la que se debe decidir cómo se tratan los
datos faltantes. La decisión puede ser la de aceptar como categoría de respuesta el
SIN DATO o, por el contrario, decidir que en esta etapa se procede a la “imputación”
de los datos faltantes, de los datos inconsistentes o fuera de rango. La imputación
puede realizarse exclusivamente en base a los demás datos del cuestionario o
también utilizando la información de los restantes cuestionarios.
2. Comparación con otras fuentes
En el proceso que involucra el trabajo de campo, la crítica y la codificación, el ingreso
de datos, la concentración, imputación y programación de los tabulados, pueden
haberse deslizado errores. Estos pueden detectarse cuando se comparan los
resultados obtenidos con los de otras encuestas u otras fuentes de datos. Estas
fuentes pueden ser encuestas recientes similares en cuanto a su contenido, con la
misma cobertura geográfica o de otras áreas con características similares. Hay cierta
información, de tipo estructural, que no puede variar significativamente en períodos
cortos. Cuando se encuentran diferencias importantes en los datos estructurales,
debe procederse a la revisión de todas las etapas de la investigación estadística.
3. Análisis estadístico
Este análisis puede ir desde el simple cálculo de indicadores elementales para las
distribuciones univariadas (mínimo, máximo, media, mediana, cuantiles, desviación
estándar), pasando por el cálculo de intervalos de confianza y la realización de
pruebas de hipótesis sobre parámetros y otros aspectos de la distribución
(aleatoriedad, bondad de ajuste, independencia), hasta la modelización de relaciones
entre variables.
4. Tabulados finales
Posteriormente del análisis es posible decidir sobre la pertinencia de las aperturas de
respuesta hasta el máximo nivel de desagregación o la necesidad de recodificar
ciertas respuestas en una sola categoría (porque su frecuencia es muy baja). Con
ello es posible definir la presentación más apropiada para las tabulaciones finales a
los efectos de la publicación.
En esta etapa, los datos muestrales se exponen de manera clara y se ilustran con
representaciones tabulares y gráficas (diagramas. histogramas, etc.); además se
calculan las medidas estadísticas apropiadas al proceso inferencial que haya sido
escogido.
5. Inferencia estadística y conclusiones
La inferencia estadística se orienta a sacar conclusiones acerca del parámetro o
parámetros poblacionales con base en el valor de un estimador obtenido a partir de
los datos muestrales extraídos de esa población.
Este paso constituye tal vez la contribución más importante de la estadística al
proceso inferencial. Aquí se fija el nivel de confiabilidad para la inferencia; esto es
debido a que las conclusiones derivadas de inferencias estadísticas jamás se pueden
tomar con un 100% de certeza, pero sí se les puede asociar un nivel de confiabilidad;
en términos de probabilidad denominados nivel de confianza y nivel de significancia.
El proceso Inferencial nos llevará a una conclusión estadística que servirá de
orientación a quien o quienes deban tomar la decisión (administrativa o clínica) sobre
el tema objeto de estudio.
6. Informe final
El informe final debe proporcionar a los usuarios información sobre la metodología
utilizada en la investigación, los principales resultados, los problemas que se debió
enfrentar y la forma en que se resolvieron.
7. Publicación y difusión de los resultados
Los resultados de la investigación son lo más importante a difundir para la mayoría
de los usuarios. Un número menor de usuarios (calificados) tendrá interés en
conocer la metodología que se utilizó en la investigación, en forma detallada.
La unidad responsable de la investigación deberá decidir el contenido y número de
publicaciones a realizar a partir de la identificación de los usuarios. Si las estadísticas
producidas por la investigación se habrán de replicar periódicamente, entonces es
usual que en la primera publicación se realice una descripción detallada de la
metodología, conjuntamente con la presentación de los primeros resultados. Las
publicaciones siguientes suprimirán las referencias a los aspectos metodológicos y
remitirán al lector interesado a la primera publicación, o dedicarán una sección de
cada publicación para hacer referencia a la metodología en forma resumida.
Algunas consideraciones relevantes para la publicación y la difusión son:
Número de publicaciones a realizar (resultados preliminares, resultados
definitivos, metodología).
Presentación: publicación impresa, publicación electrónica, página web.
Oportunidad de la publicación.
8. Informe técnico
Este informe está destinado a un número muy reducido de usuarios: académicos,
periodistas especializados, investigadores y las personas que tendrán en el futuro la
responsabilidad de realizar investigaciones similares. Contiene una descripción
detallada de la problemática originada en la investigación, las soluciones alternativas
que se plantearon para dicha problemática, los fundamentos de las soluciones que
se eligieron, recomendaciones para futuras investigaciones y resultados de la
muestra que pueden ser útiles para el futuro (bancos de medias y varianzas,
correlaciones intraconglomerado, etc.).
CONCLUSIÓN
En conclusión, la investigación estadística es una actividad realizada para para
adquirir nuevos conocimientos o información que se requiera para estudiar una
población o una muestra de esta que nos ayude a inferir conclusiones estadísticas
para la población y su objeto de estudio. Las características de una población se
resumen para su estudio generalmente irá mediante lo que se denominan
parámetros; éstos a su vez se toman o consideran como valores verdaderos de la
característica estudiada. Cuando la característica de la población estudiada se
reduce a una muestra el resumen de esa característica se hace mediante una
medida.
Para poder denominar a una investigación “estadística” se deben definir afirmaciones
relativas a la distribución de una o más variables aleatorias, así como poder
identificar un universo, las variables y el objeto de investigación que queremos en
nuestra investigación. Para poder realizar una investigación estadística es necesario
seguir un proceso largo y extendido en el que se abarquen todas las medidas
necesarias y las actividades y recursos que hagan falta para realizar de manera
correcta el análisis de la información para poder llegar a la inferencia y conclusiones
de la investigación.
Para realizar una investigación estadística se tiene que empezar por planificarla, ya
que las actividades dentro del proceso para la investigación y cualquier método
científico deben llevar un orden temporal. En este caso es clave la planificación para
evitar una prolongación innecesaria de la investigación, por lo que pudimos ver que
es la fase más larga y con más requerimientos de las tres fases; se planifica desde
los objetivos de la investigación, los conceptos básicos de una investigación, el
diseño del experimento, métodos para la recolección, captura, muestreo, el
cuestionario y promoción de la encuesta para la obtención de la información.
Ya planeada y probada en piloto nuestra encuesta con la que recolectar los datos,
después se tiene que ejecutar la obtención de la información en la segunda fase del
proceso, en donde se pone en marcha nuestro plan y se asignan las actividades y
responsabilidades del equipo, así como la distribución de los recursos para después
realizar las encuestas y para finalizar esta fase el ingreso de los datos, así como su
concentración, que es importante para seguir con la última fase del proceso.
En esta última fase se ve lo que es el análisis y la divulgación de nuestra
investigación, que empieza con el análisis de los datos, así como supervisar que se
encuentren todos los datos necesarios y de no ser así imputar los requeridos por
obligación y completar la información, y una vez que se cuenta con toda la
información se hace el análisis estadístico, resolver las incógnitas que se tengan o
estudiar el objeto de nuestro objetivo, para así poder describir correctamente los
resultados.
Para llegar a la conclusión buscada con la información obtenida es necesaria la
inferencia estadística en donde se establece el nivel de confiabilidad de las
conclusiones que se puedan obtener las probabilidades resultantes de la
investigación y la información obtenida; lo que nos llevará a una conclusión única y
estadística según la confiabilidad de la investigación y que nos servirá para tomar
decisiones sobre el tema de estudio.
Y por último con los resultados claros y una vez llegada una conclusión confiable, se
debe publicar y difundir nuestra investigación para compartir los resultados
obtenidos, así como tener antecedentes de la investigación y ser una fuente de
información sobre la población en la que se enfocó nuestro experimento y después
poder replicar la investigación y darle seguimiento. Y terminar con un informe
técnico en el que se dé a conocer una descripción detallada de la problemática
originada en la investigación las soluciones alternativas que se plantearon para dicha
problemática, los fundamentos de las soluciones que se eligieron, recomendaciones
para futuras investigaciones y resultados de la muestra que pueden ser útiles para el
futuro.
Todo este largo y exhaustivo proceso es necesario para poder llegar a conclusiones
confiables y que nos ayuden a resolver alguna problemática en estudio y poder tomar
decisiones importantes con respecto a nuestro objeto de estudio.
BIBLIOGRAFÍA
[Link]
“Planeamiento y Ejecución de Encuestas” Centro Interamericano para la
Enseñanza de la Estadística (CIENES)
“Técnicas de Muestreo” W Cochran CECSA
“Model Assisted Survey Sampling” Särndal Swensson Wretnam.
SPRINGERVERLAG
“Métodos de Investigación” N. Salkind PRENTICE HALL
“Métodos estadísticos de investigación” INE (España)
“Muestreo: Diseño y Análisis” Sharon Lohr THOMSON
“Técnicas de Muestreo Estadístico” César Perez ALFAOMEGA
“La domesticación del azar” Ian Hacking GEDISA