METODOLOGIA DE LA INVESTIGACION
Hernandez y Sampieri & Mendoza (libro)
Caps 8 y 9
Selección de la muestra en la ruta cuantitativa
En la ruta cuantitativa las muestras implican un pequeño esfuerzo de cálculo, pero ahorran
mucho tiempo y recursos.
- No en todas las investigaciones se tiene una muestra… en el caso de los censos, se deben
1
tomar todas las unidades de muestreo (todos los casos)
Definición de Muestra: Subgrupo de la población sobre el cual se recolectarán los datos
pertinentes. Debe ser representativa de toda la población (que es el total), para así poder
generalizar los resultados.
Proceso de selección de muestra
Hay 5 pasos: Determinar la unidad de muestreo - Delimitar la población o universo - Elegir
la estrategia de muestreo adecuada - Calcular el tamaño de muestra apropiado -
Seleccionar las unidades de muestreo o análisis
El primer paso en el proceso de muestreo es definir la unidad de muestreo,
es decir, sobre quiénes o qué se van a recolectar los datos. Esta decisión depende
directamente del planteamiento del problema, los objetivos, las hipótesis y el diseño
metodológico de la investigación.
En muchos casos, la unidad de muestreo coincide con la unidad de análisis, que es
aquello sobre lo que efectivamente se analizan y procesan los datos. Sin embargo, no
siempre son lo mismo.
¿Qué es cada una?
● Unidad de muestreo: lo que seleccionás o reclutás para que forme parte de tu
muestra (personas, capítulos, organizaciones, etc.).
● Unidad de análisis: lo que realmente vas a observar, medir o estudiar dentro de
esa unidad de muestreo.
Ejemplos para entenderlo mejor:
● Estudio sobre asesinos seriales jóvenes:
2
○ Unidad de muestreo: los asesinos.
○ Unidad de análisis: cada asesinato individual (porque uno puede haber
cometido varios).
● Estudio sobre violencia en series de TV:
○ Unidad de muestreo: capítulos de series.
○ Unidad de análisis: segmentos de 1 o 3 minutos dentro de esos capítulos.
● Estudio sobre cultura organizacional:
○ Unidad de muestreo: empresas.
○ Unidad de análisis: empleados de esas empresas (o sus respuestas a
cuestionarios).
● Investigación médica:
○ Unidad de muestreo: pacientes.
○ Unidad de análisis: muestras biológicas, entrevistas clínicas, historias
médicas, etc.
Claves para no pifiarla:
● La unidad de muestreo y la unidad de análisis deben estar alineadas con los
objetivos y preguntas de investigación.
● Error común de principiantes: elegir mal a quién medir o no diferenciar
correctamente entre lo que se selecciona y lo que se analiza.
En la ruta cuantitativa, además, el objetivo es que los resultados de la muestra puedan
extrapolarse a la población (validez externa). Por eso, la muestra debe ser
representativa desde el punto de vista estadístico.
2. Delimitar la población o universo La población es el conjunto total de
casos que cumplen con ciertas características específicas relacionadas con los objetivos de
la investigación. Una de las fallas más comunes en los estudios es no definir con claridad
3
quiénes forman parte de esa población, lo que lleva a errores en la selección de la
muestra.
Delimitar correctamente la población significa establecer sus límites concretos según:
● Contenido: qué tipo de casos o sujetos vas a estudiar.
● Lugar: ubicación geográfica específica.
● Tiempo: periodo determinado en el que ocurre el fenómeno.
● Accesibilidad: posibilidad real de acceder a esos casos para poder investigarlos.
Ejemplo práctico:
Si querés estudiar a los obreros de Guanajuato, no basta con decir “obreros de esa
provincia”. Tenés que definir si:
● Son de todas las ciudades o solo de algunas.
● Trabajan en cualquier industria o solo en la automotriz.
● Viven en zonas urbanas o también rurales.
Una definición adecuada sería: “obreros que habitan en zonas urbanas de Guanajuato y
trabajan en empresas que fabrican automóviles terminados”. Esto excluye a:
● Obreros de otras industrias (como autopartes).
● Empleados administrativos.
● Obreros que viven fuera del área geográfica delimitada.
Una población más grande no hace mejor a una investigación. Lo que importa
es que esté bien delimitada y sea coherente con tus objetivos.
Criterios de inclusión y exclusión:
● Edad
● Género
4
● Nivel socioeconómico
● Escolaridad
● Diagnóstico médico (en estudios clínicos), etc.
Errores frecuentes a evitar:
1. Excluir casos que sí deberían estar incluidos.
2. Incluir casos que no pertenecen a la población definida.
3. Agregar casos inelegibles (como encuestar a menores en estudios electorales).
Ejemplo de error común: usar una base de datos desactualizada de clientes de
una tienda y terminar incluyendo personas que ya no lo son.
3. Elegir la estrategia de muestreo adecuada
Una vez definida la unidad de muestreo y delimitada la población, el paso siguiente es
elegir cómo seleccionar los casos concretos que formarán parte de la muestra.
En investigaciones cuantitativas, este proceso se orienta por un objetivo clave: que la
muestra represente fielmente a la población. Como no se puede medir a todos los
individuos de un universo, se trabaja con una parte que actúe como “espejo” de ese todo.
Esa parte es la muestra.
Las expresiones como “muestra representativa”, “al azar” o “aleatoria” se usan
con frecuencia, pero no siempre reflejan correctamente el procedimiento
técnico usado.
¿Qué significa realmente "al azar" o "aleatoria"?
Estos términos hacen referencia al mecanismo de selección (que sea probabilístico), pero
no describen el tipo de muestra ni garantizan representatividad por sí solos. Que algo sea
aleatorio implica que todos los elementos de la población tienen la misma
probabilidad de ser elegidos, pero eso es solo una parte del proceso.
5
Tipos de Muestra
Existen dos enfoques principales para seleccionar las unidades de una muestra:
1. Muestreo probabilístico
Todas las unidades de la población tienen, desde el inicio, la misma probabilidad de ser
elegidas. La selección se realiza de forma aleatoria y objetiva.
Ejemplo claro: un sorteo donde todos los boletos tienen las mismas chances de salir. Este
método garantiza representatividad estadística y permite calcular márgenes de error.
2. Muestreo no probabilístico
La elección de los casos no se basa en el azar ni en la probabilidad, sino en criterios
establecidos por el investigador. Puede responder a la accesibilidad, al contexto, a las
características específicas de los casos o a una necesidad estratégica.
No garantiza representatividad estadística, pero puede ser más viable o útil en ciertos
diseños de investigación, especialmente cuando el foco está en casos particulares o
cuando hay restricciones de tiempo, recursos o acceso.
La elección entre uno u otro dependerá de varios factores: el planteamiento del
problema, el diseño metodológico, la homogeneidad o heterogeneidad de los casos y el
tipo de resultados que se buscan alcanzar (generalización o profundidad).
Ejemplos de estrategias de muestreo en investigaciones reales
1. Suicidio en prisiones de EE.UU. (Suto y Arnaut, 2010)
● Objetivo: explorar los motivos por los que los reclusos intentan suicidarse.
● Muestra: no probabilística, voluntaria.
● Método: entrevistas profundas a 24 internos de seis cárceles de Ohio.
● Comentario: al tratarse de un estudio exploratorio cualitativo, el uso de una
muestra no probabilística es pertinente. La selección se basa en la voluntariedad y
6
el acceso restringido al entorno carcelario. La finalidad es generar hipótesis y
comprensión inicial, no generalizar.
2. Consumo de drogas en la población laboral de Chile (Araneda y Cumsille, 2002)
● Objetivo: conocer las características del consumo de drogas en trabajadores
chilenos.
● Muestra: probabilística, nacional, de 7.888 personas.
● Comentario: este tipo de estudio cuantitativo busca estimaciones generalizables
y precisas sobre una población extensa, lo que requiere una muestra
representativa. La elección del diseño probabilístico permite calcular márgenes de
error y apoyar políticas públicas.
3. Prevención del abuso sexual infantil (Meza y Hernández-Sampieri, 2005)
● Objetivo: demostrar la eficacia de un programa de prevención en niños y comparar
dos formas de medición (cognitiva y conductual).
● Muestra: 150 preescolares de tres centros infantiles similares, hijos de trabajadoras
de la Secretaría de Educación de Querétaro.
● Diseño: experimental, con grupos aleatorizados (dos experimentales y uno de
control).
● Comentario: se usa una muestra dirigida controlada adecuada para diseños
experimentales, donde importa más la validez interna que la generalización. Se
privilegia el control sobre las variables y la comparación entre grupos.
¿Cómo seleccionar una muestra probabilística?
El principal objetivo de una muestra probabilística es reducir el error estándar, es decir,
minimizar la diferencia entre los valores obtenidos en la muestra y los valores reales de la
población. Este tipo de muestreo es fundamental en estudios transeccionales
descriptivos o correlacionales-causales, como las encuestas de opinión, donde se busca
estimar variables poblacionales.
Para obtener una muestra probabilística se deben seguir dos pasos fundamentales:
7
1. Calcular un tamaño de muestra representativo, considerando un margen de
error aceptable y un nivel de confianza.
2. Seleccionar las unidades de análisis al azar, asegurando que todas tengan la
misma probabilidad inicial de ser elegidas.
Cálculo del tamaño de la muestra
Este cálculo puede hacerse con fórmulas estadísticas o mediante programas específicos
como STATS®, que pide tres datos principales:
● Error máximo aceptable (margen de error): Indica cuánto error estamos
dispuestos a tolerar. Los más comunes son 5% y 1%. Por ejemplo, un margen de
error del 5% implica aceptar que en 5 de cada 100 casos puede haber una
estimación incorrecta.
● Porcentaje estimado (Estimated Percentage Level): Es la probabilidad de
ocurrencia del fenómeno que se estudia. Cuando no se tiene información previa, se
asume una probabilidad neutral de 50% (p = 0.5, q = 0.5), ya que es la opción más
conservadora.
● Nivel de confianza: Mide cuánta certeza se busca tener de que la muestra
realmente representa a la población. Los más usados son 95% y 99%. Un 95% de
confianza indica que si repitieras el estudio muchas veces, el 95% de las muestras te
daría resultados similares.
Ejemplo aplicado
Un estudiante de psicología quiere saber quiénes son los más populares de su universidad,
que tiene 5.000 alumnos. Utiliza STATS®, establece un margen de error del 5% y un nivel
de confianza del 95%. El programa le indica que necesita 357 casos para su muestra. Con
esa muestra puede generalizar los resultados al total de la población universitaria con un
margen de error y nivel de confianza definidos.
Este procedimiento se basa en el muestreo aleatorio simple (MAS), donde cada caso
tiene la misma probabilidad de ser seleccionado desde el inicio.
Selección de unidades en una muestra probabilística
8
Una vez calculado el tamaño de la muestra, el paso siguiente es seleccionar los casos
específicos. Este proceso puede hacerse de diferentes maneras según el tipo de muestreo
probabilístico elegido.
Muestreo aleatorio simple (MAS)
Es el método más básico. Todos los elementos de la población tienen la misma
probabilidad de ser seleccionados. Se puede usar un programa como STATS® o una tabla
de números aleatorios:
1. Se indica el tamaño de la muestra.
2. Se define el rango (mínimo 1 y máximo el total de la población).
3. El programa genera números aleatorios.
4. Cada número corresponde a un caso del listado de población.
Este procedimiento garantiza aleatoriedad y simplicidad.
Muestreo sistemático
Este método selecciona unidades a intervalos regulares a partir de un punto aleatorio. La
fórmula clave es:
K = N / n,
donde:
● K es el intervalo de selección,
● N el tamaño de la población,
● n el tamaño de la muestra.
Ejemplo: si N = 1.000 y n = 100, se elige un número entre 1 y 10 como punto de partida y
luego se selecciona cada K-ésima unidad (por ejemplo, la 5°, 15°, 25°, etc.). Es simple,
práctico y asegura representatividad proporcional.
9
Muestreo probabilístico estratificado
Se utiliza cuando es necesario comparar subgrupos de la población o garantizar
representación de minorías. Consiste en dividir la población en estratos homogéneos y
seleccionar muestras dentro de cada uno.
Se aplica cuando:
● El interés del investigador es comparar categorías específicas.
● Algunos subgrupos (por ejemplo, religiones minoritarias o altos niveles jerárquicos)
podrían no estar representados en un muestreo aleatorio simple.
Ejemplos de estratos: religión, nivel educativo, tamaño de empresas, tipo de enfermedad,
nivel socioeconómico, etc.
¿Cómo se realiza?
● Se calcula la muestra total.
● Se segmenta la población en estratos.
● Se determina el tamaño de muestra de cada estrato proporcionalmente:
nh = (Nh)(fh), donde fh = n / N
O, para más precisión, según la variabilidad:
nh = (Nh)(ksh),
donde sh es la desviación estándar del estrato.
Ejemplo aplicado:
Una investigación sobre políticas de recursos humanos con 1.176 empresas y un tamaño
de muestra necesario de 298 casos:
● Se segmentan las empresas según rubro o industria.
10
● Cada subpoblación (Nh) se multiplica por 0,2534 (298/1176) para obtener cuántos
casos debe tener cada estrato (nh).
● La selección final dentro de cada estrato se realiza aleatoriamente.
Muestra probabilística por racimos o conglomerados
El muestreo por racimos (también llamado cluster sampling) es una técnica útil cuando
existen limitaciones de tiempo, presupuesto o accesibilidad geográfica. En lugar de
seleccionar casos individuales dispersos, se eligen grupos (racimos o conglomerados) que
contienen internamente a las unidades de análisis.
¿Qué son los racimos?
Son agrupaciones naturales de las unidades de análisis en espacios físicos o sociales
comunes. Algunos ejemplos:
Unidad de Racimos posibles
análisis
Estudiantes Preparatorias, universidades
Pacientes Hospitales, clínicas
Obreros Fábricas, industrias
Amas de casa Supermercados, centros comerciales
Niños Escuelas
Empresas Parques industriales, zonas
económicas
Profesionales Colegios profesionales
11
Microempresas Zonas céntricas
Familias Centros de diversiones
Diferencia clave:
● Unidad de análisis: quiénes son medidos (individuos, empresas, etc.).
● Unidad muestral: el racimo mediante el cual se accede a esas unidades (una
escuela, hospital, barrio, etc.).
¿Cómo funciona?
El muestreo por racimos se realiza en dos o más etapas, todas con selección aleatoria:
1. Primera etapa: se seleccionan los racimos (por ejemplo, provincias, escuelas,
hospitales) utilizando muestreo aleatorio simple o estratificado.
2. Siguientes etapas: dentro de cada racimo, se seleccionan al azar las unidades de
análisis (por ejemplo, individuos, estudiantes, pacientes).
Ejemplo clásico:
Para una encuesta nacional, podrías proceder así:
● Seleccionar aleatoriamente provincias o estados.
● Dentro de estos, elegir municipios.
● Luego comunidades o barrios.
● Después manzanas o cuadras.
● Finalmente, seleccionar viviendas y personas dentro de ellas.
12
En cada fase se puede usar muestreo aleatorio simple (MAS).
Ventajas:
● Reduce costos y tiempos.
● Facilita la logística, sobre todo en áreas amplias o dispersas.
● Permite mantener la aleatoriedad si se aplica correctamente.
Combinación con otros métodos:
Es común combinar el muestreo por racimos con el muestreo estratificado, asegurando
así tanto eficiencia logística como representatividad de subgrupos. Siempre se mantiene el
principio clave: todos los elementos de la población deben tener inicialmente la
misma probabilidad de ser seleccionados.
Listados y otros marcos muestrales
Para poder aplicar un muestreo probabilístico de forma efectiva, no alcanza con calcular el
tamaño de la muestra y seleccionar aleatoriamente los casos. Es imprescindible contar con
un marco muestral: un registro concreto, verificable y actualizable que permita identificar,
enumerar y seleccionar las unidades que formarán parte de la muestra.
¿Qué es un marco muestral?
Es una lista o conjunto de datos que representa físicamente a la población, ya sea
mediante listados ya existentes o confeccionados ad hoc. Ejemplos comunes:
● Guías telefónicas
● Directorios escolares, médicos, empresariales, institucionales
● Registros públicos, catastros, padrones electorales
13
● Bases de datos de alumnos, clientes o empleados
● Inventarios, mapas (Google Maps, OpenStreetMap, GPS)
El marco debe ser:
● Completo (que incluya todos los casos relevantes)
● Actualizado
● Exacto y verificable
● Con buena cobertura de la población objetivo
Usos y limitaciones
No todo marco sirve para todos los estudios. Por ejemplo, usar la lista de una sola cámara
empresarial puede ser sesgado si muchas empresas no pertenecen a ella. A veces, es
necesario construir un nuevo listado integrando fuentes diversas y eliminando duplicados.
Se recomienda siempre verificar:
● Fecha de actualización
● Método de recolección de datos
● A quiénes incluye y excluye el listado
Ejemplo aplicado: uso de internet en niños
Objetivo: Estudiar hábitos digitales de niños de 4º a 6º grado en una gran ciudad
latinoamericana.
1. Población: Niños escolarizados en escuelas públicas y privadas.
2. Marco muestral: Base de datos del ministerio de educación con listado completo
de escuelas.
14
3. Muestreo:
○ Primera etapa: Selección de 4 escuelas por estrato socioeconómico (A, B, C, D
× públicas y privadas) → total: 32 escuelas.
○ Segunda etapa: Selección aleatoria de 264 alumnos por estrato → total:
2.112 niños.
Este enfoque permite una muestra representativa, estratificada y geográficamente
distribuida.
Marcos muestrales menos convencionales: archivos y mapas
Archivos:
Se usan cuando no hay listados formales. Por ejemplo:
● Un gerente quiere analizar si ciertos datos de solicitudes de empleo se relacionan
con el ausentismo.
● Marco: archivos de solicitudes de contratados (excluyendo a los rechazados).
● Método: selección sistemática 1/K de los casos a analizar.
Mapas:
Son útiles cuando las unidades están distribuidas espacialmente (ej. tiendas, escuelas,
hospitales).
● Se seleccionan racimos en zonas geográficas diversas.
● Permiten garantizar cobertura y diversidad en el muestreo.
● Herramientas: GPS, Google Maps, OpenStreetMap, mapas socioculturales,
mercadológicos, etc.
15
En síntesis, el marco muestral es el puente entre la población teórica y la muestra
real, y su correcta construcción es tan importante como la selección misma de los casos.
Un error en el marco distorsiona todo el estudio.
Tamaño óptimo de la muestra
El tamaño de la muestra es un factor crítico en la investigación cuantitativa, ya que
determina qué tan representativos son los resultados obtenidos respecto de la población.
No hay un único tamaño ideal: este varía según el tipo de estudio, el nivel de precisión
requerido, los subgrupos a analizar y la posibilidad de aplicar estadística inferencial.
Tamaños de muestra comunes en estudios nacionales y regionales
Los estudios nacionales suelen requerir muestras mayores a 1.000 personas,
especialmente en investigaciones sociales, políticas o económicas. Por ejemplo:
● “¿Cómo somos los mexicanos?”: 1.737 personas divididas por regiones.
● Barómetros de opinión en España: ~2.500 casos, muestreados por estratos y
racimos.
● Eurobarómetro: ~1.000 casos por país, con más en países grandes como Alemania.
● Barómetro de las Américas: >1.500 casos por país (n=49.738 en 2014).
En cambio, las muestras regionales (para ciudades, provincias, etc.) suelen tener entre
400 y 700 casos. Ejemplos:
● Encuesta de Acceso a la Información Pública en México (INEGI, 2016): 14.400
viviendas (450 por estado).
● Encuesta de Calidad de Vida Urbana en Chile: 8.530 casos.
● Gran Encuesta Integrada de Hogares en Colombia: 240.000 casos.
Influencia de los subgrupos en el tamaño
16
Cuando se pretende analizar subgrupos dentro de una población (por género, edad, nivel
educativo, clase social, etc.), el tamaño de muestra debe aumentarse. Por ejemplo, si se
cruzan 2 géneros × 4 grupos de edad × 5 niveles socioeconómicos → se necesitan casos
suficientes para 40 subgrupos, lo que exige una muestra mucho mayor.
Ejemplo orientativo (Tabla 8.5):
Subgrupo Individuos Organizaciones
s (nacional) (nacional)
0-4 1.000 - 1.500 200 - 500
5-10 1.500 - 2.500 500 - 1.000
+10 2.500+ 1.000+
Tamaños mínimos según el tipo de estudio
Tipo de estudio Tamaño mínimo sugerido
Transeccional 30 por grupo
(descriptivo/correlacional)
Encuesta a gran escala 100 por grupo principal, 20–50
secundarios
Estudios causales 15 por variable independiente
Estudios experimentales 15 por grupo
Tamaños mínimos según análisis estadístico
Tipo de análisis N° mínimo de casos
17
Correlación (una cola / dos colas) 64 / 82
Comparaciones causales entre grupos (una / 51 / 64 por grupo
dos)
Comparativos experimentales 21 (una cola), 27 (dos colas) por
grupo
Consideraciones adicionales
● Balance entre manejo práctico y robustez estadística: hay que equilibrar lo que
puede manejarse con lo que se requiere para obtener resultados válidos.
● Homogeneidad vs. heterogeneidad: cuanto más variada es la población, mayor
debe ser la muestra.
● Cuando la muestra tiene 100 o más casos, tiende a comportarse como una
distribución normal, lo cual es esencial para aplicar inferencias estadísticas con
seguridad. Este fenómeno está respaldado por el teorema central del límite.
Conclusión
El tamaño óptimo de la muestra depende de:
● La población objetivo (nacional/regional)
● La cantidad y tipo de subgrupos
● El tipo de análisis estadístico que se pretenda realizar
● Los recursos disponibles
Una muestra adecuada garantiza mayor validez en la inferencia de resultados, siempre que
se acompañe de un diseño metodológico sólido y una correcta selección de los casos.
18
Reemplazos de casos perdidos y muestras no probabilísticas
Reemplazo de casos perdidos
En estudios con grandes poblaciones o temas sensibles (como drogadicción,
alcoholismo, evasión fiscal, encuestas políticas, etc.), es habitual prever altos niveles de
rechazo o no respuesta. Además, cuando los marcos muestrales son imperfectos, se
recomienda aumentar la muestra entre un 10% y 20%, como medida preventiva para
poder reemplazar los casos perdidos. En México, por ejemplo, se suele usar un 20% de
reemplazo en encuestas nacionales (Instituto Nacional de Psiquiatría Ramón de la Fuente
Muñiz, 2014).
Muestras no probabilísticas
Las muestras no probabilísticas (o dirigidas) no buscan representatividad estadística,
sino que seleccionan casos típicos o relevantes según el contexto y los objetivos del
estudio. Son comunes en investigaciones cualitativas y también en algunos diseños
cuantitativos donde la generalización no es el objetivo principal.
Características:
● No permiten calcular el error estándar, ni establecer niveles de confianza.
● No se pueden extrapolar resultados a la población total de manera rigurosa.
● Son útiles para:
○ Estudios exploratorios.
○ Casos con acceso restringido o donde es difícil aplicar un muestreo
aleatorio.
○ Elegir casos con características específicas definidas desde el problema de
investigación.
● Su fortaleza radica en la profundidad del análisis, más que en la amplitud o
representatividad.
19
Muestras mixtas
A veces se combinan métodos probabilísticos y no probabilísticos. Por ejemplo, primero
se eligen contextos o instituciones clave de forma dirigida, y luego se seleccionan
individuos dentro de ellas con algún método aleatorio. El diseño dependerá siempre del
planteamiento del problema.
Ejemplos de muestras no probabilísticas
1. Ranking de los 500 mejores álbumes de rock (Rolling Stone)
○ Se usaron dos encuestas a expertos (músicos, productores, periodistas,
ejecutivos).
○ Primera muestra: 271 participantes. Segunda muestra: 100.
○ Elección no probabilística, sino basada en criterios de autoridad y
experiencia.
○ Resultado: predominancia de artistas como los Beatles, Dylan, Stones,
Springsteen, The Who.
2. Comercialización de desarrollos tecnológicos (Castrejón y Hernández-Sampieri,
2013)
○ Objetivo: conocer obstáculos para comercializar patentes e innovaciones
tecnológicas.
○ Contexto: investigadores de centros de investigación en Guanajuato, México.
○ Muestra inicial: solo 8 entrevistas. Luego, en un congreso, se amplió a 56
casos.
○ Motivo: acceso complejo, disponibilidad limitada de los sujetos.
○ Imposibilidad práctica de aplicar muestreo probabilístico.
20
Conclusión
Las muestras no probabilísticas no son defectuosas, pero su valor es diferente:
permiten una mirada intensa y enfocada sobre casos relevantes. Sin embargo, no deben
confundirse con estudios estadísticamente generalizables. Siempre hay que dejar claro
hasta dónde pueden extenderse las conclusiones y cuál es el objetivo del análisis.
La investigación, el desarrollo profesional y el muestreo
Investigación y desarrollo profesional
En la práctica profesional, realizarás investigaciones para resolver problemas, tomar
decisiones y evaluar situaciones. A veces utilizarás resultados propios, otras veces
estudios ajenos. Si tu intención es generalizar conclusiones, es necesario trabajar con
muestras probabilísticas, ya que estas permiten extrapolar los hallazgos a toda la
población.
Sin embargo, en muchos casos no contarás con suficiente tiempo, recursos o acceso, por
lo que tendrás que recurrir a muestras no probabilísticas. Esto no invalida tu estudio,
pero sí implica que deberás interpretar los resultados con cautela, reconociendo los
límites de su representatividad.
Muestreo aleatorio por marcado telefónico
(Random Digit Dialing - RDD)
Es una técnica utilizada para seleccionar muestras por vía telefónica. El procedimiento
consiste en:
● Identificar zonas geográficas mediante sus códigos telefónicos.
● Generar los dígitos restantes aleatoriamente, creando números válidos.
● Enfocar el muestreo a subgrupos como teléfonos residenciales o móviles.
● Es útil para encuestas amplias, incluso con integración de GPS o celulares.
21
Este método se utiliza frecuentemente en estudios de salud, opinión pública o
epidemiología. Se mencionan estudios relevantes en Nueva York y autores como Kreuter,
Link, Brick, entre otros.
Muestreo y alcance del estudio
La adecuación del muestreo depende del tipo de investigación y de los objetivos
planteados:
● Exploratorios: suelen usar muestras dirigidas, pero podrían usar probabilísticas.
● Experimentales: comúnmente recurren a muestras dirigidas, por dificultad para
controlar grandes grupos. La validez externa (generalización) se logra a través de
la repetición del experimento.
● Descriptivos o correlacionales-causales: requieren muestras probabilísticas si
se busca generalizar resultados con rigor estadístico.
Muestras polietápicas
En ocasiones, el diseño de la muestra implica varias etapas, como por ejemplo:
1. Seleccionar universidades.
2. Luego facultades.
3. Después cursos o materias.
4. Y finalmente estudiantes.
Este tipo de muestreo es útil para poblaciones complejas o distribuidas geográficamente.
¿Por qué fallan algunas encuestas?
A pesar de un buen diseño metodológico, encuestas recientes han fallado (como en los
casos de Trump vs. Clinton, Brexit o el plebiscito colombiano). Los motivos incluyen:
22
● Herramientas de medición poco sensibles a factores emocionales.
● Excesiva recolección por teléfono fijo (dejando fuera a muchos jóvenes).
● Altos niveles de abstención.
● Diferencias entre el momento de la encuesta y la decisión final de voto (millennials
que decidieron tarde).
En muchos casos, el error no fue del método, sino de que la muestra no reflejaba
fielmente a la población real.
Resumen final
En la investigación cuantitativa, una muestra es un subconjunto de casos seleccionados de
una población, del cual se obtendrán datos con la intención de que estos sean
representativos del universo total. La población o universo, por su parte, es el conjunto
completo de elementos que cumplen ciertas especificaciones y a los que se quiere
generalizar los resultados.
Existen dos grandes tipos de muestras: probabilísticas y no probabilísticas. En las
primeras, todos los elementos de la población tienen, desde el inicio, la misma
probabilidad de ser seleccionados, lo que permite aplicar con rigor la estadística
inferencial. En las segundas, en cambio, los elementos se eligen según el criterio del
investigador, atendiendo al contexto del estudio o la disponibilidad de los casos, y no
permiten calcular un error estándar ni generalizar con precisión los resultados.
La elección entre una u otra estrategia depende del planteamiento del problema, los
objetivos, el diseño de investigación y el tipo de análisis que se busca realizar. Por
ejemplo, si se quiere hacer una encuesta nacional de opinión para conocer actitudes
políticas, se requiere una muestra probabilística; si, en cambio, se desea explorar en
profundidad la experiencia de mujeres víctimas de violencia, lo más factible será una
muestra no probabilística.
Otro concepto clave es el de unidad de muestreo, que es el tipo de caso que se selecciona
para la muestra (por ejemplo, una persona, una escuela o una organización). A veces
coincide con la unidad de análisis, que es lo que efectivamente se estudia o mide
estadísticamente. Sin embargo, no siempre son lo mismo.
En los estudios por encuestas, que buscan generalizar los hallazgos a toda una población,
las muestras deben ser probabilísticas. La lógica es simple: si todos los elementos tienen la
23
misma posibilidad de ser elegidos, entonces el conjunto de datos extraído reflejará
fielmente las características del universo. La precisión de esta estimación depende del
llamado error de muestreo (o error estándar).
Para construir una muestra probabilística, se deben seguir dos pasos: calcular el tamaño
adecuado (usando fórmulas estadísticas o programas como STATS®) y seleccionar los
casos al azar (por ejemplo, con generadores de números aleatorios o muestreo
sistemático). Si el estudio requiere analizar diferencias entre grupos específicos —como
género, nivel socioeconómico o tipo de empresa— se puede aplicar muestreo
estratificado, que divide la población en subgrupos (estratos) y extrae muestras de cada
uno, asegurando que estén representados.
Cuando los recursos son limitados (tiempo, dinero, distancia), puede emplearse el
muestreo por racimos o conglomerados, donde se seleccionan unidades agrupadas
geográficamente o institucionalmente (como escuelas, fábricas, hospitales). En este caso,
se diferencia entre unidad muestral (el racimo) y unidad de análisis (las personas dentro
del racimo).
Para realizar cualquier tipo de muestreo probabilístico es indispensable contar con un
marco muestral: una lista, base de datos o conjunto de registros que identifiquen
claramente a los elementos de la población. Estos pueden ser guías telefónicas, directorios
empresariales, padrones electorales, registros escolares o incluso mapas geográficos.
El tamaño óptimo de la muestra dependerá de varios factores: si el estudio es nacional o
regional, el número de subgrupos que se desean analizar, el tipo de análisis estadístico
previsto, y la heterogeneidad de la población. A modo de regla general, las muestras
nacionales suelen superar los 1.000 casos, mientras que las regionales pueden oscilar
entre 400 y 700. El teorema del límite central establece que, cuando la muestra supera
los 100 casos, tiende a mostrar una distribución normal, condición útil para aplicar
pruebas estadísticas inferenciales.
En contextos sensibles o poblaciones con alta tasa de rechazo (como adicciones o evasión
de impuestos), se recomienda aumentar la muestra entre un 10 y un 20% para
compensar la pérdida de casos. Este margen permite mantener la representatividad sin
comprometer la validez de los resultados.
Finalmente, aunque las muestras no probabilísticas no permiten generalizar, son muy
útiles para estudios exploratorios, cualitativos o cuando el acceso a los participantes es
difícil. A menudo se combinan con técnicas probabilísticas según las necesidades del
estudio. Ejemplos incluyen listas de expertos como en los rankings de Rolling Stone, o
entrevistas a investigadores en congresos como en el caso de comercialización tecnológica.
24
25