CAPITULO II: Muestreo
2.0 Introducción
Una muestra es una parte de un conjunto mayor llamado población, que se
selecciona cuidadosamente para representarla. Es la base fundamental para el
diseño de una buena encuesta. Una muestra representativa de la población debe
captar la diversidad del total. Muestreo es el proceso que se lleva a cabo para
seleccionar dicha parte.
En una encuesta o investigación, la muestra se selecciona con la finalidad de
obtener información de la cual hacer deducciones sobre el grupo total en estudio.
Ello abarca tres procesos relacionados entre sí y que son los siguientes: muestreo,
el proceso de seleccionar una parte del todo; medición, la etapa intermedia que
consiste en contar y formular preguntas; y estimación, el proceso de hacer
deducciones sobre el grupo total partiendo de la información de la muestra.
El muestreo y la estimación constituyen lo que en investigación se conoce como
el diseño de la muestra.
Nuestros conocimientos, en sentido general, actitudes y acciones del diario vivir
están basados en gran medida en muestras. Esto es una realidad tanto en la vida
cotidiana como en la investigación científica.
De esta manera, la opinión que tiene una persona acerca de una determinada
empresa que durante décadas viene dando un servicio al público, por lo regular se
basa en dos o tres contactos realizados durante un determinado tiempo.
39
Es común observar a consultores que al cabo de diez o quince días en un país
extranjero, escriben informes para pautar a: gobernantes e instituciones cómo
planificar y administrar el sistema de transporte, cómo equilibrar el presupuesto,
cómo establecer un sistema de seguridad social, etc.
En realidad, la diferencia existente entre este consultor y los estudiosos de estas
áreas que viven diez o quince años dedicados a estudiarlo es que, el primero basa
sus conclusiones en una muestra mucho más pequeña.
Tanto en la ciencia como en los asuntos puramente humanos carecemos de los
recursos necesarios para estudiar más de una porción de los fenómenos que
pueden enriquecer nuestros conocimientos.
El objeto del muestreo es establecer generalizaciones con respecto a una
población total de elementos sin tener que examinarlos uno por uno.
El muestreo es ampliamente usado en los negocios y en el gobierno. En la
gerencia de producción, el muestreo del proceso de manufactura se utiliza a
menudo para mantener la adecuada calidad de un producto. El material que se
recibe como insumo regularmente se muestrea para comprobar su calidad antes
de que entre en el proceso de producción.
El muestreo se utiliza en estudios de tiempo y movimientos, en asuntos
relacionados con la determinación de la fracción de tiempo, durante la cual una
máquina o trabajador no se encuentra en producción.
En la investigación de mercados, se usa el muestreo para determinar las
preferencias del consumidor, para probar nuevos productos, para evaluar una
campaña publicitaria, para determinar los niveles de consumo de un producto en
un mercado real o potencial, para estudiar actitudes de los consumidores, para
determinar los mejores métodos de distribución, etc.
El muestreo se usa en muchas áreas de contabilidad y finanzas, por ejemplo, en la
auditoría interna de las operaciones
40
Contables de una empresa. Los registros, tales como registros de cuentas, se
muestrean para obtener la información necesaria.
Los equipos físicos se muestrean para determinar su condición y su costo de
reposición, los cálculos de nómina se muestrean para comprobar la exactitud de
los mismos.
En la administración pública, el muestreo se ha usado extensamente en varios
aspectos, tales como, empleos, desempleos, datos sobre ingresos, ahorros,
compras; los ingresos por impuestos se muestrean para obtener estimaciones
relativas a la población de todos los ingresos por impuestos, etc.
2.1 Representatividad de las muestras
El objetivo del estudio de una muestra es generalizar sus resultados, obtenidos a
través de los diferentes métodos de análisis estadísticos, en toda la población.
Así, el método para seleccionar la muestra es de gran importancia al tomar en
cuenta la validez de las inferencias realizadas, a partir de la muestra de la
población objetivo.
La muestra debe seleccionarse de una forma deliberada a partir de la población
origen, de modo que sea representativa de la población. Es decir, las
características de la muestra se aproximan a las de la población con un margen de
error conocido. Algunos investigadores con poca destreza en métodos
estadísticos, con frecuencia les preocupa más el tamaño de la muestra que su
representatividad, lo que constituye un grave error.
Una muestra representativa de 200 personas es preferible a una muestra no
representativa de 2,000,000 de personas.
El mejor y más conocido ejemplo de la no representatividad de una muestra o
error de selección muestral, según Mark L. Berenson y David M. Levine, en su obra
Estadística Básica en Administración, Concepto y Aplicaciones, (1998), ocurrió en
el sondeo de 1936 del Literary Digest. En ese año, “Literary Digest, una revista
respetada, predijo que el gobernador Alf Landon de Kansas recibiría el 57% de los
votos y que ganaría
41
abrumadoramente las elecciones presidenciales". Cuando se contaron los votos
reales, Landon recibió sólo 38%, mientras que el presidente Franklin Delano
Roosevelt fácilmente se reeligió para un segundo período en funciones. El tamaño
del error del estudio de Literary Digest se consideró enorme y sin precedentes,
habiendo perdido su credibilidad.
Que salió mal?
La predicción de Literary Digest se basó en las respuestas de 2.4 millones de
individuos, un enorme tamaño de muestra. Una razón importante fue la no
representatividad o error en la selección.
En 1936, el país, E.U.A., todavía resentía la gran depresión. Sin embargo, Literary
Digest compiló su marco de población de muestras tales como los directorios
telefónicos, las listas de membresías de clubes, suscripciones a revistas y
registros de automóviles, circunscribiéndose así a los ricos y excluyendo de su
lista a la mayoría de la población votante, quienes durante este período de dureza
económica, no podían permitirse comodidades tales como teléfono, membresías
a clubes, suscripciones a revistas y automóviles. Por tanto, 57% de las
estimaciones del voto para Landon pudieron haber estado muy cercanas de la
población objeto de estudio, pero no de la población real.
La muestra seleccionada por Literary Digest fue de 12,000,000 de personas la cual
fue respondida (por correo) por 2.4 millones de norteamericanos. Aunque la tasa
de respuestas fue pírrica, aproximadamente un 20%; los 2.4 millones que
respondieron constituye una de las muestras más grande.
Este es un claro ejemplo de que el tamaño de una muestra nunca puede
compensar la falta de representatividad de ésta.
2.2 Métodos de selección de muestras
Existen dos métodos de selección de una muestra, según la manera de
seleccionar sus elementos, que son: muestreo probabilístico y muestreo no
probabilístico.
42
2.3 Muestreo probabilístico
Es un proceso de selección de la muestra en el cual los elementos son elegidos
por métodos aleatorios, o sea, la selección de los elementos para la muestra se
efectúa por procedimientos al azar y con probabilidades conocidas de selección.
El muestreo probabilístico es el preferido por los investigadores porque la
selección de la muestra es objetiva y el error muestral puede ser medido en
términos de probabilidad bajo la curva normal.
Los tipos más comunes de muestreo probabilístico son: muestreo aleatorio
simple, muestreo sistemático, muestreo estratificado y muestreo de
conglomerados.
2.3.1 Muestreo aleatorio simple
Es un método de selección de muestras en el cual los elementos o unidades se
eligen individual y directamente por medio de un proceso aleatorio, en el que cada
elemento no seleccionado tiene la misma oportunidad de ser elegido al igual que
todos los otros elementos en cada extracción de la muestra.
De modo que cada elemento en la población debe tener igual probabilidad de ser
seleccionado.
El método más simple para obtener una muestra, mediante el muestreo aleatorio
simple consiste en numerar o codificar los elementos de la población. Luego de
numerarlos se echan en una bolsa y se extraen uno por uno y al azar cada
elemento de la muestra. Este método es de fácil aplicación cuando la población
bajo estudio es pequeña.
Este método, por conveniencia de manejo es reemplazado por una tabla de
números aleatorios; véase en la página 41.
El procedimiento para determinar una muestra, mediante muestreo aleatorio
simple, a través del uso de la tabla de números aleatorios se resume así:
1.- Asignar un solo número del 1 al N (N = tamaño de la población) a las unidades
o elementos de la población.
43
Para una población con N<100, sólo se requieren dos dígitos, por ejemplo, 01, 02,
03, 04, etc. Para poblaciones con N<1000 se requieren solamente números de tres
dígitos, por ejemplo, 001, 002, 003, etc.
2.- Decidir la dirección en que se va a leer la tabla (hacia abajo, hacia arriba, hacia
la derecha, hacia la izquierda, etc.) entonces a la ciega dejar caer el lápiz sobre la
tabla de números aleatorios y comenzar a leer.
3.- Después punto de inicio, comience a escoger los números aleatorios
requeridos, siempre de acuerdo al tamaño de la población; como se indica en el
primer pasó.
4.-Los elementos de la población cuyos números asignados coincidan con los
números obtenidos aleatoriamente constituyen la muestra aleatoria. Los números
aleatorios duplicados y los que exceden a N se ignoran.
Por ejemplo, si queremos seleccionar una muestra de 10 personas (n=10) de una
población de 200 personas (N=200), primero asignamos a cada persona un
número, desde 001 hasta 200. Inmediatamente, decidimos la dirección en que se
va a leer la tabla y preferimos hacia abajo.
Seguido, seleccionamos al azar el punto de partida de la tabla, dejando caer el
lápiz en la tabla.
Supongamos que el punto de partida corresponde a la hilera 9 y la tercera
columna y la dirección del movimiento es del punto de partida hacia abajo, como
lo habíamos establecido.
Como N=200, solamente los tres primeros dígitos de cada cinco dígitos son
necesarios. De esta manera, los 10 elementos de la muestra serán: 175, 089, 048,
003, 047, 017, 059, 167, 170, 162.
Tabla de números aleatorios
Las tablas de números aleatorios están compuestas por los dígitos 0, 1, 2, 3, 4, 5,
6, 7, 8, 9; o sea, contienen los 10 dígitos. Este conjunto de dígitos puede ser leído
de manera individual o en grupos y en cualquier dirección; hacia abajo, hacia
arriba,
44
hacia la derecha, hacia la izquierda y diagonalmente, y siempre
se pueden considerar como aleatorios.
Estas tablas, son de mucha utilidad para el muestreo
aleatorio o al azar ya que poseen dos características muy
particulares.
TABLA DE NÚMEROS ALEATORIOS
Hilera (1) (2) (3) (4) (5) (6) (7) (8)
1 24571 23165 39407 60614 99692 53643 15237 75497
2 13670 32919 85543 04891 95940 63404 76575 21672
3 30051 66205 88967 29215 16767 78664 61052 20792
4 92128 52766 59865 29936 53636 46047 75347 87500
5 55136 12504 50951 63482 77098 16146 69340 42617
6 36829 63063 34708 04290 25261 61031 94547 98720
7 28852 23758 99995 89994 80072 16337 09242 02476
8 36535 69314 56044 77614 36792 93540 67884 22881
9 73548 41988 41754 77623 74789 47006 71384 08665
10 72027 00996 40192 52962 21011 46090 33321 93884
11 62212 59442 56691 84042 17000 40994 52296 92340
12 15835 37145 62103 49902 48984 85629 50032 22670
13 11418 34412 57620 27362 40064 36801 14808 56486
14 75712 08935 99815 53736 04983 00631 43038 95376
15 82781 43481 65187 25236 97297 98008 09723 21350
16 11431 31929 02660 97338 98034 07903 82459 81239
17 67303 67361 40344 20568 65616 94778 73118 85749
18 15565 38535 75112 51825 43888 45308 02810 23307
19 24516 67385 33007 70874 29955 71904 37802 54392
20 29072 63188 51091 16185 50550 63887 06591 16804
21 98398 84599 80436 32356 57478 93489 33364 51570
22 74660 07180 17586 58164 94388 90823 52181 14110
23 76546 38853 70508 48664 67511 54981 12207 02247
24 44671 38877 19909 75430 65247 38068 34543 19751
25 27906 28645 45676 35369 65227 48617 84345 12191
26 49096 31854 78692 95604 16211 20576 70734 13683
27 21917 59181 36117 04700 17593 03176 08479 02975
28 41996 49716 16210 98364 48543 14723 24992 24723
29 06273 19931 50487 26027 18982 34026 29206 41905
30 32145 46435 50862 58842 27224 71209 91193 59023
31 21512 66037 73377 84028 52168 90387 42832 21948
32 43892 75122 68297 23761 43064 66003 09890 05100
33 44387 75667 89407 23336 89068 41164 53229 19416
34 46978 71001 65606 50456 00564 01144 30221 88556
35 15915 75596 87992 28897 85916 53472 02117 10983
36 65319 21980 74852 01770 82811 57641 40814 03221
37 16521 15881 35674 05940 79340 40810 89367 85602
38 38685 40476 53331 63211 58895 32626 30454 51839
39 47653 32290 48778 87661 56278 33845 92017 20928
40 47653 32290 48778 87661 56278 33845 92017 20928
45
La primera característica es que los dígitos están ordenados de manera tal que la
probabilidad de que aparezca cualquiera en un punto dado de una secuencia es igual a la
probabilidad de que ocurra cualquier otro.
Esto significa que en una secuencia de números, la probabilidad de que aparezca un
dígito cualquiera en un punto de la secuencia es igual a 1/10.
La segunda característica es que las combinaciones de dígitos tienen la misma
probabilidad de ocurrir que las otras combinaciones de un número igual de dígitos.
Esta segunda característica significa que todas las combinaciones de dos dígitos, tres y
así sucesivamente son igualmente probables.
Así, se puede observar que estas dos características satisfacen los requisitos necesarios
para el muestreo aleatorio.
2.3.2 Muestreo sistemático
En un muestreo sistemático, cada elemento K-ésimo, de una población arreglada en
cierto orden especificado, se selecciona para la muestra partiendo de un primer
elemento determinado al azar entre los elementos K.
Una muestra sistemática se obtiene cuando los elementos se seleccionan en forma
ordenada.
Este método de selección de la muestra depende del número de elementos o unidades
incluidos en la población y el tamaño de la muestra. Requiere del uso de un listado de
todos los elementos de la población.
Si los elementos del listado no están dispuestos en un orden particular, el muestreo
sistemático puede dar lugar a un muestreo aleatorio simple, muestreando cada elemento
k-ésimo del listado.
El elemento K se obtiene dividiendo el tamaño de la población entre el tamaño de la
muestra, o sea,
K= N/n
46
Así, si N=300 y n=20, entonces K =300 / 20 = 15
Esto significa que cada decimoquinto elemento de la población va a ser seleccionado.
El primer elemento de la muestra se selecciona de manera aleatoria, consultando la tabla
de números aleatorios para determinar dónde empezar y luego cada K-ésimo elemento
será seleccionado.
Por ejemplo, si la tabla de números aleatorios nos indica el número 12, entonces se
deberá seleccionar el decimosegundo elemento de la población como primer elemento,
después, el elemento número 27 (o sea 12+15=27); el elemento 42 (o sea 27+15=42);
elemento numero 57, etc.
Es así como una muestra sistemática puede dar la misma precisión de estimación de una
población que una muestra aleatoria simple, cuando los elementos en la población están
ordenados al azar.
El muestreo sistemático puede ser modificado ligeramente, evitando el problema de que
el intervalo de muestreo coincida con un arreglo periódico en la población considerada
y facilitando asimismo la evaluación del error de muestreo.
2.3.3 Muestreo estratificado
Existe una técnica que con gran amplitud es usada para obtener un muestreo más
eficiente, o sea, para obtener más precisión al mismo costo que la que obtendríamos con
una muestra aleatoria simple, es el muestreo estratificado.
En este tipo de muestreo, la población se divide en cierto número de subgrupos o
estratos, cada uno de los cuales se muestrea independientemente.
El proceso, a través del cual se divide la población en subgrupos o estratos, recibe el
nombre de estratificación. El objeto de la estratificación es llevar a cabo selecciones
separadas en cada uno de los subgrupos o estratos.
47
Existen dos razones de gran importancia para el uso del muestreo estratificado que son:
controlar la representatividad de la muestra y permitir la aplicación de procedimientos
de selección diferentes en cada uno de los estratos.
Mediante el ordenamiento de los elementos de la población, que generalmente es
heterogénea, en subgrupos o estratos homogéneos, la variabilidad es menor que la de la
población total. Por tal razón, se necesitará un tamaño de muestra más pequeño. Así, en
la medida en que son más semejantes los elementos en cada uno de los estratos, tanto
menor será el tamaño de la muestra.
El proceso de selección dentro de cada estrato o subgrupo, por lo general es al azar, pero
a veces es útil la realización de un censo para algunos de los estratos. Por ejemplo, en
un inventario, podemos determinar que el 10% de los artículos existentes en almacén
representan aproximadamente el 70% del valor del inventario total, y que el otro 90%
de los artículos represan el restante 30% del valor del inventario. Como se trata de que
son pocos los artículos considerados en la clase de alto valor, resulta más lógico realizar
el levantamiento de un censo completo de estos artículos y tomar una muestra al azar de
los otros estratos que presentan gran cantidad de artículos de menor valor.
Las estimaciones de la población, basadas en el muestreo estratificado, generalmente
presentan más precisión que si la población fuera muestreada por medio del muestreo
aleatorio simple.
El número de elementos que componen cada estrato es conveniente que sea
proporcional al tamaño del estrato con relación a la población.
De esta manera, por ejemplo, si el tamaño del estrato A, representa el 25% de la
población, ese mismo porcentaje es utilizado para seleccionar el número de elementos
de la muestra del estrato A. Así, si el tamaño de la muestra es de 400 elementos, el 25%
de la muestra van a ser seleccionados del
48
Estrato A, o sea, unos 100 elementos. En cambio si el estrato B representa el 15% de la
población, dicho porcentaje se utiliza para ‘seleccionar el número de elementos de
muestra de estrato B. De esta manera si el tamaño de la muestra es de 300 elementos, el
15% de la muestra se selecciona del estrato B.
2.3.4 Muestreo de conglomerados
El muestreo de conglomerados es un procedimiento de selección en el cual los
elementos para la muestra se escogen de una población agrupada o aglomerada, en lugar
de hacerlo de una población aislada. El procedimiento para obtener una muestra de
conglomerados consiste en, primero, dividir la población en grupos que son
convenientes para el muestreo. A seguidas, se selecciona una porción de los grupos al
azar o por el método sistemático. Finalmente, se toman todos los elementos al azar o por
el método sistemático de los grupos seleccionados para así obtener la muestra.
Por lo regular, una muestra obtenida, a través de este proceso, produce un mayor error
muestral, o sea, proporciona una menor precisión de las estimaciones acerca de la
población, que una muestra aleatoria simple del mismo tamaño.
Los elementos individuales dentro de cada conglomerado, normalmente tienden a ser
iguales.
Para mayor comprensión del muestreo de conglomerados, vamos a ilustrar el proceso de
selección a través de un estudio hipotético. Por ejemplo, nos interesa conocer las
condiciones económicas de los estudiantes del nivel medio de una determinada ciudad.
La población en cuestión está constituida por todos los estudiantes del nivel medio
inscritos en las escuelas dentro de los límites de la ciudad.
El muestreo aleatorio simple podría ser enfocado para el estudio. Los investigadores
podrían usar los registros existentes en las escuelas públicas y privadas y por medio de
las técnicas indicadas anteriormente, obtener una muestra aleatoria simple de la lista de
la población en cuestión.
49
Sin embargo, el resultado sería una muestra distribuida por toda la ciudad.
Aunque esta muestra podría presentar pocos problemas, resultaría poco
conveniente y muy costosa por la alta dispersión de las escuelas por toda la
ciudad.
Una alternativa sería tomar una muestra de todas las escuelas y después medir
las condiciones económicas de todos los alumnos inscritos en esas escuelas.
Este procedimiento de muestreo tendría la ventaja de reducir los costos y
simplificar el trabajo de campo.
En el muestreo de conglomerados, los elementos se seleccionan por grupos y no
en forma independiente. El efecto de la selección de grupos sobre el error
estándar va a depender de la similitud entre los elementos del grupo y aquellos de
la población.
En muchos casos, los elementos de la muestra seleccionados en grupos no
mostrarán la misma variación que presentaría un número equivalente de
elementos seleccionados de manera independiente. La gente que vive en la
misma cuadra o en el mismo sector puede ser más parecida en cuanto a
características, como por ejemplo, sus ingresos, que la gente de una población
más grande.
2.4 Muestreo no probabilístico
El muestreo no probabilístico incluye todos los métodos en que los elementos de
la muestra no se seleccionan mediante procedimientos al azar o aleatorios, o con
probabilidades de selección conocidas. Algunos procedimientos de selección del
muestreo no probabilístico son: muestreo de juicio, muestreo por cuotas,
muestreo decisional y muestreo de agrupación causal.
2.4.1 Muestreo de juicio
Este es un proceso a través del cual los elementos se escogen basándose en
opiniones informadas que garantizan la representatividad de la población que se
estudia; este muestreo se basa en la opinión de expertos. Por ejemplo, un
especialista
50
En planificación de transporte puede decidir que en un estudio sobre calidad del
servicio se deben considerar sólo los autobuses que viajen a una región
determinada, ya que éstos representan en forma adecuada al país en sentido
general.
Otro experto puede determinar que, basándose en las elecciones presidenciales
anteriores, la representación electoral de una sola provincia o del Distrito
Nacional constituye la base suficiente para hacer predicciones sobre los
resultados electorales de todo el país.
Aunque estas selecciones de muestras son prudentes y cautas, proporcionan una
base de generalización muy peligrosa. Los juicios que se basan en fundamentos
anteriores, por ejemplo, pueden ser invalidados por los cambios que se producen
en las condiciones ocurridas entre el pasado y el presente.
Las muestras de juicios proporcionan interesantes estudios de casos y pueden
generar hipótesis muy importantes, pero no constituyen bases confiables para
estimaciones estadísticas.
2.4.2 Muestreo por cuotas
Es un proceso de selección en el cual los elementos son elegidos en el campo
mismo, por los entrevistadores, utilizando categorías prefijadas de elementos de
la muestra, para obtener un número predeterminado de casos en cada categoría.
Las cuotas se establecen sobre la base de características conocidas de la
población en estudio. Por ejemplo, un censo reciente puede mostrar que la
población estudiantil de una provincia representa el 25% de la población
estudiantil total.
El tipo más sencillo de muestreo por cuotas establecería que el 25% de la muestra
provendría de esa provincia y las selecciones reales serían efectuadas por los
entrevistadores en el campo.
Las cuotas pueden establecerse de manera satisfactoria, basándose en los datos
de un censo y en otras informaciones, pero existen limitaciones prácticas que son
impuestas por la clase de información disponible.
51