Muestreo
[2.1] ¿Cómo estudiar este tema?
[2.2] Concepto de muestreo y tipos
[2.3] Muestreos aleatorios
[2.4] Muestreos no aleatorios
[2.5] Cálculo del tamaño de la muestra
[2.6] Error de muestreo y nivel de confianza: evaluación de
muestras para la investigación de mercados profesional
2 TEMA
Investigación Cuantitativa
Esquema
Muestreo estadístico
Probabilístico No probabilístico
• Aleatorio simple
• Por cuotas
• Estratificado
• Opinático o intencional, casual o
• Por conglomerados
incidental
• Polietápico
• Por redes o bola de nieve
• Aleatorio sistemático
Cálculo del tamaño muestral
Error de muestreo y nivel
de confianza: evaluación de muestra
para la investigación de
mercados profesional.
TEMA 2 – Esquema 2 © Universidad Internacional de La Rioja (UNIR)
Investigación Cuantitativa
Ideas clave
2.1. ¿Cómo estudiar este tema?
Para estudiar este tema deberás leer las Ideas clave desarrolladas en este documento,
que se complementan con lecturas y otros recursos que se muestran al final del tema para
que puedas ampliar los conocimientos sobre el mismo.
Por consiguiente, es suficiente con leer los contenidos de los siguientes apartados con
mucha atención y siendo consciente de que toda la información que se transmite en los
mismos es de esencial adquisición para un profesional del ámbito de la investigación de
mercados.
Se trata de conocimientos absolutamente aplicados que un investigador de mercados
siempre tiene en mente y necesita en su día a día para llevar a cabo su trabajo. Se
imparten con el objetivo de que sean adquiridos para desarrollar la profesión y no
únicamente con el objetivo de pasar un examen o prueba.
Este tema está dedicado al muestreo, que constituye el pilar fundamental de la
investigación cuantitativa, pues la forma de compilación de los datos en los que se
basa cualquier investigación de mercado y su calidad son los factores que garantizan la
posterior utilidad de los análisis que se lleven a cabo.
El muestreo, al igual que el resto de las materias que integran las disciplinas que
componen la Estadística, tiene fundamentos científicos, pero la aplicación de los mismos
para la obtención de muestras fiables y representativas, también tiene algo de arte.
Al público en general, y a muchos de los clientes con los que se trabaja en el entorno
profesional, les cuesta bastante comprender la mecánica del muestreo y, por ello, es muy
importante que el profesional de la investigación de mercados tenga la mejor
preparación posible en este terreno. Ganar experiencia y sabiduría en el diseño de
muestras es un deber de todo profesional de la investigación de mercados, para ser capaz
de jugar con todos los elementos que integran este proceso y poder elaborar propuestas
alternativas que ofrezcan, a costes razonables, datos fiables y representativos de las
poblaciones objetivo.
TEMA 2 – Ideas clave 3 © Universidad Internacional de La Rioja (UNIR)
Investigación Cuantitativa
El coste de un trabajo de campo es, precisamente, uno de los aspectos que más
preocupa a los clientes de las empresas de investigación de mercados. A veces, se pueden
llevar a cabo ajustes justificados de forma científica, mientras que, en otras ocasiones,
según cuál sea el objetivo del estudio y el grado de exactitud con el que se quiera estimar
el resultado, no será posible llevar a cabo rebajas. El diseñador de muestras debe
estar preparado para enfrentar discusiones en torno a presupuestos de trabajo
de campo con sus clientes y, tener argumentos para justificar todas las
recomendaciones que deba hacer en torno a cualquier proyecto.
2.2. Concepto de muestreo y tipos
Teniendo en cuenta que:
» Universo: se define como el conjunto teórico finito o infinito de sujetos o elementos
que tienen una característica común, observable y susceptible de ser medida.
» Población estadística: conjunto finito o infinito de elementos (personas, animales,
cosas, entidades…) susceptibles de ser observados, medidos o registrados con relación
a alguna característica de interés para un investigador.
El muestreo es el proceso de seleccionar un conjunto de individuos de una
población con el fin de estudiarlos y poder caracterizar el total de la
población.
Proceso estadístico
Población
Muestreo Inferencia
estadística
Muestra
Figura 1. Fuente: adaptado de [Link]
TEMA 2 – Ideas clave 4 © Universidad Internacional de La Rioja (UNIR)
Investigación Cuantitativa
Para muchos investigadores, el concepto de universo y de población es equivalente. Sin
embargo, en la realidad se debe tener en cuenta que pueden darse diferencias.
Ejemplo I
Supongamos que el departamento de marketing de la
empresa «Verdifresh» quiere realizar un estudio acerca del
gasto medio semanal por hogar de la ciudad de
Valencia en fruta y verdura.
¿Cuál es el universo?
Según la definición, el universo estaría compuesto por TODOS los hogares de la ciudad
de Valencia. Sin embargo, en la realidad, el universo no se puede abarcar porque el
número de hogares de Valencia es un conjunto de elementos en constante movimiento:
hogares nuevos que se crean, hogares que se cierran, la cifra puede estar cambiando
constantemente. Por consiguiente, para hacer el estudio, los investigadores tienen que
conformarse con un censo correspondiente a una fecha concreta y, en
consecuencia, con los hogares que figuren en el registro censados en ese momento. Este
censo disponible es la población de referencia y a ella debe referirse el estudio y sus
resultados.
Por otro lado, un estudio como el que quiere abordar este departamento de marketing
tendría un coste inabordable si hubiese que localizar y entrevistar a todos los hogares
censados en Valencia. Con gran probabilidad, «Verdifresh» encargaría un trabajo de
campo telefónico, con lo cual, el universo pasaría a ser el listado de teléfonos que utilizase
la empresa de trabajo de campo, o bien, se decantaría por encuestas cara a cara en una
muestra representativa de los supermercados Mercadona (que es la cadena que vende
estos productos) en Valencia, con lo cual, el universo pasaría a ser el conjunto de clientes
habituales y casuales de dichos supermercados.
Es debido a estas cuestiones que, para la realización de estudios estadísticos se emplean
muestras de la población abarcable, debiendo considerarse el concepto de universo
como teórico en muchas ocasiones.
TEMA 2 – Ideas clave 5 © Universidad Internacional de La Rioja (UNIR)
Investigación Cuantitativa
Dado que el objetivo de la inferencia estadística es el de inducir el comportamiento
de una población a partir de la extracción y análisis de una muestra, el punto más
importante de un proceso de muestreo es que la información contenida en la
muestra extraída sea representativa de la población que la ha generado.
Esta representatividad se consigue trabajando con las denominadas muestras
aleatorias. Una muestra es aleatoria cuando todos los elementos de la población de
referencia tienen la misma probabilidad de ser seleccionados y cuando estos elementos
se extraen de forma independiente.
Al estudiar una característica o variable de la población, nos interesará averiguar el valor
de los parámetros que describen esta variable y que serán desconocidos para
nosotros. La muestra, si es representativa, nos proporcionará una estimación de estos
parámetros mediante los estadísticos que podremos calcular a partir de la información
contenida en la muestra.
Los tipos de muestreo se dividen en:
Muestreo probabilístico Muestreo no probabilístico
Todos los individuos u objetos La elección de los elementos no
integrantes de la población tienen la depende de la probabilidad, sino de las
misma probabilidad de ser extraídos causas relacionadas con las
para formar parte de una muestra características de la investigación o de
quien establece la muestra
Aleatorio simple Por cuotas
Estratificado por conglomerados Opinático o intencional, casual o
Polietápico incidental,
Aleatorio sistemático Por redes o bola de nieve
Figura 2.
Elegir una muestra probabilística o no probabilística depende de los objetivos del
estudio, del esquema de investigación y del alcance de sus contribuciones, pero es mucho
más habitual trabajar con probabilísticas.
TEMA 2 – Ideas clave 6 © Universidad Internacional de La Rioja (UNIR)
Investigación Cuantitativa
2.3. Muestreos aleatorios
Muestreos aleatorios
Muestreo aleatorio simple
Muestreo aleatorio estratificado
Muestreo por conglomerados
o racimos
Muestreo polietápico
Muestreo sistemático
Figura 3.
» Muestreo aleatorio simple
o Es el más popular entre los muestreos probabilísticos.
o Se utiliza cuando se conocen (o se tiene un listado o registro) todos los elementos que
conforman la población.
o Cada elemento de la población tiene la misma probabilidad de ser elegido para formar
parte de la muestra.
o Es el más utilizado y el más recomendable junto con sus variaciones.
En la práctica, aplicar un muestreo aleatorio simple para extraer una muestra de n
elementos de una población consiste en:
o Disponer de un censo o lista de todos los elementos que forman la población.
o Tener asignado un número identificativo para cada elemento de la población.
o Utilizar una tabla de números aleatorios, un bombo de lotería, un software estadístico
generador de números aleatorios o extractor de muestras, o cualquier otro dispositivo
que nos permita seleccionar de forma aleatoria n números identificativos de
los elementos de la población para formar una muestra de tamaño n.
TEMA 2 – Ideas clave 7 © Universidad Internacional de La Rioja (UNIR)
Investigación Cuantitativa
o Escoger los casos que corresponden a los n números aleatorios e identificar a los
elementos de la población que los poseen: estos elementos son los que forman la
muestra aleatoria simple.
Ventajas Inconvenientes
El muestreo aleatorio simple garantiza las Hay que tener una lista o censo de la
condiciones de representatividad dado que población, cosa que no se puede lograr la
permite extraer muestras aleatorias. mayoría de las veces.
Tabla 1. Ventajas e inconvenientes del muestreo aleatorio simple.
Actualmente, en estudios particulares, este tipo de muestreo se lleva a cabo utilizando
un programa estadístico que seleccione una muestra de elementos aleatoriamente de una
lista general, que es la población y, en trabajos de campo profesionales, especialmente
en los telefónicos, los entrevistadores disponen del sistema CATI (Computer Assisted
Telephone Interview) que efectúa selecciones de números de teléfono de listados
profesionales muy grandes y representativos de las poblaciones, de forma automática.
Ejercicio I
Supongamos que sobre una población de 20 estudiantes universitarios estamos
investigado acerca de los que han tenido alguna experiencia laboral.
Estudiante ¿Experiencia Estudiante ¿Experiencia
laboral? laboral?
[Link] Sí 11. Rebeca NO
2. Lucía NO 12. Rafael NO
[Link] NO 13. Vicente SÍ
4. Marcos NO 14. Lucas NO
5. Laura SÍ 15. Natalia NO
6. Amparo SI 16. Patricia NO
7. Alejandro NO 17. Mario NO
[Link] NO 18. Javier NO
9. Eduardo NO 19. Luis SÍ
10. María SÍ 20. Aitana SÍ
Tabla 2.
Elija una muestra aleatoria simple de tamaño n = 8 de esta población. Use la tabla de
números aleatorios adjunta, empiece en la fila 2 columna 1 y continúe seleccionando
dígitos adecuados al caso hacia la derecha. Cuando termine proporcione una lista con los
integrantes de la muestra.
TEMA 2 – Ideas clave 8 © Universidad Internacional de La Rioja (UNIR)
Investigación Cuantitativa
Tabla de números aleatorios
17 30 13 5
5 34 31 15
17 31 24 34
25 12 26 20
27 40 14 2
22 13 11 9
38 2 23 19
18 3 9 20
9 31 40 1
32 22 2 22
33 14 22 9
3 6 27 33
28 33 27 25
39 10 10 29
39 21 12 28
17 18 30 24
Tabla 3.
o ¿Cuál es el parámetro poblacional que nos interesa estudiar en esta población?
o ¿Qué resultado muestral nos proporciona la muestra extraída acerca de este
parámetro?
o ¿Se parece al poblacional?
Solución
Para generar la muestra aleatoria simple, tomamos 8 números de la tabla de números
aleatorios.
Comenzamos, tal como se nos indica, por la fila 2 de la columna 1, que contiene el número
5 y continuamos hacia la derecha. El siguiente número es el 34, pero como sólo tenemos
20 estudiantes, lo dejamos. El siguiente es el 31, que tampoco nos sirve. El siguiente es
el 15: lo tomamos. Seguimos en la tercera fila. Tomamos el 17 y los otros no nos sirven.
Seguimos en la cuarta fila, que nos proporciona dos números válidos: el 12 y el 20.
Seguimos en la quinta fila, que nos proporciona el 14 y el 2. Seguimos en la sexta fila, que
nos proporciona el 13. Con este número ya tenemos 8, que son: 5, 15, 17, 12, 20, 14, 2, 13.
Ahora, para extraer la muestra, tomamos a los estudiantes de la lista que se corresponden
con estos números aleatorios, tal y como se ve en la siguiente tabla.
TEMA 2 – Ideas clave 9 © Universidad Internacional de La Rioja (UNIR)
Investigación Cuantitativa
Estudiante ¿Experiencia Estudiante ¿Experiencia
laboral? laboral?
[Link] Sí 11. Rebeca NO
2. Lucía NO 12. Rafael NO
[Link] NO 13. Vicente SÍ
4. Marcos NO 14. Lucas NO
5. Laura SÍ 15. Natalia NO
6. Amparo SI 16. Patricia NO
7. Alejandro NO 17. Mario NO
[Link] NO 18. Javier NO
9. Eduardo NO 19. Luis SÍ
10. María SÍ 20. Aitana SÍ
Tabla 4.
El parámetro poblacional que nos interesa estudiar acerca de esta población es:
Parámetro poblacional = P = proporción de estudiantes que tienen
experiencia laboral en la población
La muestra extraída, proporciona una estimación de este parámetro, la proporción
muestral o número de casos de la muestra que tienen experiencia laboral, que en este
caso es:
Proporción muestral = p = 3/8 = 0,375
El resultado obtenido mediante la muestra aleatoria simple, indica que la proporción de
estudiantes que tiene experiencia laboral en esta población está en torno al 37,5%.
En este caso, conocemos el parámetro poblacional, pues:
P = 7/20 = 0,35
Por consiguiente, el resultado real en la población es que hay un 35% de estudiantes con
experiencia laboral.
La muestra se ha aproximado bastante, pero se da una diferencia entre p y P, que es el
error muestral. En este caso, no hemos controlado el error, pues simplemente
queríamos experimentar la mecánica de la extracción, pero en la realidad si se hace, ya
que el tamaño de la muestra se calcula para cometer un error concreto (el menor posible),
para un nivel de confianza determinado de las estimaciones. Al explicar el cálculo del
tamaño de la muestra se verá claro este aspecto del muestreo.
TEMA 2 – Ideas clave 10 © Universidad Internacional de La Rioja (UNIR)
Investigación Cuantitativa
» Muestreo aleatorio estratificado
El muestreo aleatorio estratificado es una ampliación del simple, que proporciona
muestras más eficientes a partir de la utilización de más información acerca de la
población.
Al explicar el muestreo aleatorio simple, hemos considerado a la población como un
conjunto de individuos acerca de los que interesa estudiar una característica, sin
plantearnos la existencia de subgrupos (denominados estratos) de interés dentro de la
población.
Sin embargo, en la realidad, muchas poblaciones están subdivididas en estratos que hay
que tener en cuenta a la hora de diseñar muestras.
Ejemplo II
Supongamos que se desea realizar un estudio acerca de la intención emprendedora de
los estudiantes universitarios en España. La población objetivo de este tipo de estudio es
la población de estudiantes universitarios de España. En este caso, para tener una
muestra representativa de esta población, hay que tener en cuenta que está formada por
los estratos de las especialidades:
Figura 4. Fuente: Elaboración propia.
TEMA 2 – Ideas clave 11 © Universidad Internacional de La Rioja (UNIR)
Investigación Cuantitativa
Por supuesto, también será importante considerar otros estratos tales como:
o Universidad
o Curso
o Género
Y otros, pero la especialidad es fundamental, pues es un factor muy determinante de la
intención emprendedora. Si al diseñar una muestra representativa de la población para
un estudio cualquiera no se tiene en cuenta la existencia de estratos, podríamos obtener
como resultado lo que se conoce como una muestra sesgada.
Una muestra sesgada sería aquella que mostraría un desequilibrio en la composición:
demasiados (o pocos) hombres o mujeres, demasiados (o pocos) jóvenes o mayores,
respecto de la población, y así sucesivamente.
Una muestra es representativa de la población cuando su distribución reproduce la
de la población en sus estratos relevantes. Si al calcular la distribución muestral y
compararla con la poblacional vemos que hay diferencias notables entre los porcentajes
de personas en cada estrato, entonces estaremos ante una muestra sesgada que no
representa bien a la población.
Se denomina muestreo estratificado a aquel en el que los elementos de la población
se dividen en estratos, en que la muestra se toma asignando un número determinado de
miembros a cada estrato y escogiendo, finalmente, por muestreo aleatorio simple a los
elementos dentro de cada estrato.
Una muestra estratificada puede ser proporcional o no serlo. En la realidad, lo más
habitual es diseñar muestras proporcionales, es decir, muestras que se compongan de
una proporción de elementos igual a la que hay en la población para cada estrato. Por
eso, cuando se realiza un muestreo estratificado proporcional, lo que se hace es dividir el
tamaño total de la muestra proporcionalmente al tamaño relativo del estrato en la
población.
𝑛 𝑛
𝑁𝑖
𝑛 = 𝑡𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 𝑒𝑠𝑡𝑟𝑎𝑡𝑖𝑓𝑖𝑐𝑎𝑑𝑎 = ∑ 𝑛𝑖 = ∑ 𝑛 ·
𝑁
𝑖=1 𝑖=1
TEMA 2 – Ideas clave 12 © Universidad Internacional de La Rioja (UNIR)
Investigación Cuantitativa
Siendo:
o n el tamaño de la muestra total.
o ni el tamaño muestral de cada estrato.
o Ni el tamaño poblacional de cada estrato.
o N el tamaño de la población.
Por ejemplo, si en una población hay un 55% de mujeres y un 45% de hombres, en la
muestra mantendremos esta misma proporción. Sin embargo, la muestra no
proporcional puede ser la más eficiente en algunos casos, como vamos a ver enseguida.
Este procedimiento es satisfactorio si no hay gran diferencia en dispersión de un
estrato a otro. Pero no es el procedimiento más eficiente cuando las desviaciones
estándares difieren sustancialmente en los distintos estratos, ya que la consideración
más importante para la representatividad de la muestra no es el tamaño, sino la variación
de la población.
Ejemplo III
Supongamos que tenemos una población de N = 500 individuos dividida en cuatro
grupos de edad (estratos) de tamaño: 10%, 20%, 30% y 40% de la población y que ha de
extraerse una muestra de n = 200 individuos.
Una muestra proporcional se compondría de:
20 individuos del estrato 1, ya que 200x0,1 = 20 individuos
40 individuos del estrato 2, ya que 200x0,2 = 40 individuos
60 individuos del estrato 3, ya que 200x0,3 = 60 individuos
80 individuos del estrato 4, ya que 200x0,4 = 80 individuos
Total 200 individuos
Este procedimiento es satisfactorio si no hay gran diferencia en dispersión de un estrato
a otro. Pero no es el procedimiento más eficiente cuando las desviaciones estándares
difieren sustancialmente en los distintos estratos, ya que la consideración más
importante para la representatividad de la muestra no es el tamaño sino la variación de
la población.
TEMA 2 – Ideas clave 13 © Universidad Internacional de La Rioja (UNIR)
Investigación Cuantitativa
Ejemplo IV
Supongamos que tenemos una población de 500 personas estratificada en grupos de
edad como en el ejemplo anterior:
Grupo de edad Frecuencia Porcentaje Porcentaje Porcentaje
válido acumulado
18-24 AÑOS 50 10,0 10,0 10,0
25-34 AÑOS 100 20,0 20,0 30,0
35-44 AÑOS 150 30,0 30,0 60,0
45-54 AÑOS 200 40,0 40,0 100,0
Total 500 100,0 100,0 10,0
Tabla 5.
Supongamos que analizamos la distribución de la edad concreta de los individuos en cada
uno de los estratos y que obtenemos el siguiente resultado:
N Media Desviación
típica
Estrato Tamaño Edad Edad
1,00 50 20,46 1,82
2,00 100 29,41 2,88
3,00 150 39,45 3,38
4,00 200 49,11 2,78
Total 500 39,40 10,11
Tabla 6.
Observando los resultados, vemos que la desviación estándar del Estrato 1 es menor que
la del Estrato 2, que a su vez es menor que la del Estrato 3. En cambio, el Estrato 4
presenta una desviación estándar parecida a la del Estrato 2. En consecuencia, la
distribución de las edades es más dispersa en el Estrato 3 que en los otros y, por
consiguiente, para extraer una muestra representativa de dicho estrato vemos,
intuitivamente, que se necesitará un tamaño muestral mayor que en algunos de los otros
casos.
TEMA 2 – Ideas clave 14 © Universidad Internacional de La Rioja (UNIR)
Investigación Cuantitativa
El tamaño inicial del estrato no es lo más importante, sino la variabilidad de su
contenido. El Estrato 3 tiene 150 individuos, 50 menos que el Estrato 4, que tiene 200.
Si aplicamos la proporcionalidad a la determinación de la muestra, tomaríamos 80
individuos del Estrato 4 y 60 del Estrato 3. Sin embargo, como veremos a continuación,
si tenemos en cuenta que el Estrato 3 es más disperso la muestra más eficiente tomaría
más elementos del Estrato 3 que la proporcional y menos elementos del Estrato 4 que la
proporcional.
En definitiva, para obtener la máxima eficiencia en la estratificación, debemos asignar
mayor representación a los estratos con mayor dispersión y menor representación a los
estratos con menor dispersión. Para ello, podemos dividir el tamaño total de la muestra
entre los estratos proporcionalmente a la variabilidad del estrato, tomando menos
elementos de estratos donde la característica tenga menor dispersión. Esto se consigue
aplicando la asignación de Neyman:
𝑁𝑖 𝜎𝑖
𝑛𝑖 = 𝑛 · 𝑛
∑𝑖=1 𝑁𝑖 𝜎𝑖
Siendo:
o ni = tamaño muestral del estrato.
o n = tamaño de la muestra total a extraer.
o Ni = tamaño poblacional del estrato.
o σi = desviación estándar de la variable en cada estrato poblacional.
Ejemplo V
De la población anterior de N = 500 individuos dividida en cuatro grupos de edad
(estratos) de tamaño: 10%, 20%, 30% y 40% de la población, ha de extraerse una muestra
de n = 200 individuos. Se sabe que la dispersión poblacional de cada estrato es: 1,82;
2,88; 3,38 y 2,78 años. Determinar el tamaño muestral de cada estrato aplicando la
asignación de Neyman para lograr la máxima eficiencia.
𝑁𝑖 𝜎𝑖 50 · 1,82
𝑛1 = 𝑛 · 𝑛 = 200 · = 12,62
∑𝑖=1 𝑁𝑖 𝜎𝑖 50 · 1,82 + 100 · 2,88 + 150 · 3,38 + 200 · 2,78
𝑁𝑖 𝜎𝑖 100 · 2,88
𝑛2 = 𝑛 · 𝑛 = 200 · = 39,98
∑𝑖=1 𝑁𝑖 𝜎𝑖 50 · 1,82 + 100 · 2,88 + 150 · 3,38 + 200 · 2,78
TEMA 2 – Ideas clave 15 © Universidad Internacional de La Rioja (UNIR)
Investigación Cuantitativa
𝑁𝑖 𝜎𝑖 150 · 3,38
𝑛3 = 𝑛 · 𝑛 = 200 · = 70,31
∑𝑖=1 𝑁𝑖 𝜎𝑖 50 · 1,82 + 100 · 2,88 + 150 · 3,38 + 200 · 2,78
𝑁𝑖 𝜎𝑖 200 · 2,78
𝑛4 = 𝑛 · 𝑛 = 200 · = 77,11
∑𝑖=1 𝑁𝑖 𝜎𝑖 50 · 1,82 + 100 · 2,88 + 150 · 3,38 + 200 · 2,78
Comparemos las muestras:
Muestra estratificada Muestra estratificada eficiente
proporcional no proporcional
Estrato 1 20 12,62≈13
Estrato 2 40 39,98≈40
Estrato 3 60 70,31≈70
Estrato 4 80 77,11≈77
Total 200 200
Tabla 7.
En conclusión, necesitaríamos realizar menos entrevistas en los Estratos 1 y 4, las
mismas en el Estrato 2 y más entrevistas en el Estrato 3.
¿Cuál es el obstáculo al que nos enfrentamos en la realidad para aplicar la
asignación eficiente de Neyman? El desconocimiento de la variabilidad de los
estratos de la población, que salvo excepciones no suele estar disponible.
¿Cómo podemos solucionar este problema? Obteniendo estos datos a partir de
estudios previos si los hay, apelando al juicio de expertos, realizando muestras piloto o,
incluso, aplicando la intuición si se tiene mucha experiencia. En caso de no ser factible
llevar a cabo la determinación de la variabilidad de los estratos, entonces se aplicará la
asignación proporcional.
» Muestreo por conglomerados o racimos
Se utiliza cuando no es posible obtener una lista de todos los elementos de la población
y su empleo es adecuado si la población es muy grande y dispersa.
TEMA 2 – Ideas clave 16 © Universidad Internacional de La Rioja (UNIR)
Investigación Cuantitativa
Los conglomerados se caracterizan por ser homogéneos entre sí, pero
internamente presentan un alto grado de heterogeneidad en sus componentes.
La técnica consiste en lo siguiente: se divide a la población en grupos o racimos, luego
se selecciona aleatoriamente algunos de esos grupos, por considerar que cada uno de
ellos es representativo de la población y, posteriormente, se toma una muestra aleatoria
de cada uno de los grupos que se han seleccionado.
Este procedimiento produce una muestra más precisa a un menor costo ya que se utiliza
cuando hay una variación considerable dentro de cada grupo, siendo los grupos similares
entre sí.
El conglomerado es común en los diseños polietápicos y en las muestras de zona
geográfica. Cuando se muestrean conglomerados que contienen números de unidades
desiguales, pueden utilizar el muestreo probabilístico proporcional al tamaño para que
la probabilidad de selección del conglomerado sea igual a la proporción de unidades que
contiene.
Ejemplo VI
Como hemos visto, en la muestra por conglomerados, los elementos que componen una
población se reúnen en unidades de muestreo de mayor tamaño, llamadas
conglomerados.
Para llevar a cabo una encuesta electoral, o de consumo, o de opinión, podemos
muestrear familias en lugar de votantes, consumidores u opinantes individuales. En
estos casos, las familias forman los conglomerados y los miembros de las familias son las
unidades de muestreo.
Otros casos típicos son los que se diseñan para
analizar los gastos familiares o para controlar el
nivel de audiencia de los programas y cadenas de
televisión. En estos casos, se utiliza un muestreo por
conglomerados–familias que han sido elegidas
aleatoriamente. Las familias incluyen personas de
todas las edades, muy representativas de las mismas
edades y preferencias de la totalidad de la población.
TEMA 2 – Ideas clave 17 © Universidad Internacional de La Rioja (UNIR)
Investigación Cuantitativa
» Muestreo polietápico
Muestreo en el que se procede por etapas: se obtiene una muestra de unidades primarias,
más amplias que las siguientes; de cada unidad primaria se toman, para una submuestra,
unidades secundarias, y así sucesivamente hasta llegar a las unidades últimas o más
elementales.
Puede considerarse como una modificación del muestreo por conglomerados.
En este caso, no forman parte de la muestra elementos o unidades de todos los
conglomerados, sino que, una vez seleccionados los conglomerados aleatoriamente, se
efectúan submuestras dentro de cada uno de ellos.
Ejemplo VII
Múltiples etapas, polietápico:
o 1º etapa: muestra de ciudades.
o 2º etapa: muestra de familias.
o 3º etapa: muestra de individuos.
El Instituto Nacional de Estadística de España aplica este diseño para la realización de
muchas encuestas debido al gran tamaño y dispersión de la población española.
Por ejemplo, para la encuesta nacional de salud, en la que se capta la opinión de los
españoles sobre su salud y sobre el sistema nacional de salud, se efectúa una selección de
municipios, distritos, hogares y, finalmente, un miembro del hogar.
» Muestreo sistemático
Los elementos se seleccionan de la población en un intervalo uniforme que se mide
respecto de tiempo, orden o espacio. Se emplea si existe una lista ordenada
sistemáticamente de los elementos de la población, siendo imprescindible conocer
cuántos elementos componen esa población. Es el muestreo más adecuado para llevar a
cabo auditorías, por ejemplo, ya que permite extraer muestras sistemáticas y aleatorias
de documentos de cualquier archivo documental organizado.
TEMA 2 – Ideas clave 18 © Universidad Internacional de La Rioja (UNIR)
Investigación Cuantitativa
La técnica consiste en tomar cada k elementos de una lista que contiene todos los
elementos de una población, eligiéndose al azar el primer elemento de la muestra. Para
determinar el valor k se calcula el cociente entre el tamaño de la población N y el tamaño
de la muestra n.
Ejemplo VIII
Si se tiene una población de 150 documentos ordenados según un número de registro y
se desea tomar una muestra de 30, entonces, en primer lugar, se calcula k:
𝑁 150
𝐾 = = =5
𝑛 30
Este resultado indica que habrá que tomar un documento de cada 5, comenzando por
uno que se determina tomando un número al azar entre 1 y 5.
Si el número escogido al azar fuese el 2, entonces, se tomaría el segundo documento,
después el número 7, después el número 12, después el 17 y así, sucesivamente, hasta
tener una muestra de 30 documentos.
El azar, en este caso, interviene en la selección del número por el cuál comenzar la
primera extracción. El resto de elementos de la muestra se extrae de forma sistemática.
Figura 5. Fuente: [Link]
TEMA 2 – Ideas clave 19 © Universidad Internacional de La Rioja (UNIR)
Investigación Cuantitativa
2.4. Muestreos no aleatorios
Muestreo no aleatorio
Muestreo por cuotas
Muestreo opinático o
intencional
Muestreo por casual o
incidental
Muestreo por redes
Muestreo sistemático
Figura 6.
» Muestreo por cuotas
o Es el más popular de los muestreos no probabilísticos.
o Consiste en formar estratos de la población sobre la base de ciertas características y
en procurar que estén representadas en proporciones semejantes a las que existen
en la población.
o Principales características utilizadas para estratificar la población: sexo, edad,
ocupación, etc.
o Una vez determinada la cuota se eligen los primeros que se encuentran y que
cumplen esas características. Este tipo de muestreo tiene como beneficio que se
pueden realizar estudios exploratorios rápidos y económicos.
Por ejemplo:
Una empresa farmacéutica quiere estimar la aceptación del sabor de un nuevo producto
de cierta gama inocua, para lo cual invita a la degustación del producto en un hospital
utilizando un muestreo por cuotas de sexo y edad, para estimar si hay diferencias entre
hombres, mujeres, niños, jóvenes, adultos de mediana edad y mayores de 64 años.
Los encuestadores y administradores del producto, van llenando cuotas establecidas de
personas con estas características hasta completar la muestra y ellos son los que eligen
a las personas según su criterio.
TEMA 2 – Ideas clave 20 © Universidad Internacional de La Rioja (UNIR)
Investigación Cuantitativa
» Muestreo opinático o intencional
Es una técnica que se basa en la opinión del investigador para constituir una muestra de
sujetos en función de su carácter típico, como en el estudio de casos extremos o
marginales, o de los casos típicos. Permite estudiar fenómenos raros o inusitados.
Es cierto que en este tipo de muestreo la realización del trabajo de campo puede
simplificarse enormemente al concentrarse mucho la tarea de selección de la muestra.
Sin embargo, se pueden cometer errores y sesgos debidos al investigador por tratarse de
un muestreo subjetivo (según las preferencias del investigador) y, también por el hecho
de que los resultados de la encuesta no tienen fiabilidad estadística exacta.
Por ejemplo:
o Encuesta sobre consumo de un producto financiero muy específico.
o Encuestas a usuarios de sistemas de envío de dinero al extranjero.
o Encuestas a compradores de productos informáticos y otras.
» Muestreo casual o incidental
La muestra está conformada por sujetos fácilmente accesibles y presentes en un lugar
determinado, y en un momento preciso. Los sujetos se incluyen en el estudio a medida
que se presentan, y hasta que la muestra alcance el tamaño deseado.
Por ejemplo:
o Encuestas en vía pública que se realizan en un día y horario determinado.
o Encuestas de opinión a la salida de cines acerca de una programación concreta.
» Muestreo por redes (bola de nieve)
o Consiste en localizar a algunos individuos según determinadas características.
o Se utiliza en poblaciones marginales o de difícil acceso.
o Se basa en redes sociales, en las amistades.
Cuando se encuentra el primer representante, este puede conducir a otro, y ese a un
tercero, y así, sucesivamente hasta conseguir una muestra suficiente.
TEMA 2 – Ideas clave 21 © Universidad Internacional de La Rioja (UNIR)
Investigación Cuantitativa
Por ejemplo:
o Personas que padecen una determinada enfermedad.
o Personas que fueron sometidas a un tipo particular de intervención.
o Personas que forman parte de determinados grupos sociales, etnias, refugiados y
similares.
Figura 7. Fuente: [Link]
2.5. Cálculo del tamaño de la muestra
Determinar el tamaño para que una muestra sea representativa y proporcione
estimaciones fiables es uno de los elementos clave del muestreo.
Pero, ¿por qué es tan importante? Cuando queremos estimar un parámetro
poblacional utilizamos un estimador. Los mejores estimadores para los casos más
habituales de estimar una media (µ), una desviación estándar (σ) o una proporción (P)
poblacional son la media (¯x), la desviación estándar (s) y la proporción (p) muestral.
Pero, aun trabajando con los mejores estimadores, sabemos que se va a producir un
error, es decir, una diferencia entre el parámetro poblacional y el valor de la estimación
muestral. Este error se denomina error de muestreo.
Este error es desconocido, porque también lo es el parámetro poblacional. Por esta razón,
se construyen intervalos de confianza que nos proporcionan los límites entre los
cuales hay una probabilidad de que el verdadero valor del parámetro esté contenido en
ellos.
TEMA 2 – Ideas clave 22 © Universidad Internacional de La Rioja (UNIR)
Investigación Cuantitativa
El tamaño muestral forma parte de la formulación de los intervalos de confianza y, de
hecho, si observamos el siguiente intervalo para la media poblacional:
𝜎 𝜎
𝑃 (𝑥̅ − 1,96 ≤ 𝜇 ≤ 𝑥̅ + 1,96 ) = 0,95
√𝑛 √𝑛
Donde:
1,96 = α/2 = valor de la distribución normal estándar que limita el área de confianza
del 95%.
Figura 8. Fuente: [Link]
𝜎
Es fácil darse cuenta de que el error muestral es 1,96 , ya que es la cantidad en que el
√𝑛
estimador muestral difiere del parámetro poblacional. Teniendo en cuenta este hecho,
un analista puede decidir cuál es el error máximo que quiere cometer al estimar el
parámetro con un nivel de confianza dado. Es decir, puede fijar un valor para el error
muestral y, a partir de ese valor, determinar cuál debe ser el tamaño de la muestra (n)
para que se cumpla con la probabilidad asignada, es decir, para el nivel de confianza
fijado.
Como cada parámetro tiene su propio intervalo de confianza, la determinación del
tamaño muestral obedece a una fórmula concreta según queramos estimar:
» Una media poblacional (µ).
» Una proporción poblacional (P).
» Una desviación estándar poblacional (σ).
TEMA 2 – Ideas clave 23 © Universidad Internacional de La Rioja (UNIR)
Investigación Cuantitativa
Nosotros vamos a limitar la explicación a los dos primeros: determinar el tamaño de la
muestra para estimar una media y para estimar una proporción poblacionales, que son
los que se dan a la práctica en investigación de mercados profesional.
Es muy importante tener en cuenta, en las siguientes fórmulas, los valores que toma Zα/2
según el nivel de confianza que se escoja:
Zα/2 = 1,96 para un nivel de confianza del 95%, que es el más habitual.
Zα/2 = 1,64 para un nivel de confianza del 90%.
Zα/2 = 2,58 para un nivel de confianza del 99%.
» Tamaño muestral para estimar una media poblacional
1. Si conocemos la varianza poblacional:
𝜎
𝑆𝑒𝑎 𝑑 = 𝑒𝑟𝑟𝑜𝑟 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙 = 𝑧𝛼⁄2
√𝑛
Despejando de esta expresión la n o tamaño muestral, tenemos:
𝑧𝛼/2 𝜎 2
𝑇𝑎𝑚𝑎ñ𝑜 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙 = 𝑛 = ( )
𝑑
Entonces, se cumple que:
𝑃(𝜇 − 𝑑 ≤ 𝑥̅ ≤ 𝜇 + 𝑑) = 1 − 𝛼
Es decir, que, para un nivel de confianza dado, la media muestral queda entre el
parámetro poblacional menos y más el error muestral con la probabilidad 1-α.
Ejercicio
Un punto de venta de «Verdifresh» quiere calcular el gasto medio mensual en ensaladas
de sus clientes. ¿Qué tamaño muestral, o, dicho de otra forma, a cuántos clientes tiene
que entrevistar para averiguar este gasto medio con un nivel de confianza del 99% y sin
cometer un error superior a 5 euros? Se supone que el gasto sigue una normal de
desviación estándar de 12 euros.
TEMA 2 – Ideas clave 24 © Universidad Internacional de La Rioja (UNIR)
Investigación Cuantitativa
Solución
Datos de los que disponemos:
Conocemos la desviación estándar poblacional (que es lo mismo que conocer la varianza)
σ = 12 euros
Sabemos el nivel de confianza 1-α = 0,99 de donde el valor de zα/2 = 2,58
Sabemos el error que queremos cometer como máximo d = 5 euros
Por consiguiente, el tamaño muestral adecuado para estimar la media poblacional en
estas condiciones es:
𝑧𝛼/2 𝜎 2 2,58 ∙ 12 2
𝑇𝑎𝑚𝑎ñ𝑜 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙 = 𝑛 = ( ) =( ) = 38,34 𝑐𝑙𝑖𝑒𝑛𝑡𝑒𝑠
𝑑 5
En definitiva, si entrevistamos aleatoriamente a unos 38 clientes habituales y
representativos, tenemos una probabilidad del 95% de que la media muestral que
obtengamos cumpla que:
𝑃(𝜇 − 5 ≤ 𝑥̅ ≤ 𝜇 + 5) = 0,95
2. Si no conocemos la varianza:
La fórmula a aplicar para determinar el tamaño muestral es:
𝑧𝛼/2 𝑠 2
𝑇𝑎𝑚𝑎ñ𝑜 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙 = 𝑛 = ( )
𝑑
Es la misma fórmula que para el caso de varianza conocida pero la varianza poblacional
se sustituye por una estimación (s) de dicha varianza (ya que es desconocida) que se
obtiene con lo que llamamos una muestra piloto, es decir, entrevistando a unas pocas
personas, o haciendo una medición para unas cuantas unidades, o tomando un valor de
un estudio anterior o cualquier otro dato que nos permita obtener una varianza muestral.
TEMA 2 – Ideas clave 25 © Universidad Internacional de La Rioja (UNIR)
Investigación Cuantitativa
» Tamaño muestral para estimar una proporción poblacional
Al igual que en el caso de la media, partimos de la fórmula del intervalo de confianza para
estimar una proporción poblacional:
𝑃(1 − 𝑃) 𝑃(1 − 𝑃)
𝑃(𝑝 − 𝑧𝛼⁄2 √ ≤ 𝑃 ≤ 𝑝 + 𝑧𝛼⁄2 √ )=1−𝛼
𝑛 𝑛
𝑃(1 − 𝑃)
𝑆𝑒𝑎 𝑑 = 𝑒𝑟𝑟𝑜𝑟 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙 = 𝑧𝛼⁄2 √
𝑛
Despejando de esta expresión la n o tamaño muestral, tenemos:
𝑧𝛼2 𝑃(1 − 𝑃)
2
𝑇𝑎𝑚𝑎ñ𝑜 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙 = 𝑛 =
𝑑2
Como desconocemos la proporción poblacional P, podemos sustituirla por la proporción
obtenida en una muestra piloto, o directamente, como se hace la mayoría de las veces,
por el valor p = 0,5 que es el que corresponde al supuesto de máxima amplitud del
intervalo de confianza, también llamado de máxima indeterminación.
Es importante comprender el supuesto de máxima indeterminación, porque se aplica
constantemente, ya que lo más habitual es desconocer cómo se comporta una población
en cuanto a la proporción de sus integrantes que hacen o no alguna cosa, que poseen o
no una cualidad y similares.
Si, por ejemplo, estamos estudiando la proporción de personas que comprarían un
producto o no lo harían en una población, lo más normal, es que no tengamos idea de
cuál sería la proporción de los que comprarían. Entonces, el «peor» supuesto o de
máxima indeterminación, o de máxima dispersión, es el de suponer que el 50% lo compre
y el otro 50% no lo compre.
En este caso:
p = 0,5 y q = (1-p) = 0,5
varianza p.q = 0,5·0,5 = 0,25
TEMA 2 – Ideas clave 26 © Universidad Internacional de La Rioja (UNIR)
Investigación Cuantitativa
Cualquier otro supuesto que hiciésemos, nos daría una varianza menor, es decir, una
situación menos dispersa en la población.
Por ejemplo:
o Si p = 0,1 (lo compra un 10%) y q = 0,9, (no lo compra un 90%), entonces p·q = 0,1·0,9
= 0,09.
o Si consideramos p= 0,4 (lo compra un 40%) y q= 0,6 (no lo compra un 60%), entonces
p·q = 0,4·0,6 = 0,24, etc.
Cualquier par de valores de p y q que probemos dará un valor de pq menor que 0,25. Por
eso, tomando 0,25, aseguramos que nos ponemos «en el peor» de los casos, de forma
que, la estimación que hagamos de P será fiable porque abarcará todas las situaciones
posibles, incluyendo la más dispersa de todas.
Por consiguiente, el tamaño muestral para estimar una proporción:
𝑧𝛼2 𝑝(1 − 𝑝)
2
𝑇𝑎𝑚𝑎ñ𝑜 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙 = 𝑛 =
𝑑2
𝑧𝛼2 0,5 ∙ 0,5
2
𝑇𝑎𝑚𝑎ñ𝑜 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙 = 𝑛 =
𝑑2
Entonces, se cumple que:
𝑃(𝑃 − 𝑑 ≤ 𝑝 ≤ 𝑃 + 𝑑) = 1 − 𝛼
Es decir, que, para un nivel de confianza dado, la proporción muestral queda entre el
parámetro poblacional menos y más el error muestral con la probabilidad 1-α.
Ejercicio
El jefe del departamento de marketing de «Verdifresh» quiere averiguar qué proporción
de clientes de una zona de Valencia visita la página web de la empresa con un error
máximo del 5%.
TEMA 2 – Ideas clave 27 © Universidad Internacional de La Rioja (UNIR)
Investigación Cuantitativa
Se sabe que hace dos años un estudio similar dio un valor del 25% de los clientes de la
zona.
Determina el tamaño muestral mínimo necesario para obtener una muestra que
proporcione una estimación de la proporción poblacional de clientes de la zona que
visitan actualmente la web al 95% de confianza.
Solución
Sabemos que p = 0,25.
Sabemos que 1-α = 0,95, por lo que los valores de z son ±1,96.
Sabemos que el error máximo que se quiere cometer es del 5%, por lo que d = 5/100 =
0,05 (recordad que el error siempre se pone en la fórmula en tanto por uno en el caso de
estimación de proporciones)
Por consiguiente:
𝑧𝛼2 𝑝(1 − 𝑝)
2 1,962 ∙ 0,25 ∙ 0,75
𝑇𝑎𝑚𝑎ñ𝑜 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙 = 𝑛 = = = 288,12 𝑐𝑙𝑖𝑒𝑛𝑡𝑒𝑠
𝑑2 0,052
Para estimar la proporción de clientes de la zona que visitan la web con un error máximo
del 5% y un nivel de confianza del 95%, hay que entrevistar a 288 clientes como mínimo.
Si se hacen las entrevistas aplicando un muestreo aleatorio, entonces, se cumplirá que:
𝑃(𝑃 − 5 ≤ 𝑝 ≤ 𝑃 + 5) = 0,95
Es decir, que para un nivel de confianza del 95%, la proporción muestral quedará entre
el parámetro poblacional menos y más el error muestral del 5% con una probabilidad de
0,95.
» Tamaño muestral para estimar una media o una proporción poblacional
en el caso de poblaciones finitas
Las fórmulas presentadas en el apartado anterior, se utilizan habitualmente cuando no
se conoce el tamaño de la población objetivo o cuando se supone que es infinito.
TEMA 2 – Ideas clave 28 © Universidad Internacional de La Rioja (UNIR)
Investigación Cuantitativa
En el caso de conocer el tamaño de la población objetivo, se recomienda el uso de las
siguientes fórmulas alternativas, ya que, en muchos casos, reducen el tamaño de la
muestra, lo cual implica una reducción de costes para el cliente en la realización de
trabajos de campo.
o Para el caso de estimación de una media poblacional:
𝑁. 𝑧 2 . 𝑆 2
𝑛=
𝑑2 (𝑁 − 1) + 𝑧 2 𝑆 2
o Para el caso de estimación de una proporción poblacional:
𝑁. 𝑧 2 . 𝑝𝑞
𝑛= 2
𝑑 (𝑁 − 1) + 𝑧 2 𝑝𝑞
Ejercicio 1
¿A cuántas personas tenemos que entrevistar de una población de 50 000 habitantes
para saber la edad media con un nivel de confianza del 99% y un error máximo de 1 año
si en una muestra piloto se obtuvo una varianza de 45 años al cuadrado?
Solución 1
Como se trata de estimar una media poblacional para una población finita, aplicamos:
𝑁. 𝑧 2 . 𝑆 2
𝑛=
𝑑2 (𝑁 − 1) + 𝑧 2 𝑆 2
50 000. 2,582 . 45 14 976 900
𝑛= 2 2
= = 297,76
1 (50 000 − 1) + 2,58 . 45 49 999 + 299,538
Redondeando, habría que entrevistar a 298 personas seleccionadas aleatoriamente.
Ejercicio 2
¿A cuántas personas tendría que estudiar de una población de 15 000 habitantes para
conocer cuántas compran fármacos al menos una vez por semana con un nivel de
confianza del 95% y un error muestral del 2%?
TEMA 2 – Ideas clave 29 © Universidad Internacional de La Rioja (UNIR)
Investigación Cuantitativa
Solución 2
Como se trata de estimar una proporción poblacional para una población finita,
aplicamos:
𝑁. 𝑧 2 . 𝑝𝑞
𝑛=
𝑑2 (𝑁 − 1) + 𝑧 2 𝑝𝑞
15 000. 1,962 . 0,5.0,5 14 406
𝑛= 2 2
= = 2069,82
0,02 (15 000 − 1) + 1,96 . 0,5.0,5 5,9996 + 0,9604
Redondeando, habría que entrevistar a 2 070 personas.
2.6. Error de muestreo y nivel de confianza: evaluación de
muestras para la investigación de mercados profesional
» Jugando con el nivel de confianza y el error muestral
Cuando se elaboran presupuestos de trabajo de campo es importante saber jugar con el
nivel de confianza y el error muestral, para poder ofrecer al cliente precios ajustados y
entregar muestras de fiabilidad que puedan ir desde una fiabilidad aceptable, a una
estándar y a una excelente.
o Las muestras estándar son aquellas en las que se aplica un error muestral máximo
del ±5% para un nivel de confianza del 95%.
o Las muestras aceptables son aquellas en las que se aplica un error muestral
máximo del ±5% para un nivel de confianza de entre el 90% y el 94%.
o Las muestras excelentes serían aquellas con errores inferiores al ±5% y niveles de
confianza de entre el 95% y el 99%.
Teniendo esto presente, se puede jugar con el diseño y calcular varias alternativas de
tamaño muestral, cuando hay problemas de presupuesto en una negociación para
realizar un trabajo de campo.
TEMA 2 – Ideas clave 30 © Universidad Internacional de La Rioja (UNIR)
Investigación Cuantitativa
Los elementos con los que se puede jugar en la fórmula, son el error y el nivel de
confianza. También se puede jugar con la p y la q, siempre que se realice una muestra
piloto, pero esta, ya de por sí, supone un coste adicional, aunque si sale favorable (es
decir, si rebaja la máxima indeterminación pq = 0,25), se pueden aprovechar las
entrevistas piloto llevadas a cabo, e incluirlas en la muestra.
Veamos un ejemplo para comprender mejor la importancia de esta parte del diseño de
muestras.
Ejercicio
Una empresa de reciclaje de escombros, que vende arena, grava y otros productos
derivados del reciclaje que se utilizan en el ámbito de la construcción y adecuación de
jardines y otros espacios, quiere llevar a cabo un estudio de satisfacción de sus clientes,
así como captar su opinión acerca de diversos aspectos relacionados con esta actividad.
La empresa tiene una cartera de 2 300 clientes tras cinco años de andadura. Si las
principales estimaciones que desean que proporcione el estudio son las referentes a la
nota media de satisfacción con sus servicios en una escala de 9 puntos donde 1 = muy
insatisfecho y 9 = muy satisfecho, más la de la proporción de clientes que está comprando
productos al menos una vez al mes, ¿qué tamaño muestral puede recomendar la empresa
de trabajo de campo sin pasarse de un presupuesto de 3 500 euros, sabiendo que el coste
unitario de cada entrevista es de 10 euros?
Solución
La empresa de trabajo de campo considera los datos de partida y efectúa algunos cálculos
de tamaño muestral posible:
1. Cálculo del tamaño muestral para estimar la nota media de satisfacción
Para este cálculo, deciden aplicar un nivel de confianza del 95% y un error muestral
de ±0,5 puntos en la escala de 9. Como no se conoce la desviación estándar, se decide
aplicar una de 3 puntos, en base a la experiencia de otros estudios de satisfacción de
clientes, pues, aunque pueda haber algún caso extremo de puntuación baja o alta, la
mayoría de clientes suele estar más satisfecho que insatisfecho, a menos que una
empresa lo haga muy mal, cosa que no parece aplicable al caso de la empresa de
reciclaje.
TEMA 2 – Ideas clave 31 © Universidad Internacional de La Rioja (UNIR)
Investigación Cuantitativa
Bajo estos supuestos, el tamaño de la muestra se obtiene aplicando valores a la
fórmula:
𝑁. 𝑧 2 . 𝑆 2
𝑛=
𝑑2 (𝑁 − 1) + 𝑧 2 𝑆 2
2300 · 1,962 32
𝑛= = 130,51
0,52 · 2299 + 1,962 32
2. Cálculo de la muestra necesaria para estimar la proporción de clientes
que compra producto reciclado al menos una vez al mes
Para este supuesto, decide aplicar un nivel de confianza del 95% y un error muestral
de ±3%, bajo un supuesto de máxima indeterminación p = q = 0,5. El cálculo queda
como sigue:
𝑁. 𝑧 2 . 𝑝𝑞
𝑛=
𝑑2 (𝑁 − 1) + 𝑧 2 𝑝𝑞
2300 · 1,962 0,5 · 0,5
𝑛= = 729,13
0,032 · 2299 + 1,962 0,5 · 0,5
A la vista de estas cifras, la empresa de trabajo de campo, sabe que la muestra para
calcular la proporción, cubre de sobras la que se necesita para estimar la media de
satisfacción. Sin embargo, es necesario reducir el tamaño muestral de esta
propuesta, pues 729 encuestas a 10 euros, supondrían un coste excesivo: 7 290 euros
frente a los 3 000 disponibles.
Para reducir el tamaño muestral, sin bajar el nivel de confianza, el diseñador de la
muestra decide aumentar el error muestral hasta el límite de ±5%, ya que el de ±3% era
más exigente. El nuevo cálculo da lo siguiente:
2300 · 1,962 0,5 · 0,5
𝑛= = 329,30
0,052 · 2299 + 1,962 0,5 · 0,5
En este caso, aplicando los valores tradicionales, habría que hacer 329 encuestas, que
cubrirían bien ambos objetivos con un coste de trabajo de campo de 329 x 10 = 3 290
euros, precio asumible por parte del cliente. La muestra sería fiable y adecuada.
TEMA 2 – Ideas clave 32 © Universidad Internacional de La Rioja (UNIR)
Investigación Cuantitativa
Por consiguiente, la empresa de investigación de mercados aconsejaría hacer 329 - 330
entrevistas que proporcionarían estimaciones de la proporción muestral con un error
del ±5% a un nivel de confianza del 95% y un error muestral inferior a 0,5
puntos en la estimación de la media de satisfacción del cliente en una escala de 9 puntos.
» Evaluación de muestras a posteriori
En muchas ocasiones, al aplicar el criterio de máxima indeterminación, la muestra
que finalmente se obtiene es más precisa de lo que se piensa a priori, es decir, cuando se
hace el diseño.
El desconocimiento de la varianza p·q en una población nos hace aplicar, en muchas
ocasiones, un tamaño muestral más elevado del que realmente sería necesario para
estimar una proporción. Sin embargo, como empresa de trabajo de campo o
profesionales, siempre deberemos hacer lo posible para calcular tamaños que garanticen
la fiabilidad de las estimaciones. Con todo, lo que sí que podemos hacer para
proporcionar mayor satisfacción al cliente, es calcular el error muestral realmente
cometido a posteriori, es decir, una vez extraída la muestra bajo criterios exigentes.
Si el error a posteriori es más bajo que el que aplicamos a la fórmula inicial de cálculo de
tamaño de la muestra, siempre lo podremos incluir en la ficha técnica y ampliar el grado
de fiabilidad inicial, lo cual siempre será una buena noticia para el cliente, ya que le
estaremos indicando que las estimaciones realizadas con esa muestra son más fiables de
lo que podíamos pensar todos en un principio.
Veamos un ejemplo para comprender mejor cómo funcionan estos mecanismos de
revisión de fiabilidad.
Ejemplo:
Una empresa de transporte público local encargó un estudio para la puesta en marcha de
una nueva línea de autobús en un municipio, que uniría otros 4 en su recorrido. La
población total de estos 4 municipios era de 80 000 habitantes, de entre 14 y 84 años,
que eran las edades estimadas de los usuarios potenciales.
TEMA 2 – Ideas clave 33 © Universidad Internacional de La Rioja (UNIR)
Investigación Cuantitativa
La empresa quería que le estimasen la proporción de personas que estarían interesadas
en utilizar la línea al menos una vez por semana.
La empresa de trabajo de campo calculó el tamaño muestral necesario para efectuar esta
estimación con un error muestral máximo del ±5% para un nivel del 95%, bajo criterio
de máxima indeterminación (lo habitual en un caso como este). El cálculo dio el siguiente
resultado:
80 000. 1,962 . 0,5.0,5
𝑛= = 382,33
0,052 (80 000 − 1) + 1,962 . 0,5.0,5
Por consiguiente, se realizaron 383 entrevistas aleatorias entre la población.
Tras llevar a cabo las entrevistas, el resultado del estudio, indicó que un 34% de la
población estaba interesado en utilizar la nueva línea de autobús al menos una vez a la
semana.
La empresa de trabajo de campo, revisó el error a priori (5%), dado que la estimación
de la proporción dio un resultado bastante por debajo del 50%. Para ello, despejó el error
de la fórmula de cálculo del tamaño muestral:
𝑁𝑧 2 𝑝𝑞 2
√ 𝑛 − 𝑧 𝑝𝑞
𝑑=
𝑁−1
Aplicando valores, sabiendo que p = 0,34 y q = 0,66 (pues salió un 34% de respuesta
positiva contra un 66% de otra respuesta acerca del interés por utilizar el nuevo autobús
una vez a la semana):
80 000. 1,962 . 0,34.0,66
√ 383 − 1,962 0,34.0,66
𝑑= = 0,0473
79999
Multiplicando el resultado por 100, la empresa concluyó que, en realidad, la muestra
extraída comete un error muestral de ±4,73% en lugar de un error de ±5%.
TEMA 2 – Ideas clave 34 © Universidad Internacional de La Rioja (UNIR)
Investigación Cuantitativa
Dominar estas técnicas resulta conveniente e importante, ya que la estadística no es una
ciencia exacta y, toda reducción del error muestral es buena noticia, ya que confiere
mayor fiabilidad de los estudios que se realizan.
La estimación que se lleva a cabo en este estudio es puntual, y arroja un 34% de usuarios
potenciales, pero, desde un punto de vista de rentabilidad de la nueva línea de autobús,
al cliente le interesa más conocer el intervalo de confianza de esta estimación, que se
halla restando y sumando el error a la estimación puntual, es decir, haciendo:
o 34% – 4,73% = 29,27%
o 34% + 4,73% = 38,73%
De esta forma, la empresa de investigación de mercados puede decirle a la de transporte
que, semanalmente, puede esperar una demanda de entre un 29,27% (80 000 x 0,2927
=23 416 viajeros potenciales) de la población y un 38,73% (80 000 x 0,3873 = 30 984
viajeros potenciales) de la población con un 95% de probabilidad.
Las cifras habrían sido diferentes de aplicar el 5% en lugar del 4,73% como error de
muestreo, y menos realistas, pues el intervalo habría sido más amplio: entre un 29%
(23 200 viajeros) y un 39% (31 200 viajeros).
Como profesionales de la investigación de mercados, debemos conocer todos estos
recursos y ofrecer siempre la máxima calidad a los clientes de trabajo de campo e
informes de estimaciones, para que ellos puedan diseñar sus estrategias de venta y
analizar la viabilidad de los productos que ofrecen al mercado.
TEMA 2 – Ideas clave 35 © Universidad Internacional de La Rioja (UNIR)
Investigación Cuantitativa
Lo + recomendado
No dejes de leer…
Informe metodológico: encuesta sobre Equipamiento y Uso de Tecnologías
de Información y Comunicación en los Hogares 2016 (TIC–H’16)
Para ver cómo diseña el Instituto Nacional de Estadística una encuesta oficial de ámbito
nacional. En el documento, hallarás los conceptos estudiados en este tema, aplicados a
la población española para la elaboración de esta encuesta de carácter anual.
Accede al artículo a través del aula virtual o desde la siguiente dirección web:
[Link]
No dejes de ver…
Demostración efectiva de funcionamiento de un sistema CATI
Este vídeo contiene una demostración de uso de un sistema de llamada predictiva muy
útil para servicios del tipo: call centers, contact centers, telemarketing, televenta, SAC,
etc.
Accede al vídeo a través del aula virtual o desde la siguiente dirección web:
[Link]
TEMA 2 – Lo + recomendado 36 © Universidad Internacional de La Rioja (UNIR)
Investigación Cuantitativa
+ Información
A fondo
Sistema CATI
Presentación resumida sobre del sistema CATi como el más implementado actualmente
para la realización de encuestas en call centers.
Accede al artículo a través del aula virtual o desde la siguiente dirección web:
[Link]
Webgrafía
Capacitación de encuestadores
En este vídeo de youtube se describe cómo capacita la empresa real, Captura Consulting,
a los encuestadores que realizan los trabajos de campo y cómo organizan el trabajo de
campo.
Accede a la página web a través del aula virtual o desde la siguiente dirección:
[Link]
TEMA 2 – + Información 37 © Universidad Internacional de La Rioja (UNIR)
Investigación Cuantitativa
Bibliografía
Hueso, A. y Cascant, M.J. (2012). Metodología y técnicas cuantitativas de investigación.
En Cuadernos docentes en procesos de desarrollo, nº 1. Valencia: Editorial Universitat
Politécnica de València. Recuperado de
[Link]
%C3%A9cnicas%20cuantitativas%20de%20investigaci%C3%B3n_6060.pdf?sequence
=3
Lind, D.A. y otros (2005). Estadística Aplicada a los Negocios y la Economía. México:
McGraw Hill.
Pérez, C. (2009). Técnicas de muestreo estadístico. Madrid: Garceta Grupo Editorial.
Ruíz–Maya, L. y Martín, J. (2004). Fundamentos de Inferencia Estadística (3ª Edición).
Madrid: Ed. Thomson.
TEMA 2 – + Información 38 © Universidad Internacional de La Rioja (UNIR)
Investigación Cuantitativa
Actividades
Trabajo: ejercicios de muestreo y tamaño muestral
Descripción y pautas de elaboración
Los ejercicios son sencillos y muy aplicados. Basta con completar los espacios reservados
para colocar las soluciones.
Objetivos
» Adquirir práctica en las operaciones de muestreo.
Ejercicio 1:
«Verdifresh» se plantea realizar un estudio de satisfacción de los clientes de la ciudad de
Valencia con sus productos. Para acceder a los consumidores plantea un muestro
polietápico en que en la primera etapa selecciona 5 zonas de las 19 en que se divide
Valencia capital, en la segunda etapa 10 puntos de venta de esas zonas (2 de cada una de
ellas) y en la tercera etapa a los clientes que compran algún producto «Verdifresh» el día
concreto en el que se hace la encuesta. Si las zonas de Valencia y los puntos de venta (Mi)
que hay en cada una de ellas son:
1 Ciutat Vella M1, M2, M3, M4
2 Eixample M5, M6, M7, M8, M9, M10
3 Extramurs M11, M12, M13, M14, M15, M16
4 Campanar M17, M18, M19, M20
5 La Saïdia M21, M22, M23
6 El Plà del Real M24, M25
7 L’Eixample M26, M27, M28, M29
8 Patraix M30, M31, M32, M33, M34
9 Jesús M35, M36, M37, M38, M39,
M40
10 Cuatre Carreres M41, M42, M43
TEMA 2 – Actividades 39 © Universidad Internacional de La Rioja (UNIR)
Investigación Cuantitativa
11 Poblats M44, M45
Marítims
12 Camins al Grau M46, M47
13 Algirós M48, M49, M50, M51
14 Benimaclet M52, M5, M54, M55
15 Rascanya M56, M57
16 Benicalap M58, M59, M60
17 Pobles del Nord M61, M62
18 Pobles de l’Oest M63, M64
19 Pobles del Sud M65, M66, M67
Establece la muestra de zonas y puntos de venta a considerar para realizar las encuestas
utilizando la siguiente serie de números aleatorios entre 1 y 19 generada por Excel:
» 15, 12, 11, 2, 8, 9, 6, 1, 12, 17, 11, 19, 9, 9, 14, 10, 3, 10, 14 para seleccionar la zona.
» Las siguientes series de números aleatorios entre 1 y 6 generadas por Excel, para
seleccionar los puntos de venta en los casos en que haya más de dos puntos de venta
en la zona:
o 1, 3, 6, 5, 2, 4 para la primera zona seleccionada con más de dos puntos de venta.
o 2, 3, 1, 6, 4, 5, para la segunda con más de dos puntos de venta.
o 2, 5, 4, 1, 3, 6 para la tercera con más de dos puntos de venta.
o 1, 3, 2, 5, 6, 4 para la cuarta con más de dos puntos de venta.
Utiliza las series de 6 números aleatorios que sean necesarias. Al poner la muestra en la
tabla preparada para ello, conservar el orden en el que se extraen las zonas y los puntos
de venta y NO ordenarlos de otra forma.
Utiliza esta tabla para resolver este ejercicio.
TEMA 2 – Actividades 40 © Universidad Internacional de La Rioja (UNIR)
Investigación Cuantitativa
La muestra de zonas y puntos de venta a considerar para realizar las encuestas es:
Nº Zona que le corresponde Nº aleatorio o Punto de venta que le
aleatorio dos casos corresponde
Ejercicio 2
«Verdifresh» quiere estudiar a una muestra de 10 agricultores de entre 5 000 posibles
que realizan un determinado cultivo en una comunidad autónoma. Para seleccionar a los
candidatos se plantea realizar un muestreo sistemático sobre la lista de los 5 000.
¿Qué número corresponderá en la lista a cada uno de los 10 candidatos si el número
aleatorio entre 1 y K es 320?
Incluye la solución aquí, indicando el valor de K y rellenando la tabla con los números
solicitados:
K=
Ejercicio 3
El departamento de Recursos Humanos de «Verdifresh» está haciendo una auditoría de
las horas extraordinarias trabajadas en el último año por sus trabajadores de todas las
secciones, que son 320. El objetivo es el de estimar la media de horas extraordinarias
realizadas por persona. Como el número de partes emitidos por los trabajadores acerca
de las horas extraordinarias es muy elevado, se decide extraer una muestra.
¿De qué tamaño debe ser la muestra de partes emitidos para estimar la media de horas
extraordinarias con un error máximo de 2 horas para un nivel de confianza del 95%?
TEMA 2 – Actividades 41 © Universidad Internacional de La Rioja (UNIR)
Investigación Cuantitativa
Como información adicional, los analistas toman la dispersión que se obtuvo el año
anterior en un estudio similar, que es una desviación estándar de 4,8 horas.
Indica la fórmula empleada y el tamaño de la muestra calculada en la respuesta.
Ejercicio 4
¿A cuántas personas habría que estudiar de una población de 70 000 habitantes de 18 y
más años para conocer cuántas compran un libro al menos una vez por mes con un nivel
de confianza del 95% y un error muestral del 4%, bajo supuesto de máxima
indeterminación?
Indica la fórmula empleada y el tamaño de la muestra calculada en la respuesta.
Ejercicio 5:
Si en el ejercicio anterior se obtiene una proporción del 18% una vez aplicado el muestreo
y realizadas las entrevistas, ¿qué error muestral a posteriori se ha cometido al hacer esta
consulta? ¿Mejora este error las expectativas iniciales acerca de la fiabilidad de la
estimación obtenida con la muestra?
Indica la fórmula empleada y el error muestral cometido a posteriori en la respuesta.
TEMA 2 – Actividades 42 © Universidad Internacional de La Rioja (UNIR)
Investigación Cuantitativa
Test
1. En un muestreo probabilístico…
A. Todos los individuos u objetos integrantes de la población tienen una
probabilidad de 0,5 de entrar a formar parte de la muestra.
B. Todos los individuos u objetos integrantes de la población tienen la
misma probabilidad de ser extraídos para formar parte de una
muestra.
C. Todos los individuos u objetos integrantes de la población tienen probabilidades
aproximadamente iguales de ser extraídos para formar parte de una muestra.
2. En un muestreo se han seleccionado distritos sanitarios, después hospitales y, después
facultativos cirujanos para hacer un estudio sobre su opinión acerca de sus condiciones
de trabajo. Este tipo de muestreo es…
A. Aleatorio sistemático.
B. Aleatorio estratificado.
C. Aleatorio polietápico.
3. Un muestreo por cuotas consiste en…
A. Formar estratos de la población sobre la base de ciertas
características y procurar que estén representadas en proporciones
semejantes a las que existen en la población.
B. Formar estratos de la población y aplicar un muestreo aleatorio simple a los
individuos de cada estrato.
C. Entrevistar indiscriminadamente a personas de todo tipo en lugares públicos sin
aplicar ningún criterio en especial.
4. Al calcular el tamaño muestral, si lo hacemos a un nivel de confianza del 99%, el valor
de z es…
A. 1,96.
B. 2,58.
C. 1,64.
TEMA 2 – Test 43 © Universidad Internacional de La Rioja (UNIR)
Investigación Cuantitativa
5. Al calcular el tamaño muestral para estimar una proporción…
A. No es recomendable superar un error muestral del ±5%.
B. Siempre hay que poner en la fórmula un error del ±5%.
C. Las mejores estimaciones se obtienen utilizando un error muestral del ±%.
6. La siguiente fórmula sirve para…
𝑧𝛼/2 𝜎 2
𝑛= ( )
𝑑
A. Calcular el tamaño muestral para estimar una proporción cuando se conoce el
tamaño de la población.
B. Calcular el tamaño muestral para estimar una proporción cuando se conoce la
desviación estándar poblacional.
C. Calcular el tamaño muestral para estimar una media cuando no se
conoce el tamaño de la población y se conoce la desviación estándar
poblacional o una aproximación de la misma.
7. La siguiente fórmula sirve para…
𝑧𝛼2 𝑝(1 − 𝑝)
2
𝑛=
𝑑2
A. Calcular el tamaño muestral para estimar una proporción cuando se conoce el
tamaño de la población.
B. Calcular el tamaño muestral para estimar una proporción cuando
no se conoce el tamaño de la población.
C. Calcular el tamaño muestral para estimar una media cuando no se conoce el
tamaño de la población.
8. El supuesto de máxima indeterminación se aplica cuando…
A. Al calcular el tamaño muestral para estimar una media, se desconoce el tamaño
de la población.
B. Al calcular el tamaño muestral para estimar una proporción, se
desconocen los valores poblacionales de P y Q.
C. Al calcular el tamaño muestral para estimar una media se desconoce el valor de
la desviación estándar poblacional.
TEMA 2 – Test 44 © Universidad Internacional de La Rioja (UNIR)
Investigación Cuantitativa
9. De los siguientes conceptos, el que corresponde a una técnica para seleccionar los
elementos de una muestra es…
A. Tabla de números aleatorios.
B. Estratos.
C. Extracciones.
10. Deseamos conocer la opinión de los ciudadanos de Málaga sobre el sistema de salud
pública. Para ello elegimos una muestra aleatoria de entre los abonados a una compañía
telefónica. Entonces…
A. La población de estudio es la de los ciudadanos de Málaga.
B. La población objetivo es la de los abonados a la compañía telefónica en Málaga.
C. La población de estudio es la de los abonados a la compañía
telefónica en Málaga.
TEMA 2 – Test 45 © Universidad Internacional de La Rioja (UNIR)