INTRODUCCIÓN A LOS TIRPOS DE MUESTREO
• El muestreo es utilizado en la estadística con la finalidad de optimizar
recursos (tiempo, mano de obra, materiales e insumos). Para lograrlo, los
métodos estadísticos ofrecen dos tipos de muestreo: probabilístico y no
probabilístico (Martínez, 2007). En este capítulo se pretende esbozar de
forma general, los conceptos relacionados con los métodos de muestreo
usados en estadística.
INTRODUCCIÓN A LOS TIRPOS DE MUESTREO
• Métodos de muestreo probabilístico
• Los métodos de muestreo probabilístico buscan que todos los elementos
que conforman la población tengan igual probabilidad al ser seleccionados
en la muestra. Es decir, todas las muestras de un tamaño determinado que
se puedan sacar de una población tendrán la misma probabilidad de ser
elegidas. Este método de muestreo es el más recomendable, dado que
aseguran de alguna manera la representatividad de la muestra que se
extrae; se dice “de alguna manera” porque pueden emplearse técnicas
para determinar el tamaño representativo de la muestra para poblaciones
finitas e infinitas, a partir del nivel de confianza, error de muestreo y
tamaño de la población. A continuación se describen los principales
métodos de muestreo probabilístico.
ALEATORIO SIMPLE MUESTREO
• El muestreo aleatorio simple es más utilizado por su agilidad, sin embargo
es poco útil cuando se tienen poblaciones muy grandes. Los pasos a
seguir en este tipo de muestreo son los siguientes: se asigna un número a
cada elemento de la población y, por medio de un mecanismo tal como
balotas dentro de un recipiente o el uso de números aleatorios, se elige el
número de elementos requeridos para la muestra (Martínez, 2000).
MUESTREO ALEATORIO SISTEMÁTICO
• El muestreo aleatorio sistemático consiste en asignar números a la
totalidad de elementos de la población. Martínez (2000, p. 2) describe el
proceso para aplicar este tipo de muestreo:
➢Inicialmente se toma un número aleatorio i (elegido al azar) y los elementos que
conforman la muestra son aquellos que se ubican en los sitios i, i+k, i+2k, i+3k,...,
i+(n-1)k, o sea que se toman los individuos de k en k, donde k es el resultado de
dividir el número de elementos de la población entre el número de elementos de la
muestra: k=N/n. El número i que se emplea como punto de partida será un número
al azar entre 1 y k.
Al emplear el muestreo aleatorio sistemático se debe tener cuidado con las
poblaciones en las cuales se dan periodicidades, pues al elegir elementos con
periodicidad constante (k), es posible que se obtenga una muestra con diferencia
constante entre los datos, mientras que en la población no se presenta este
comportamiento.
Muestreo aleatorio estratificado
• Este tipo de muestreo busca simplificar los procesos, con el objeto de
minimizar el error muestral al determinar el tamaño óptimo de la muestra,
básicamente cuando la población es heterogénea y presenta gran
variabilidad. El procedimiento consiste en determinar categorías (o
estratos) diferentes entre los elementos de la población (Martínez, 2000).
Los estratos se definen con respecto a la similitud entre las características
de los elementos, por ejemplo: estado civil, género y nivel salarial. El
objeto del muestreo estratificado garantiza que todos los estratos
definidos por el investigador estarán representados en la muestra. Cada
estrato es independiente y en cada uno de ellos se realiza el muestreo
aleatorio simple para seleccionar los elementos que conformarán la
muestra.
• La distribución de los elementos que serán muestreados en cada estrato
se conoce como afijación, y puede ser de diferentes tipos:
MUESTREO ALEATORIO SISTEMÁTICO
• Afijación simple:
• cuando el número de elementos muestreados se reparte en iguales
cantidades en todos los estratos.
• Afijación proporcional:
• el número de elementos muestreados en cada estrato es la proporción de
su tamaño con respecto al de la población.
• Afijación óptima:
• además de la proporción en cada estrato, se tiene en cuenta la variación
(desviación típica). Este tipo de afijación no es muy usada, debido a que en
la mayoría de los procesos muestrales no se conoce la desviación. Posada y
Buitrago (2008) plantean el siguiente ejemplo ilustrativo:
Muestreo aleatorio por conglomerados
• En este tipo de muestreo, el marco muestral está integrado por varios
elementos que forman una unidad, la cual se conoce como conglomerado.
Por ejemplo: las unidades de salud, los departamentos de una empresa, los
municipios de un departamento. Este tipo de muestreo se realiza mediante
la selección de un número de conglomerados de forma aleatoria y
posteriormente se analizan todos los elementos que pertenecen a los
conglomerados seleccionados (Martínez, 2000).
• El muestreo por conglomerados suele confundirse con el muestreo
estratificado. La diferencia radica en que el estratificado presenta de
manera natural las agrupaciones, mientras que el muestreo por
conglomerados ya están definidos los grupos de acuerdo a la finalidad del
estudio.
Muestreo aleatorio por conglomerados
• En algunos casos, el proceso de muestreo puede llegar a ser complejo y se
acude al muestreo polietápico, el cual consiste en realizar etapas sucesivas,
utilizando en cada una de ellas alguno de los métodos de muestreo
probabilístico ya mencionados. Normalmente, la primera etapa utilizada da
lugar a la división de las unidades en una segunda etapa y así
sucesivamente, hasta completar las unidades requeridas en la muestra.
• A manera de ejemplo se menciona un caso en el cual es posible utilizar el
muestreo polietápico: se requiere tomar una muestra de 400 estudiantes de
grado del último grado de los colegios públicos ubicados en la zona urbana
de la ciudad de Lima, para indagar sobre los programas e instituciones de
educación superior preferidos por ellos. Para seleccionar la muestra se
utilizarán cuatro etapas, las cuales se describen a continuación:
Muestreo aleatorio por conglomerados
• Primera etapa: selecciona al azar 8 de los 41 distritos que conforman la zona
urbana del municipio de Lima.
• Segunda etapa: tomar aleatoriamente 5 instituciones educativas en cada
una de los 8 distritos.
• Tercera etapa: en cada institución educativa, se toma aleatoriamente un
grupo del último grado.
• Cuarta etapa: en cada grupo del último grado seleccionado, se toman al azar
10 estudiantes. Finalmente, la muestra estará constituida por 400
estudiantes (8x5x1x10), a los cuales les será aplicado el instrumento.
• Aspectos importantes del muestreo probabilístico
• Los métodos de muestreo probabilístico, en su mayoría, utilizan como
instrumento de recolección de información la encuesta, la cual posibilita
errores como los que se mencionan a continuación.
• Error de cobertura o sesgo en la selección.
• El éxito de lograr una selección adecuada de la muestra está determinado
por la claridad en los datos de la población que entran a participar en el
muestreo. El error de cobertura se presenta cuando se omiten algunos
elementos que hacen parte de la población, de forma que no tienen
posibilidad de entrar en la muestra, conduciendo la selección de la muestra
a un proceso sesgado. Si en la lista de la población no se incluyen todos los
elementos, la muestra orientará la estimación a una parte de la población y
no a la población real (Martínez, 2007).
• Error o sesgo de no respuesta.
• El error de no respuesta se presenta al no obtener los datos de todos los elementos de la muestra. En este
caso debe intentarse varias veces usando diferentes medios (por teléfono o correo electrónico), para la
aplicación de la encuesta (Martínez, 2007).
• Error de muestreo
• El error de muestreo es usual cuando se aplica el instrumento a una muestra y no a la totalidad de la
población; es decir, cuando no se realiza un censo. A pesar de que este error no se puede evitar, es posible
controlarlo mediante la selección de un diseño de muestreo adecuado. Este tipo de error representa la
variación o las diferencias aleatorias entre las posibles muestras de la población (Martínez, 2007). 2.2.4 Error
de medición El error de medición está asociado con la baja precisión de las respuestas obtenidas en la
aplicación del instrumento. Básicamente se debe a errores cometidos al formularse las preguntas o al grado
de incidencia que pudo tener el entrevistador sobre el entrevistado (Martínez, 2007.
• 1. Mencione los beneficios del muestreo en los análisis estadísticos.
_________________________________________________
_________________________________________________
_________________________________________________
• 2. Establezca la diferencia entre el muestreo probabilístico y no probabilístico.
_________________________________________________
_________________________________________________
_________________________________________________
• 3. Realice un paralelo entre las características principales de los tipos de muestreo probabilístico.
_________________________________________________
_________________________________________________
_________________________________________________
• 4. Realice un paralelo entre las características principales de los tipos de muestreo no probabilístico.
_________________________________________________
_________________________________________________
_________________________________________________
• 5. En cada uno de los siguientes enunciados, determine cuál tipo de muestreo es más recomendable aplicar
y justifique las razones por las cuales se recomienda.
_________________________________________________
_________________________________________________
_________________________________________________
• a) Se debe seleccionar una muestra de 150 personas de una comunidad de 2.000 habitantes,
con el objeto de hacerles una encuesta sobre los servicios públicos de salud que reciben. Los
habitantes están distribuidos en 5 barrios con tamaños diferentes.
_________________________________________________
_________________________________________________
_________________________________________________
• b) Se requiere realizar una encuesta sobre las políticas públicas de un municipio, para ello se
divide el municipio en 16 comunas, de estas se toman al azar la 4, 6, 7, 11, 13 y 16, y sólo se
concentran en estas comunas. Se toma una muestra aleatoria de habitantes de cada una de
ellas para encuestarlos. _________________________________________________
_________________________________________________
_________________________________________________
• c) Un docente se encuentra realizando una investigación en una universidad, para constituir la
muestra usa estudiantes voluntarios de la Institución.
• _________________________________________________
_________________________________________________
_________________________________________________
• d) Un reportero selecciona tres o cuatro congresistas considerando que éstos reflejan la opinión
general de todos los congresistas sobre una ley en particular.
• _________________________________________________
_________________________________________________
MUESTREO ALEATORIO SIMPLE
• El muestreo aleatorio simple es uno de
los tipos de muestreo probabilístico que
existen, ¿lo has utilizado, conoces en
qué se diferencia de los demás?
• Sabemos que uno de los temas más
importantes para una investigación de
mercados es el muestreo, por ello
hemos preparado una serie de
información que esperamos sea de tu
ayuda acerca de este método, sus
ventajas y desventajas, y cómo utilizarlo
de la mejor manera.
MUESTREO ALEATORIO SIMPLE
• ¿Qué es el muestreo aleatorio simple?
• El muestreo aleatorio simple es un tipo de muestreo que consiste en
seleccionar un subconjunto aleatorio de individuos de la población
objetivo para representar a todo el grupo..
• El muestreo aleatorio simple es un procedimiento de muestreo
probabilístico que da a cada elemento de la población objetivo y a cada
posible muestra de un tamaño determinado, la misma probabilidad de ser
seleccionado.
• Esta es una técnica utilizada en los estudios de mercado para recopilar
datos de una muestra de una población más amplia.
• Sin embargo, este método de muestreo no es el único utilizado en
investigaciones del consumidor, sobre todo porque es complicado
obtener un marco de muestreo de donde extraer al azar.
MUESTREO ALEATORIO SIMPLE
• El muestreo aleatorio simple es un tipo de muestreo que consiste en
seleccionar un subconjunto aleatorio de individuos de la población objetivo
para representar a todo el grupo..
• El muestreo aleatorio simple es un procedimiento de muestreo
probabilístico que da a cada elemento de la población objetivo y a cada
posible muestra de un tamaño determinado, la misma probabilidad de ser
seleccionado.
• Esta es una técnica utilizada en los estudios de mercado para recopilar
datos de una muestra de una población más amplia.
• Sin embargo, este método de muestreo no es el único utilizado en
investigaciones del consumidor, sobre todo porque es complicado obtener
un marco de muestreo de donde extraer al azar.
MUESTREO ALEATORIO SIMPLE
• Las encuestas por muestreo consisten en
extraer de una población finita de N
unidades, subpoblaciones de un tamaño
fijado de antemano. Si todas las unidades
son indistinguibles, el número de N N!
muestras de tamaño n viene dado por: =
n ( N − n)!n!
Determinación del tamaño muestral en muestreo aleatorio simple
• El tamaño de la muestra se debe elegir de modo que se consiga
una precisión pre especificada en la estimación del parámetro de interés.
Si, por ejemplo, nuestro interés se centra en estimar la media de una
variable con distribución normal, sabemos que el intervalo de
confianza correspondiente a nivel 1-α viene dado por la expresión:
= x t( n−1)( /2) S x
S S
Sx = Si la población es infinita Sx = Si la población es finita
n N −n
N − 1
Determinación del tamaño muestral en muestreo aleatorio simple
• Este intervalo nos indica que con una confianza 1-α, la diferencia entre el
verdadero valor de µ y su estimación M(x) (conocido una vez que se
tome la muestra) es menor que t( n −1)( / 2 ) S x Esta cantidad, por
tanto, mide la precisión de nuestra estimación.
Además, en la práctica, si la población que se muestrea no sigue una
distribución normal, el intervalo anterior sigue siendo válido
asintóticamente (lo que significa que solo vale si la muestra es
suficientemente grande), y el valor de t(n-1)(α/) puede sustituirse por el
percentil correspondiente, Z(n-1)(α/) de la distribucion normal N(0;1)
Para el cálculo del tamaño muestral necesario para estimar la media de la población
con un error inferior a ɛ basta con igualar la anchura del intervalo anterior a ɛ y
despejar n. Es facil comprobar que: 2 2
NZ (1− /2 ) S
n=
Si la población es infinita: ( N − 1) 2 + Z (12− /2 )
Aplicación al muestreo en una población finita (con lenguaje R)
• El tamaño de muestra si sabemos que la población es finita de tamaño
500 sería:
n=tam.muestra(alfa=0.05,epsilon=2,s=15,N=500)
Si la población es finita de tamaño 10000, prácticamente no hay diferencia
con una población infinita:
tam.muestra (alfa=0.05,epsilon=2,s=15,N=10000)
Estimadores lineales insesgados en muestreo aleatorio simple
• Tal y como señalábamos en el anterior, si el parámetro poblacional
tiene una expresión lineal del tipo. N
= Y
i =1
i
• entonces el estimador de Horvitz-Thompson para dicho parámetro
poblacional viene dado por:
Tal que E(ˆHT ) =
n
Yi
ˆ =
HT
i =1 i
• Siendo πi la probabilidad de que la unidad ui pertenezca a una muestra
determinada o probabilidad de primera inclusión. Partimos como es usual de una
población formada por N elementos
= u1 , u2 ,... u N
En los que se estudiar una variable de interés X que toma los valores
Estimadores lineales insesgados en muestreo aleatorio simple
X = X 1 , X 2 ,... X N ; sobre cada elemento de lapoblación
Para ello, se selecciona una muestra de tamaño n dada por S = u1 , u2 ,...un
en los que la variable X toma los valores
XS = X 1 , X 2 ,... X n ; sobre cada elemento de la muestra
• Como en muestreo aleatorio simple sin reposición la probabilidad de primera
inclusión πi viene dado por πi =n/N ya podemos especificar los estimadores lineales
insesgados para los parámetros poblacionales más comunes a estimar. Tendremos
que .
• Total. N N N n
Xi Xi N
= X = X i Yi = X i X =
ˆ = = X = N X = ˆ
i =1 i
i
i =1 i =1 n / N n i =1
Estimadores lineales insesgados en muestreo aleatorio simple
N n n
Xi Xi
= = X i / N Yi = X i / N X = =
i =1 i =1 Nn / N i =1 n
• Total de clase
N n n
Ai 1
= A = Ai Yi = Ai A =
ˆ = N Ai
i =1 i =1 n / N n i =1
• Proporción
N n n
A / N 1
= P = Ai / N Yi = Ai / N Pˆ = i = Ai
i =1 i =1 n / N n i =1
Estimadores lineales insesgados en muestreo aleatorio simple
• Evidentemente cualquier de estos estimadores nos indican muy poco
acerca del parámetro poblacional a estimar a menos que sea posible
evaluar la bondad del estimador. Por lo tanto, además de estimar los
parámetros poblacionales, se desearía fijar un limite sobre el error de
estimación. Mediante ciertos cálculos, es posible calcular la varianza
del estimador de Horvitz-Thompson para cada uno de los
estimadores. Las varianzas de los estimadores anteriores nos van a
proporcionar los errores estándar de estimación y vienen dado por:
2 2
S S
ˆ ˆ
= V ( = ˆ) = N (1 − f )
2
ˆ
2 x2 = Vˆ ( X ) = (1 − f )
n n
2
2 S
ˆ ˆ
2 V ( = ) = N (1 − f )
ˆ 2 S X = Vˆ ( X ) = (1 − f )
n n
Límite para el error de estimación
Estimadores lineales insesgados en muestreo aleatorio simple
N 1 N 1 3
V ( p) = PQ(1 − f ) ˆ
V ( A) = PQ(1 − f )
N −1 n N −1 n
• Vamos a analizar las varianzas de los estimadores. En el caso del
estimador del total y de la media poblacional dependen de S2 que es la
cuasi-varianza poblacional. Esta cuasi-varianza poblacional S2 tiene la
siguiente expresión
1 N
1 N
2
S =
2
N − 1 i =1
( X i − )=
N − 1 i =1
Xi − N
2
también se denomina cuasi-varianza
Estimadores lineales insesgados en muestreo aleatorio simple
• En el caso de la proporción y el total de clase, la varianza de dichos
estimadores dependen de P y de Q. El parámetro P corresponde a la
proporción de clase dentro de la población, es decir,
N
1
P=
N
A
i =1
i
• Y Q =1 – P. al parámetro f se le denomina fracción de muestreo y vine
dado por: f = n/N
• y representa la fracción de la población N contenida en la muestra o
la relación existente entre el tamaño de la muestra y el tamaño de la
población. Siempre n ≤ N; si n = N entonces f = 1 y 1 − f = 0. Por otra
parte, si n << N, entonces n/N ∼= 0 y por lo tanto 1 − f ≈ 1 y las
varianzas de los estimadores serán mayores. A la diferencia 1 − f se le
denomina factor de corrección de población finita y tiene en cuenta
el hecho de que una estimación basada en una muestra de tamaño n
= 10 de una población de N = 20 elementos, contiene más
información acerca de la población que una muestra de n = 10 de una
población de N = 20000 elementos
EJEMPLOS
EJEMPLOS
• Solución
• N=750 científicos; n = 50; M(y) = 10,31 horas; S2 = 2,25
= X = N X = ˆ = ?
EJEMPLOS
ˆ = N X = 750 *10,31horas = 7732,31horas
N − n 2, 25 750 − 50
2
ˆ S
V (X ) = = = 0, 042
n N 50 750
ˆ ˆ 2 N − n S 2
2 750 − 50 2, 25
V ( = ˆ) = N = 750 = 23625
N −1 n 750 50
ˆ 2 N − n S 2
2 750 − 50 2,25
E = 2 V (ˆ) = 2 N = 2 750 = 2 23625 = 307,41horas
N −1 n 750 50
• Se estima que el número total de horas por trabajador que se pierden
es de 7732,31 horas. Pero este total puede aumentar o disminuir en
307,41 horas
• E=307,41 es un margen de error pequeño
EJEMPLOS
EJEMPLOS
EJEMPLOS
• Para estimar los costes totales acumulados para las 120 casas tenemos
en cuenta que el estimador lineal insesgado del total de una
característica X sobre una población viene dado por:
ˆ = N X
N = 120
n = 35,5, 30,2, 28,9, 36,4, 29,8, 34,1, 32,6, 26,4, 38, 38,2, 32,2, 27,5.
398,8
X= = 32, 48
12
ˆ = 120*389,8 3898
EJEMPLOS
ˆ
V ( ) = N (1 − f ) S / N
ˆ 2
2
X 2
− n X 12839,36 − 12 * 32, 48 2
S = 2 i
= 16,36
n −1 11
2ˆ = Vˆ (ˆ) = N 2 (1 − f ) S 2 / n = 1202 * (0,9) *16,36 / 12 = 17668,8
ˆ = Vˆ (ˆ) = 17668,8 132,92
2
• Se estima que:
• El costo promedio es de 32,48 unidades
• el costo total es de 3898 unidades. Pero este costo puede aumentar o disminuir en
132,92 unidades, (llamado error estándar de estimación del total)
MUESTREO ESTRATIFICADO
MUESTREO POR CONGLOMERADOS