UNIVERSIDAD NACIONAL DEL CALLAO
FACULTAD DE INGENIERÍA AMBIENTAL
Y DE RECURSOS NATURALES
Muestreo por Conglomerados
1
• Estimación de la media
• Una vez seleccionados los conglomerados Conglomerado mi yi
a muestrear, se obtiene de cada uno su 1 32 125
tamaño (mi) y la suma de la variable que 2 28 136
3 25 145
se desea analizar (yi). Nótese que es la
4 27 134
suma de las variables, no la media 5 26 135
• Después se suma cada una de las 6 30 128
columnas y se aplica a la siguiente Total 168 803
ecuación:
n
y • Como los valores de las sumatorias 803
y= ni =1 i
y= 4,8
i=1 mi ya está calculado en la tabla, 168
solamente se sustituyen los valores
2
Estimación de la varianza de la media:
Para el cálculo de la varianza de la media es Conglomerado mi yi M(yi)*mi (yi_M(yi))^2
conveniente agregar dos columnas a la tabla, en la 1 32 125 152,952 781,336
primera se multiplica la media general por el 2 28 136 133,833 4,694
3 25 145 119,494 650,554
tamaño de cada conglomerado, en la 2da columna 4 27 134 129,054 24,467
se resta el total de cada conglomerado menos el 5 26 135 124,274 115,051
de la columna anterior y se eleva ala cuadrado. La 6 30 128 143,393 236,940
columna se suma. Total 168 803 803,000 1813,042
Media General 4,780
La varianza se calcula con la
Si N = 81 conglomerados y M = 2268 elementos en
siguiente ecuación: la población. Nótese que se la sumatoria ya está
N − n i =1 ( yi − y * mi
n
ˆ calculada en la tabla que se muestra.
V ( y) = 2
Nn( M / N ) n −1 81 − 6 1813, 042
Vˆ ( y ) = 2
0, 0713
81*6(2268 / 81) 6 − 1
= y z /2 Vˆ (Y )
y − Z /2 Vˆ (Y ) y + Z /2 Vˆ (Y )
4, 78 − 1,96 0, 0713) 4, 78 + 1,96 0, 0713)
4, 26 5,3
3
NOMENCLATURA PARA UN MUESTREO POR
CONGLOMENRADOS
Notación:
• N = número de conglomerados en la población.
• n = número de conglomerados seleccionados en una MIA.
• mi = número de elementos en el conglomerado i,
• yi = total de las observaciones en el i-th conglomerado.
n
m i
m= 1
; tamaño promedio del conglomerado en la muestra
n
N
M = mi = número de elementos en la población
1
M
M= = tamaño promedio del conglomerado en la población
N
4
ESTIMACIÓN DE UNA MEDIA Y UN TOTAL
POBLACIONALES
El estimador de la media poblacional µ es la media muestral, la cual está
n n
dada por y=
i =1
y / m
i
i =1
i
Estimador de la media poblacional µ
n
y i
y= i =1 . . . . . . . . . . . (8.1)
n
m
i =1
i
5
ESTIMACIÓN DE UNA MEDIA Y UN TOTAL
POBLACIONALES
Varianza estimada de y
n
N −n
i
( y − y m i ) 2
Vˆ ( y ) = 2
1 . . . . . . . . . . . (8.2)
NnM n −1
Límite para el error de estimación:
n
N −n
i
( y − y mi ) 2
. . . . . . . . . . . (8.3)
2 Vˆ ( y ) = 2 2
1
NnM n −1
La varianza estimada en la ecuación (8,2) es sesgada y
sería un buen estimador V ( y ) únicamente si n es grande.
6
ESTIMACIÓN DE UNA MEDIA Y UN TOTAL
POBLACIONALES
• El total poblacional es ahora Mµ porque M es denota el
número total de elementos en la población. Por lo tanto
como en MIA, M y proporciona un estimador de
Estimador del total poblacional :
n
y i
My=M i =1
n . . . . . . . . . . . (8.4)
m
i =1
i
Varianza estimada de My :
n
N −n
( y − ym ) 2
i i
. . . . . . . . . . . (8.5)
Vˆ ( M y ) = M 2Vˆ ( y ) = M 2 2
i =1
NnM n −1
7
ESTIMACIÓN DE UNA MEDIA Y UN TOTAL
POBLACIONALES
Límite para el error de estimación:
n
2N −n ( y − ym )
i i
2
ˆ
2 V (M y) = 2 M 2
i =1 . . . . . . . . . . . (8.6)
NnM n −1
• Nótese que el estimador M y es útil si se conoce el número de elementos
M en la población.
8
ESTIMACIÓN DE UNA MEDIA Y UN TOTAL
POBLACIONALES
• Ejemplo 2. Un fabricante de prendas de vestir tiene N = 90 plantas localizadas
a lo largo de los Estados Unidos y quiere estimar el promedio de horas que las
máquinas de coser estaban para reparaciones en los últimos meses (Sin
funcionar). Debido a que las plantas están muy dispersas, decide usar el
muestreo de conglomerados, especificando cada planta como un grupo de
máquinas. Cada planta contiene muchas máquinas y la comprobación del
registro de reparación para cada máquina requeriría mucho tiempo. Por lo
tanto, utiliza el muestreo en racimo o conglomerados en dos etapas. Se
dispone de suficiente tiempo y dinero para probar n = 10 plantas y
aproximadamente 20% de las máquinas en cada planta. Los datos resultantes
se dan en la tabla siguiente:
• Queremos estimar el tiempo medio de inactividad por máquina, y sabemos
que el número total de máquinas en todas las plantas es de M = 4500.
9
PLANTA Mi mi Tiempo sin funcionar (en horas) Promedio S2i
1 50 10 5 7 9 0 11 2 8 4 3 5 5,40 11,38
2 65 13 4 3 7 2 11 0 1 9 4 3 2 1 5 4,00 10,67
3 45 9 5 6 4 11 12 0 1 8 4 5,67 16,75
4 48 10 6 4 0 1 0 9 8 4 6 10 4,80 13,29
5 52 10 11 4 3 1 0 2 8 6 5 3 4,30 11,12
6 58 12 12 11 3 4 2 0 0 1 4 3 2 4 3,83 14,88
7 42 8 3 7 6 7 8 4 3 2 5,00 5,14
8 66 13 3 6 4 3 2 2 8 4 0 4 5 6 3 3,85 4,31
9 40 8 6 4 7 3 9 1 4 5 4,88 6,13
10 56 11 6 7 5 10 11 2 1 4 0 5 4 5,00 11,80
n
y i
y= i =1
n
m
i =1
i
10
n
PLANTA Mi mi
yi
Promedio S 2i Mi*(M(yi)) y i
y= i =1
n
1 50 10 54 5,40 11,38 270
m i
2 65 13 47 4,00 10,67 260 i =1
3 45 9 51 5,67 16,75 255 458
y= = 4, 4038
4 48 10 48 4,80 13,29 230,4 104
5 52 10 43 4,30 11,12 223,6
n
N
6
7
58
42
12
8
46
40
3,83
5,00
14,88
5,14
222,3333
210
y insg =
nM
M Y
i =1
i i
8 66 13 40 3,85 4,31 253,8462
90
9 40 8 50 4,88 6,13 195 y insg = ( 2400,179 ) = 4,80
10 56 11 39 5,00 11,80 280 10* 4500
TOTAL 104 458 2400,179
2 Si2
2
2
N n S N mi
Vˆ ( y inseg ) = 1 −
M
i
+
N n nM 2
M
1 − Mi
i mi
11
PLANTA Mi mi yi Promedio S2i Mi*(M(yi)) S2t /$C$13 (1-mi/Mi)M2i*S2I/mi
1 50 10 54 5,40 11,38 270 1,14 2275,56
2 65 13 47 4,00 10,67 260 1,07 2773,33
3 45 9 51 5,67 16,75 255 1,68 3015,00
4 48 10 48 4,80 13,29 230,4 1,33 2423,89
5 52 10 43 4,30 11,12 223,6 1,11 2429,09
6 58 12 46 3,83 14,88 222,333333 1,49 3308,05
7 42 8 40 5,00 5,14 210 0,51 918,00
8 66 13 40 3,85 4,31 253,846154 0,43 1159,10
9 40 8 50 4,88 6,13 195 0,61 980,00
10 56 11 39 5,00 11,80 280 1,18 2703,27
TOTAL 458 105,46 2400,17949 10,55 21985,30
n= 10
2 Si2
2
2
N n S N mi
ˆ
V ( y inseg ) = 1 −
t
+ 2 1 − M Mi Vˆ ( y inseg ) = 0, 014 = 0,1183
M N n nM i mi
2
90 10 90
2 (
ˆ
V ( y inseg ) = 1 − 10, 55 + 21985, 3 )
4500 90 10 * 4500
Vˆ ( y ) = 0, 0004 *9, 38 + 0, 0098 0, 014
inseg 12
= y Z /2 Vˆ ( y )
= 4, 4038 1,96 0, 014
= 4, 4038 0, 232
13
ESTIMACIÓN DE UNA MEDIA Y UN TOTAL POBLACIONALES
• Ejemplo 3. Un inspector quiere estimar el peso promedio de llenado para
cajas de cereal empacadas en una fábrica. El cereal en paquetes que contiene
12 cajas cada uno. El inspector selecciona aleatoriamente 5 y mide el peso de
llenado de cada caja en los paquetes muestreados, con los resultados en (en
onzas) que se muestra en el cuadro adjunto.
• Estime el peso promedio de llenado para las cajas empacadas por esta
fábrica, y establezca un límite para el error de estimación.
Se sabe que el número total de cajas empacadas por la fábrica es lo
suficientemente grande para que no se tome en cuenta la corrección finita.
Paquete Onzas de llenado
I 16,1 15,9 16,1 16,2 15,9 15,8 16,1 16,2 16,0 15,9 15,8 16,0
II 15,9 16,2 15,8 16,0 16,3 16,1 15,8 15,9 16,0 16,1 16,1 15,9
III 16,2 16,0 15,7 16,3 15,8 16,0 15,9 16,0 16,1 16,0 15,9 16,1
IV 15,9 16,1 16,2 16,1 16,1 16,3 15,9 16,1 15,9 15,9 16,0 16,0
V 16,0 15,8 16,3 15,7 16,1 15,9 16,0 16,1 15,8 16,0 16,1 15,9 14
ESTIMACIÓN DE UNA MEDIA Y UN TOTAL POBLACIONALES
Paquete Onzas de llenado yi Promedio S2i
I 16,1 15,9 16,1 16,2 15,9 15,8 16,1 16,2 16,0 15,9 15,8 16,0 192,00 16,00 0,02
II 15,9 16,2 15,8 16,0 16,3 16,1 15,8 15,9 16,0 16,1 16,1 15,9 192,10 16,01 0,02
III 16,2 16,0 15,7 16,3 15,8 16,0 15,9 16,0 16,1 16,0 15,9 16,1 192,00 16,00 0,03
IV 15,9 16,1 16,2 16,1 16,1 16,3 15,9 16,1 15,9 15,9 16,0 16,0 192,50 16,04 0,02
V 16,0 15,8 16,3 15,7 16,1 15,9 16,0 16,1 15,8 16,0 16,1 15,9 191,70 15,98 0,03
TOTAL 960,30
Suma mi 60
y
n
y= i =1
i
=
960,3
= 16, 005 N −n i
( y − y * mi ) 2
ˆ
V ( y) = i =1
2
n
m
60 n −1
i Nn ( M / N )
i =1
• xxx
15
Paquete Onzas de llenado yi Promedio mi S 2i (yi-medi*mi)^2
I 16,1 15,9 16,1 16,2 15,9 15,8 16,1 16,2 16,0 15,9 15,8 16,0 192,00 16,00 12 0,02 0,0036
II 15,9 16,2 15,8 16,0 16,3 16,1 15,8 15,9 16,0 16,1 16,1 15,9 192,10 16,01 12 0,02 0,0016
III 16,2 16,0 15,7 16,3 15,8 16,0 15,9 16,0 16,1 16,0 15,9 16,1 192,00 16,00 12 0,03 0,0036
IV 15,9 16,1 16,2 16,1 16,1 16,3 15,9 16,1 15,9 15,9 16,0 16,0 192,50 16,04 12 0,02 0,1936
V 16,0 15,8 16,3 15,7 16,1 15,9 16,0 16,1 15,8 16,0 16,1 15,9 191,70 15,98 12 0,03 0,1296
TOTAL 960,30 60 0,3320
n
N −n i
( y − y * mi ) 2
M
M = ; m=
mi 60
= = 12
ˆ
V ( y) = i =1
2
N n 5
NnM n −1 N −n
→ 1, para N muy grnade o desconocido
N
n
(y − y * mi ) 2
ˆ
1
V ( y) = i =1
i
=
1
*
0,3320
0, 0005 B = 2 Vˆ ( y ) = 2 0, 0005 = 0, 045
n m2 n −1 5*122 720
16
ESTIMACIÓN DE UNA MEDIA Y UN TOTAL POBLACIONALES
Frecuentemente el número de elementos en la población no es conocido en
problemas donde el muestreo por conglomerados es apropiado. Entonces
no podemos usar el estimador My , pero podemos formar otro estimador
del total poblacional que no depende de M. La cantidad y t dada por:
1 n
y t = yi . . . . . . . . . . . (8.7)
n i =1
es el promedio de los totales de conglomerados para los n conglomerados
muestreados. Es por esto que (8,7) es un estimador insesgado del promedio de
los N totales de conglomerados en la población. Por el mismo razonamiento
empleado en MIA, (8,4) es un estimador insesgado de la suma de los totales de
conglomerados o, equivalentemente, del total poblacional .
Por ejemplo es altamente improbable que se conozca el número de adultos
varones en una ciudad, por lo que el estimador de M y tendrá que ser usado en
lugar de N y t para estimar .
17
ESTIMACIÓN DE UNA MEDIA Y UN TOTAL POBLACIONALES
Estimador del total poblacional , el cual no depende de M:
n
N
Ny t =
n
y
1
i . . . . . . . . . . . (8.8)
Varianza estimada de Ny :
n
N −n
(y i − yt ) 2
Vˆ ( Ny t ) = N 2Vˆ ( y t ) = N 2 1
Nn n −1 . . . . . . . . . . . (8.9)
Límite para el error de estimación:
N −n
(y i − yt ) 2
. . . . . . . . . . . (8.10)
2 Vˆ ( Nyt ) = 2 N 2
Nn n −1
18
ESTIMACIÓN DE UNA MEDIA Y UN TOTAL
POBLACIONALES
• Ejemplo 4. usando los datos del ejemplo 2, estimar el ingreso total
de todos los residentes de la ciudad si M no es conocido.
Establezca un límite para el error de estimación, sabiendo que N =
415 conglomerados.
• Solución.
415
Nyt = (1329 000) = $22 061 400
25
2
n
1 1
1 i t n i
( y − y )2
= y − 2
i y = 82 039 000 000 −
25
(1 329 000 ) 2
= 11389 360 000
ˆ 2 415 − 25 11 389 360 000
2 V ( Nyt ) = 2 (415) = 3 505 920
415 x 25 24
19
ESTIMACIÓN DE UNA MEDIA Y UN TOTAL
POBLACIONALES
• Ejemplo 5. El gerente de circulación d un periódico desea estimar
el número promedio de ejemplares comprados por familia en
determinada comunidad. Los costos de transporte de un hogar a
otro son sustanciales. Es por eso que se listan los 4 000 hogares de
la comunidad en 400 conglomerados geográficos de 10 hogares
cada uno, y se selecciona una muestra irrestricta aleatoria de 4
conglomerados. Se realizan las entrevistas con los resultados que
se muestran en la tabla adjunta. Estime el número promedio de
periódicos por hogar en la comunidad y establezca un límite para
el error de estimación.
20
ESTIMACIÓN DE UNA MEDIA Y UN TOTAL
• Solución. POBLACIONALES
Conglomerado Número de periódicos Total
1 1 2 1 3 3 2 1 4 1 1 19
4
2 1 3 2 2 3 1 4 1 1 2 20
y
3 2 1 1 1 1 3 2 1 3 1 16
i
19 + 20 + 16 + 20 4 1 1 3 2 1 5 1 2 3 1 20
y= i =1
4
= = 1,875
m
40 n n n n
( y − ym ) = y − 2 y yi mi + y m
i 2 2 2 2
i =1 i i i i
1 i =1 i =1 i =1
n n
(y
1
i − ymi ) = yi2 − nm2 y 2 = (19) 2 + (20) 2 + (16) 2 + (20) 2 − 4(10) 2 (1,875) 2 = 10,75
2
i =1
N −n
i i
( y − y m ) 2
(400 − 4)(10,75)
ˆ
V ( y) = 2
1
= = 0,0089
NnM n −1 2
400 (4)(10) (3)
2 Vˆ ( y ) = 2 0,0089 = 0,19
21
SELECCIÓN DEL TAMAÑO DE MUESTRA PARA LA
ESTIMACIÓN DE MEDIAS Y TOTALES
• La cantidad de información en una muestra por
conglomerados es afectada por dos factores, el número y
el tamaño relativo de los conglomerados.
N −n 2
Vˆ ( y ) = ( s c )
NnM
2
(y i − y mi ) 2 . . . . . . . . . . . (8.11)
s =
2 1
n −1
c
N −n
V ( y) = 2
( 2
c ) . . . . . . . . . . . (8.12)
NnM
22
SELECCIÓN DEL TAMAÑO DE MUESTRA PARA LA
ESTIMACIÓN DE MEDIAS Y TOTALES
• Tamaño de muestra requerido para estimar µ con B:
N c2
n= . . . . . . . . . . . (8.13)
ND + c2
B2M 2
D=
4
• Tamaño de muestra requerido para estimar
, usando Nyt con un límite B:
N c2 . . . . . . . . . . . (8.14)
n=
ND + c2 2
B
D= 2
4N
23
SELECCIÓN DEL TAMAÑO DE MUESTRA PARA LA
ESTIMACIÓN DE MEDIAS Y TOTALES
• Ejemplo 6. Los datos del ejemplo 2
representan una muestra preliminar de
ingresos en la ciudad. ¿Qué tan grande debe
ser la muestra para estimar el ingreso
promedio por persona µ con B = $ 500?
• Solución. Para utilizar la ecuación (8,13), debemos
estimar σ2c
24
SELECCIÓN DEL TAMAÑO DE MUESTRA PARA LA
ESTIMACIÓN DE MEDIAS Y TOTALES
n
( y − ym )
i i
2
15 227 502 247
s =
2 1
= = 634 479 260
n −1
c
24
2
B m (500 ) 2 (6,04) 2
2
D= = = (62 500 )(6,04) 2
4 4
N c2 415(634 479 260 )
n= = 167
ND + c 415(6,04) (62 500 ) + 634 479 260
2 2
25
SELECCIÓN DEL TAMAÑO DE MUESTRA PARA LA
ESTIMACIÓN DE MEDIAS Y TOTALES
• Ejemplo 7. Usando nuevamente los datos del ejemplo 2,
como una muestra preliminar de ingresos en la ciudad,
señale ¿qué tan grande se necesita una muestra para
estimar el ingreso total de todos los residentes, , con B =
$ 1 000 000?. Hay 2500 residentes en la ciudad (M =
2500).
• Solución. Usamos la ecuación (8,14) y estimamos σ2c
mediante
sc2 = 634 479 260
26
SELECCIÓN DEL TAMAÑO DE MUESTRA PARA LA
ESTIMACIÓN DE MEDIAS Y TOTALES
B2 (1000 000) 2
D= 2
=
4N 4(415) 2
(1000 000) 2
ND = = 602 409 000
4(415)
N c2 415(634 479 260 )
n= = 213
ND + c 602 409 000 + 634 479 260
2
• Luego se deben muestrear 213 conglomerados de los
415 para estimar el ingreso total con un límite de B = $ 1
000 000 para el error de estimación.
27
SELECCIÓN DEL TAMAÑO DE MUESTRA PARA LA
ESTIMACIÓN DE MEDIAS Y TOTALES
• El estimador Nque
yt se muestra en la ecuación (8,8), se
usa para estimar cuando M es desconocido. La varianza
estimada de que se muestra en (8,9) es N yt
N −n 2
Vˆ ( Ny t ) = N 2 st
Nn
n
i t
( y − y ) 2
st2 = i= . . . . . . . . . . . (8.15)
n −1
N −n 2
V ( Ny t ) = N 2V ( y t ) = N 2 t . . . . . . . . . . . (8.16)
Nn
• Tamaño de muestra para estimar , usando Nyt con un
límite B:
N t2 . . . . . . . . . . . (8.17)
n=
ND + t2
28
SELECCIÓN DEL TAMAÑO DE MUESTRA PARA LA
ESTIMACIÓN DE MEDIAS Y TOTALES
• Ejemplo 8. Suponiendo que los datos del ejemplo 2
provienen de un estudio preliminar de ingresos en la
ciudad y que no se conoce M. ¿Qué tan grande debe ser
la muestra para estimar el ingreso total de todos los
residentes, , con B = 1 000 000?.
• Solución.
i t
( y − y ) 2
11 389 360 000
st2 = i=
= = 474 556 667
n −1 24
29
SELECCIÓN DEL TAMAÑO DE MUESTRA PARA LA
ESTIMACIÓN DE MEDIAS Y TOTALES
B2 (1000 000) 2
D= 2
=
4N 4(415) 2
N t2 415(474 556 667 )
n= = 183
ND + t2
415(1000 000 ) / 4(415) + 474 556 667
2 2
• Entonces se debe tomar una muestra de 183
conglomerados para tener un límite de $ 1 000 000 en el
error de estimación.
30
ESTIMACIÓN DE UNA PROPORCION
POBLACIONAL
• Estimador de la proporción poblacional P:
n
a i
. . . . . . . . . . . (8.18)
p = i =1
n
m
i =1
i
• Varianza estimada de p:
n
N −n
i
( a − pmi ) 2
. . . . . . . . . . . (8.19)
Vˆ ( p) = 2
i =1
NnM n −1
• Límite para el error de estimación:
n
N −n
i
( a − pmi ) 2
. . . . . . . . . . . (8.20)
2 Vˆ ( p) = 2 2
i =1
NnM n −1
31
ESTIMACIÓN DE UNA PROPORCION
POBLACIONAL
• Ejemplo 9. además de la pregunta sobre su ingreso, se
interroga a los residentes, de la encuesta del ejemplo 2,
acerca de si son dueños o alquilan la casa donde viven.
Los resultados se muestran en la tabla adjunta. Utilice
los resultados para estimar la proporción de residentes
que viven en casa de alquiler. Establezca un límite para el
error de estimación.
32
conglomerado mi ai mi*2 ai*2 ai*mi
1 8 4 64 16 32
2 12 7 144 49 84
3 4 1 16 1 4
4 5 3 25 9 15
5 6 3 36 9 18
6 6 4 36 16 24
7 7 4 49 16 28
8 5 2 25 4 10
9 8 3 64 9 24
10 3 2 9 4 6
11 2 1 4 1 2
12 6 3 36 9 18
13 5 2 25 4 10
14 10 5 100 25 50
15 9 4 81 16 36
16 3 1 9 1 3
17 6 4 36 16 24
18 5 2 25 4 10
19 5 3 25 9 15
20 4 1 16 1 4
21 6 3 36 9 18
22 8 3 64 9 24
23 7 4 49 16 28
24 3 0 9 0 0
25 8 3 64 9 24
TOTAL 151 72 1047 262 511
mi: número de residentes
ai: número de arrendatarios 33
ESTIMACIÓN DE UNA PROPORCION
POBLACIONAL
• Solución. El mejor estimador de la proporción poblacional
de arrendatarios es p.
n
ai 72
n
(a − pm ) = a
2 2
− 2 p ai mi + p 2 mi2
p= = = 0,48
i =1 i i i
n i =1
m
151
i
i =1
n
i
( a
i =1
− pmi ) 2
= 262 − 2( 0, 477 )(511) + ( 0, 477 ) 2
(1047 ) = 12,729
415 − 25 (12,729 )
Vˆ ( p) =
2
= 0,00055
415(25)(6,04) 24
2 Vˆ ( p) = 2 0,00055 = 0,05
34
Selección del tamaño de muestra para la estimación
de proporciones
• La estimación de la proporción poblacional P, con un
límite de B unidades para el error de estimación, implica
que el experimentador quiere:
2 Vˆ ( p) = B N c2
n=
n
ND + c2
(a i − pmi ) 2
s c2 = i =1 . . . . . . . . . . . (8,21)
n −1
• Ejemplo 10. los datos del ejemplo 2 son absoletos.
Se va a realizar un nuevo estudio en la misma
ciudad con el propósito de estimar P de residentes
que alquilan casa en que viven. ¿Qué tamaño de
muestra se necesita? Si B = 0,04.
35
Selección del tamaño de muestra para la estimación
de proporciones
• Solución. El mejor estimador de σ2c es s2c el cual es
calculado usando los datos de la tabla.
n
i
( a − pmi ) 2
12,729 B = 0,04
sc2 = i =1
= = 0,53
n −1 24
B 2 m 2 (0,04) 2 (6,04) 2
D= = = 0,0146
4 4
N c2 (415)(0,530 )
n= = 34
ND + c (415)(0,0146 ) + 0,530
2
• De modo que se deben muestrear 34
conglomerados para estimar P, con B = 0.04.
36
MUESTREO POR CONGLOMERADOS
COMBINADO CON ESTRATIFICACIÓN
• Ejemplo 11. consideremos los datos del ejemplo 2 como
la muestra del estrato 1, con N1 = 415 y n1 = 25. se toma
una ciudad vecina más pequeña como el estrato 2, con
N2 = 168 y n2 = 10 bloques. Estime el ingreso promedio
por persona en las dos ciudades combinadas, y
establezca un límite para el error de estimación, dados
los datos adicionales que se muestran en la tabla
adjunta.
37
MUESTREO POR CONGLOMERADOS
COMBINADO CON ESTRATIFICACIÓN
conglomerado mi yi mi*2 yi*2 yi*mi
1 2 18000 4 324000000 36000
2 5 52000 25 2704000000 260000
3 7 68000 49 4624000000 476000
4 4 36000 16 1296000000 144000
5 3 45000 9 2025000000 135000
6 8 96000 64 9216000000 768000
7 6 64000 36 4096000000 384000
8 10 115000 100 13225000000 1150000
9 3 41000 9 1681000000 123000
10 1 12000 1 144000000 12000
TOTAL 49 547000 313 39335000000 3488000
mi: número de
residentes
ai: número de
arrendatarios
38
MUESTREO POR CONGLOMERADOS
COMBINADO CON ESTRATIFICACIÓN
• Solución.
yt1 = 53 160 yt =
54 7000
= 54 700
2
10
m1 = 6,04 m2 = 4,90
• Estimación del promedio poblacional del total por
conglomerado y = 1 ( N y + N y )
st 1 t1 2 t2
N
• Mientras que el estimador del promedio del tamaño
de conglomerado es 1 ( N m + N m )
1 1 2 2
N
• Un estimador de la media poblacional por elemento
es entonces y * = N1 yt1 + N 2 yt 2
N1m1 + N 2 m2
39
• La varianza puede ser estimada:
N1 ( N1 − n1 ) n1
ˆ 1
V(y ) = 2
*
( yi − yt1 ) − y * (mi − m1 ) +
2
M n1 (n1 − 1) I =1
N 2 ( N 2 − n2 ) 2
n2
+ ( yi − yt 2 ) − y * (mi − m2 )
n2 (n2 − 1) i =1
• Donde M es el número total de elementos en la
población y puede ser estimado si no es conocido
por:
N1m1 + N2 m2
40
• Para los datos de la tabla, se tiene
415(53160) + 168(54700 )
y* = = 9385
415(6.04) + 168(4.90)
• Para el estrato 1
1 n1
( yi − yt1 ) − y * (mi − m1 )2 = 675 930 246
n1 − 1 i =1
• Para el estrato 2
1 n2
( yi − yt 2 ) − y * (mi − m2 )2 = 74 934 600
n2 − 1 i =1
41
N1m1 + N2m2 = 3329.8
Vˆ ( y*) = 412 563 .8
B = 2 Vˆ ( y*) = 2 412 563.8 = 1285
• Entonces el ingreso promedio por persona para las
dos ciudades combinadas es: $ 9385±1285.
• Vemos que el límite para el error de estimación es
menor que el del estrato 1, como se encontró en el
ejemplo 2.
42
Estimación de una media y un total poblacionales
1. Población
43
Estimación de una media y un total poblacionales
• Ejemplo 1. Un
44
Estimación de una media y un total poblacionales
Ejemplo
45
Estimación de una media y un total poblacionales
• Solución.
46
Estimación de una proporción poblacional
• Ejemplo
47
SELECCIÓN DEL TAMAÑO DE MUESTRA
• Ejemplo
48
SELECCIÓN DEL TAMAÑO DE MUESTRA
• Ejemplo 5.
49
SELECCIÓN DEL TAMAÑO DE MUESTRA
• Para eliminar
50