0% encontró este documento útil (0 votos)
40 vistas29 páginas

Muestreo Aleatorio Estratificado: Guía Completa

Este documento introduce el concepto de muestreo aleatorio estratificado, donde la población se divide en subgrupos homogéneos llamados estratos y se toma una muestra aleatoria de cada estrato. Esto aumenta la precisión de las estimaciones y reduce los costes en comparación con un muestreo aleatorio simple. Explica cómo definir los parámetros del diseño, como las probabilidades de inclusión y los parámetros a estimar en cada estrato y en la población total.

Cargado por

Marc Pastor Pou
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
40 vistas29 páginas

Muestreo Aleatorio Estratificado: Guía Completa

Este documento introduce el concepto de muestreo aleatorio estratificado, donde la población se divide en subgrupos homogéneos llamados estratos y se toma una muestra aleatoria de cada estrato. Esto aumenta la precisión de las estimaciones y reduce los costes en comparación con un muestreo aleatorio simple. Explica cómo definir los parámetros del diseño, como las probabilidades de inclusión y los parámetros a estimar en cada estrato y en la población total.

Cargado por

Marc Pastor Pou
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Muestreo Aleatorio Estratificado

Introducción

Se ha visto el diseño muestral del muestreo aleatorio simple que es sencillo de aplicar,
aunque si la población en estudio es muy heterogénea es conveniente agrupar las unidades de

la población en estratos internamente homogéneos y muestrear dentro de ellos.


Se va a definir un nuevo diseño de gran importancia y aplicación real, que es el muestreo
estratificado.

Por ejemplo, supongamos que deseamos tomar una muestra de una facultad para estimar
el número medio de horas de estudio que dedican los alumnos. Se puede observar que a priori
la muestra puede considerarse tanto por curso o en sentido global.

Si deseamos tomar una muestra de tamaño n podemos actuar de dos formas:

i ) Seleccionamos una m.a.s. de tamaño n arbitraria de la población y realizamos inferencias.

ii ) Seleccionamos una m.a.s. de tamaño ni (donde i = 1, . . . , L) de forma independiente en


cada una de las subpoblaciones de forma que
L
X
n= ni
i=1

Ante estas dos formas de actuar, intuitivamente se puede apreciar que en ii ) la muestra va
a ser más representativa de la población, ya que va a estar formada por unidades de todas las
subpoblaciones y en consecuencia el error de muestreo será menor.

Si utilizamos i ) nos encontramos que tendremos que seleccionar n′ unidades n′ > n para
tener un error de muestreo similar al de ii ) con lo cual los costes aumentan.

En general al muestreo realizado en ii ) se le llama muestreo estratificado, donde a cada


una de las subpoblaciones se le llaman estratos y su objetivo fundamental es aumentar la
precisión de las estimaciones.

1
¿Cuáles son las razones fundamentales para utilizar el muestreo estratificado?

a) Aumentar la precisión de las estimaciones y reducir los costes.


b) Permitir no sólo estimar parámetros de la población, sino también de los estratos.
c) Es muy útil cuando las observaciones pueden diferir marcadamente en diferentes partes de

la población.

Definición del diseño muestral y parámetros asociados

Formalizando el problema, podemos considerar una población U de tamaño N , dividida en


L estratos de unidades homogéneas: U1 , . . . , UL cada uno de ellos con N1 , . . . , NL unidades tales

que Lh=1 Nh = N .
P

Toda unidad Ui ∈ U pertenece a una y solo una subpoblación o estrato.


Se denomina ponderación del estrato h-ésimo (o peso) al cociente

Nh
Wh =
N
PL
para todo h = 1, . . . , L, de modo que h=1 Wh = 1.

En cada estrato se extrae una muestra sh de tamaño nh que estará formada por unidades
de Uh , de este modo, en cada estrato h se define el diseño muestral (Sh , Ph (·)) .
En consecuencia, el espacio muestral S está formado por S = S1 × S2 × · · · × SL y para todo

s ∈ S, s = (s1 , s2 , . . . , sh ) donde sh es una muestra del estrato h de tamaño nh , de manera que


el tamaño de s será n = Lh=1 nh .
P

Como la extracción de las muestras en cada estrato es independiente,

p(s) = p1 (s1 )p2 (s2 ) · · · pL (sL )

para todo s ∈ S.
nh
Al cociente fh = Nh
se le denomina fracción de muestreo o tasa de muestreo del estrato
h.

En cuanto a las probabilidades de inclusión, la unidad i pertenecerá a la muestra si fue


extraı́da de su estrato, es decir, πk = πkh donde πkh = P {k ∈ sh }.
De manera análoga,

πkl = πkh πlh si k y l están en estratos diferentes

2
h
πkl = πkl si k y l están en el mismo estrato h.

Es decir

πk = πkh si k ∈ Uh
(
h
πkl si k, l ∈ Uh
πkl = h h′
πk πl si k ∈ Uh y l ∈ Uh′

Diseño muestral aleatorio simple estratificado

En el caso en que en cada estrato se realice un mas(Nh , nh ) se dice que el diseño muestral
es aleatorio simple estratificado.

En este caso, para cada estrato h,


nh
πkh =
Nh
si k ∈ Uh

h nh (nh − 1)
πkl = πkl =
Nh (Nh − 1)
si k, l ∈ Uh .

nh nh′
πkl =
Nh Nh′
si k ∈ Uh y l ∈ Uh′

Parámetros a estimar

Sea X la variable a estudiar. Se denota por Xhi el valor de la variable X sobre la unidad i
del estrato h. Ası́ se identifican las unidades con dos subı́ndices: uno para el estrato y otro para
el lugar que ocupa en el estrato.

Media poblacional del estrato h


Nh
1 X 1 X
Xh = Xhk = Xk
Nh k=1 Nh k∈U
h

Cuasivarianza poblacional del estrato h


hN
1 X 2
Sh2 = Xhk − X h
Nh − 1 k=1

3
Varianza poblacional del estrato h
Nh
1 X 2
σh2 = Xhk − X h
Nh k=1

Total del estrato h


Nh
X
Xh = Xhk
k=1

Relación entre los parámetros de los estratos y los de la población

L
X
X= Wh X h
h=1

Demostración:

N L Nh
1 X 1 XX
X= Xi = Xhi =
N i=1 N h=1 i=1
L Nh L L
1 X Nh X 1 X X
Xhi = Nh X h = Wh X h
N h=1 Nh i=1 N h=1 h=1

En un muestreo estratificado se verifica que:


L
X L
X
2 2
σ = Wh (X h − X) + Wh σh2
h=1 h=1

es decir

Varianza poblacional = Varianza entre estratos + Varianza dentro de los estratos

Demostración:
Nh
L X
X
N σ2 = (Xhi − X)2 =
h=1 i=1
Nh
L X
X
((Xhi − X h ) + (X h − X))2 =
h=1 i=1
XL XNh Nh
L X
X
2
(Xhi − X h ) + (X h − X)2 =
h=1 i=1 h=1 i=1
L
X L
X
Nh σh2 + Nh (X h − X)2
h=1 h=1

4
Por tanto
L
X L
X
2
σ = Wh σh2 + Wh (X h − X)2
h=1 h=1
Observación: Cuanto más pequeño sea el término que mide la variabilidad dentro de los
estratos
L
X
Wh σh2
h=1
es decir, hay más homogeneidad dentro de los estratos, mayor será el término
L
X
Wh (Xh − X)2
h=1

que mide la heterogeneidad existente entre los estratos.


Ası́, hay más heterogeneidad entre los estratos y será más aconsejable usar el muestreo

estratificado, puesto que su precisión dependerá de la varianza dentro de los estratos.


La situación contraria dará origen al muestreo por conglomerados, que se verá en otro tema.

Estimación de parámetros y propiedades

Consideramos un diseño muestral (S, P (·)) definido sobre una población estratificada U a

partir de los diseños muestrales de los estratos (Sh , Ph (·)) para h = 1, . . . , L.


Se desea estimar un parámetro del tipo
N
X
θ= ak X k =
k=1
L X
X L
X
ak X k = θh
h=1 k∈Uh h=1

es decir, se puede expresar como una suma de parámetros lineales sobre cada estrato.
De este modo, a partir de estimadores insesgados de θh obtenemos un estimador insesgado
de θ, es decir,
L
X
θb = θbh
h=1

es un estimador insesgado de θ, y por la independencia de los θbh


L
X
V (θ)
b = V (θbh )
h=1

y
L
X
Vb (θ)
b = Vb (θbh )
h=1

5
Esto lleva a la conclusión de que interesa obtener buenos diseños en los estratos que pro-

duzcan poco error para que el error total se lo menor posible.


Para muestreo sin reemplazamiento usamos para cada estrato el estimador de Horvitz-
Thompson para θh . Ası́,
X ak X k
θbh =
k∈s
πkh
h

de modo que
L X
X ak X k
θb =
h=1 k∈s
πkh
h

Estimador de X y del total X en el muestreo aleatorio estratificado

Se tiene que
L
X
X= Wh X h
h=1

Y por otro lado


b = 1 XX
X h k
nh k∈s
h

que corresponde al estimador de Horvitz-Tompson de X h .


Al ser un muestreo aleatorio simple por estrato, se tiene que

 1 − fh 2
V Xh = Sh
nh

donde
nh
fh =
n
y por tanto el estimador de la varianza es

 1 − fh 2
Vb X h = Sbh
nh

donde
1 X b 2

Sbh2 = Xk − X h
nh − 1 k∈s
h

Por tanto, el estimador de la media global es


L L
b = X Nh X
X b = XW X b
h h h
h=1
N h=1

6
En cuanto a las varianzas
L L
  X Nh2  b  X Nh2 1 − fh 2
V X =
b V Xh = Sh =
h=1
N2 h=1
N 2 nh
" L L
#
1 X Nh2 Sh2 X Nh2 nh 2
− S =
N 2 h=1 nh h=1
nh Nh h
" L L
#
1 X Nh2 Sh2 X
− Nh Sh2 =
N 2 h=1 nh h=1
" L L
#
X W 2S 2 X W h 2
h h
− Sh
h=1
n h
h=1
N

En cuanto al estimador de la varianza se obtiene que


" L L
#
2 b2
  1 X N S
h h
X
Vb X b =
2
− Nh Sbh2
N h=1 nh h=1

Por otro lado, el estimador del total X en el muestreo aleatorio estratificado, dado que
X = N X, se obtiene de manera directa que
L
X
X
b= Nh X
b
h
h=1

y las correspondientes varianzas son


L L
  X Nh2 Sh2 X
V X
b = − Nh Sh2
h=1
n h
h=1

L L
  X Nh2 Sbh2 X
Vb X
b = − Nh Sbh2
h=1
n h
h=1

Estimador de una proporción P

Si se considera P como la media de variables dicotómicas


(
1 Si la unidad k posee la caracterı́stica
Ik =
0 Si la unidad k no posee la caracterı́stica

Se tiene que
L
X
Pb = Wh Pbh
h=1

donde
1 X
Pbh = Ik
nh k∈s
h

7
Se puede demostrar que
L
  X Nh2 (1 − fh )Nh
V P
b = Ph (1 − Ph ) =
h=1
N 2 nh (Nh − 1)

L
X 1 − fh Nh
Wh2 Ph (1 − Ph )
h=1
nh Nh − 1

Y el estimador de la varianza es

L
  X (1 − fh ) b
Vb Pb = Wh2 Ph (1 − Pbh )
h=1
nh − 1

Ejemplo

Una empresa de publicidad, interesada en invertir en televisión, decide realizar una encuesta
para estimar el número promedio de horas por semana que se ve la televisión en los hogares de
una determinada comunidad.

La comunidad contiene dos ciudades (A y B) y un área rural. La ciudad A está situada


alrededor de una fábrica, y la mayorı́a de los hogares están compuestos de trabajadores de
fábricas con niños en edad escolar. La ciudad B es de tipo residencial y la forman residentes

mayores con pocos niños en casa. Hay 155 hogares en A, 62 en B y 93 en la zona rural. Es
decir, tenemos N1 = 155, N2 = 62 y N3 = 93 con N = 310.
Supongamos que se toma un muestreo estratificado. La firma publicitaria tiene suficiente

tiempo y dinero para entrevistar a n = 40 hogares y decide seleccionar al azar muestras de


tamaño n1 = 20 de A, n2 = 8 de B y n3 = 12 en el área rural. Los resultados son:

A B R
35 28 26 41 27 4 49 10 8 15 21 7
43 29 32 37 18 41 25 30 14 30 20 11
36 25 29 31 12 32 34 24
39 38 40 45
28 27 35 34

8
Se considera el siguiente programa en R:

str.mu.est = function ( N.vec , y , detalles = " no " ) {


# Estima la media poblacional , mu , dadas m.a.s
# tomadas de cada estrato
# N.vec es un vector de los tamanos de estrato
# y es una lista donde cada elemento es una muestra
# de un estrato
N.ttl = sum ( N.vec )
n.vec = unlist ( lapply (y , length ))
fpc = ( N.vec - n.vec ) / N.vec
ybar = unlist ( lapply (y , mean ))
yvar = unlist ( lapply (y , var ))
mu.hat = sum ( N.vec * ybar ) / N.ttl
var.mu = sum ( N.vec ^2 * fpc * yvar / n.vec ) / ( N.ttl ^2)

Conf.Int = 2 * sqrt ( var.mu )


if ( detalles == " no " ) {
cbind ( mu.hat , var.mu , Conf.Int )}
else { cbind ( mu.hat , var.mu , Conf.Int , n.vec , ybar , yvar )}
}

Se aplica los datos del ejemplo:

N.size = c (155 ,62 ,93)


str1 = c (35 ,43 ,36 ,39 ,28 ,28 ,29 ,25 ,38 ,27 ,26 ,32 ,29 ,40 ,35 ,
41 ,37 ,31 ,45 ,34)
str2 = c (27 ,15 ,4 ,41 ,49 ,25 ,10 ,30)
str3 = c (8 ,14 ,12 ,12 ,15 ,30 ,32 ,21 ,20 ,34 ,7 ,11 ,24)
x = list ( ciudad _ A = str1 , ciudad _ B = str2 , rural = str3 )

str.mu.est ( N.vec = N.size , y =x , detalles = " si " )

mu.hat var.mu Conf.Int n.vec ybar yvar


ciudad _ A 27 .51346 1 .897915 2 .755297 20 33 .90000 35 .35789
ciudad _ B 27 .51346 1 .897915 2 .755297 8 25 .12500 232 .41071
rural 27 .51346 1 .897915 2 .755297 13 18 .46154 84 .10256

9
Asignación de muestras en estratos (afijaciones)

Un aspecto de gran importancia en el muestreo estratificado es la determinación del tamaño


muestral en cada estrato, pues generalmente se suele disponer del tamaño global n, calculado

a partir de la precisión exigida.


Por ello, el muestreo estratificado debe repartir las n unidades muestrales entre los L es-
L
P
tratos, fijando nh el tamaño de la muestra en cada estrato, de manera que n = nh para
h=1
optimizar la obtención de información.
A este proceso se le conoce como asignación o afijación muestral.
La distribución de unidades muestrales en cada estrato depende de diversos factores, pero

hay tres de ellos que son fundamentales:

La importancia o peso de los estratos Wh .

La variabilidad de la variable de estudio Sh2 en cada estrato.

Los costes ch de muestrear una unidad en el estrato h.

En función de estos factores se pueden realizar distintos tipos de afijaciones.

Afijación uniforme

Consiste en asignar el mismo número de unidades muestrales a cada estrato.


Ası́
n
nh = r =
L
para todo h = 1, . . . , L de modo que

nh r
fh = =
Nh Nh

Si r no es un número entero, se toma un aproximación.

En este caso las varianzas de los estimadores son:


Para el total
L   2
  X
2 r Sh
V X̂ = Nh 1 −
h=1
Nh r
Para la media
L   2
  X
ˆ 2 r Sh
V X̄ = Wh 1 −
h=1
Nh r

10
Afijación proporcional

En la muestra aparece la misma proporción de cada estrato que aparece en la población. Es


decir,
nh Nh
=
n N
o equivalentemente

nh n
= =f
Nh N
para todo h = 1, . . . , L.
Es decir, la fracción de muestreo en cada estrato es la misma y es igual a la fracción de

muestreo global. El valor de los pesos o ponderaciones de cada estrato se extraen de la muestra:

Nh nh
Wh = =
N n

En este caso, para la media y el total,


L
b̄ = 1
X
X nh X

h
n h=1
L
1 X b̄
X =
b nh X h
f h=1

Y las varianzas correspondientes son


L
1−f X
V (X) =
b̄ Wh Sh2
n h=1
L
1−f X
V (X)
b = Nh Sh2
f h=1

La afijación uniforme es un caso particular de la afijación proporcional, cuando se toma


N
Nh = .
L

11
Afijación óptima

Si las Sh2 son aproximadamente iguales la asignación proporcional es la más recomendable,


pero si varı́an mucho es mejor la afijación óptima. Cuanto mayor sea Sh2 mayor será la proporción
de unidades que se deben tomar del estrato h.

Proposición

La función de coste se define como


L
X
C = C0 + Ch nh
h=1

siendo C0 un coste fijo del muestreo y Ch el coste de muestrear una unidad en el estrato h.
La varianza de la media es mı́nima (fijando un valor de coste C ∗ ) y el coste es mı́nimo
(fijando una varianza de la estimación de la media V ∗ ) cuando

Wh Sh
nh ∝ √
Ch
o equivalentemente
Nh Sh
nh ∝ √
Ch
Demostración:

El problema consiste en calcular el mı́nimo

mı́nV (X)

nh

sujeto a la restricción de que


L
X
C0 + nh Ch = C ∗
h=1

Se utiliza el método de los multiplicadores de Lagrange.

Se define la función
L L
! " L
#
X W 2S 2
h h
X W 2S 2
h h
X

ϕ(nh , λ) = − + λ C0 + nh Ch − C
h=1
nh h=1
Nh h=1

Se toma la derivada
∂ Wh2 Sh2
ϕ(nh , λ) = − 2 + λCh = 0
∂nh nh

12
De donde se deduce que

Nh Sh
nh = √ ⇒
λCh
Nh Sh
nh ∝ √
Ch

Si se plantea el problema ahora como

mı́n C
nh

sujeto a la restricción de que


L L
X W 2S 2 X W 2S 2
h h
− h h
=V∗
h=1
nh h=1
Nh

Entonces se define la función


L
! " L L
#
X X W 2S 2 X W 2S 2
ϕ(nh , λ) = C0 + nh Ch +λ h h
− h h
−V∗
h=1 h=1
nh h=1
Nh

∂ W 2S 2
ϕ(nh , λ) = Ch − λ h2 h = 0
∂nh nh
de donde
p
λWh2 Sh2
nh = ⇒
Ch
Wh Sh
nh ∝ √
Ch

Valores exactos de nh

Estos valores dependen de cual de las dos condiciones se tienen que verificar.
Si se cumple la primera condición
L
X
C0 + nh Ch = C ∗
h=1

entonces
(C ∗ − C0 )Nh Sh

Ch
nh = L
P √
Nh Sh Ch
h=1

En el segundo caso, si
L L
X W 2S 2 X W 2S 2
h h
− h h
=V∗
h=1
nh h=1
Nh

13
entonces
PL √
Nh Sh Nl Sl Cl
nh =  l=1
√ L

2
P
Ch N 2 V ∗ + Nh Sh
h=1

Observaciones: Con la afijación óptima se toma una muestra más grande en un estrato si:

1. El estrato es más grande

2. La variabilidad del estrato es mayor.

3. El muestreo en el estrato es más barato.

Afijación de Neyman

En el caso de que no haya diferencias entre los costes de un estrato a otro (Ch = c para
todo h = 1, . . . , L) se tiene un caso particular de la afijación óptima con lo cual

C = C0 + nc,

Es decir, el coste total solo depende de n y no de cuál sea la afijación y no se impone ninguna

restricción en cuanto a quienes sean los nh .


La fijación óptima de Neyman resulta ser

Nh Sh
nh ∝ √ = Nh Sh
Ch

y la asignación óptima para un coste fijo C ∗ se convierte en una asignación óptima para un n
fijo (si dan C ∗ , C0 y c están dando n).

Ası́, imponiendo que


L
X
nh = n
h=1

se obtiene
Nh Sh
nh = n L
P
Nl Sl
l=1

Observación: No tiene sentido fijar V ∗ y calcular nh para que C sea mı́nima, pues C no
depende de nh .

14
En la afijación de Neyman la varianza de la media es
L
!2 L
  1 X 1 X
V X
b̄ = Wh Sh − Wh Sh2
n h=1
N h=1

Y la varianza del total es


L
!2 L
    1
ˆ =
X X
b = N 2 V X̄
V X Nh Sh − Nh Sh2
n h=1 h=1

Efectos debidos a la estimación de la asignación de Neyman

En la práctica en muy pocas ocasiones se conocen los valores de las cuasivarianzas S2h

∀h = 1, . . . , L pero podemos sustituirlas por sus estimaciones Sbh2 (h = 1, . . . , L).


Si denotamos por n
bh los tamaños muestrales obtenidos sustituyendo cada Sh por su estima-
ción insesgada Sbh , es decir
Wh Sbh
n̂h = n L
P
Wh Sbh
h=1

Entonces la varianza para X


b̄ es

L L
X 1 2 2 1 X
V (X)
b̄ = Wh Sh − Wh Sh2
h=1
n
b h N h=1

El problema que se plantea en la práctica es calcular cuánto se incrementa la varianza al

sustituir el valor correcto nh por el de la aproximación n


bh (h = 1, . . . , L).
Si se denomina M la desviación relativa máxima entre los nh :

| nh − nbh |
M = máx
h=1,...,L n
bh

entonces, el aumento relativo de la varianza será


b̄ − V (X)
VAprox (X) b̄
N ey
≤ M2
V (X)b̄
N ey

Esta cota M es bastante alta.


Ası́, si se incrementa la desviación relativa entre los nh entonces a su vez aumenta la varianza.

Por ejemplo, si M = 0,2 entonces el aumento proporcional de la varianza será de M 2 = 0,04,


es decir, del 4 %.

15
Formación de estratos

La elección de estratos homogéneos es el punto fundamental del muestreo estratificado. En


la práctica muchas veces viene ya determinados por razones históricas debido a encuestas que
se realizan con una periodicidad determinada, y la experiencia hace que se sepa de antemano

los valores que sirven de frontera entre un estrato y otro. No obstante la primera vez que se
realiza un estudio es preciso que consideremos algún procedimiento que nos permita construir
estratos

Criterios para formar estratos

Puesto que a los estratos le pedimos la condición de homogeneidad, en general debemos


considerar una variable auxiliar de forma que reproduzca la variabilidad de la variable en
estudio. Usualmente la variable auxiliar es la variable de estudio observada en una situación

anterior, o una variable muy correlacionada con la variable en estudio.


En general el número de estratos debe ser como mucho n2 , pues para que sea posible estimar
la varianza en los estratos, el número de observaciones deberá ser nh ≥ 2.

Una vez determinado el número de estratos hay que definirlos; para ello hay diversos pro-
cedimientos basados en una variable auxiliar (o en la variable en estudio).
Entre ellos, se encuentran:

Regla de Dalenius-Hodges: también conocido como regla de acumulación de la raı́z cuadrada


de la frecuencia. Los estratos se definen de forma que la acumulación de la raı́z cuadrada de la
frecuencia sea constante.

Regla de Ekman: los extremos de los estratos se determinan de modo que el producto del
peso del estrato por su rango de variación sea constante, es decir,
 
Wh máx {Xhi } − mı́n {Xhi } = cte
i i

Regla de Dalenius-Gurney: los extremos de los estratos se determinan de forma que el

producto del peso del estrato por la cuasidesviación tı́pica sea constante, es decir,

Wh Sh = cte

16
Estos criterios tienen todos su base en que optimizan la dispersión de la varianza en los

estratos de forma que se tenga más homogeneidad dentro de ellos.

Ejemplo

Un investigador desea estimar el promedio anual de ventas para 56 empresas. Se encuentran


disponibles datos de frecuencias en una clasificación por incremento de 50.000 unidades y se

presentan en la tabla siguiente:

√ √
Ingresos Frecuencias Frecuencias Frecuencias Acumuladas
100-150 11 3,32 3,32
150-200 14 3,74 7,06
200-250 9 3,00 10,06
250-300 4 2,00 12,06
300-350 5 2,24 14,30
350-400 8 2,83 17,13
400-450 3 1,73 18,86
450-500 2 1,41 20,27

¿Cómo podemos asignar las empresas a tres estratos?

Utilizando el criterio del método acumulativo de la raı́z cuadrada de las frecuencias cons-
truimos la columna de la raı́z cuadrada de las frecuencias y luego construimos la columna de

las acumuladas siendo el T otal = Acumuladas Ni = 20,27.
Entonces dividiendo entre 3,
20,27
= 6,76
3
de modo que los lı́mites de los estratos deben estar lo más cerca posible de 6,76 y 2 × (6,76) =

13, 52.
En consecuencia, los estratos serán:

(100, 200] ; (200, 350] ; (350, 500]

17
Comparación entre distintas afijaciones y el m.a.s.

Se puede comparar la ganancia en precisión que se consigue con el muestreo estratificado


en relación al m.a.s.
Pero no es cierto que cualquier diseño estratificado dé una varianza menor que un muestreo

aleatorio simple. Si los nh están muy lejos de los que proporciona la afijación óptima, no se
obtiene niguna mejora con respecto al error.

Teorema

Supongamos que fh son muy pequeños y en consecuencia 1 − fh ≈ 1, para todo h = 1, . . . , L

y consideremos el estimador de la media poblacional con un muestreo aleatorio estratificado


L
b = XW X
X b
h h
h=1

entonces se verifica que:


     
b ≤V
VN ey X prop X ≤ Vmas X
b b

Demostración:
Se tiene que
2
b = 1 − f S2 = N − n ≃ S
Vmas (X)
n nN n
L L
  1−f X
2 1 X
Vprop Xb = Wh Sh ≃ Wh Sh2
n h=1 n h=1
L
!2 L L
!2
  1 X 1 X 1 X
VN ey Xb = Wh Sh − Wh Sh2 ≃ Wh Sh
n h=1 N h=1 n h=1

En consecuencia, teniendo en cuenta el análisis de la varianza realizado anteriormente,


L L
2
X 2 X
σ = Wh X h − X + Wh σh2
h=1 h=1

y utilizando

N −1 2
σ2 = S ≃ S2
N
σh2 ≃ Sh2

por lo tanto podemos aproximar


L L
X 2 X
S2 ≃ Wh X h − X + Wh Sh2
h=1 h=1

18
L L
1−f X 2 1−f X 2
Vmas (X) =
b Wh Sh + Wh X h − X ≃
n h=1 n h=1
L
b + 1 − f X W X − X 2
Vprop (X) h h
n h=1
el segundo sumando siempre es positivo, por lo que obtenemos
   
b ≤V
Vprop X mas X
b

Análogamente,
L L
!2
    1X 1 X
Vprop X − VN ey X =
b b Wh Sh2 − Wh Sh =
n h=1 n h=1
 !2 
L L
1 X X
Wh Sh2 − Wh Sh 
n h=1 h=1

llamando
L
X
S̄ = Wh Sh
h=1
se puede observar que
L L
!2 L
X X X
Wh Sh2 − Wh Sh = Wh Sh2 − S̄ 2 =
h=1 h=1 h=1
L
X 2
Wh Sh − S̄
h=1

de modo que
    1X L
b −V 2
Vprop X N ey X
b = Wh Sh − S̄
n h=1
con lo que obtenemos
   
b ≤V
VN ey X prop X
b

Observación: Las condiciones establecidas en el teorema equivalen a que la extracción de


unidades en los estratos es con reemplazamiento.

Observación: En general no es cierto que cualquier muestra estratificada de lugar a una

varianza más pequeña en comparación con una muestra aleatoria simple.


La relación entre m.a.s. y m.a.e. con afijación proporcional indica que la ganancia en preci-
sión con este, será mayor cuanto mayor sea
L
X 2
Wh X h − X
h=1

19
que mide la heterogeneidad entre los estratos. Es decir, la estratificación está justificada cuando

ese término es grande.


En el caso de la afijación de Neyman, es mejor usarla dependiendo del valor del término
L
X 2
Wh Sh − S̄
h=1

que muestra si la variación dentro de cada estrato (Sh ) cambia de uno a otro. Si sucede esto,
entonces la ganancia de la afijación de Neyman será apreciable con respecto a la afijación

proporcional.

Tamaño de la muestra

Se trata de calcular el tamaño global n de la muestra, cuando queremos estimar X̄ y fijamos


 
un error de muestreo e = σ X b̄ .

Se puede demostrar que


L W2
h 2
P
Sh
h=1 w h
n= L
e2 + N1 Wh Sh2
P
h=1

donde
nh
wh =
n
son los pesos muestrales.

Con afijación proporcional

En este caso
nh Nh
wh = = = Wh
n N
de donde se deduce que
L
Wh Sh2
P
N
h=1
n= L
Wh Sh2
P
N e2 +
h=1

Con afijación óptima de Neyman

En este caso
nh 1 Nh Sh Nh Sh
wh = = n L = L
n n P P
Nk Sk Nk Sk
k=1 k=1

20
de donde se deduce que
 L
2
P
N Wh Sh
h=1
n= L
Wh Sh2
P
N e2 +
h=1

Ejemplo

Una población se divide en dos estratos de igual tamaño de los que se obtienen muestras
aleatorias simples. En el supuesto de afijación proporcional y una fracción de muestreo global
igual al 5 %, ¿qué tamaño n de muestra es necesario tomar para obtener una desviación tı́pica

para el estimador de la media igual a 0.5? Un estudio piloto ha mostrado los siguientes valores
para las cuasivarianzas de los estratos: S12 = 25 y S22 = 15.
N1 N2 1
N1 = N2 ⇒ W1 = N
= N
= 2
= W2 .

Por otro lado, en la afijación proporcional


L
  1−f X
V X =
b̄ Wh Sh2
n h=1

f = 0,05 de modo que

(1 − 0,05) 1
0,52 = (25 + 15) ⇒
n 2

0,95 · 40
n= = 76
0,25 · 2

Con lo que al tener una afijación proporcional, n1 = 38 y n2 = 38.

Ejemplo

En una población constituida por 1500 familias de cierta localidad, se desea estimar los

gastos de alimentación por familia, usando una muestreo aleatorio estratificado.


Para estratificar la población se utiliza la variable ingresos anuales que es una variable
correlacionada con la variable en estudio.

Se construyen tres estratos:

Estrato 1: Familias con ingresos bajos. N1 = 517

Estrato 2: Familias con ingresos medios. N2 = 633


Estrato 3: Familias con ingresos altos. N3 = 350

21
Supongamos que se extrae una m.a.e de tamaño n = 30 con n1 = 10, n2 = 13 y n3 = 7.

Realizando el muestreo en cada estrato, se obtiene:

 
Estrato 1: X̄1 = 6866,7 y V X̄1 = 74278,65
 
Estrato 2: X̄2 = 8244,54 y V X̄2 = 21981,05
 
Estrato 3: X̄3 = 10041,29 y V X̄3 = 105279,05

Entonces

X 1
X
b̄ = Wh X
b̄ =
h [517 · 6866,7 + 633 · 8244,54 + 350 · 10041,29] =
h
1500
8188,88

Por otro lado

L
  X   1  2
Wh2 V X 517 · 74278,65 + · · · + 3502 · 105279,05 =

Vb X
b̄ = b̄ =
h
h=1
1500
18469,56

Se calcula ahora la correspondiente afijación óptima de Neyman.

Supongamos ahora que n = 40. Como no se conocen los Sh2 , utilizamos las correspondientes
Sx2 de la variable X auxiliar que se refiere a los ingresos, siendo estos:

S1 = 2138,3
S2 = 1683,58
S3 = 2334,79

Ası́,
Sh Nh
nh = n P
Nh Sh
h

de modo que

X
Nh Sh = 517 · 2138,3 + 633 · 1683,58 + 350 · 2334,79 =
h

2988243,60

22
40 · 2138,03 · 517
n1 = = 14,8 ⇒ n1 = 15
2988243,60
40 · 1683,58 · 633
n2 = = 14,27 ⇒ n2 = 14
2988243,60
40 · 2334,79 · 350
n3 = = 10,93 ⇒ n3 = 11
2988243,60

Con este tamaño muestral y la afijación de Neyman, ¿qué error de muestreo se obtiene?

!2
b̄ = e2 = 1 1 X
  X
V X Wh Sh − Wh Sh2
n h
N h
Ası́,
 2
2 1 517 350
e = 2138,03 + · · · + 2334,79 −
40 1500 1500

 
1 517 2 350 2
2138,03 + · · · + 2334,79 = 96522,03
1500 1500 1500

Ası́

e = 310,68

Postestratificación o estratificación a posteriori

En muchas situaciones, al considerar el marco poblacional, no se dispone de la información

para la construcción de los estratos, o incluso conocidos estos, es difı́cil identificar si una unidad
poblacional pertenece o no a un estrato dado, hasta que no se le pregunte a la persona en
cuestión.

Ejemplos de estas situaciones se presentan cuando se analizan caracterı́sticas personales


como religión, ideas polı́ticas, etc; o en muestreos en que las encuestas se realizan por teléfono.
En estos casos podemos obtener una muestra aleatoria simple de tamaño n de la población,

y si tenemos L estratos, U1 , . . . , UL , podemos asignar a posteriori las unidades muestrales a


dichos estratos y de este modo obtener estimaciones más precisas.
Observemos que en este caso los tamaños muestrales en cada estrato nh son variables alea-

torias para h = 1, . . . , L, pues varı́an de una muestra a otra. Ello produce un aumento del error
de la estimación.

23
Se extrae una m.a.s. de tamaño n de la población y se puede asignar o clasificar nh en el

estrato h una vez que la muestra ha sido extraı́da. De este modo nh para h = 1, . . . , L son v.a.
que suman n.
La distribución de los tamaños muestrales en cada estrato es una variable aleatoria hiper-

geométrica HG(N, Nh , n), es decir,


  
Nh N − Nh
k n−k
P (nh = k) =  
N
n

para k = 0, 1, . . . , n, de modo que

Nh
E(nh ) = n
N  
Nh Nh N − n
V (nh ) = n 1−
N N N −1

Supongamos que se quiere estimar X y que Wh son conocidos.


Un estimador insesgado de X será
LX
X
b
P ost = Wh X
b
h
h=1

donde
b = 1 XX
X h k
nh k∈s
h

La varianza del estimador, se demuestra que es


L
 1−f X L

2 1−f X
V X P ost ≈
b Wh Sh + (1 − Wh )Sh2
n h=1 n2 h=1

Se puede observar que la varianza aproximada tiene dos componentes: La primera compo-
nente coincide con la varianza de la estimación de la media X
b mediante muestreo aleatorio

estratificado con afijación proporcional.

La segunda componente refleja la variación adicional introducida por la postestratificación,


siendo en comparación menor a la anterior componente para valores grandes de n.

Observación: hay textos en que teniendo en cuenta un desarrollo de Taylor se llega a que
L L
  1−f X 1−f X S2
V X P ost ≈
b 2
Wh Sh + Wh (1 − Wh ) h
n h=1 n h=1 nh

24
Ejemplo con R

Se simulan unos datos que hacen el papel de población.

# Datos artificiales
set.seed (666)
unosdatos = rbind ( matrix ( rep ( " nc " ,530) , 530 , 1 , byrow = TRUE ) ,
matrix ( rep ( " sc " ,270) , 270 , 1 , byrow = TRUE ))
unosdatos = c b in d . d a t a . f r a m e ( unosdatos , c ( rep (1 ,350) , rep (2 ,150) , rep (3 ,50) , rep (1 ,100) ,
rep (2 ,150)) , rnorm (800 ,100 ,10))

names ( unosdatos ) = c ( " provincia " , " region " , " ingresos " )
# head ( unosdatos )

Se muestran cuantas observaciones hay en cada estrato.


table ( unosdatos $ region )

1 2 3
450 300 50

Tamaños de los estratos en las variables n1, n2 y n3 que luego definen los pesos.

n1 = table ( unosdatos $ region )[[1]]


n2 = table ( unosdatos $ region )[[2]]
n3 = table ( unosdatos $ region )[[3]]

Se extrae una muestra aleatoria de cada estrato. Se usa la librerı́a sampling.

library ( sampling )
s = strata ( unosdatos , " region " , size = c (50 ,30 ,20) , method = " srswor " )

# Se extraen las observaciones de la poblaci ó n original


strat _ cosa = getdata ( unosdatos , s )

Se genera una nueva variable que contiene al lado de cada elemento el tamaño del estrato
al que pertenece y se calculan los pesos que varı́an según cada estrato.

strat _ cosa $ pobtamano = with ( strat _ cosa ,


ifelse ( region == " 1 " , n1 , ifelse ( region == " 2 " ,n2 , n3 )))

strat _ cosa $ mispesos = 1 / strat _ cosa $ Prob

Se define el diseño de muestreo estratificado según la librerı́a survey.

library ( survey )

dstrata = svydesign ( id =∼1 , weights =∼mispesos , fpc =∼pobtamano , strat =∼region ,


data = strat _ cosa )

summary ( dstrata )

25
Stratified Independent Sampling design
svydesign ( id = ∼1 , weights = ∼mispesos , fpc = ∼pobtamano ,
strat = ∼region , data = strat _ cosa )

Probabilities :
Min. 1 st Qu. Median Mean 3 rd Qu. Max.
0 .1000 0 .1000 0 .1111 0 .1656 0 .1111 0 .4000

Stratum Sizes :
1 2 3
obs 50 30 20
design.PSU 50 30 20
actual.PSU 50 30 20

Population stratum sizes ( PSUs ) :


1 2 3
450 300 50

Data variables :
[1] " provincia " " ingresos " " region " " ID _ unit " " Prob " " Stratum "
[7] " pobtamano " " mispesos "

# Estimaci ó n de la media global y su error est á ndar


svymean (∼ingresos , dstrata , na.rm = TRUE )

mean SE
ingresos 99 .294 0 .9384

# Medias por estratos


svyby (∼ingresos , ∼region , dstrata , svymean )

region ingresos se
1 1 98 .33096 1 .340274
2 2 100 .69394 1 .455315
3 3 99 .55878 1 .922938

# Estimaci ó n del total global y su error est á ndar


svytotal (∼ingresos , dstrata , na.rm = TRUE )

total SE
ingresos 79435 750 .74

# Cuantiles de la distribuci ó n y sus intervalos de confianza


svyquantile (∼ingresos , quantile = c (0 .25 ,0 .5 ,0 .75 ) ,
design = dstrata , na.rm = TRUE , ci = TRUE )

$ quantiles
0 .25 0 .5 0 .75
ingresos 93 .82295 99 .21559 105 .5731

$ CIs
, , ingresos

0 .25 0 .5 0 .75
( lower 91 .52617 97 .12242 103 .1760
upper ) 95 .18418 101 .80955 107 .6897

26
svyhist (∼ingresos , dstrata , main = " Sample " , col = " pink " )

27
svyboxplot ( ingresos ∼ as.factor ( region ) , dstrata , col = " peachpuff " )

28
plot ( svysmooth (∼ingresos , design = dstrata ))

29

También podría gustarte