0% encontró este documento útil (0 votos)
179 vistas28 páginas

3 MSA Inter Conf

El documento describe los intervalos de confianza y cómo se utilizan para indicar la precisión de las estimaciones obtenidas en una encuesta por muestreo. Explica cómo se calculan los intervalos de confianza para la media poblacional y provee un ejemplo numérico para estimar el número total de firmas en una petición y calcular el intervalo de confianza del 80%. También discute brevemente cómo se determina el tamaño de muestra necesario para estimar un parámetro fijando la precisión y confiabilidad deseadas.

Cargado por

Ivi Downham
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
179 vistas28 páginas

3 MSA Inter Conf

El documento describe los intervalos de confianza y cómo se utilizan para indicar la precisión de las estimaciones obtenidas en una encuesta por muestreo. Explica cómo se calculan los intervalos de confianza para la media poblacional y provee un ejemplo numérico para estimar el número total de firmas en una petición y calcular el intervalo de confianza del 80%. También discute brevemente cómo se determina el tamaño de muestra necesario para estimar un parámetro fijando la precisión y confiabilidad deseadas.

Cargado por

Ivi Downham
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Intervalos de confinaza y tamaños de muestra en el

MSA

Bulmaro Juárez Hernández

Otoño de 2020

Bulmaro Juárez Hernández Intervalos de confinaza y tamaños de muestra en el MSA Otoño de 2020 1 / 26
Intervalos de confianza

Al realizar una encuesta por muestreo, no basta con informar sobre la


altura promedio de los árboles de cierto bosque o la proporción en la
muestra de los votantes con la intención de votar por el candidato X en
una elección futura. Sino también se debe proporcionar una indicación de
la exactitud de las estimaciones que se obtienen.
En estadı́stica se utilizan los intervalos de confianza (IC) como una
forma de indicar la exactitud de una estimación.
En el muestreo de probabilidad, a partir de una población finita, sólo existe
un número finito de muestras posibles, además de conocer la probabilidad
con la que se puede elegir cada una de ellas, de forma que si, se pudieran
generar todas las muestras posibles a partir de la población, se podrı́a
calcular el nivel de confianza exacto para un procedimiento de IC.

Bulmaro Juárez Hernández Intervalos de confinaza y tamaños de muestra en el MSA Otoño de 2020 2 / 26
Dado que, en la mayor parte de las encuestas por muestreo, sólo se tiene
una población finita. Para utilizar resultados asintóticos en el muestreo de
poblaciones finitas, se supone que la población es a su vez parte de una
superpoblación mayor; que esta superpoblación es parte de una
superpoblación mayor, y ası́ sucesivamente, hasta que las superpoblaciones
sean tan grandes como sea necesario.
Ası́, la población bajo estudio está contenida en una serie creciente de
poblaciones finitas, y esta contención puede dar propiedades de
consistencia y normalidad asintótica.
Hájek (1960) demuestra un teorema del lı́mite central para el MSA sin
reemplazo. El teorema indica que, si se cumplen ciertas condiciones de
regularidad y si n, N y N − n son “suficientemente grandes”, entonces la
distribución muestral de

ȳn − Y
T =p SN
1 − Nn √ n
es aproximadamente normal estándar.
Bulmaro Juárez Hernández Intervalos de confinaza y tamaños de muestra en el MSA Otoño de 2020 3 / 26
IC para la media para muestras grandes

Un IC de 100(1 − α) % para una muestra “grande” para la media


poblacional es
 r r 
n SN n SN
ȳn − zα/2 1 − √ , ȳn + zα/2 1 − √
N n N n
donde zα/2 es el percentil (1 − α/2) de la distribución normal estándar.
Como SN no se conoce, entonces, para muestras grandes se sustituye por
sn , con un ligero cambio en la aproximación.
Ası́ que el IC de 100(1 − α) % para la media poblacional está dado por
 r r 
n sn n sn
ȳn − zα/2 1 − √ , ȳn + zα/2 1 − √
N n N n
o bien por  
ȳn − zα/2 sȳn , ȳn + zα/2 sȳn

Bulmaro Juárez Hernández Intervalos de confinaza y tamaños de muestra en el MSA Otoño de 2020 4 / 26
Ejemplo
Se recabaron firmas para una petición en 676 hojas. Cada hoja tenı́a
espacio suficiente para 42 firmas pero en muchas de las hojas se recabó un
número menor. Se contó el número de firmas por hoja en una muestra
aleatoria de 50 hojas (7 % del total aproximadamente), los resultados se
muestran en la siguiente Tabla.

Tabla: Resultados para una muestra de 50 hojas de petición yi =número de


firmas; fi =frecuencia.
yi 42 41 36 32 29 27 23 19 16 15
fi 23 4 1 1 1 2 1 1 2 2
yi 14 11 10 9 7 6 5 4 3
fi 1 1 1 1 1 3 2 1 1 T:50

Se desea estimar el número total de firmas para la petición y el IC del


80 %.

Bulmaro Juárez Hernández Intervalos de confinaza y tamaños de muestra en el MSA Otoño de 2020 5 / 26
Ejemplo
Se recabaron firmas para una petición en 676 hojas. Cada hoja tenı́a
espacio suficiente para 42 firmas pero en muchas de las hojas se recabó un
número menor. Se contó el número de firmas por hoja en una muestra
aleatoria de 50 hojas (7 % del total aproximadamente), los resultados se
muestran en la siguiente Tabla.

Tabla: Resultados para una muestra de 50 hojas de petición yi =número de


firmas; fi =frecuencia.
yi 42 41 36 32 29 27 23 19 16 15
fi 23 4 1 1 1 2 1 1 2 2
yi 14 11 10 9 7 6 5 4 3
fi 1 1 1 1 1 3 2 1 1 T:50

Se desea estimar el número total de firmas para la petición y el IC del


80 %.

Bulmaro Juárez Hernández Intervalos de confinaza y tamaños de muestra en el MSA Otoño de 2020 5 / 26
Ejemplo
Se recabaron firmas para una petición en 676 hojas. Cada hoja tenı́a
espacio suficiente para 42 firmas pero en muchas de las hojas se recabó un
número menor. Se contó el número de firmas por hoja en una muestra
aleatoria de 50 hojas (7 % del total aproximadamente), los resultados se
muestran en la siguiente Tabla.

Tabla: Resultados para una muestra de 50 hojas de petición yi =número de


firmas; fi =frecuencia.
yi 42 41 36 32 29 27 23 19 16 15
fi 23 4 1 1 1 2 1 1 2 2
yi 14 11 10 9 7 6 5 4 3
fi 1 1 1 1 1 3 2 1 1 T:50

Se desea estimar el número total de firmas para la petición y el IC del


80 %.

Bulmaro Juárez Hernández Intervalos de confinaza y tamaños de muestra en el MSA Otoño de 2020 5 / 26
Solución: En este caso, la unidad de muestreo es una hoja y las
observaciones, yi , son el número de firmas por hoja. Como
aproximadamente la mitad de las hojas tenı́an el número máximo de
firmas, los datos se presentan como una distribución de frecuencias.
Obsérvese que la distribución real difiere mucho de la normal, colocándose
la frecuencia mayor en el extremo superior izquierdo. No obstante, basados
en la experiencia, existe razón para creer que las medias de muestras de 50
observaciones se distribuyen aproximadamente como una normal.

Ası́, de los datos en la tabla se obtiene:


19
X 19
X 19
X
n= fi = 50, y= fi yi = 1471, fi yi2 = 54, 497.
i=1 i=1 i=1

Por lo tanto, la estimación del total de firmas es:

(676)(1, 471)
Yb = N ȳn = = 19, 888
50

Bulmaro Juárez Hernández Intervalos de confinaza y tamaños de muestra en el MSA Otoño de 2020 6 / 26
La varianza muestral sn es

" n # " n Pn #
( f y )2
1 X 1 X i i
sn2 = fi (yi − ȳn )2 = fi yi2 − P i=1
n
n−1 n−1 i=1 fi
i=1 i=1
(1471)2
 
1
= 54497 − = 229.0
49 50

Y un IC del 80 % está dado por:


 √ √ 
(1.28)(676) 1 − 0.074(15.13) (1.28)(676) 1 − 0.074(15.13)
19, 888 − √ , 19, 888 + √
50 50

Esto es: [18, 107, 21, 669].

Un conteo completo demostró que habı́a 21,045 firmas.

Bulmaro Juárez Hernández Intervalos de confinaza y tamaños de muestra en el MSA Otoño de 2020 7 / 26
Tamaño de muestra para estimar Y N

Uno de los problemas básicos en la encuesta por muestreo es determinar el


tamaño de muestra necesario para estimar el parámetro de ı́nteres de tal
forma que se cumplan cierta precisión y cierta confiabilidad. Ası́, uno de
los criterios que se usan para determinar el tamaño de muestra necesario
para estimar un parámetro es mediante la fijación de la precisión y la
confiabilidad del estimador. Donde,

La precisión se refiere al máximo alejamiento o error entre el


estimador y el parámetro correspondiente que el investigador esta
dispuesto a aceptar, también es llamado margen de error.
La confiabilidad está dada por la seguridad o confianza que se desea
tener de que el estimador conserve la precisión deseada.

Bulmaro Juárez Hernández Intervalos de confinaza y tamaños de muestra en el MSA Otoño de 2020 8 / 26
Una expresión que relaciona estos conceptos y que es obtenida del
concepto de intervalo de confianza, está dada por:

d = zα/2 · sȳn , (1)

donde:
d =precisión (máximimo error de muestreo que el investigador esta
dispuesto a cometer).

zα/2 = percentil o cuantil de nivel α/2 de la distribución normal estándar.

sȳn =estimación de la desviación estándar de la media muestral.

Bulmaro Juárez Hernández Intervalos de confinaza y tamaños de muestra en el MSA Otoño de 2020 9 / 26
Ası́, elevando al cuadrado ambos lados de (1) y considerando que
(N − n)sn2
sȳ2n = , se obtiene
nN
2 Ns 2 − z 2 ns 2
zα/2 n α/2 n
d2 = ⇒ nNd 2 + nzα/2
2
sn2 = Nzα/2
2
sn2 .
nN
Esto es,
2 s2
Nzα/2 n
n= 2 s2
.
Nd 2 + zα/2 n

2 s2
zα/2 n
O bien si se considera n0 = 2
, que representa el tamaño de la
d
muestra para estimar la media poblacional cuando la población es infinita
o muy grande en el MSA, entonces se tiene que,
n0
n= .
1 + nN0

Bulmaro Juárez Hernández Intervalos de confinaza y tamaños de muestra en el MSA Otoño de 2020 10 / 26
Tamaño de muestra para estimar Y N
n0
n= ,
1 + nN0
donde,
zα/2 sn2
n0 = .
d2
Para determinar el tamaño de muestra adecuado, es necesario estimar la
varianza (desviación estándar), a continuación se dan algunas
recomendaciones .
Se pueden utilizar cantidades de una muestra al hacer una prueba
preliminar de la encuesta, posiblemente éste es el mejor método, pues
la prueba preliminar debe ser semejante a la encuesta que se llevará a
cabo. La prueba preliminar o muestra piloto, es una pequeña muestra
extraı́da para obtener información y sirve de guı́a para el diseño de la
encuesta principal, y naturalmente puede servir para estimar las
cantidades necesarias para establecer el tamaño de la muestra para
realizar la encuesta principal.
Bulmaro Juárez Hernández Intervalos de confinaza y tamaños de muestra en el MSA Otoño de 2020 11 / 26
Utilice estudios anteriores o datos disponibles en las referencias. Es
posible hallar estimaciones de varianzas ya publicadas en estudios
relacionados con los que se desean llevar a cabo; se pueden utilizar
como punto de partida para estimar el tamaño de la muestra.
En ocaciones, una distribución hipotética de los datos puede
proporcionar la varianza. Por ejemplo, si se piensa que la población
tiene una distribución normal, es claro que no se conoserá la varianza,
pero si se tiene una idea del rango de los datos, entonces se puede
rango rango
estimar la desviación estándar por medio de o por ya
4 6
que aproximadamente el 95 % de los valores de una población normal
están a una distancia de dos desviaciones estándar de la media y el
99.7 % de los valores están a menos de tres desviaciones estándar de
la media.

Bulmaro Juárez Hernández Intervalos de confinaza y tamaños de muestra en el MSA Otoño de 2020 12 / 26
Ejemplo.
En un rancho donde se engordan novillos para carne, se desea estimar el
peso promedio por novillo. Se sabe que la varianza estimada es sn2 = 900.
Se desea estimar el peso medio por novillo con una precisión de ±10Kg
esto implica que conocido el peso promedio para los novillos de la muestra,
ȳn , se tendrá la seguridad de que, el peso promedio verdadero, se alejará
del de la muestra en no más de 10Kg, con una confiabiliadad del 95 %.
¿Qué tamaño de muestra se necesitará, para que se cumplan los
requerimientos pedidos, si N = 300 novillos.

Solución: Se tiene,
(a) La precisión, d = 10kg; esto es, d 2 = 100kg 2 .
(b) Para una confiabilidad del 95 % se tiene que: zα/2 = z0.025 = 1.96;
2
esto es, z0.025 = 3.842.

Bulmaro Juárez Hernández Intervalos de confinaza y tamaños de muestra en el MSA Otoño de 2020 13 / 26
(c) Se sabe que: N = 300 y que sn2 = 900.
Con la información dada anteriormente, se calcula n0 , esto es
2 s2
zα/2 n (3.842)(900) 3, 457.8
n0 = = = ≈ 35,
d2 100 100
Ası́,
n0 35 35
n= n0 = 35
= ≈ 32.
1+ N 1 + 300 1.117
Esto es, el tamaño n de la muestra requerida será de 32 novillos cuando
N = 300.

Bulmaro Juárez Hernández Intervalos de confinaza y tamaños de muestra en el MSA Otoño de 2020 14 / 26
Ahora, ¿qué pasará con el tamaño de la muestra necesario para estimar la
media poblacional, si se aumenta el tamaño de la población, manteniendo
fijas, tanto la precisión, como la confiabilidad?

El efecto, se observa en la siguiente tabla:

Tabla: Efecto del tamaño de la población, sobre el tamaño de la muestra necesario


para estimar la media poblacional para precisión y confiabilidad constantes.
N n N n N n
300 31.3432 20000 34.9389 500000 34.9975
1000 33.8164 30000 34.9592 600000 34.9980
2000 34.3980 100000 34.9878 700000 34.9982
3000 34.5964 200000 34.9939 800000 34.9985
4000 34.6964 300000 34.9959 900000 34.9986
10000 34.8779 400000 34.9969 2000000 34.9994

Bulmaro Juárez Hernández Intervalos de confinaza y tamaños de muestra en el MSA Otoño de 2020 15 / 26
Puede notarse que el tamaño de la población tiene poco efecto en el
tamaño de la muestra, ya que a partir de N = 2000, el valor de n tomado
como el mı́nimo entero mayor o igual es el mismo. También se observa que
n → n0 cuando N → ∞.

Bulmaro Juárez Hernández Intervalos de confinaza y tamaños de muestra en el MSA Otoño de 2020 16 / 26
Factores que determinan el tamaño de la muestra

De la ecuación, que expresa el cálculo del tamaño de muestra para una


población infinita,
2 S2
zα/2 N
n0 = 2
,
d
se puede establecer el efecto de los factores que determinan el tamaño de
muestra n0 .
Tamaño de muestra en función de la Precisión
En la fórmula anterior para calcular el tamaño de muestra n0 se observa
que la precisión d aparece en el denominador, por lo que: si se desea una
precisión alta, entonces el valor de d será pequeño con lo cual se tendrá un
n0 con un valor relativamente grande, esto es, a medida que se aumenta la
precisión, se requerirá un mayor tamaño de muestra (n0 ).

Bulmaro Juárez Hernández Intervalos de confinaza y tamaños de muestra en el MSA Otoño de 2020 17 / 26
En el ejemplo del cálculo del tamaño de muestra para la estimación del
peso promedio de novillos, si se supone una población muy grande, para
una confiabilidad fija del 95 % y suponiendo que sn2 = 900, aumentando la
precisión se tienen los siguientes valores para n0 .

d (kg) n0
15 16
10 35
5 139
2 865

Observándose claramente que al exigir mayor precisión, se requiere de un


mayor tamaño de muestra.
Por lo que: a mayor precisión, mayor tamaño de muestra
(n0 ).

Bulmaro Juárez Hernández Intervalos de confinaza y tamaños de muestra en el MSA Otoño de 2020 18 / 26
Tamaño de muestra en función de la Confiabilidad.
En la ecuación que se viene analizando, la confiabilidad (1 − α) se expresa
en términos de zα/2 el cual se encuentra en el numerador, por lo que a
mayor confiabilidad se tendrá un mayor valor de zα/2 (considerado como el
percentil de cola derecha de la normal estándar), por lo tanto un valor
mayor de n0 . Para observar tal relación, se fijará sn2 = 900 y d = 10kg con
lo cual se obtienen los siguientes valores de n0 .

Confiabilidad( %) |zα/2 | n0
66 0.9542 9
80 1.2812 15
95 1.9600 35
99 2.5758 60

Bulmaro Juárez Hernández Intervalos de confinaza y tamaños de muestra en el MSA Otoño de 2020 19 / 26
Con lo que se concluye que a mayor confiabilidad (es decir, si se quiere
tener mayor seguridad de que el IC sea funcional, en el sentido de que
contenga al parámetro), se requerirá un tamaño de muestra mayor, con lo
que:

a mayor confiabilidad, mayor n0 .

Bulmaro Juárez Hernández Intervalos de confinaza y tamaños de muestra en el MSA Otoño de 2020 20 / 26
Tamaño de muestra en función de la variabilidad de la población.
La variabilidad de una población se mide a través de la varianza y ésta,
que se identifica como SN2 y que se estima por sn2 es un factor del
numerador de la ecuación para n0 , es por esto, que a mayor valor de sn2 se
tendrá un mayor valor de n0 .
Para el caso que se analiza, si se fija una confiabilidad 1 − α = 0.95, es
decir, |z0.025 | = 1.96 y d = 10kg, variando sn2 se tienen los siguientes
valores de n0 .

sn2 n0
800 31
900 35
1000 39
1500 58

Bulmaro Juárez Hernández Intervalos de confinaza y tamaños de muestra en el MSA Otoño de 2020 21 / 26
Lo cual implica que a mayor sn2 (es decir, mayor variabilidad en la
población), se requerirá un tamaño de muestra mayor, con lo que:

a mayor variabilidad (SN2 ), mayor n0 .

Bulmaro Juárez Hernández Intervalos de confinaza y tamaños de muestra en el MSA Otoño de 2020 22 / 26
Estimación del tamaño de la muestra cuando se conoce
el coeficiente de variación
También se puede expresar la precisión en términos del coeficiente de
variación (CV), Cȳn , dado que Cȳn es una medida de variabilidad, al igual
que Sȳn , sólo que CV es expresado en porcentaje. Ası́, se puede partir de la
siguiente igualdad de la precisión,
d = zα/2 ȳn Cȳn ;
esto es,
 n  CY2
d 2 = zα/2
2
ȳn2 Cȳ2n , donde Cȳ2n = 1 − ,
N n
SN
y CY = , representa el coeficiente de variación poblacional. De lo
Y
anterior, sustituyendo a Cȳ2n , se tiene

CY2  n
d 2 = zα/2
2
ȳn2 1− ,
n N
Bulmaro Juárez Hernández Intervalos de confinaza y tamaños de muestra en el MSA Otoño de 2020 23 / 26
de forma que al despejar n se llega a:
2 ȳ 2 C 2
Nzα/2 2 ȳ 2 C 2
zα/2
n Y n0 n Y
n= = , donde n 0 = .
2 ȳ 2 C 2
Nd 2 + zα/2 n Y 1 + nN0 d2
Que es el tamaño de muestra estimado para estimar la media poblacional
de una población finita en el MSA, usando el CV, para una precisión y
nivel de confianza dados.

En este caso, también se deben usar estimadores de SN y Y , con lo cual el


CV con el que se cálculo el tamaño de muestra es:
sn
CbY = .
ȳn

Bulmaro Juárez Hernández Intervalos de confinaza y tamaños de muestra en el MSA Otoño de 2020 24 / 26
Estimación del tamaño de la muestra cuando la
población es infinita o muy grande
Al estimar el tamaño de muestra necesario para que en el MSA se
satisfaga una precisión d y un nivel de confianza igual a 1 − α se tiene que
partir de la ecuación,
d 2 = zα/2
2
Sȳ2n . (2)
Ahora, para poblaciones infinitas o muy grandes, se tiene que

SN2
sȳ2n = .
n
Para mayor claridad se establece que, si N → ∞ entonces n → n0 . Por lo
que la expresión anterior resulta:

SN2
Sȳ2n = . (3)
n0

Bulmaro Juárez Hernández Intervalos de confinaza y tamaños de muestra en el MSA Otoño de 2020 25 / 26
Ahora, sustituyendo (3) en (2) y despejando n0 se tiene que, el tamaño de
muestra estimado para una población infinita o muy grande está dado por:
2 S2
zα/2 N
n0 = .
d2
Nótese que esta expresión de n0 es independiente del tamaño de la
población.
Por otra parte, se ha probado que, el tamaño de muestra estimado dadas
una precisión y confiabilidad deseadas para el MSA en una población
finita, está dada por
n0
n= .
1 + nN0
Ası́, para calcular n primero se cálcula n0 y si la fracción de muestreo
n0 1
fm = > entonces se procede al cálculo de n usando la fórmula
N 20
anterior, cuyo resultado será, naturalmente, el que se obtendrı́a mediante
el cálculo directo de n.
Bulmaro Juárez Hernández Intervalos de confinaza y tamaños de muestra en el MSA Otoño de 2020 26 / 26

También podría gustarte