0% encontró este documento útil (0 votos)
151 vistas15 páginas

Dise No de Muestreo Sistem Atico (IV) : Bulmaro Ju Arez Hern Andez

Este documento describe un estudio de muestreo sistemático para estimar el número de piezas defectuosas producidas por 13 máquinas. Se seleccionó una muestra de 1 de cada 5 piezas producidas. Suponiendo que la primera pieza de cada máquina era defectuosa y el resto correctas, se calculó la varianza del estimador de la proporción de piezas defectuosas y el coeficiente de correlación intramuestral. Se construyó una tabla de análisis de varianza y se determinó que la varianza del estimador de la proporción fue de 0

Cargado por

Ivi Downham
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
151 vistas15 páginas

Dise No de Muestreo Sistem Atico (IV) : Bulmaro Ju Arez Hern Andez

Este documento describe un estudio de muestreo sistemático para estimar el número de piezas defectuosas producidas por 13 máquinas. Se seleccionó una muestra de 1 de cada 5 piezas producidas. Suponiendo que la primera pieza de cada máquina era defectuosa y el resto correctas, se calculó la varianza del estimador de la proporción de piezas defectuosas y el coeficiente de correlación intramuestral. Se construyó una tabla de análisis de varianza y se determinó que la varianza del estimador de la proporción fue de 0

Cargado por

Ivi Downham
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Diseño de Muestreo Sistemático (IV)

Bulmaro Juárez Hernández

Otoño 2020

Bulmaro Juárez Hernández Diseño de Muestreo Sistemático (IV) Otoño 2020 1 / 15


Ejemplo (5)
En un proceso de control de calidad se trata de analizar la producción de
piezas en serie de trece máquinas. Para ello se controlan las piezas
producidas por las trece máquinas en el primer minuto de su
funcionamiento. La distribución de piezas producidas por cada máquina en
el primer minuto es la siguiente:
No. de Máquina 1 2 3 4 5 6 7 8 9 10 11 12 13
No. de Piezas producidas 5 5 4 2 5 4 5 4 3 4 4 3 2
Para estimar el número de piezas defectuosas en el proceso de producción
se realiza un muestreo sistemático 1 en 5, es decir, se selecciona una de
cada cinco piezas empezando por la primera pieza de la primer máquina
hasta que se agoten sus piezas , para pasar a continuación a la primer
pieza de la segunda máquina hasta que se agoten sus piezas, y ası́
sucesivamente hasta que se agoten todas las piezas de todas las máquinas.
Suponiendo que la primera pieza producida por cada máquina es
defectuosa y que todas las demás son correctas, se pide lo siguiente:

Bulmaro Juárez Hernández Diseño de Muestreo Sistemático (IV) Otoño 2020 2 / 15


Continuación
(a) Calcular la varianza del estimador de la proporción de piezas
defectuosas producidas por las máquinas y el valor del
coeficiente de correlación intramuestral. ¿Existirá ganancia
en precisión respecto a un muestreo irrestricto aleatorio con
fracción de muestreo del 20 % ¿Por qué? Cuantificarla.
Obtener la tabla del análisis de la varianza para la
producción del total.
(b) Estimar la varianza para cada muestra sistemática posible
según el procedimiento de muestreo propuesto. ¿Con qué
muestra sistemática se quedarı́a de tal forma que esta
represente mejor a toda la producción? ¿Existirá ganancia en
precisión si se estiman las varianzas utilizando
estratificación? Dar la estimación de la proporción de piezas
defectuosas producidas por las máquinas.

Bulmaro Juárez Hernández Diseño de Muestreo Sistemático (IV) Otoño 2020 3 / 15


Si se define una variable dicotómica A a la que se le asigna el valor 1 para
las piezas defectuosas y el valor 0 para las piezas correctas, y se clasifican
las 50 piezas en 10 filas de 5 piezas cada una (muestreo sistemático 1 en 5)
siguiendo el orden del enunciado del problema, se tendrá la siguiente tabla:
1
1 0 0 0 0 5
1
1 0 0 0 0 5
2
1 0 0 0 1 5
1
0 1 0 0 0 5
1
0 1 0 0 0 5
1
1 0 0 0 0 5
2
1 0 0 0 1 5
1
0 0 1 0 0 5
1
0 1 0 0 0 5
2
1 0 0 1 0 5
6 3 1 1 2 13
10 10 10 10 10 50

Para calcular la varianza del estimador de la proporción se tiene:


" 2 2 2 2 2 #
1 6 13 3 13 1 13 1 13 2 13
   
V (P)
b = − + − + − + − + − = 0.0344.
5 10 50 10 50 10 50 10 50 10 50

Bulmaro Juárez Hernández Diseño de Muestreo Sistemático (IV) Otoño 2020 4 / 15


También se puede calcular la varianza del estimador de la proporción de la
siguiente manera:
k
1 X 13 13 1 6 4 3 7 1 9 1 9 2 8
   
b = PQ −
V (P) P
bj Q
bj = 1− − + + + + = 0.0344.
k j=1 50 50 5 10 10 10 10 10 10 10 10 10 10

A continuación se construye la tabla del análisis de la varianza para la


población (producción total).
Fuente de Grados de Sumas de Cuadrados Cuadrados
Variación libertad medios
Pn Pk 2 2 = 1.72 = 0.43
Entre k −1=5−1=4 i=1 j=1 xj − X = 1.72 Sbs 4

Pn Pk
Dentro N − k = 50 − 5 = 45 i=1 j=1 (Xij − x j )2 = 7.9 2 =
Sws 7.9
45 = 0.1755
Pn Pk 2 9.62
TOTAL N − 1 = 50 − 1 = 49 i=1 j=1 Xij − X = 9.62 S2 = 49 = 0.1963

Conocida esta tabla pueden realizarse los cálculos correspondientes. Por


ejemplo, la varianza del estimador de la proporción también podrı́a
calcularse como:
2
n Sbs S2 1 0.43
   
V (P)
b = V (P
bj ) = 1− = (1 − f ) bs = 1− = 0.0344.
N n n 5 5

Bulmaro Juárez Hernández Diseño de Muestreo Sistemático (IV) Otoño 2020 5 / 15


La varianza para el estimador del total de clase será:
2
V (A)
b = V (N P bj ) = N 2 (1 − f ) Sbs = 502 · 0.0344 = 86.
bj ) = N 2 V (P
n

Del valor de la varianza puede deducirse el valor del coeficiente de


correlación intramuestral a través de la fórmula:
σ2
V (x j ) = (1 + (n − 1)ρw ).
n

Esto es,
49
50
(0.1963)
0.0344 = (1 + (10 − 1)ρw ) ⇒ ρw = 0.0875.
10

Se observa un valor de ρw muy cercano a cero, lo que indica que el


muestreo sistemático va a tener una precisión muy cercana a la del
aleatorio simple al estimar la proporciónde piezas defectuosas. Esto
concuerda con el hecho de que S 2 y Sws 2 también tienen valores muy
2
cercanos. Concretamente S = 0.1963 > Sws 2 = 0.1755 lo que indica que

es más preciso el muestreo aleatorio simple.


Bulmaro Juárez Hernández Diseño de Muestreo Sistemático (IV) Otoño 2020 6 / 15
La varianza del estimador de la proporción en el muestreo aleatorio simple
1 − 15 · 0.1933

es = 0.0157, lo que indica que la ganancia en precisión
10
0.0344 − 0.0157
del aleatorio simple sera = 54.3 %.
0.0344
Dado el valor del coeficiente de correlación intramuestral muy cercano a
cero, se pueden estimar las varianzas mediante la fórmula del muestreo
aleatorio simple. Esto es,
b2  6 6

1 − 10

b1 ) = (1 − f ) S1 = (1 − f ) P1 Q1 = 1 − 1
b b
10
Vb (P = 0.0213;
n n−1 5 10 − 1
b2
b2 ) = (1 − f ) S2 = (1 − f ) P2 Q2 = (1 − 0.2) (0.3)(1 − 0.3) = 0.0186;
b b
Vb (P
n n−1 10 − 1
b2
S P
b3 Qb3 (0.1)(1 − 0.1)
b3 ) = (1 − f ) 3 = (1 − f )
Vb (P = (1 − 0.2) = 0.008;
n n−1 10 − 1
Vb (P
b4 ) = Vb (P
b3 ) = 0.008
b2
b5 ) = (1 − f ) S5 = (1 − f ) P5 Q5 = (1 − 0.2) (0.2)(1 − 0.2) = 0.0142.
b b
Vb (P
n n−1 10 − 1

Según estos resultados las muestras más precisas son la tercera y la cuarta.
Bulmaro Juárez Hernández Diseño de Muestreo Sistemático (IV) Otoño 2020 7 / 15
También se puede estimar la varianza a partir del muestreo estratificado,
agrupando las 10 filas (estratos) de la población en grupos de 2, y
considerando cada dos filas como un estrato del que se seleccionan dos
unidades para la muestra, con esto se tiene que:
n
1−f X2 1 − 0.2 h i
2 2 2 2 2 2
V
b (P
b1 ) = (xh1 − xh2 ) = (1 − 1) + (1 − 0) + (0 − 1) + (1 − 0) + (0 − 1) = 0.032;
n2 h=1 102
n
1−f X2 1 − 0.2 h i
2 2 2 2 2 2
V
b (P
b2 ) = (xh1 − xh2 ) = (0 − 0) + (0 − 1) + (1 − 0) + (0 − 0) + (1 − 0) = 0.024;
n2 h=1 102

V b3 ) = 0.008 · (0 − 1)2 = 0.008 = V


b (P b (P
b4 ); V b5 ) = 0.008[(1 − 0)2 + (1 − 0)2 ] = 0.016.
b (P

Las mejores muestras según el método del muestreo estratificado también


resultan ser la tercera y la cuarta, y además coinciden en varianza con el
método anterior. Para el resto de muestras se observa ganacia en precisión
del método de estimación utilizando la fórmula del muestreo aleatorio
simple. La proporción estimada de piezas defectuosas producidas será la
1
derivada de la 3ra o 4ta muestra, esto es: Pb = Pb3 = Pb4 = , es decir, se
10
estima un 10 % de producción defectuosa.
Bulmaro Juárez Hernández Diseño de Muestreo Sistemático (IV) Otoño 2020 8 / 15
Ejemplo (6)
Un investigador desea determinar la calidad del azúcar contenida en la
savia de los árboles de una finca, que se encuentran situadas a lo largo de
la misma de forma natural en 7 hileras. El número total de árboles es
desconocido, por lo que no puede relizarse una muestra irrestricta
aleatoria. Como procedimiento alternativo el investigador decide usar una
muestra sistemática de 1 en 7. En la siguiente tabla se encuentran los
datos del contenido de azúcar en la savia de los árboles muestreados:
Árbol Contenido de azúcar
Muestreado en la savia X2
1 82 6724
2 76 5776
3 83 6889
.. .. ..
. . .
210 84 7056
211 80 6400
212 79 6241
P212 P212 2
i=1 xi = 17066 i=1 xi = 1486800
Estimar el contenido promedio de azúcar en la savia de los árboles de la
finca estableciendo los errores absoluto y relativo de la estimación. Realizar
la estimación mediante un intervalo de confianza al nivel del 5 %.
Bulmaro Juárez Hernández Diseño de Muestreo Sistemático (IV) Otoño 2020 9 / 15
Le estimación de la media vendrá dada por:
P212
xi
X = x j = i=1 = 80.5.
b
212
Para calcular el error absoluto de muestreo se considera la estimación de la
varianza, que se basará en la fórmula del muestreo aleatorio simple, ya que
intuitivamente se puede suponer que la población de árboles en la finca es
aleatoria en cuanto al contenido de azúcar en la savia debidoa que se
supone una distribución natural de los mismos en la finca. Previamente se
necesita estimar la cuasivarianza mediante la siguiente fórmula:
212 2
2 − ( i=1 xi )
P
P212
x
i=1 i
Sb2 = 212
= 535.48.
212 − 1

Bulmaro Juárez Hernández Diseño de Muestreo Sistemático (IV) Otoño 2020 10 / 15


Además, al ser la muestra sistemática 1 en 7 y n = 212, entonces,
N = nk = (212)(7) = 1484 árboles. La estimación de la varianza del
estimador de la media resulta ser:
 
b ) = Vb (x ) = 1 − 1 535.48 = 2.16 ⇒ σ
b
Vb (X b(Xb ) = 1.47.
j
7 212

El error relativo de muestreo será:


q
b ) = V (x j ) = 1.47 = 0.0182(1.82 %).
b
Cbv (X
E (x j ) 80.5

El error relativo es bajo, por lo que la estimación puede decirse que es


buena.

Bulmaro Juárez Hernández Diseño de Muestreo Sistemático (IV) Otoño 2020 11 / 15


Por otra parte, un intervalo de confianza para la media suponiendo
normalidad en la distribución de las medias estimadas de la población será:

b ±z σ
X α b (X ) = 80.5 ± 1.96 · 1.47 = [77.6, 83.4].
b

En caso de no poder suponer normalidad se toma el intervalo más tosco


dado por:
b±σ b(X
b) 1.47
X √ = 80.5 ± √ = [74, 87].
α 0.05
El intervalo obtenido sin suponer normalidad es más ancho (peor) que en
el caso de suponer normalidad, sin embargo no es muy diferente.

Bulmaro Juárez Hernández Diseño de Muestreo Sistemático (IV) Otoño 2020 12 / 15


Ejemplo (7)
Una muestra sistemática de 1 en 6 es obtenida de una lista de votantes
registrados para estimar la proporción de votantes que están a favor de la
emisión de bonos propuesta. Se utilizan deiferentes puntos de inicio
aleatoriopara asegurar que los resultados de la muestra no se vean
afectados por variación periódicaen la población. Los resultados
codificados de esta encuesta de elección previa se muestran en la siguiente
tabla. Estimar p, la proporciónde los 5775 votantes registrados que están a
favor de la emisión de bonos propuesta (N = 5775). Establecer un lı́mite
para el error de estimación.
P|[n]|=962
Votante 4 10 16 ··· 5760 5766 5772 i=1 yi
Respuesta 1 0 1 ··· 0 0 1 652

Al ser la muestra sistemática 1 en 6 y N = 5775, entonces,


N = nk ⇒ 5775 = (n)(6) ⇒ |[n]| = 962, donde |[·]| significa parte
entera de n. Por tanto el tamaño muestral es 962.

Bulmaro Juárez Hernández Diseño de Muestreo Sistemático (IV) Otoño 2020 13 / 15


Como n es grande y se han tomado varios puntos de inicio aleatorio en la
extracción de la muestra sistemática, se puede estimar la proporción
proporcional mediante la proporción muestral, y el error se estimará
utilizando la fórmula del muestreo aleatorio simple. Esto es,
P962
652
P = Pj = i=1 Xi =
b b = 0.678.
962 962

bj ) = 1 − n Pj (1 − Pj ) = 1 − 962
 
  b b (0.678)(1 − 0.678)
Vb (P)
b = Vb (P = 0.000196.
N n−1 5775 962 − 1

⇒ σ
b(X
b ) = 0.014.

Bulmaro Juárez Hernández Diseño de Muestreo Sistemático (IV) Otoño 2020 14 / 15


El error relativo de muestreo cuando se asegura que el 67.8 % de los
votantes registrados favorece la emición de bonos propuesta, será:
q
Vb (P)
b 0.014
Cbv (P)
b = = = 0.0206 (2.06 %).
Pb 0.678
Por otra parte, un intervalo de confianza para la proporción, suponiendo
normalidad, será:

Pe ± zα σ b = 0.678 ± (2)(0.014).
b(P)

El lı́mite para el error de estimación, será el radio del intervalo de


confianza, esto es, 0.028 (2.8 %).

Bulmaro Juárez Hernández Diseño de Muestreo Sistemático (IV) Otoño 2020 15 / 15

También podría gustarte