UNIVERSIDAD NACIONAL “SAN LUIS GONZAGA”
FACULTAD DE ADMINISTRACIÓN
ASIGNATURA: _ CONTROL ESTADÍSTICO DE PROCESOS.
DETERMINACIÓN DEL TAMAÑO DE LA MUESTRA PARA LA MEDIA
En los ejemplos anteriores sobre estimación de intervalos de confianza, el tamaño de
muestra fue determinado de manera arbitraria sin tomar en cuenta el tamaño del
intervalo de confianza. En el mundo de los negocios, la determinación del tamaño de
muestra adecuado, es un procedimiento complicado que está sujeto a restricciones
presupuéstales, tiempo, facilidad de selección, etcétera. Por ejemplo: El Gerente de
mercadotecnia de una compañía que suministra gas natural para consumo doméstico
(cocina, calefacción, terma), desearía estimar el consumo promedio anual en un área
geográfica clase “A” de la ciudad de Ica, esto significaría que tendría que decidir que
tanto error está dispuesto a permitir en la estimación del consumo anual promedio de
la población. Se requiere tal vez que la precisión esté dentro de + 10, + 20, + 50,
balones de gas, etcétera. El Gerente también tendría que determinar qué tan seguro
desea estar de estimar correctamente el parámetro verdadero de la población.
Para desarrollar una fórmula para determinar el tamaño de la muestra, para estimar la
media, recuerde:
Χ−μ Χ
Ζ=
σΧ
√n
Donde Z es el valor crítico correspondiente a un área ( 1−α ) /2, del centro de una
distribución normal. Al multiplicar ambos extremos tenemos Z(x) / √
n = X -
Recuerde también que Z será negativo si la media muestral Χ , es menor que la Xy
positivo si la Χ , es mayor que la X; y que la diferencia entre la Χ de muestra y la X
se representa por e y se le denomina error de muestreo. El error de muestreo se
define como: e = Z (x / √ n ), entonces el tamaño de muestra lo hallamos a través de:
( Ζ )2 ( σ Χ )2
n=
e2
Para determinar el tamaño de la muestra debemos conocer:
a) El nivel de confianza, es el valor crítico de la distribución normal.
b) El error de muestreo permitido (e)
c) La desviación estándar X
En la práctica la determinación de estas tres cantidades no es fácil, estas preguntas
son respondidas por el experto en la materia, es decir por aquel que conoce las
variables que se van analizar. 95% es el intervalo de confianza más utilizado (Z=1.96),
si se da una mayor confianza (99%), podría ser más adecuado (Z=2.58), si se toma
como aceptable una menor confianza o sea 90%, entonces Z=1.645.
En cuanto al error de muestreo, debemos de pensar en que tanto de error podemos
aceptar y todavía seguir siendo capaces de obtener conclusiones sobre los datos.
Debemos tener disponible una estimación de desviación estándar,
desafortunadamente rara vez se conoce la desviación estándar. En algunos casos la
desviación estándar puede ser estimada de datos anteriores, en otros, uno puede
desarrollar una estimación apropiada si se toma en cuenta el alcance y la distribución
de la variable. Si se supone que la distribución es normal, el alcance es
aproximadamente de 6 desviaciones. Es muy probable que no se conozca la varianza
de la característica en la población, en tales casos se debe recurrir a investigaciones
similares realizadas con anterioridad.
Ejemplo: Suponga que la Gerente de CALZADOS OSCAR´S pretende estimar el
promedio de ventas unitarias semanales, dentro de más o menos 5 unidades y desea
Dr. Vicente Ecos Quintanilla. 1
UNIVERSIDAD NACIONAL “SAN LUIS GONZAGA”
FACULTAD DE ADMINISTRACIÓN
ASIGNATURA: _ CONTROL ESTADÍSTICO DE PROCESOS.
estar 95% segura de estudiar correctamente la media verdadera, basándose en
estudios
anteriores se obtuvo una X = 25 unidades. Entonces el tamaño inicial de la muestra se
( Ζ )2 ( σ Χ ) 2
n0 =
determina de la siguiente manera: e2
( 1.96 )2 (25 )2
n0 = ( 3 .8416 ) ( 625 )
( 5 )2 25
n0 = n0 =96 . 04
Regla: Redondear al entero mayor más cercano: 97 con el fin de sobrepasar
ligeramente la expectativa deseada. Si la Gerente utiliza estos criterios debería tomar
una muestra de 97 tiendas.
Aplicando factor de corrección; en el supuesto de que CALZADOS OSCAR´S tenga
1153 tiendas a nivel nacional, entonces el tamaño de muestra corregido sería:
n0
n= 96 . 04
n n=
96 . 04
1+ 0 1+
Ν 1153
n = 88.66 entonces n = 89
CALZADOS OSCAR´S deberá tomar aleatoriamente una muestra de 89 de sus
tiendas.
Un biólogo pretende investigar el peso promedio de los ciervos cazados en el
estado de Maryland. Un estudio anterior en una muestra aleatoria de diez ciervos
cazados mostró que la desviación estándar de sus pesos es de 12.2 libras. ¿Qué
tan grande debe ser una muestra para que el biólogo tenga un nivel de confianza
del 95% de que el error de estimación es a lo más de 4 libras?
En consecuencia, observe que, si el tamaño de la muestra es 36, se puede tener un
95% de confianza en que la μ difiere en menos de 4 libras de la X .
Una empresa eléctrica dedicada a la fabricación de focos, cuya vida útil de los
mismos siguen una distribución aproximadamente normal con una desviación
estándar de 40 horas. ¿De qué tamaño se necesita que sea la muestra si se
desea tener un nivel de confianza del 96% de que la media poblacional esté
dentro de 10 horas de la media real?
( Ζ )2 ( σ Χ ) 2
n0 =
e2
( 2.054 )2 ( 40 )2
n 0= =67.5
102
N= 68
Dr. Vicente Ecos Quintanilla. 2
UNIVERSIDAD NACIONAL “SAN LUIS GONZAGA”
FACULTAD DE ADMINISTRACIÓN
ASIGNATURA: _ CONTROL ESTADÍSTICO DE PROCESOS.
¿Qué pasaría si en lugar de tener un error de estimación de 10 horas sólo se requiere
un error de 5 horas?
( Ζ )2 ( σ Χ ) 2
n0 =
e2
( 2.054 )2 ( 40 )2
n 0= 2
=270.010
5
.
N = 270
Suponga que en el ejercicio anterior se tiene una población de 300 focos, y se
desea saber de qué tamaño debe de ser la muestra. El muestreo se realizará sin
reemplazo.
z2 . σ 2 . N
n= 2 2
E ( N −1 )+ z . σ
2.0542 . 402 .300
n= =67.35
10 2 ( 300−1 )+2.054 2 .40
n= 68
También se puede recurrir a investigaciones preliminares denominadas encuestas piloto,
este procedimiento es el que más se emplea para determinar el tamaño de muestra. En
primer lugar, se debe identificar la población a la cual se va investigar, definida claramente
la unidad de investigación y las características que tienen que ver con el estudio, luego se
procede a determinar el tamaño de la muestra.
Supongamos que la cartera de clientes de la tienda Viviana Sport es de 467, si para
efectos de llevar a cabo un estudio piloto, sobre la característica “ventas” mensuales (miles
de soles) se selecciona una muestra aleatoria consistente en el 1.5% de la población.
(0.015 x 467 = 7). Recuerde que el tamaño del piloto no debe ser superior al 5% del
tamaño de la población.
A continuación, se detalla una muestra aleatoria de tamaño 7.
Dr. Vicente Ecos Quintanilla. 3
UNIVERSIDAD NACIONAL “SAN LUIS GONZAGA”
FACULTAD DE ADMINISTRACIÓN
ASIGNATURA: _ CONTROL ESTADÍSTICO DE PROCESOS.
N° Cod. X X2
ventas
1 285 172 29584
2 015 220 48400
3 385 350 122500
4 133 185 34225
5 060 193 37249
6 007 210 44100
7 023 175 30625
1505 346683
215
1505
= x=
7
2 2 2 2 2 2 2
(172−215) +(220−215) +(350−215) (1 85−215) +(1 93−215) (210−215) (17 5−215)
σ=
6
2
s =3851.33 Se si desea un error de 5 mil soles y un Nivel de Confianza de 0.95,
entonces conocida la desviación estándar, podemos aplicar las siguientes fórmulas
para hallar el tamaño de muestra:
2 2
NZ S
n= NE 2 +Z 2 S 2
467∗1.962∗3851.33
n= =261.024574
467∗52+ 1.962∗3851.33
ó tambien podemos utilizar la siguiente fórmula:
2
S
n=
( ) ( )
E 2 S2
Z
+
N
Dr. Vicente Ecos Quintanilla. 4
UNIVERSIDAD NACIONAL “SAN LUIS GONZAGA”
FACULTAD DE ADMINISTRACIÓN
ASIGNATURA: _ CONTROL ESTADÍSTICO DE PROCESOS.
3851.33
n= =261.024574
( )( )
2
5 3851.33
+
1.96 467
Veamos otro ejemplo. En una población de 250 familias, cuya actividad principal es la
agricultura. La unidad de investigación, se define como el conjunto de personas,
ligadas por un lazo de consanguinidad, dependencia económica, etcétera. Una vez
identificada y enumerada la población se procede a calcular el tamaño de muestra.
Como no se conoce las varianzas poblacionales de una o algunas de las
características se procede a estimarlas mediante una encuesta preliminar.
Arbitrariamente tomaremos un 4% de la población; o sea: 0.04 (250) = 10. Establecido
el “n” piloto se utiliza cualquier método de selección aleatoria. Supongamos ahora que
la información referente a la característica “salario semanal”, sea la siguiente:
260 180 240 245 165 215 190 210 185 250
O también
Significa que para evaluar la característica Salario semanal, necesitamos un tamaño
de muestra de n =
MÉTODO DE ASIGNACIÓN PROPORCIONAL.
A través del método de asignación proporcional, la muestra se reparte entre los
estratos proporcionalmente a los tamaños de estos. Este tipo de asignación la
utilizaremos para el siguiente ejemplo:
Supongamos ahora que la cartera de clientes de la tienda “VIVIANA SPORT”, ha
sido clasificada cualitativamente, en tres categorías: como de clase “A” y cuenta
con una cartera de 182 clientes; como de clase “B” fueron clasificados una
cartera de 215 clientes y como de clase “C” se clasificó una cartera de 70
clientes. Estadísticamente hablando los clientes han sido divididos en tres
grupos llamados estratos.
Dr. Vicente Ecos Quintanilla. 5
UNIVERSIDAD NACIONAL “SAN LUIS GONZAGA”
FACULTAD DE ADMINISTRACIÓN
ASIGNATURA: _ CONTROL ESTADÍSTICO DE PROCESOS.
Este método permite que los tamaños muéstrales se distribuyan en la misma
proporción que las unidades en la población.
En otras palabras, el peso relativo dado por el número de unidades en cada estrato en
relación al total de elementos de la población, debe ser igual para hallar la muestra.
Como quiera que para el ejemplo de la tienda VIVIANA SPORT n = ….. debemos
hallar los pesos (w) correspondientes:
182
W1 = 467 =
215
W2 = 467 =
70
W3 = 467 =
MUESTREO NO PROBABILÍSTICO POR CUOTAS
El muestreo por cuotas es una técnica de muestreo no probabilístico, en donde la
muestra reunida tiene la misma proporción de individuos, así mismo debe observarse
que la población debe dividirse en subgrupos, asegurándose que la muestra sea
representativa.
En este tipo de muestreo se fijan cuotas que consisten en un número de cuotas que
reúnen unas determinadas condiciones, tales como por ejemplo 33 individuos de 18 a
35 años de sexo femenino y residentes en el distrito de Río Grande. Una vez
determinada la cuota se eligen a aquellos que cumplan tales características. Este
método se utiliza también en las encuestas de opinión.
CONFECCIONES ROSSY, novel empresa iqueña, cuya actividad principal está
dedicada a la confección y comercialización de prendas de vestir
exclusivamente para damas, por lo que necesitan realizar una primera
aproximación al mercado, para tal efecto deberá recurrir a la información con
que cuenta el Instituto Nacional de Estadística e Informática de la Provincia Ica.
El estrato de interés para CONFECCIONES ROSSY está conformado por las
damas de la Provincia de Ica cuyas edades sean mayores de 18 pero menores de
45 años, precisamente de los niveles socio – económicos A, B y C de la
Provincia de Ica. Información que a continuación se detalla en el siguiente
cuadro:
Población de Damas de la Provincia de Ica, por niveles socio-económicos, según
grupos de edad – julio 2022
NIVELES SOCIO ECONÓMICOS
GRUPOS DE EDAD TOTAL
A B C
[18 – 27) 7 130 10 243 22 350 39 723
27 – 36 5 530 13 722 18 123 37 375
[36 –45) 9 150 21 271 24 595 55 016
TOTAL
Fuente: Elaboración propia.
La técnica de muestreo más conveniente es la del muestreo no probabilístico por
cuotas. A través de la información podemos seleccionar las unidades de muestra al
azar según la distribución poblacional definida por las características de control, es
Dr. Vicente Ecos Quintanilla. 6
UNIVERSIDAD NACIONAL “SAN LUIS GONZAGA”
FACULTAD DE ADMINISTRACIÓN
ASIGNATURA: _ CONTROL ESTADÍSTICO DE PROCESOS.
decir cuotas por niveles socio – económicos, según edades de la población femenina
de la Provincia de Ica.
Población Porcentual de damas de la Provincia de Ica, por niveles socio-económicos,
según grupos de edad – julio 2022
NIVELES SOCIO ECONÓMICOS
GRUPOS DE EDAD TOTAL
A B C
TOTAL 100.00
Fuente: Elaboración propia
Determinados los porcentajes, procedemos a calcular el tamaño de muestra, de
acuerdo con los datos y en base a la siguiente fórmula, dado que se conoce el tamaño
de la población (N).
Ζ 2 pq Ν
n0 = 2
Ε ( Ν−1 )+Ζ 2 pq
De donde:
p: Es la proporción de la población que tiene la característica de interés (0.65)
q:(1-p), es la proporción de la población que no tiene la característica de interés
q = (1 – 0.65) = 0.35
E: Es el máximo de error permisible.
N: Tamaño de la población.
Entonces:
Nivel de confianza NC =
Valor estandarizado Z =
Con la característica de interés p =
Sin la característica de interés q =
Error E =
Tamaño de la población N =
Hallando el tamaño de muestra inicial.
Aplicando factor de corrección
n0 Ν
n=
n 0 + ( Ν −1 )
Como puede observarse en este caso aplicando el correspondiente factor de
corrección, este prácticamente no surte ningún efecto en la determinación del tamaño
de la muestra seleccionada. Determinado el tamaño de la muestra debemos luego
determinar el número de cuestionarios que debemos aplicar en cada uno de los
niveles socio – económicos, según grupos de edad de las damas de la Provincia de
Ica. Por ejemplo:
Número de cuestionarios a aplicarse en la Población de damas de la Provincia
de Ica, por niveles socio económicos, según grupos de edad – julio - 2022
GRUPOS DE EDAD NIVELES SOCIO ECONÓMICOS TOTAL
Dr. Vicente Ecos Quintanilla. 7
UNIVERSIDAD NACIONAL “SAN LUIS GONZAGA”
FACULTAD DE ADMINISTRACIÓN
ASIGNATURA: _ CONTROL ESTADÍSTICO DE PROCESOS.
A B C
[18 – 27)
27 – 36
[36 – 45)
TOTAL
Fuente: Elaboración propia.
Dr. Vicente Ecos Quintanilla. 8