Intervalo de confianza bilateral para la media
𝑥̅−𝜇𝑥
Si X es una v.a. normal y la 𝑍 = también es normal estándar, donde
�
√𝑛
�
𝑥̅ es la media muestral de una muestra aleatoria de tamaño n. Siendo la media poblacional µ el
parámetro de interés, entonces se tienen los siguientes casos:
Caso 1.1. Intervalo de confianza para , si la varianza poblacional 2 es conocida.
σ σ
Xz μXz
(1)
α/2 α/2
/2 /2
n n
-z/2 0 +z/2
Caso 1.2. Intervalo de confianza para , si la varianza poblacional 2 es desconocida.
En este caso se usará la varianza muestral S2, se asume que la distribución es aproximadamente
normal, por lo que además se usará la distribución t-Student con n-1 grados de libertad. Por lo
𝑥̅ −𝜇𝑥
dicho, ahora el estadístico será 𝑇 = 𝑠𝑥
√𝑛
X t α/2,n-1s/ n μ X t α/2,n-1s/ n (2)
/2 /2
-t/2, n -1 0 t/2, n -1
Tamaño de la muestra para estimar la media
El tamaño de la muestra para estimar la media, se lo obtiene con una confianza del 100(1-)%
con un error máximo | x -| a partir del intervalo de confianza para la media, caso 1.1.
z σ 2
n α/2 (3)
e
Donde:
x es el estimador puntual de
e= |𝑥̅ -| error máximo admisible (error de estimación)
2 es la varianza poblacional
Zα/2 es el punto crítico en la distribución normal correspondiente al nivel de significancia α
Para poder calcular el tamaño de la muestra, se debe fijar el error de muestreo y conocer es la
desviación estándar poblacional o aproximarla.
Fijación del error de muestreo e
Puesto que e= |𝑥̅ -|, se entiende que e tiene las mismas unidades de la variable de estudio X,
por ejemplo, si X: salario tiene como unidad de medida dólares, de igual forma el error e tendrá
como unidad de medida dólares.
Luego para poder fijar e antes del cálculo de la muestra se recomienda que este error no supere
el 5% en términos de porcentaje. Para resolver el problema, se puede partir de una hipótesis,
por ejemplo, si quiere comprobar que el salario medio es $490, se podría tomar un 5% de este
valor para fijar el error, luego: e=$490*0.05 = $24.5.
En términos generales: e=u0*e% [unidades]
Si, en el ejemplo anterior tenemos se pide calcular el tamaño de la muestra para estimar el
salario medio con un error de $30, el proceso será inverso para verificar si este valor no supera
el 5% en términos de porcentaje. Luego, en lugar de multiplicar dividimos:
e% = $30/$490= 0.061 e%=6.1%, luego $30 no es apropiado, ya que en términos de
porcentaje supera el 5%.
En términos generales: e% = e(unidades) / u(unidades)
Para finalizar, si no se cuenta con una hipótesis acerca de la media, como último recurso se
podría tomar la media de un estudio anterior o prueba piloto (no muy recomendable) para fijar
una hi- pótesis sobre la media para los cálculos.
Aproximación de la varianza poblacional 2
Aunque en la fórmula del tamaño de la muestra, se encuentra la varianza 2, esta puede ser un
valor teórico conocido, pero no siempre será así, por lo que debe aproximarse. Se tienen tres cri-
terios:
Estudios anteriores
𝑛 2
Si se conoce la varianza muestral de estudios similares o anteriores 𝑆2 = 𝑖=1(𝑥𝑖−𝑥̅)
∑
, se to-
∗ 𝑛∗−1
mará este valor para aproximar la varianza poblacional 2.
Prueba piloto
Se toma una muestra cuyo tamaño n* es mucho más pequeño que la muestra definitiva n,
𝑛 2
(n*<<n), y se halla la varianza muestral 𝑆2 = ∑𝑖=1(𝑥𝑖−𝑥̅) , la misma que aproximará a 𝜎 2.
∗ 𝑛∗−1
Regla empirica
Si no es posible aproximar la varianza por los dos criterios anteriores, se recurre a la regla empí-
rica, sin embargo, es la menos recomendable. El criterio se basa en la normalidad de la distribu-
ción normal, y la posilbildad de hallar intervalos de confianza a una, dos y tres desviaciones es-
tándar de la media. A dos desviaciones estándar de la media, se tiene un intervalo de confianza
que contiene un poco más del 95% de las observaciones, de modo que:
p(-2<X<+2)= p(- 0.95450
2<Z<+2)=
Recuerde: p(-zo<Z<+zo)=0.95 z=±1.96
Luego en el rango de variación de los datos contiene aproxiamadamente 4 desviaciones
estándar, 2 a la izquierda de la media y dos a la derecha de la media.
Rango 4 Rango /4 y esta se reemplaza en la fórmula (3)
Intervalo de confianza bilateral para estimar una proporción
Dada una muestra aleatoria de tamaño n de una población grande y sea la variable aleatoria dis-
creta binomial X: número de éxitos en la muestra. Entonces pˆ =x/n es un estimador puntual de
la proporción poblacional p. Se conoce que la distribución de muestreo de pˆ es
aproximadamente
𝑝(1−𝑝)
normal con media p y varianza 𝜎 2 = , y la distribución de Z es aproximadamente normal
𝑝̂ 𝑛
𝑝̂−𝑝
con forma límite 𝑍 =
𝑝̂(1−𝑝̂)
√ 𝑛
El intervalo de confianza biltaral al 100(1-)% para la estimación de la proporción poblacional p
n pˆ)
pˆ α/2 pˆ(1- α/
2
pˆ(1
de éxitos es: z p pˆ z - pˆ) (5)
n
La muestra se considera grande si np≥5
Tamaño de la muestra para estimar la proporción
2 2
2 𝑍𝛼/2 𝜎
𝑛∞ = (𝑍𝛼/2𝜎 ) = (6)
𝑒 𝑒2
donde:
La varianza poblacional es 2 = pq
es El error de estimación e = |𝑝̂ − 𝑝|
Punto crítico correspondiente a una significancia : Z/2.
Al igual que, el cálculo del tamaño de la muestra para estimar la media, se aplica la corrección
en la fórmula del tamaño de la muestra.
Fijación del error de muestreo e
Puesto que e = |𝑝̂ − 𝑝| no tiene unidad de medida, este teoricamente toma valores entre cero y
uno, sin embargo para garantizar un muestreo adecuado, se recomienda usar valores del error
directamente entre 1% y 5%, es decir 0.01 ≤p≤0.05
Aproximación de la varianza poblacional 2=pq
Aunque en la fórmula del tamaño de la muestra, se encuentra la varianza 2, esta puede ser un
valor teórico conocido, pero no siempre será así, por lo que debe aproximarse. Se tienen tres cri-
terios:
Prueba de hipótesis sobre la media con varianza desconocida
Sea X1, X2, …, Xn una muestra aleatoria extraida de una distribución aproximadamente normal
de media y varianza 2. Sean 𝑥̅ el estimador puntual de la media poblacional , y 𝑠2 su
varianza.
𝑛
Como se observa la varianza es desconocida. Además, la variable T tiene distribución t-Student
con n-1 grados de libertad.
𝑇 = 𝑥̅ − 𝜇
𝑠
√𝑛
Para probar la hipótesis se siguen los mismos pasos del caso de muestras grandes, con los
cambios sobre los puntos críticos como se indica a continuación.
Pasos de la prueba: Bilateral Unilater Unilater
al al
superio inferio
r r
1. Hipótesis estadísticas H 0 : μ μ H 0 : μ μ 0 H 0 : μ μ 0
0 H:μμ H:μμ
H:μμ 1 0 1 0
1
0
2. Nivel de significancia tα/2,gl tα,gl = + tα,gl = -
=
±
3. Estadístico de prueba xμ
T0 s/ n
4. Regla de decisión To > To > + tα,gl To < - tα,gl
tα/2,gl
Ho se rechaza si:
5. Interpretación de los resultados
Nota.- Para esta prueba de hipótesis, los grados de libertad, son g.l. = n–1, ya que se va a
estimar un parámetro, por ende se tiene una restricción.
Usualmente algunos programas estadísticos suelen usar la distribución t-Student para prue-
bas de hipótesis sobre la media, puesto que la distribución t-Student es una buena aproximación
de la distribución normal, especialmente cuando el tamaño de la muestra es grande, lo que está
justificado en parte por el teorema del límite central.
Estudios anteriores
Si se conoce la varianza muestral
∗ 𝑆 2 = 𝑝̂ 𝑞̂ de estudios similares o anteriores,
se tomará este valor para aproximar la varianza poblacional 2.
Prueba piloto
Se toma una muestra cuyo tamaño n* es mucho más pequeño que la muestra
definitiva n, (n*<<n), y se halla la varianza
∗ muestral 𝑆2 = 𝑝̂𝑞̂ , la misma que
aproximará a varianza
poblaciona
l 2.
Regla
e
m
pi
ric
a
Al no poder aplicar los criterios anterioes, se toma p =q=0.5, es decir se
considera que la probabilidad de éxitos es igual a la probabilidasd de
fracasos; ello evita el sesgo y se en- cuentra un tamaño de muestra máximo.