100% encontró este documento útil (1 voto)
90 vistas19 páginas

Intervalos de Confianza en Estadística

Este documento presenta fórmulas para calcular intervalos de confianza para estimar parámetros como la media, varianza y diferencia de medias de distribuciones normales en diferentes situaciones: cuando la desviación estándar es conocida o desconocida, cuando las varianzas poblacionales son conocidas o desconocidas. Incluye ejemplos numéricos para ilustrar cómo aplicar las fórmulas y la función t.test de R para calcular intervalos de confianza.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
100% encontró este documento útil (1 voto)
90 vistas19 páginas

Intervalos de Confianza en Estadística

Este documento presenta fórmulas para calcular intervalos de confianza para estimar parámetros como la media, varianza y diferencia de medias de distribuciones normales en diferentes situaciones: cuando la desviación estándar es conocida o desconocida, cuando las varianzas poblacionales son conocidas o desconocidas. Incluye ejemplos numéricos para ilustrar cómo aplicar las fórmulas y la función t.test de R para calcular intervalos de confianza.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Inferencia Estadística

Dagoberto Bermúdez Rubio

28 abril, 2020

Intervalo de confianza para la media de una distribución normal


con σ conocida
Sea Y1 , Y2 , . . . , Yn una muestra alearoria de una distribución N (µ, σ 2 ), con σ 2 conocida. Por lo tanto


(Ȳ − µ) n
Z= (1)
σ
es una cantidad pivotal para estimar µ.
Un intervalo de confianza del (1 − α)% para µ está dado por:
 
σ σ
p Ȳ − zα/2 √ < µ < Ȳ + zα/2 √ =1−α (2)
n n

A la expresión

σ
e = zα/2 √ (3)
n

se le denomina error muestral. De la ecuación (3) podemos despejar n y así obtenemos la siguiente fórmula
para el tamaño de muestra cuando se quiere estimar µ.

z
α/2 · σ 2
n= (4)
e
estatura=c(173,170,172,160,167,162,168,174,166,170)
sigma=sd(estatura)
n=length(estatura);n

## [1] 10
conf=0.99
alfa=1-conf
mean(estatura)

## [1] 168.2
z=qnorm(1-alfa/2);z

## [1] 2.575829
e=z*sigma/sqrt(n); e

## [1] 3.738652

1
li=mean(estatura)-e
ls=mean(estatura)+e
ic=c(li,ls); ic

## [1] 164.4613 171.9387


l=ls-li; l

## [1] 7.477303

Intervalo de confianza para la media de una distribución normal


con σ desconocida
Sea Y1 , Y2 , . . . , Yn una muestra alearoria de una distribución N (µ, σ 2 ), con σ 2 desconocida. Por lo tanto


(Ȳ − µ) n
T(n−1) = (5)
s
es una cantidad pivotal para estimar µ.
Un intervalo de confianza del (1 − α)% para µ está dado por:
 
s s
p Ȳ − tα/2,n−1 √ < µ < Ȳ + tα/2,n−1 √ =1−α (6)
n n
estatura=c(173,170,172,160,167,162,168,174,166,170)
n=length(estatura)
conf=0.90
alfa=1-conf
t=qt(1-alfa/2,n-1); t

## [1] 1.833113
e=t*sd(estatura)/sqrt(n); e

## [1] 2.660646
li=mean(estatura)-e
ls=mean(estatura)+e
ic=c(li,ls); ic

## [1] 165.5394 170.8606


l=ls-li; l

## [1] 5.321292

Función [Link]
estatura=c(173,170,172,160,167,162,168,174,166,170)
[Link](estatura, [Link]=0.90)

##
## One Sample t-test
##
## data: estatura

2
## t = 115.89, df = 9, p-value = 1.347e-15
## alternative hypothesis: true mean is not equal to 0
## 90 percent confidence interval:
## 165.5394 170.8606
## sample estimates:
## mean of x
## 168.2

Intervalo de confianza para la varianza de una distribución normal


con µ conocida
Sea Y1 , Y2 , . . . , Yn una muestra alearoria de una distribución N (µ, σ 2 ), con µ conocida. Por lo tanto
Pn
i=1 (Yi − µ)2
χ2(n) = (7)
σ2

es una cantidad pivotal para estimar σ 2 .


Un intervalo de confianza del (1 − α)% para σ 2 está dado por:

Pn Pn !
i=1 (Yi − µ) i=1 (Yi − µ)
2 2
p <σ <2
=1−α (8)
χ2(1−α/2,n) 2
χ(α/2,n)

Intervalo de confianza para la varianza de una distribución normal


con µ desconocida
Sea Y1 , Y2 , . . . , Yn una muestra alearoria de una distribución N (µ, σ 2 ), con µ desconocida. Por lo tanto

Pn
i=1 (Yi − Ȳ )2 (n − 1)S 2
χ2(n−1) = = (9)
σ2 σ2

es una cantidad pivotal para estimar σ 2 .


Un intervalo de confianza del (1 − α)% para σ 2 está dado por:
!
(n − 1)S 2 (n − 1)S 2
p < σ 2
< =1−α (10)
χ2(1−α/2,n−1) χ2(α/2,n−1)

estatura=c(173,170,172,160,167,162,168,174,166,170)
n=length(estatura)
s2=var(estatura)
confi=0.99
alfa=1-confi
chi2=qchisq(alfa/2,n-1)
chi1=qchisq(1-alfa/2,n-1)
li=(n-1)*s2/chi1
ls=(n-1)*s2/chi2
icv=c(li,ls); icv

## [1] 8.037525 109.283765

3
Intervalo de confianza para la diferencia de medias µ1 − µ2 con var-
ianzas poblacionales conocidas
Sea X1 , X2 , . . . , Xn1 una muestra alearoria de una distribución N (µ1 , σ12 ) y de forma independiente,
Y1 , Y2 , . . . , Yn2 una muestra alearoria de una distribución N (µ2 , σ22 ), con σ12 y σ22 conocidas. Por lo tanto

(X̄ − Ȳ ) − (µ1 − µ2 )
Z= s (11)
σ12 σ2
+ 2
n1 n2

es una cantidad pivotal para estimar µ1 − µ2 .


Un intervalo de confianza del (1 − α)% para µ1 − µ2 está dado por:
 s s 
σ12 σ2 σ12 σ22 
p (X̄ − Ȳ ) − zα/2 + 2 < µ1 − µ2 < (X̄ − Ȳ ) + zα/2 + =1−α (12)
n1 n2 n1 n2

mujeres=c(162,167,165,160,162,168) #intervalo para la diferencia de medias con varianzas conocidas


hombres=c(180,166,173,168,172,172,178,175)
n1=length(mujeres)
n2=length(hombres)
sig21=var(mujeres)
sig22=var(hombres)
conf=0.99
alfa=1-conf
z=qnorm(1-alfa/2)
e=z*sqrt(sig21/n1+sig22/n2); e

## [1] 5.413329
li=mean(mujeres)-mean(hombres)-e
ls=mean(mujeres)-mean(hombres)+e
icdm=c(li,ls); icdm

## [1] -14.413329 -3.586671

Intervalo de confianza para la diferencia de medias µ1 − µ2 con var-


ianzas poblacionales desconocidas iguales
Sea X1 , X2 , . . . , Xn1 una muestra alearoria de una distribución N (µ1 , σ12 ) y de forma independiente,
Y1 , Y2 , . . . , Yn2 una muestra alearoria de una distribución N (µ2 , σ22 ), con σ12 = σ22 desconocidas (homocedasti-
cidad). Por lo tanto

(X̄ − Ȳ ) − (µ1 − µ2 )
T(n1 +n2 −2) = (13)
1 1
r
Sp · +
n1 n2
con

(n1 − 1)S12 + (n2 − 1)S22


Sp2 = (14)
n1 + n2 − 2

4
es una cantidad pivotal para estimar µ1 − µ2 .
Un intervalo de confianza del (1 − α)% para µ1 − µ2 está dado por:

1 1 1 1
 r r 
p (X̄ − Ȳ ) − tα/2,n1 +n2 −2 · Sp + < µ1 − µ2 < (X̄ − Ȳ ) + tα/2,n1 +n2 −2 · Sp + = 1−α (15)
n1 n2 n1 n2

mujeres=c(162,167,165,160,162,168) #intervalo para la diferencia de medias con varianzas desconocidas pe


hombres=c(180,166,173,168,172,172,178,175)
n1=length(mujeres)
n2=length(hombres)
s12=var(mujeres)
s22=var(hombres)
conf=0.99
alfa=1-conf
gl=n1+n2-2
t=qt(1-alfa/2,gl)
sp=sqrt(((n1-1)*(s12)+(n2-1)*(s22))/gl)
e=t*sp*sqrt(1/n1+1/n2); e

## [1] 6.80164
li=mean(mujeres)-mean(hombres)-e
ls=mean(mujeres)-mean(hombres)+e
icdm=c(li,ls); icdm

## [1] -15.80164 -2.19836


p(−15.80 < µ1 − µ2 < −2.19) = 99%, se concluye que la media de la estatura para las mujeres, es
significativamente menor a la media de los hombres con un nivel de confianza del 99%
Función [Link]
mujeres=c(162,167,165,160,162,168) #intervalo para la diferencia de medias con varianzas desconocidas pe
hombres=c(180,166,173,168,172,172,178,175)
[Link](mujeres,hombres, [Link] = 0.99, [Link] = T)

##
## Two Sample t-test
##
## data: mujeres and hombres
## t = -4.0418, df = 12, p-value = 0.001634
## alternative hypothesis: true difference in means is not equal to 0
## 99 percent confidence interval:
## -15.80164 -2.19836
## sample estimates:
## mean of x mean of y
## 164 173

Intervalo de confianza para la diferencia de medias µ1 − µ2 con var-


ianzas poblacionales desconocidas y desiguales
Sea X1 , X2 , . . . , Xn1 una muestra alearoria de una distribución N (µ1 , σ12 ) y de forma independiente,
Y1 , Y2 , . . . , Yn2 una muestra alearoria de una distribución N (µ2 , σ22 ), con σ12 6= σ22 desconocidas (heterocedasti-
cidad). Por lo tanto

5
(X̄ − Ȳ ) − (µ1 − µ2 )
T(ν) = s (16)
S12 S2
+ 2
n1 n2

con

(S12 /n1 + S22 /n2 )2


ν= (17)
(S12 /n1 )2 /(n1 − 1) + (S22 /n2 )/(n2 − 1)

Un intervalo de confianza del (1 − α)% para µ1 − µ2 está dado por:


 s s 
S12 S22 S12 S22 
p (X̄ − Ȳ ) − tα/2,ν · + < µ1 − µ2 < (X̄ − Ȳ ) + tα/2,ν · + =1−α (18)
n1 n2 n1 n2

mujeres=c(162,167,165,160,162,168) #intervalo para la diferencia de medias con varianzas desconocidas pe


hombres=c(180,166,173,168,172,172,178,175)
n1=length(mujeres)
n2=length(hombres)
s12=var(mujeres)
s22=var(hombres)
conf=0.99
alfa=1-conf
gl=(s12/n1+s22/n2)^2/((s12/n1)^2/(n1-1)+(s22/n2)^2/(n2-1)); gl

## [1] 11.9242
t=qt(1-alfa/2,gl); t

## [1] 3.058078
e=t*sqrt(s12/n1+s22/n2); e

## [1] 6.426815
li=mean(mujeres)-mean(hombres)-e
ls=mean(mujeres)-mean(hombres)+e
icdm=c(li,ls); icdm

## [1] -15.426815 -2.573185


mujeres=c(162,167,165,160,162,168) #intervalo para la diferencia de medias con varianzas desconocidas pe
hombres=c(180,166,173,168,172,172,178,175)
[Link](hombres,mujeres, [Link] = 0.99, [Link] = F)

##
## Welch Two Sample t-test
##
## data: hombres and mujeres
## t = 4.2825, df = 11.924, p-value = 0.001079
## alternative hypothesis: true difference in means is not equal to 0
## 99 percent confidence interval:
## 2.573185 15.426815
## sample estimates:
## mean of x mean of y
## 173 164

6
p(2.57 < µh − µm < 15.42) = 0.99, µh > µm .

Intervalo de confianza para el cociente de varianzas


Sea X1 , X2 , . . . , Xn1 una muestra alearoria de una distribución N (µ1 , σ12 ) y de forma independiente,
Y1 , Y2 , . . . , Yn2 una muestra alearoria de una distribución N (µ2 , σ22 ). Por lo tanto
(n1 −1)S12 (n2 −1)S22
σ12
∼ χ2(n1 −1) y σ22
∼ χ2(n2 −1)
Por lo que

S12 σ22
· ∼ F(n1 −1,n2 −1) (19)
S22 σ12

El inyervalo de confianza para el cociente de varianzas queda dado por:

1 S12 σ2 1 S2
 
P · 2 < 12 < · 12 =1−α (20)
b S2 σ2 a S2

donde a = F(α/2,n1 −1,n2 −1) y b = F(1−α/2,n1 −1,n2 −1)


mujeres=c(162,167,165,160,162,168) #intervalo para el cociente de varianzas
hombres=c(180,166,173,168,172,172,178,175)
n1=length(mujeres)
n2=length(hombres)
conf=0.99
alfa=1-conf
a=qf(alfa/2,n1-1,n2-1)
b=qf(1-alfa/2,n1-1,n2-1)
li=1/b*var(mujeres)/var(hombres)
ls=1/a*var(mujeres)/var(hombres)
icv=c(li,ls); icv

## [1] 0.04773605 6.45474802


σ12
p(0.04 < σ22
< 6.45) = 0.99, se puede suponer que σ12 = σ22
mujeres=c(162,167,165,160,162,168) #intervalo para el cociente de varianzas
hombres=c(180,166,173,168,172,172,178,175)
[Link](mujeres,hombres, [Link] = 0.99)

##
## F test to compare two variances
##
## data: mujeres and hombres
## F = 0.45455, num df = 5, denom df = 7, p-value = 0.4025
## alternative hypothesis: true ratio of variances is not equal to 1
## 99 percent confidence interval:
## 0.04773605 6.45474802
## sample estimates:
## ratio of variances
## 0.4545455

7
Intervalo de confianza para la proporción p
Sea Y1 , Y2 , . . . Yn una muestra aleatoria, de una distribución Bernoulli con probabilidad de éxito p. Dado que
para n grande y usando el Teorema del Límite Central, se tiene que

(p̂ − p) n
Z=p (21)
p(1 − p)
Pn
Yi Y
Donde p̂ = i=1
= (proporción estimada)
n n
Con un nivel de confianza del (1 − α)%,

√ !
(p̂ − p) n
P −zα/2 <p < zα/2 = 1 − α (22)
p(1 − p)

Despejando p en el centro se tiene:

p(Li < p < Ls ) = 1 − α (23) (ejercicio)

Otra forma más popular de encontrar un intervalo de confianza para la proporción p, es utilizar p̂ para estimar
la varianza. Entonces, dado que para valores grandes del tamaño de muestra n, se tiene una distribución
normal estándar aproximada

(p̂ − p) n
Z=p (24)
p̂(1 − p̂)

Lo que conduce al siguiente intervalo

r r !
p̂(1 − p̂) p̂(1 − p̂)
p p̂ − zα/2 · < p < p̂ + zα/2 · =1−α (25)
n n

A la expresión
r
p̂(1 − p̂)
e = zα/2 · (26)
n

se le denomina error muestral. De la ecuación (24) podemos despejar n y así obtenemos la siguiente fórmula
para el tamaño de muestra cuando se quiere estimar p.

2
zα/2 · p̂(1 − p̂)
n= (27)
e2

A pesar de lo simple que resulta el cálculo del intervalo para la proporción dado en la ecuación (25), llamado
intevalo de Wald, y de su amplia difusión, hay estudios que demuestran que este, tiene un mal desempeño
(Agresti & Coull, 1998; Brown, Cai & DasGupta, 2002; Newcombe & Merino, 2006). Agresti & Coull
(1998) muestran que las estimaciones dadas por (23) son inadecuadas, particularmente cuando el verdadero
parámetro p toma valores cercanos a 0 o a 1.

8
Intervalo de confianza para la diferencia de proporciones p1 − p2
Sea X1 , X2 , . . . Xn1 una muestra aleatoria, de una distribución Bernoulli con probabilidad de éxito p1 y de
forma independiente, Y1 , Y2 , . . . Yn2 una muestra aleatoria, de una distribución Bernoulli con probabilidad
de éxito p2 . Dado que para n1 y n2 grandes y usando el Teorema del Límite Central, se tiene de forma
aproximada que

(p̂1 − p̂2 ) − (p1 − p2 )


Z=r (28)
p̂1 (1 − p̂1 ) p̂2 (1 − p̂2 )
+
n1 n2

Con lo que se obtiene siguiente intervalo

 s s 
p̂1 (1 − p̂1 ) p̂2 (1 − p̂2 ) p̂1 (1 − p̂1 ) p̂2 (1 − p̂2 ) 
p (p̂1 − p̂2 ) − zα/2 · + < p1 − p2 < (p̂1 − p̂2 ) + zα/2 · + = 1−α (29)
n1 n2 n1 n2

9
Ejercicios
Ejercicio 1
(Ecuación Welch-Satterthwaite) Suponga que X1 , X2 , . . . , Xn1 es una muestra aleatoria de una población
normal (µ1 , σ12 ) y Y1 , Y2 , . . . , Yn2 es otra muestra aleatoria independiente de la anterior de una población
normal (µ2 , σ22 ). Si σ12 6= σ22 desconocidas. Mostrar que:

(X̄1 − X̄2 ) − (µ1 − µ2 )


T(ν) = s
S12 S2
+ 2
n1 n2

Con
(S12 /n1 + S22 /n2 )2
ν=
(S1 /n1 ) /(n1 − 1) + (S22 /n2 )/(n2
2 2 − 1)

Ejercicio 2
¿Cuál es la temperatura corporal normal para personas sanas? Una muestra aleatoria de 130 temperaturas
corporales en personas sanas proporcionadas por Allen Shoemaker dio 36.8 grados de promedio y desviación
estándar 0.4056 grados.
media=36.8
n=130
desv=0.4056
confi=0.99
alfa=1-confi
t=qt(1-alfa/2,n-1)
e=t*desv/sqrt(n); e

## [1] 0.09300609
li=media-e
ls=media+e
ic=c(li,ls); ic

## [1] 36.70699 36.89301


a. Encontrar un intervalo de confianza de 99% para el promedio de temperatura corporal de personas sanas.
b. El intervalo de confianza obtenido en el inciso a) ¿contiene el valor de 37 grados, que es el promedio
aceptado de temperatura citado por médicos y otros? ¿Qué se puede concluir?

Ejercicio 3
Suponha que uma amostra aleatória de 50 garrafas de uma marca específica de xarope para tosse seja
selecionada e o teor alcoólico de cada garrafa seja determinado. Seja µ o teor médio de álcool da população de
todas as garrafas da marca em estudo. Suponha que o intervalo de confiança de 95% resultante seja (7, 8, 9, 4).
a. Um intervalo de confiança de 90% calculado dessa mesma amostra teria sido mais estreito ou mais largo
que o intervalo mencionado acima? Explique seu raciocínio.
b. Considere a afirmação a seguir: existe 95% de chance de µ estar entre 7,8 e 9,4. Essa afirmação está
correta? Por quê?

Ejercicio 4
La cámara de comercio de Bogotá está interesada en estimar la cantidad promedio de dinero que gasta la
gente que asiste a convenciones, calculando comidas, alojamiento y entretenimiento por día. De las distintas

10
convenciones que se llevan a cabo en la ciudad, se seleccionaron 16 personas y se les pregunto la cantidad que
gastaban por día, obteniendo la siguiente información (en miles de pesos) 375, 437, 407, 370, 355, 472, 337,
435, 420, 380, 395, 460, 330, 360, 390, 407. Si se supone que la cantidad de dinero gastada en un día es una
variable aleatoria normal, obtener e interpretar un intervalo de confianza del 99% para la media poblacional.

Ejercicio 5
El DANE llevó a cabo una encuesta sobre el costo de vida en Bogotá y Medellín para obtener el gasto
promedio en alimentación en familias constituidas por cuatro personas. De cada ciudad se selecciona una
muestra aleatoria de 12 familias y se observaron sus gastos semanales (miles) en alimentación obteniendo
medias de 243 y 219 y desviaciones estándar de 27 y 18 respectivamente. Teniendo en cuenta el numeral
anterior, obtenga un intervalo de confianza del 95% para la diferencia real de los promedios. ¿Se estaría
inclinado a concluir que el gasto promedio es mayor en Bogotá?

Ejercicio 6
Se llevó a cabo una ecuesta en Bogotá sobre el ingreso diario por localidades a 10 familias te Teusaquillo
y a 15 de Usaquén. Para Teusaquillo la media y la desviación estándar muestrales son $78264 y $9346
respectivamente, y para Usaquén $78264 y $6415. A un nivel de confianza del 95%. Suponga que los datos se
tomaron de dos poblaciones normales.
a. Establecer si hay diferencia significativa en las varianzas poblacionales de los ingresos diarios por familia.
b. Establecer si hay diferencia significativa en los promedios poblacionales de los ingresos diarios por familia.
n1=10 #Teusaquillo
n2=15 #Usaquen
med1=78264
s1=9346
med2=78264
s2=6415
alfa=0.05
a=qf(1-alfa/2,n1-1,n2-1)
b=qf(alfa/2,n1-1,n2-1)
li=(s1)^2/(s2)^2*1/a
ls=(s1)^2/(s2)^2*1/b
ic=c(li,ls); ic

## [1] 0.6613751 8.0613497


### Parte b)

Ejercicio 7
Para una comparación de los porcentajes de piezas defectuosas producidas por dos líneas de montaje, de
cada línea se seleccionaron muestras aleatorias independientes de 100 piezas. La línea A produjo 18 piezas
defectuosas en la muestra y la línea B contenía 12 piezas defectuosas.
a. Encontrar un intervalo de confianza de 98% para la verdadera diferencia en proporciones de piezas
defectuosas para las dos líneas.
b. ¿Hay evidencia aquí que sugiera que una línea produce una proporción más alta de piezas defectuosas que
la otra?

Ejercicio 8
Un supervisor desea estimar el costo promedio correcto del primer semestre en una universidad hasta en 50
mil pesos, con una probabilidad del 94%. Si se selecciona una muestra aleatoria de estudiantes de primer

11
semestre y a cada uno se les pide anotar sus datos financieros ¿Cuántos alumnos deben ser incluidos en la
muestra? Si una muestra piloto arrojo una desviación estándar de 320 mil pesos. %RTA: 145

Ejercicio 9
Sea X1 , X2 , . . . , Xn una muestra aleatoria con distribución N (µ1 , σ12 ) y Y1 , Y2 , . . . , Ym otra muestra aleatoria
independiente con distribución N (µ2 , σ22 ). Si a, b y k son constantes conocidas, encontrar un intervalo de
confianza al (1 − α)% para aµ1 + bµ2 en los siguientes casos
a. Con σ12 y σ22 conocidas.
b. Con σ12 y σ22 desconocidas pero σ12 = kσ22 .

Ejercicio 10
El bogotano promedio se ha acostumbrado a comer fuera de casa, y muchos en restaurantes de comida
rápida. Un resultado de este hábito ha sido el incremento en el consumo per cápita de queso y de las bebidas
refrescantes desde hace una década. El ministerio de salud da a conocer que, por año, cada bogotano consume
2.57 libras de queso y toma 47 litros de refrescos. Para probar la veracidad de estos promedios se seleccionó
una muestra aleatoria de 20 consumidores y se obtuvo la siguiente:
Queso (lb/año): Media 2.81, Desviación 0.38

Bebidas(L/año): Media 45.2, Desviación 11.5


¿Estos datos le permiten cuestionar la veracidad de la información del Ministerio de salud? Usar un nivel de
confianza del 98%. RTA: (2.59, 3.03) ; (38.67, 51.73)

Ejercicio 11
Las edades de cinco profesores universitarios son: 29, 44, 51, 62 y 49 años. Suponga que las edades se
distribuyen de forma normal. Calcular:
a. Un intervalo de confianza del 99% para la desviación estándar de las edades de todos los profesores de la
universidad. RTA: (6.24 , 52.87)
b. Con una confiabilidad del 98% un intervalo de confianza para la edad promedio de todos los profesores de
la universidad. RTA: (26.84 , 67.15)
x=c(29, 44, 51, 62, 49)
n=length(x)
s2=var(x)
conf=0.99
alfa=1-conf
a=qchisq(1-alfa/2, n-1)
b=qchisq(alfa/2, n-1)
li=sqrt((n-1)*s2/a)
ls=sqrt((n-1)*s2/b)
ic=c(li,ls); ic

## [1] 6.236641 52.843331


####Parte b
[Link](x, [Link] = 0.98)

##
## One Sample t-test
##
## data: x

12
## t = 8.7428, df = 4, p-value = 0.0009432
## alternative hypothesis: true mean is not equal to 0
## 98 percent confidence interval:
## 26.85689 67.14311
## sample estimates:
## mean of x
## 47

Ejercicio 12
Suponga que se quiere estimar la diferencia en el promedio de la acidez de la lluvia en dos lugares, uno en un
área relativamente limpia, cerca del océano, y el otro en un área sujeta a una alta contaminación del aire.
Si se desea realizar la estimación con un error máximo de 0.1 pH, y con una probabilidad de 0.9, ¿Cuántas
lluvias, habrá que incluir en cada muestra (suponga que la varianza de las mediciones de pH es 0.25 en ambos
lugares y que los tamaños muestrales son iguales.)

Ejercicio 13
In an effort to estimate the mean amount spent per customer for dinner at a major Atlanta restaurant, data
were collected for a sample of 49 customers. Assume a population standard deviation of $5.
a. At 95% confidence, what is the margin of error?
b. If the sample mean is $24.80, what is the 95% confidence interval for the population mean?

Ejercicio 14
Levando em conta simultaneamente as respostas dadas por 200 clientes de uma empresa a todos os itens
de um questionário, foi calculado um índice de satisfação global correspondente a cada entrevistado. Ele
pode variar desde 0 (totalmente insatisfeito) até 100 (totalmente satisfeito). Com respeito a esse índice de
satisfação, foi construído um Intervalo de Confiança a 95% para a sua média populacional, que vai desde 43,5
até 63,9. Quais das seguintes afirmações estão corretas e quais não estão? Por que?
a. A probabilidade de que a verdadeira média populacional do índice de satisfação esteja entre 43,5 e 63,9 é
95%.
b. Se fosse extraída uma outra amostra, também com 200 clientes, a probabilidade da média (amostral) dos
índices de satisfação correspondentes a essa nova amostra estar entre 43,5 e 63,9 seria de 95%.
c. Se fossem extraídas 100 amostras, todas elas com 200 clientes, e (usando o mesmo procedimento que deu
origem ao intervalo de 43,5 a 63,9) fosse construído um Intervalo de Confiança a 95% para cada uma delas,
cerca de 95 desses intervalos conteriam dentro de si a verdadeira média populacional.
d. O desvio padrão populacional do índice de satisfação é aproximadamente igual a 5,1.
e. Todos os entrevistados têm seus índices de satisfação entre 43,5 e 63,9.

Ejercicio 15
Una inspectora de la Superintendencia de Industria y Comercio investiga las acusaciones contra una fábrica de
cerveza, porque no llena bien sus latas, afirmando que contienen 330 ml. Se muestrearon 18 latas de cerveza,
encontrando un contenido medio de 325 ml. y una desviación estándar de 8.5 ml. ¿Debe la inspectora multar
la cervecería con un nivel de confianza del 99%? RTA: (319.19, 330.81)

Ejercicio 16
Un fabricante de automóviles asegura que el recorrido promedio por galón de gasolina corriente de su marca
es al menos 40 km. Un defensor del consumidor piensa que este valor es exagerado. Diez automóviles de este

13
modelo son conducidos del mismo modo con un galón de gasolina corriente, los kilómetros recorridos son: 48,
44, 40, 40, 20, 44, 20, 44, 50 y 35. ¿Qué se puede concluir con una confianza del 90%? RTA: (32.35 , 44.65)

Ejercicio 17
Let X̄ be the mean of a random sample of size n from a distribution that N (µ, 9) . Find n such that
P (X̄ − 1 < µ < X̄ + 1) = 0.90.

Ejercicio 18
A chemical process has produced, on the average, 800 tons of chemical per day. The daily yields for the past
week are 785, 805, 790, 793, and 802 tons. Estimate the mean daily yield, with confidence coefficient 0.90,
from the data. What assumptions did you make?
x=c(785, 805, 790, 793, 802)
[Link](x, [Link] = 0.90)

##
## One Sample t-test
##
## data: x
## t = 213.24, df = 4, p-value = 2.902e-09
## alternative hypothesis: true mean is not equal to 0
## 90 percent confidence interval:
## 787.0519 802.9481
## sample estimates:
## mean of x
## 795
cv=20/800*100; cv

## [1] 2.5

Ejercicio 19
Refer to Exercise 18. Find a 90% confidence interval for σ 2 , the variance of the daily yields.
x=c(785, 805, 790, 793, 802)
n=length(x)
s2=var(x)
conf=0.90
alfa=1-conf
a=qchisq(alfa/2,n-1)
b=qchisq(1-alfa/2,n-1)
li=(n-1)*s2/b
ls=(n-1)*s2/a
ic=c(li,ls); ic

## [1] 29.30101 391.15097


icd=c(sqrt(li),sqrt(ls));icd

## [1] 5.41304 19.77754

Ejercicio 20
Sea X1 , X2 , . . . , Xn una muestra aleatoria de una distribución N (θ, θ). Determinar un intervalo de confianza
para θ usando la distribución

14
a. Normal.
b. ji-cuadrado.

Ejercicio 21
A survey conducted by the American Automobile Association showed that a family of four spends an average
of $215.60 per day while on vacation. Suppose a sample of 64 families of four vacationing at Niagara Falls
resulted in a sample mean of $252.45 per day and a sample standard deviation of $74.50.
a. Develop a 95% confidence interval estimate of the mean amount spent per day by a family of four visiting
Niagara Falls.
b. Based on the confidence interval from part (a), does it appear that the population mean amount spent per
day by families visiting Niagara Falls differs from the mean reported by the American Automobile Association?
Explain.

Ejercicio 22
Los bombillos industriales deberían tener una vida media útil aceptable para usuarios potenciales y una
variación relativamente pequeña en su duración. Si algunos bombillos fallan demasiado pronto en su vida útil,
los usuarios se molestan y es probable que los cambien por bombillos producidos por un fabricante diferente.
Variaciones grandes por arriba de la media reducen las ventas de reemplazo; en general, la variación en la
vida útil de los focos altera los programas de cambio establecidos por los usuarios. Una muestra aleatoria de
20 bombillos producidos por un fabricante particular produjo los siguientes valores de vida útil (en horas):
2100 2302 1951 2067 2415 1883 2101 2146 2278 2019 1924 2183 2077 2392 2286 2501 1946 2161 2253 1827
a. Calcular un intervalo de confianza para la vida útil media de la duración de los bombillos producidos por
este fabricante al 98% de confianza.
b. Establezca un límite de confianza superior de 99% para la desviación estándar de las duraciones de vida
útil para los bombillos producidos por este fabricante. ¿La verdadera desviación estándar poblacional es
menor que 150 horas? ¿Por qué sí o por qué no?

Ejercicio 23
Sea X1 , X2 , . . . , Xn una muestra aleatoria de una distribución Bernoulli con probabilidad de éxito θ. Dado
(X̄ − θ)
que para n grande p tiene aproximadamente una distribución normal estándar, utilizar esta
θ(1 − θ)/n
expresión para calcular un intervalo del 100(1 − α)% para θ. Este intervalo se conoce como intervalo Score y
fue propuesto por Wilson (1927).

Ejercicio 24
El número de accidentes del tránsito mortales en una ciudad es, en promedio, de 12 mensuales. Tras una
campaña de señalización y educación se contabilizaron en 6 meses sucesivos: 8; 11; 9; 7; 10; 9 accidentes
mortales. ¿Se puede decir con un nivel de confianza del 95% que fue efectiva la campaña? RTA: (7.51 , 10.48)

Ejercicio 25
Se sabe que el peso promedio de mujeres entre 30 y 40 años en cierta región, ha sido históricamente de 53 kg,
con una desviación estándar de 5 Kg. En un estudio realizado en 16 mujeres de tales edades en esa región
arrojó una media de 50 Kg. ¿Se puede decir a un nivel de confianza del 95% si el peso promedio ha cambiado?
RTA: (47.55 , 52.45)

15
Ejercicio 26
Owing to the variability of trade-in allowance, the profit per new car sold by an automobile dealer varies
from car to car. The profits per sale (in hundreds of dollars), tabulated for the past week, were 2.1, 3.0, 1.2,
6.2, 4.5, and 5.1. Find a 90% confidence interval for the mean profit per sale. What assumptions must be
valid for the technique that you used to be appropriate?

Ejercicio 27
A mathematics test is given to a class of 50 students randomly selected from high school 1 and also to a class
of 45 students randomly selected from high school 2. For the class at high school 1, the sample mean is 75
points, and the sample standard deviation is 10 points. For the class at high school 2, the sample mean is 72
points, and the sample standard deviation is 8 points. Construct a 95% confidence interval for the difference
in the mean scores. What assumptions are necessary?

Ejercicio 28
Uma amostra aleatória de 625 donas de casa revela que 70% delas preferem a marca A de detergente. Construa
um intervalo de confiança para p = proporção de donas de casa que preferem A com coeficiente de confiança
de 90%

Ejercicio 29
En un estudio sobre hipertensión se tomó una muestra de 200 personas en una zona rural y se encontró a
48 hipertensos. En otra muestra de 400 personas en una zona urbana, se obtuvo un 27, 7% de hipertensos.
¿Se puede decir que el porcentaje de hipertensos en la zona urbana es distinto que en la rural? Use 95% de
confianza. RTA: (-0.1107 , 0.0367)

Ejercicio 30
Un entomólogo desea estimar el tiempo de desarrollo promedio correcto del ácaro rojo de los cítricos hasta en
medio día. Por experimentos previos se sabe que la desviación estándar del tiempo es de cuatro días. ¿Qué
tan grande debe ser la muestra del entomólogo para tener una confianza del 97% de su estimación? RTA: 302
desv=4
e=0.5
confi=0.97
alfa=1-confi
z=qnorm(1-alfa/2); z

## [1] 2.17009
n=1+round((desv*z/e)^2,0);n

## [1] 302

Ejercicio 31
Biólogos de la Comisión de Caza y Pesca de Florida observaron las zonas de distribución estacionales (en
hectáreas) para caimanes en un lago en las afueras de Gainesville, Florida. Cinco caimanes observados en
la primavera mostraron zonas de distribución de 8.0, 12.1, 8.1, 18.2 y 31.7. Cuatro caimanes diferentes
observados en el verano mostraron zonas de distribución de 102.0, 81.7, 54.7 y 50.7.
a. Con un 90% de confianza determinar si las varianzas poblacionales entre las zonas de distribución en
primavera y verano son iguales o diferentes.
b. Calcular la diferencia entre los promedios de las zonas de distribución en primavera y verano, con un
intervalo de confianza del 95%.

16
Ejercicio 32
El cobre sólido, producido por sinterización (calentamiento sin fundir) de un polvo en condiciones ambientales
especifi cadas, se mide a continuación para ver su porosidad (en fracción de volumen debido a huecos) en un
laboratorio. Una muestra de n1 = 4 mediciones independientes de porosidad tienen una media de X̄1 = 0.22
y varianza de s21 = 0.001. Un segundo laboratorio repite el mismo proceso en cobre sólido formado de un
polvo idéntico y obtiene n2 = 5 mediciones independientes de porosidad con X̄2 = 0.17 y s22 = 0.002.
a. Probar si es válido suponer que las varianzas poblacionales son iguales con un nivel de confianza del 98%.
b. Calcular la diferencia real entre las medias poblacionales (µ1 − µ2 ) para estos dos laboratorios, con un
coeficiente de confianza de 0.95.

Ejercicio 33
Una empresa de fabrica bombillas de 60 W mediante dos procesos diferentes, Proceso A y Proceso B se
considera que ambos procesos producen bombillas con igual promedio de vida útil, sin embargo existen dudas
respecto a la variabilidad en la duración de las bombillas. Para estudiar esta situación el departamento
de ingeniería decidió tomar una muestra de 16 bombillas para cada uno de los procesos de producción y
mediante un experimento acelerado estimar la variabilidad de cada una de estas muestras, se calculó entonces
la varianza de cada una de las muestras obteniéndose que la varianza de la muestra del proceso A, SA 2
, es el
doble de la varianza de la muestra del proceso B, SB . Considerando que la variabilidad en las poblaciones
2

de bombillas producida por cada uno de los procesos debería ser igual, puede afirmarse que lo observado
mediante estas pruebas refleja problemas en el proceso A?. Si la probabilidad del evento anterior es menor a
0.11 se puede afirmar que el proceso A presenta problemas.

Ejercicio 34
Un fabricante farmacéutico compra materias primas de dos proveedores diferentes. El nivel medio de impurezas
es aproximadamente el mismo para ambos proveedores, pero el fabricante está preocupado por la variabilidad
en la cantidad de impurezas de entre un embarque y otro. Si el nivel de impurezas tiende a variar en forma
excesiva de una fuente de abastecimiento, esto podría afectar la calidad del producto final. Para comparar la
variación en el porcentaje de impurezas para los dos proveedores, el fabricante selecciona diez envíos de cada
uno de ellos y mide el porcentaje de impurezas de cada envío. Las varianzas muestrales fueron s21 = 0.273
y s22 = 0.094 respectivamente. Calcular un intervalo de confianza de 95% para el cociente de las varianzas
poblacionales.

Ejercicio 35
A chemist who has prepared a product designed to kill 60/ of a particular type of insect wants to evaluate
the kill rate of her preparation. What sample size should she use if she wishes to be 95/ confident that her
experimental results fall within 0.02 of the true fraction of insects killed?

Ejercicio 36
To estimate the proportion of unemployedworkers in Panama, an economist selected at random 400 persons
from the working class. Of these, 25 were unemployed.
a. Estimate the true proportion of unemployed workers and place bounds on the error of estimation.
b. How many persons must be sampled to reduce the bound on the error of estimation to 0.02?

Ejercicio 37
Past experience shows that the standard deviation of the yearly income of textile workers in a certain state is
$400. How many textile workers would you need to sample if you wished to estimate the population mean to
within $50.00, with probability 0.95?

17
Ejercicio 38
How many voters must be included in a sample collected to estimate the fraction of the popular vote favorable
to a presidential candidate in a national election if the estimate must be correct to within 0.005? Assume that
the true fraction lies somewhere in the neighborhood of 0.5. Use a confidence coefficient of approximately .95.

Ejercicio 39
In a poll taken among college students, 300 of 500 fraternity men favored a certain proposition whereas 64 of
100 nonfraternity men favored it. Estimate the difference in the proportions favoring the proposition and
place a 2-standard-deviation bound on the error of estimation.

Ejercicio 40
Refer to Exercise 39. How many fraternity and nonfraternity men must be included in a poll if we wish to
obtain an estimate, correct to within 0.05, for the difference in the proportions favoring the proposition?
Assume that the groups will be of equal size and that p = 0.6 will suffice as an approximation of both
proportions.

18
Referencias
• Cuervo, E. C. (2015). Estadística matemática. Universidad Nacional de Colombia.
• Mendenhall, W., Scheaffer, R. L., & Wackerly, D. D. (1994). Estadística matemática con aplicaciones.
Grupo Editorial Iberoamérica,.
• Zhang, H., & Rojas, H. A. G. (2010). Teoría estadística: aplicaciones y métodos. Hugo Andrés Gutiérrez
Rojas.

¡Gracias!
Dagoberto Bermúdez R
Email: dagobertobermudez@[Link]

19

También podría gustarte