Taller No.
Fundación universitaria los libertadores.
Estadística Inferencial
Angie Pardo Salazar
Brandol Palomares Saiz
Laura Nathalia Anaya
2021
Punto 1.
Las declaraciones de impuestos presentadas antes del 31 de marzo obtienen un reembolso
que en promedio es de $1056. Considere la población de los declarantes de “última hora”
que presentan su declaración los últimos cinco días del periodo para este trámite
(normalmente del 10 al 15 de abril)
En una muestra de 400 personas que presentaron su declaración entre el 10 y el 15 de abril,
la media de los reembolsos fue $910. Por experiencia se sabe que es posible considerar que
la desviación estándar poblacional es σ $1600. Con α 0.05
Código Salida
> zsum.test(mean.x=910,sigma.x=1600, One-sample z-Test
n.x=400,conf.level=0.95)
data: Summarized x
z = 11.375, p-value < 2.2e-16
alternative hypothesis: true mean
is not equal to 0
95 percent confidence interval:
753.2029 1066.7971
sample estimates:
mean of x
910
GEOGEBRA EXCEL
Punto 2
La Employment and Training Administration informó que la prestación media del seguro de
desempleo es $238/semana (The World Almanac, 2003). Un investigador del estado de
Virginia anticipó que datos muestrales indicarán que la prestación media semanal del seguro
de desempleo en el estado de Virginia es menor que la media de todo el país.
En una muestra de 100 individuos la media muestral encontrada fue $231 y la desviación
estándar muestral fue s $80 Si α 0.05
Código Salida
## instalar el paquete BSDA One-sample t-Test
library(BSDA)
data: Summarized x
help("tsum.test") t = 28.875, df = 99, p-
tsum.test(mean.x=5,s.x=sqrt(2),n.x=15,conf.level=0.90) value < 2.2e-16
alternative hypothesis:
true mean is not equal to
0
95 percent confidence
interval:
215.1263 246.8737
sample estimates:
mean of x
231
GEOGEBRA EXCEL
Punto 3.
Construir un intervalo de confianza al 95% para la proporción de nidos que tienen más de 100
huevos.
Primero definimos una variable que vale 1 si el nido tiene más de 100 huevos y 0 en caso
contrario:
tortugas %>%
mutate(masDe100=ifelse(Huevos>100,1,0)) %>%
tabyl(masDe100) %>%
adorn_totals("row")
## masDe100 n percent
## 0 1166 0.91307753
## 1 111 0.08692247
## Total 1277 1.00000000
Por tanto, la proporción estimada de nidos con más de 100 huevos es el 8.69%. Calculamos el
intervalo de confianza con BinomCI():
BinomCI(111, 1277,conf.level=0.95)
## est lwr.ci upr.ci
## [1,] 0.08692247 0.07268332 0.1036394
Por tanto, con un 95% de confianza podemos asegurar que entre un 7.27% y un 10.37% de los
nidos de tortuga de Boa Vista tienen más de 100 huevos.
Si queremos el intervalo con mejor presentación:
tortugas %>%
mutate(masDe100=ifelse(Huevos>100,1,0)) %>%
summarize(nE=sum(masDe100),n=n()) %>%
do(data.frame(BinomCI(.$nE,.$n,conf.level=0.95))) %>%
do(formatInterval(.$est,.$lwr.ci,.$upr.ci)) %>%
flextable() %>%
fontsize(size=14, part="all") %>%
autofit()
estimateCI95%
0.0869(0.0727, 0.1036)
Punto 4
En una piscifactoría se desea comparar el porcentaje de peces adultos que miden menos de 20
cm con los que miden más de 40 cm. Para ello, se toma una muestra de 200 peces observando
que 40 de ellos miden menos de 20 cm y una muestra de 200 peces de los que 57 miden más
de 40 cm. Halla un intervalo de confianza para la diferencia de proporciones al nivel de
confianza del 0.95. Realizarlo también para un nivel de confianza del 99%.
Solución
> vector_menos20<- c(40, 143)
> vector_peces<- c(200, 200)
> prop.test(vector_menos20, vector_peces)
2-sample test for equality of proportions with continuity correction
data: vector_menos20 out of vector_peces
X-squared = 104.8, df = 1, p-value < 2.2e-16
alternative hypothesis: two.sided
95 percent confidence interval:
-0.6035891 -0.4264109
sample estimates:
prop 1 prop 2
0.200 0.715
> prop.test(vector_menos20, vector_peces, conf.level = 0.99)
2-sample test for equality of proportions with continuity correction
data: vector_menos20 out of vector_peces
X-squared = 104.8, df = 1, p-value < 2.2e-16
alternative hypothesis: two.sided
99 percent confidence interval:
-0.6298547 -0.4001453
sample estimates:
prop 1 prop 2
0.200 0.715
Intervalos de confianza para la diferencia de proporciones entre los peces adultos que miden
menos de 20 cm al 95% y 99%, respectivamente: (-0.6035891, -0.4264109), (-0.6298547, -
0.4001453)
> vector_mas40<- c(160, 57)
> vector_peces<- c(200, 200)
> prop.test(vector_mas40, vector_peces)
2-sample test for equality of proportions with continuity correction
data: vector_mas40 out of vector_peces
X-squared = 104.8, df = 1, p-value < 2.2e-16
alternative hypothesis: two.sided
95 percent confidence interval:
0.4264109 0.6035891
sample estimates:
prop 1 prop 2
0.800 0.285
> prop.test(vector_mas40, vector_peces, conf.level = 0.99)
2-sample test for equality of proportions with continuity correction
data: vector_mas40 out of vector_peces
X-squared = 104.8, df = 1, p-value < 2.2e-16
alternative hypothesis: two.sided
99 percent confidence interval:
0.4001453 0.6298547
sample estimates:
prop 1 prop 2
0.800 0.285
Intervalos de confianza para la diferencia de proporciones entre los peces adultos que miden
más de 40 cm al 95% y 99%, respectivamente: (0.4264109, 0.6035891) y (0.4001453,
0.6298547)
> vector_compar<- c(40, 57)
> vector_peces<- c(200, 200)
> prop.test(vector_compar, vector_peces)
2-sample test for equality of proportions with continuity correction
data: vector_compar out of vector_peces
X-squared = 3.4841, df = 1, p-value = 0.06196
alternative hypothesis: two.sided
95 percent confidence interval:
-0.173589075 0.003589075
sample estimates:
prop 1 prop 2
0.200 0.285
> prop.test(vector_compar, vector_peces, conf.level = 0.99)
2-sample test for equality of proportions with continuity correction
data: vector_compar out of vector_peces
X-squared = 3.4841, df = 1, p-value = 0.06196
alternative hypothesis: two.sided
99 percent confidence interval:
-0.19985467 0.02985467
sample estimates:
prop 1 prop 2
0.200 0.285
Intervalos de confianza para la diferencia de proporciones entre los peces adultos que miden
menos de 20 cm y los que miden más de 40 cm al 95% y 99%, respectivamente: (-
0.173589075, 0.003589075) y (-0.19985467, 0.02985467)
Punto 5.
De una cierta población se ha extraído una muestra de 64 individuos, cuyo valor medio es 1012.
Se sabe por otras experiencias del mismo tipo, que la desviación típica vale 25. Hallar intervalos
de confianza para el valor medio de la población a los niveles de confianza del 0.95 y 0.99.
Solución
Iniciamos un nuevo Script en RStudio donde introducimos los datos relativos a la
media, varianza, tamaño muestral y nivel de significación que proporciona el enunciado.
> alpha<- 0.05
> n = 64
> varianza <- 625
> media <- 1012
> cuantil<- qnorm(1 – alpha/2)
Una vez introducidos los datos del enunciado, pasamos a calcular los extremos inferior
y superior del intervalo de acuerdo a la expresión que se vio anteriormente:
> lim_inf<-media – cuantil * sqrt(varianza) / sqrt(n)
> lim_inf
[1] 1005.875
> lim_sup<- media + cuantil * sqrt(varianza) / sqrt(n)
> lim_sup
[1] 1018.125
Por tanto, se tiene el 95% de confianza de que el
intervalo [1005.875, 1018.125] contenga el valor medio de la población
P[1005.875 ≤ μ ≤ 1018.125 ] = 0.95
Para el nivel de confianza del 0.99, lo único que tenemos que cambiar es el valor de α
> alpha<- 0.01
> cuantil<- qnorm(1 – alpha/2)
> lim_inf<-media – cuantil * sqrt(varianza) / sqrt(n)
> lim_inf
[1] 1003.951
> lim_sup<- media + cuantil * sqrt(varianza) / sqrt(n)
> lim_sup
[1] 1020.049
Por tanto, el intervalo de confianza para el valor medio de la población al nivel de
confianza del 0.99 es [1003.951, 1020.049]
P[1003.951 ≤ μ ≤ 1020.049 ] = 0.99