0% encontró este documento útil (0 votos)
71 vistas9 páginas

Taller de Estadística Inferencial 2021

El documento presenta 5 puntos relacionados con estadística inferencial. El primer punto calcula un intervalo de confianza para el reembolso promedio de declaraciones de impuestos presentadas tarde. El segundo punto compara la prestación promedio de seguro de desempleo en Virginia vs a nivel nacional. El tercer punto estima la proporción de nidos de tortugas con más de 100 huevos. El cuarto punto calcula intervalos de confianza para la diferencia de proporciones entre tamaños de peces. El quinto punto estima intervalos de confianza para
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
71 vistas9 páginas

Taller de Estadística Inferencial 2021

El documento presenta 5 puntos relacionados con estadística inferencial. El primer punto calcula un intervalo de confianza para el reembolso promedio de declaraciones de impuestos presentadas tarde. El segundo punto compara la prestación promedio de seguro de desempleo en Virginia vs a nivel nacional. El tercer punto estima la proporción de nidos de tortugas con más de 100 huevos. El cuarto punto calcula intervalos de confianza para la diferencia de proporciones entre tamaños de peces. El quinto punto estima intervalos de confianza para
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd

Taller No.

Fundación universitaria los libertadores.


Estadística Inferencial

Angie Pardo Salazar


Brandol Palomares Saiz
Laura Nathalia Anaya
2021
Punto 1.

Las declaraciones de impuestos presentadas antes del 31 de marzo obtienen un reembolso


que en promedio es de $1056. Considere la población de los declarantes de “última hora”
que presentan su declaración los últimos cinco días del periodo para este trámite
(normalmente del 10 al 15 de abril)
En una muestra de 400 personas que presentaron su declaración entre el 10 y el 15 de abril,
la media de los reembolsos fue $910. Por experiencia se sabe que es posible considerar que
la desviación estándar poblacional es σ $1600. Con α 0.05
Código Salida
> zsum.test(mean.x=910,sigma.x=1600, One-sample z-Test
n.x=400,conf.level=0.95)
data: Summarized x
z = 11.375, p-value < 2.2e-16
alternative hypothesis: true mean
is not equal to 0
95 percent confidence interval:
753.2029 1066.7971
sample estimates:
mean of x
910

GEOGEBRA EXCEL
Punto 2

La Employment and Training Administration informó que la prestación media del seguro de
desempleo es $238/semana (The World Almanac, 2003). Un investigador del estado de
Virginia anticipó que datos muestrales indicarán que la prestación media semanal del seguro
de desempleo en el estado de Virginia es menor que la media de todo el país.
En una muestra de 100 individuos la media muestral encontrada fue $231 y la desviación
estándar muestral fue s $80 Si α 0.05
Código Salida
## instalar el paquete BSDA One-sample t-Test
library(BSDA)
data: Summarized x
help("tsum.test") t = 28.875, df = 99, p-
tsum.test(mean.x=5,s.x=sqrt(2),n.x=15,conf.level=0.90) value < 2.2e-16
alternative hypothesis:
true mean is not equal to
0
95 percent confidence
interval:
215.1263 246.8737
sample estimates:
mean of x
231

GEOGEBRA EXCEL

Punto 3.

Construir un intervalo de confianza al 95% para la proporción de nidos que tienen más de 100
huevos.
 
Primero definimos una variable que vale 1 si el nido tiene más de 100 huevos y 0 en caso
contrario:

tortugas %>%
mutate(masDe100=ifelse(Huevos>100,1,0)) %>%
tabyl(masDe100) %>%
adorn_totals("row")

## masDe100 n percent
## 0 1166 0.91307753
## 1 111 0.08692247
## Total 1277 1.00000000

Por tanto, la proporción estimada de nidos con más de 100 huevos es el 8.69%. Calculamos el
intervalo de confianza con BinomCI():

BinomCI(111, 1277,conf.level=0.95)

## est lwr.ci upr.ci


## [1,] 0.08692247 0.07268332 0.1036394

Por tanto, con un 95% de confianza podemos asegurar que entre un 7.27% y un 10.37% de los
nidos de tortuga de Boa Vista tienen más de 100 huevos.
Si queremos el intervalo con mejor presentación:

tortugas %>%
mutate(masDe100=ifelse(Huevos>100,1,0)) %>%
summarize(nE=sum(masDe100),n=n()) %>%
do(data.frame(BinomCI(.$nE,.$n,conf.level=0.95))) %>%
do(formatInterval(.$est,.$lwr.ci,.$upr.ci)) %>%
flextable() %>%
fontsize(size=14, part="all") %>%
autofit()

estimateCI95%
0.0869(0.0727, 0.1036)

Punto 4

En una piscifactoría se desea comparar el porcentaje de peces adultos que miden menos de 20
cm con los que miden más de 40 cm. Para ello, se toma una muestra de 200 peces observando
que 40 de ellos miden menos de 20 cm y una muestra de 200 peces de los que 57 miden más
de 40 cm. Halla un intervalo de confianza para la diferencia de proporciones al nivel de
confianza del 0.95. Realizarlo también para un nivel de confianza del 99%.

Solución
> vector_menos20<- c(40, 143)
> vector_peces<- c(200, 200)
> prop.test(vector_menos20, vector_peces)

2-sample test for equality of proportions with continuity correction

data: vector_menos20 out of vector_peces


X-squared = 104.8, df = 1, p-value < 2.2e-16
alternative hypothesis: two.sided
95 percent confidence interval:
-0.6035891 -0.4264109
sample estimates:
prop 1 prop 2
0.200 0.715

> prop.test(vector_menos20, vector_peces, conf.level = 0.99)

2-sample test for equality of proportions with continuity correction

data: vector_menos20 out of vector_peces


X-squared = 104.8, df = 1, p-value < 2.2e-16
alternative hypothesis: two.sided
99 percent confidence interval:
-0.6298547 -0.4001453
sample estimates:
prop 1 prop 2
0.200 0.715

Intervalos de confianza para la diferencia de proporciones entre los peces adultos que miden
menos de 20 cm al 95% y 99%, respectivamente: (-0.6035891, -0.4264109), (-0.6298547, -
0.4001453)

> vector_mas40<- c(160, 57)


> vector_peces<- c(200, 200)
> prop.test(vector_mas40, vector_peces)

2-sample test for equality of proportions with continuity correction

data: vector_mas40 out of vector_peces


X-squared = 104.8, df = 1, p-value < 2.2e-16
alternative hypothesis: two.sided
95 percent confidence interval:
0.4264109 0.6035891
sample estimates:
prop 1 prop 2
0.800 0.285

> prop.test(vector_mas40, vector_peces, conf.level = 0.99)

2-sample test for equality of proportions with continuity correction

data: vector_mas40 out of vector_peces


X-squared = 104.8, df = 1, p-value < 2.2e-16
alternative hypothesis: two.sided
99 percent confidence interval:
0.4001453 0.6298547
sample estimates:
prop 1 prop 2
0.800 0.285

Intervalos de confianza para la diferencia de proporciones entre los peces adultos que miden
más de 40 cm al 95% y 99%, respectivamente: (0.4264109, 0.6035891) y (0.4001453,
0.6298547)

> vector_compar<- c(40, 57)


> vector_peces<- c(200, 200)
> prop.test(vector_compar, vector_peces)

2-sample test for equality of proportions with continuity correction

data: vector_compar out of vector_peces


X-squared = 3.4841, df = 1, p-value = 0.06196
alternative hypothesis: two.sided
95 percent confidence interval:
-0.173589075 0.003589075
sample estimates:
prop 1 prop 2
0.200 0.285

> prop.test(vector_compar, vector_peces, conf.level = 0.99)

2-sample test for equality of proportions with continuity correction

data: vector_compar out of vector_peces


X-squared = 3.4841, df = 1, p-value = 0.06196
alternative hypothesis: two.sided
99 percent confidence interval:
-0.19985467 0.02985467
sample estimates:
prop 1 prop 2
0.200 0.285

Intervalos de confianza para la diferencia de proporciones entre los peces adultos que miden
menos de 20 cm y los que miden más de 40 cm al 95% y 99%, respectivamente: (-
0.173589075, 0.003589075) y (-0.19985467, 0.02985467)
Punto 5.
De una cierta población se ha extraído una muestra de 64 individuos, cuyo valor medio es 1012.
Se sabe por otras experiencias del mismo tipo, que la desviación típica vale 25. Hallar intervalos
de confianza para el valor medio de la población a los niveles de confianza del 0.95 y 0.99. 
Solución
Iniciamos un nuevo Script en RStudio donde introducimos los datos relativos a la
media, varianza, tamaño muestral y nivel de significación que proporciona el enunciado.
> alpha<- 0.05
>  n = 64
>  varianza <- 625
> media <- 1012
> cuantil<- qnorm(1 – alpha/2)
Una vez introducidos los datos del enunciado, pasamos a calcular los extremos inferior
y superior del intervalo de acuerdo a la expresión que se vio anteriormente:
> lim_inf<-media – cuantil * sqrt(varianza) / sqrt(n)
> lim_inf
[1] 1005.875
> lim_sup<- media + cuantil * sqrt(varianza) / sqrt(n)
> lim_sup
[1] 1018.125
Por tanto, se tiene el 95% de confianza de que el
intervalo [1005.875, 1018.125] contenga el valor medio de la población
P[1005.875 ≤ μ ≤ 1018.125 ] = 0.95

Para el nivel de confianza del 0.99, lo único que tenemos que cambiar es el valor de α

> alpha<- 0.01
> cuantil<- qnorm(1 – alpha/2)
> lim_inf<-media – cuantil * sqrt(varianza) / sqrt(n)
> lim_inf
[1] 1003.951

> lim_sup<- media + cuantil * sqrt(varianza) / sqrt(n)


> lim_sup
[1] 1020.049

Por tanto, el intervalo de confianza para el valor medio de la población al nivel de


confianza del 0.99 es [1003.951, 1020.049]
P[1003.951 ≤ μ ≤ 1020.049 ] = 0.99

También podría gustarte