INTERVALOS DE CONFIANZA EN R
Intervalo de confianza para la media en una población normal con varianza
conocida 1.
De una cierta población se ha extraído una muestra de 64 individuos, cuyo valor
medio es 1012. Se sabe por otras experiencias del mismo tipo, que la desviación
típica vale 25. Hallar intervalos de confianza para el valor medio de la población a
los niveles de confianza del 0.95 y 0.99.
Solución
Iniciamos un nuevo Script en R Studio donde introducimos los datos relativos a la
media, varianza, tamaño muestral y nivel de significación que proporciona el
enunciado.
> alpha<- 0.05
> n = 64
> varianza <- 625
> media <- 1012
> cuantil<- qnorm(1 -- alpha/2)
Una vez introducidos los datos del enunciado, pasamos a calcular los extremos
inferior y superior del intervalo de acuerdo a la expresión que se vió anteriormente:
> lim_inf<-media -- cuantil * sqrt(varianza) / sqrt(n)
> lim_inf
[1] 1005.875
> lim_sup<- media + cuantil * sqrt(varianza) / sqrt(n)
> lim_sup
[1] 1018.125
Por tanto, se tiene el 95% de confianza de que el intervalo [1005.875, 1018.125]
contenga el valor medio de la población
P 1005. 875 µ 1018. 125 0. 95
Para el nivel de confianza del 0.99, lo único que tenemos que cambiar es el valor
de α
> alpha<- 0.01
> cuantil<- qnorm(1 -- alpha/2)
> lim_inf<-media -- cuantil * sqrt(varianza) / sqrt(n)
> lim_inf
[1] 1003.951
> lim_sup<- media + cuantil * sqrt(varianza) / sqrt(n)
> lim_sup
[1] 1020.049
Por tanto, el intervalo de confianza para el valor medio de la población al nivel de
confianza del 0.99 es [1003.951, 1020.049]
P 1003. 951 µ 1020. 049 0. 99
Intervalo de confianza para la media en una población normal con varianza
desconocida
En una muestra de 9 preparados de jugo de tomate se ha obtenido una media de
21 mg/100 cc y una cuasidesviación típica de 2.45 mg/100 cc. Supuesto que el
contenido de vitamina C del jugo de tomate se distribuye según una distribución
Normal de varianza desconocida. Se pide:
a) Estimar el contenido medio de vitamina C del jugo de tomate
b) Calcular el intervalo de confianza al 98 %
El estimador pedido es la media muestral, 21
En primer lugar, introducimos los datos del ejemplo
> alpha<- 0.02
>n=9
> cuasi <- 2.45
> media <- 21
La función que devuelve resultados de los cuantiles de la t-Student es:
qt(p, df, [Link] = T)
donde:
p: Vector de probabilidades
df: Grados de libertad
[Link]: Parámetro booleano, si es TRUE (por defecto), las probabilidades son
P[X ≤ x], de lo contrario, P X x .
> cuantil<- qt((1 -- alpha/2), 8, [Link] = T)
> lim_inf<-media -- cuantil * cuasi / sqrt(n)
> lim_inf
[1] 18.63456
> lim_sup<- media + cuantil * cuasi / sqrt(n)
> lim_sup
[1] 23.36544
P 18. 63456 µ 23. 36544 0. 98
Por lo tanto, hay un 98% de confianza de que el intervalo [18.63456, 23.36544]
contenga el contenido medio en vitamina C del jugo de tomate.
Supongamos el mismo ejemplo pero en el caso de disponer de los datos de los 9
preparados en contenido de vitamina C del jugo de tomate. Los datos se muestran
en el fichero [Link]
EJERCICIO:
Para los siguientes datos 120,130,100,115,118,104 hallar un intervalo de 95%
para
>X<-c(120,130,100,115,118,104)
>[Link](x=X,[Link]=0.95
One Sample t-test
data: X
t = 25.529, df = 5, p-value = 1.722e-06
alternative hypothesis: true mean is not equal to 0
95 percent confidence interval:
102.9705 126.0295
sample estimates:
mean of x
114.5
con una confianza del 95% el verdadero valor de la media esta entre 102.97 y
126.029
INTERVALO DE CONFIANZA DIFERENCIA DE MEDIAS
1. INTERVALO DE CONFIANZA PARA DIFERENCIA DE MEDIAS MUESTRAS
GRANDES
EJEMPLO:
Se aplica una prueba estandarizada de química a 50 niñas y 75 niños. Las niñas
obtuvieron una calificación promedio de 76, y los niños de 81. Encuentre un
intervalo de confianza del 95% para la diferencia 1 2, donde 1 es la
calificación promedio de todos los niños y 2 es la calificación promedio de todas
las niñas que pudieron realizar el examen. Suponga que las varianzas de las
poblaciones para las niñas y los niños son 36 y 81 respectivamente.
Solución
> alpha<-0.05
> n1=75
> n2=50
> varianza1<-64
> varianza2<-36
> media1<-81
> media2<-76
>cuantil<-qnorm(1-alpha/2)
> lim_inf<-(media1 - media2) - cuantil * sqrt(varianza1/n1 + varianza2/n2)
> lim_inf
[1] 2.541567
> lim_sup<- (media1 -media2) + cuantil * sqrt(varianza1/n1+varianza2/n2)
> lim_sup
[1] 7.458433
intervalo (2.541,7.458)
INTERVALO DE CONFIANZA DIFERENCIA DE MEDIAS MUESTRAS
PEQUEÑAS CON VARIANZAS IGUALES PERO DESCONCIDAS
1. Se registran los siguientes datos en días, que representan los tiempos de
recuperación de pacientes tratados aleatoriamente con uno de dos medicamentos
para aliviarlos de graves infecciones en la vesícula
Medicamento 1 Medicamento 2
n1 14 n2 16
x1 17 x2 19
s 21 1. 5 s 22 1. 8
Encuentre un intervalo de confianza del 99% para la diferencia 2 1 en el
tiempo promedio de recuperación para los dos medicamentos que las poblaciones
son normales con varianzas iguales.
> alpha<-0.001
> n1=16
> n2=14
> alpha<-0.005
> n1=16
> alpha<-0.005
> n1=14
> n2=16
> varianza1<-1.5
> varianza2<-1.8
> media1<-17
> media2<-19
> cuantil<- qt((1 - alpha/2),n1+n2-2, [Link] = T)
> lim_inf<-(media2 - media1)- cuantil * sqrt(((n1-1)*varianza1+(n2-
1)*varianza2)/(n1+n2-2))*sqrt(1/n1+1/n2)
>lim_inf
[1] 0.70
> lim_sup<-(media2 - media1)+ cuantil * sqrt(((n1-1)*varianza1+(n2-
1)*varianza2)/(n1+n2-2))*sqrt(1/n1+1/n2)
> lim_sup
[1] 3.30
2. La siguiente tabla proporciona datos sobre la precipitación total registrada en 11
estaciones meteorológicas de dos provincias españolas. Suponiendo
independencia y normalidad. Calcular un intervalo de confianza a un nivel de
confianza del 95% para la diferencia de medias. Asuma que ambas varianzas son
iguales
A 100 89 81 120 130 105 60 70 90 108 130
B 120 115 96 115 140 120 75 90 108 130 135
Solución:
>A <- c(100, 89, 84, 120, 130, 105, 60, 70, 90, 108, 130)
>B <- c(120, 115, 96, 115, 140, 120, 75, 90, 108, 130, 135)
> [Link](A,B , [Link] = 0.95, [Link] = TRUE)
Two Sample t-test
data: A and B
t = -1.5755, df = 20, p-value = 0.1308
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-33.381287 4.654015
sample estimates:
mean of x mean of y
98.72727 113.09091
INTERVALO [-33.38,4.65]
INTERVALO DE CONFIANZA PARA UNA PROPORCIÓN
En una muestra de 900 personas con pelo oscuro se encontró que 150 de ellas
tenían los ojos azules. Construir un intervalo de confianza al 95% para la
proporción de individuos que teniendo el pelo oscuro posee los ajos azules. ¿Son
compatibles estos resultados con la suposición de que dicha proporción vale 1/4?
Solución
Intervalo de confianza, a un nivel de confianza del 95% para la proporción de
alumnos varones en la población
> alpha<- 0.05
> n = 900
> p = 150/900
> cuantil<- qnorm(1 -- alpha/2)
> lim_inf<-p -- cuantil * sqrt (p*(1 -- p)) / sqrt (n)
> lim_inf
[1] 0.1423188
> lim_sup<-p + cuantil * sqrt (p*(1 -- p)) / sqrt (n)
> lim_sup
[1] 0.1910145
INTERVALO [0.1423,0.1910]
INTERVALO DE CONFIANZA PARA DIFERENCIA DE PROPORCIONES
Unos estudios sobre las ranas tigres en dos regiones de Méjico tienen como
objetivo comparar las proporciones de dichas ranas en cada una de las regiones.
Para ello se toma una muestra al azar de 100 ranas observando que 5 son ranas
tigres en la zona A, mientras que de una muestra de 150 ranas en la zona B, 9
son ranas tigres. Construir un intervalo de confianza al 95% para la diferencia
entre las verdaderas proporciones de ranas tigres en la dos regiones.
¿Puede suponerse que la proporción de ranas tigres es igual en ambas regiones?
Solución:
>ranastigres<- c(5, 9)
>ranas<- c(100, 150)
> [Link](ranastigres, ranas, [Link] = 0.95)
2-sample test for equality of proportions with continuity correction
data: ranastigres out of ranas
X-squared = 0.0031527, df = 1, p-value = 0.9552
alternative hypothesis: [Link]
95 percent confidence interval:
-0.07550922 0.05550922
sample estimates:
prop 1 prop 2
0.05 0.06
INTERVALO [-0.07550, 0.0555]
2
INTERVALO DE CONFIANZA PARA LA VARIANZA
EJEMPLO :
Para estudiar la audiencia de un programa de televisión, se ha medido el número
de personas que ven el programa en diferentes días. Los datos del número de
personas (en miles) son los siguientes:
521, 742, 593, 635, 788, 717, 606, 639, 666, 624. Suponiendo normalidad. Se
pide: construir un intervalo de confianza al 95% para la varianza.
> datos <- c(521, 742, 593, 635, 788, 717, 606, 639, 666, 624)
> datos
[1] 521 742 593 635 788 717 606 639 666 624
> n <- length(datos)
> alfa <- 0.05
> L1 <- (n -- 1) * varianza / qchisq(1-alfa / 2,n -- 1)
> L2 <- (n -- 1) * varianza / qchisq(alfa /2,n -- 1)
> IC <- c(L1,L2)
> IC
[1] 2891.53 20369.25
El intervalo de confianza pedido es: (20369.25, 2891.53).