CAP9
CAP9
Capítulo 9
Teoría de la estimación
261
262 Teoría de la estimación
E(b
θ) 6= θ o E(b
θ) = θ + b(θ)
Entonces
" n # n
X (Xi − μ)2 1X
2 2 2 2
E(b
σ ) = E − (X − μ) = E(Xi − μ) − E(X − μ) =
n n
i=1 i=1
n
X
1 σ2 σ2
= σ2 − = σ2 −
n n n
i=1
Vamos a fijar, a contuación una serie de conceptos: Un estadístico utilizado para aproximar
un parámetro de la población se denomina estimador del parámetro. El número obtenido
cuando se evalúa el estimador para una muestra en particular, es una estimación del
parámetro. Por ejemplo, el estadístico X es un estimador de μ; el valor que obtenemos al
264 Teoría de la estimación
à n
!
£ ¤ £ £ ¤¤2 (1) £ ¤ 1X
ECM (X) = V ar X + (μ − E X = V ar X = V ar Xi =
n
i=1
à n !
1 X nσ 2 σ2
= V ar (Xi ) = =
n2 n2 n
i=1
de la muestra y por tanto variables aleatorias, siendo el objetivo de los intervalos de con-
fianza encontrar tales funciones de forma que con cierta seguridad se pueda afirmar que
θ∗1 ≤ θ ≤ θ∗2 .
En término generales, la construcción de un intervalo de confianza para un parámetro
desconocido θ consiste en encontrar dos funciones θ∗1 (X1 , X2 , · · · , Xn ) y θ∗2 (X1 , X2 , · · · , Xn )
de los valores muestrales (estadísticos) (θ∗1 ≤ θ∗2 ) tales que
Figura 9.1
donde
Figura 9.2
Por tanto las funciones muestrales θ∗1 (X) y θ∗2 (X) tienen las siguientes expresiones
σ σ
θ∗1 (X) = X − zα/2 √ y θ∗2 (X) = X + zα/2 √
n n
Sustituyendo estas expresiones en el primer miembro de la expresión (9.1) se tiene
∙ ¸
σ σ
P X − zα/2 √ ≤ μ ≤ X + zα/2 √ =1−α (9.2)
n n
9.2 Estimación por intervalos de confianza: Intervalos de confianza para una
población Normal 267
σ ³ σ ´2
= zα/2 √ ⇒ n = zα/2
n
Ejemplo 9.3. Ante la sospecha de una diferencia sistemática entre dos laboratorios A y
B en la determinación de la cantidad de albúmina sérica, expresada en gr./100ml., se ha
realizado una experiencia consistente en la extracción de sangre a 10 pacientes. Para cada
muestra de sangre se midió la albúmina sérica en ambos laboratorios y las diferencias entre
laboratorios (A—B) fueron las siguientes:
0.6, 0.7, 0.8, 0.9, 0.3, 0.5, —0.5, 1.3, 0.4, 0.8
b) ¿Qué tamaño mínimo de muestra deberíamos tomar para que la amplitud del inter-
valo fuese menor o igual que la mitad del anterior?
9.2 Estimación por intervalos de confianza: Intervalos de confianza para una
población Normal 269
Respuesta:
X: “Diferencia albúmina entre A y B”; n = 10; x = 0,58; σ = 0,22; X Ã N (μ, 0,22)
a) 1 − α = 0,90; α = 0,10; α/2 = 0,05; zα/2 = z0,05 = 1,645
∙ ¸ ∙ ¸
σ σ 0,22 0,22
P X − zα/2 √ ≤ μ ≤ X + zα/2 √ = P 0,58 − 1,645 √ ≤ μ ≤ 0,58 + 1,645 √ =
n n 10 10
= P [0,4656 ≤ μ ≤ 0,6944] = 0,90
X −μ
T = √
b/ n − 1
σ
α /2 α/2
1−α
−t +t
α / 2, n −1 α / 2, n −1
o que la distribución de
pb − p
r à N (0, 1) para n grande
pbqb
n
De esta forma el intervalo de confianza para el parámetro desconocido p viene dado por
" r r #
pbqb pbqb
P pb − zα/2 ≤ p ≤ pb + zα/2 =1−α (9.5)
n n
es un intervalo aleatorio, para tamaño de muestra grande, que contiene a p con una proba-
bilidad 1 − α, donde pb = X/n.
Ejemplo 9.5. Una encuesta de 100 votantes para conocer sus opiniones respecto a dos
candidatos muestra que 55 apoyan a A y 45 a B. Se pide: Calcular un intervalo de confianza
para la proporción de votos de cada candidato, al nivel de confianza del 95 %.
Respuesta:
" r r #
pbqb pbqb
P pb − zα/2 ≤ p ≤ pb + zα/2 =
n n
" r r #
55 0,55 × 0,45 55 0,55 × 0,45
=P − 1,96 ≤p≤ + 1,96 =
100 100 100 100
Ejemplo 9.6. Unos grandes almacenes desean estimar la proporción de empleados que
están a favor de cambiar el convenio laboral. Para ello se realiza una encuesta a 100
trabajadores y resulta que la mitad está a favor del cambio y la otra mitad no. La estimación
9.2 Estimación por intervalos de confianza: Intervalos de confianza para una
población Normal 273
debe quedar a menos de 0.05 de la proporción verdadera de los que están a favor del
cambio del convenio, con un coeficiente de confianza del 90 %. ¿Cuántos empleados se
debe muestrear?.
Es necesario una muestra de 271 empleados para estimar la proporción verdadera, que
está a favor del cambio del convenio laboral, con una exactitud de ±0,05.
Ejemplo 9.7. Un equipo de investigadores realiza unos estudios para estimar la proporción
de personas que padecen gripe A, en una región española, mediante un intervalo con un
error máximo de 0.015 y nivel de confianza 0.95. ¿A cuántas personas deben analizar para
alcanzar aproximadamente este objetivo, sabiendo que en un pequeño sondeo orientativo
(muestra piloto) resultó que el 15 % de las personas estaban afectadas por la enfermedad?
Respuesta:
X : “Número de personas con gripe A”; pb = 0,15; zα/2 = z0,025 = 1,96; = 0,015
à p !2 µ √ ¶2
pbqb 0,15 × 0,85
n= z0,025 = 1,96 = 2176,9
0,015
Es necesario una muestra de 2177 personas para estimar la proporción de ellas que padecen
gripe A, con una exactitud de ±0,015.
α /2
1− α α /2 h i
χ2 ≤ χ2 ≤ χ2
P 1−α/2;n n α/2;n = 1 − α
2 2
χ1−α / 2,n χα / 2,n
Por tanto,
⎡ n ⎤ ⎡ n n ⎤
X 2
X 2
X 2
⎢ (Xi − μ) ⎥ ⎢ (Xi − μ) (Xi − μ) ⎥
⎢ 2 ⎥ ⎢ i=1 ⎥
P⎢ χ2α/2;n ⎥ ⎢ ⎥ = 1−α
i=1 i=1
⎢χ1−α/2;n ≤ ≤ ⎥= P⎢ ≤ σ2 ≤
⎣ σ2 ⎦ ⎣ χ2
α/2;n χ1−α/2;n ⎥
2
⎦
⎡ n n ⎤
X 2
X 2
⎢ (Xi − μ) (Xi − μ) ⎥
⎢ i=1 ⎥
⎢ , i=1 ⎥
⎢ χ2α/2;n χ21−α/2;n ⎥
⎣ ⎦
Ejemplo 9.8. Se estudia un nuevo proceso de fabricación de bombillas que se supone reduce
la dispersión de la duración de las mismas. Sabiendo que la duración media de las bombillas
es 1100 horas y suponiendo que su distribución es normal, construir intervalos de confianza
para la dispersión a los niveles del 90 % y 98 % a partir de una muestra de tamaño 20 que
ha dado Σi xi = 22160 y Σi x2i = 25000000.
20
X 20
X 20
X
2 2 2
(xi − μ) = xi + 20μ − 2μ xi =
i=1 i=1 i=1
2
= 25000000 + 20(1100) − 2 × 1100 × 22160 = 448000
9.2 Estimación por intervalos de confianza: Intervalos de confianza para una
población Normal 275
£ ¤
= P 14262,97 ≤ σ 2 ≤ 41290,32 = 0,90
I = [119,42 ; 203,2]
I = [109,20 ; 232,88]
Ejemplo 9.9. En unos laboratorios se realizan unos estudios para determinar el nivel de
nistamina que hay en un determinado ungüento. Se sabe que su distribución sigue una ley
Normal. Se toma una muestra de 16 ungüentos y se calcula su varianza resultando ser de
30. Estimar la varianza mediante un intervalo de confianza del 80 %.
Respuesta: 1 − α = 0,80 ⇒ α/2 = 0,1; χ20,1;15 = 22,3 : χ20,9;15 = 8,55
0.1
0.80 0.1
" # ∙ ¸
σ2
nb σ2
nb 16 × 30 16 × 30
P ≤ σ2 ≤ =P ≤σ ≤2 =
χ2α/2;n−1 χ21−α/2;n−1 22,3 8,55
£ ¤
= P 21,40 ≤ σ 2 ≤ 56,14 = 0,80
⎡ ⎤
⎢ ⎥
⎢ (X − Y ) − (μX − μY ) ⎥
⎢
P ⎢−Zα/2 ≤ s ≤ Zα/2 ⎥
⎥=
⎣ σ 2X σ 2Y ⎦
+
nX nY
⎡ s s ⎤
σ 2X σ 2Y σ 2X σ 2Y
= P ⎣(X − Y ) − Zα/2 + ≤ μX − μY ≤ (X − Y ) + Zα/2 + ⎦=1−α
nX nY nX nY
Ejemplo 9.10. En una vaquería se utilizan dos tipos de piensos para alimentar a las vacas.
Se desea comparar la media de engorde con ambos piensos. Para ello, se alimenta a 10
vacas durante un cierto tiempo con el pienso A obteniéndose una ganancia media de peso
de 2 Kg por vaca. Simultáneamente a otras 12 vacas se les alimenta con el pienso B y se
obtiene un engorde medio de 2.4 Kg. Por experiencias anteriores se sabe que las variables
objeto de estudio, engorde con cada uno de los piensos siguen distribuciones normales con
desviación típica de 0.06 para el pienso A y 0.1 para el pienso B. Estimar la diferencia de
engorde a un nivel de confianza del 95 %.
Respuesta:
⎡ s s ⎤
σ 2A σ 2B σ 2A σ 2B ⎦
P ⎣(X A − X B ) − Zα/2 + ≤ μA − μB ≤ (X A − X B ) + Zα/2 + ⇒
nA nB nA nB
" r #
0,062 0,12
⇒ I = (2 − 2,4) ± 1,96 + = [−0,4677 , − 0,3323]
10 12
Por lo tanto, hay el 95 % de confianza de que μA − μB se encuentre entre −0,4577 y
−0,3323. El intervalo no contiene al cero, por lo tanto hay diferencia de engorde con cada
uno de los piensos, siendo el engorde medio mayor con el pienso B.
2) Desconocidas las varianzas pero supuestas iguales σ 2X = σ 2Y , y tamaños
muestrales pequeños, entonces la variable aleatoria
(X − Y ) − (μX − μY )
T = r à tnX +nY −2
1 1
Sp +
nX nY
9.4 Intervalos de confianza para dos poblaciones normales independientes 279
Suponiendo que las dos poblaciones examinadas son normales e independientes con igual
varianza, estimar la diferencia del contenido medio en nicotina del tabaco a un nivel de
confianza del 95 %.
Respuesta:
16 + · · · + 17 (16 − 15)2 + · · · (17 − 15)2
A : nX = 4; x = = 15; σb2X = = 3,34
4 4
18 + · · · + 19 (18 − 19)2 + · · · (19 − 19)2
B : nY = 4; y = b2Y =
= 19; σ =2
4 4
s r
b2X + nY σ
nX σ b2Y 4 × 3,34 + 4 × 2
Sp = = = 1,88
nX + nY − 2 6
tα/2;nX +nY −2 = t0,025;6 = 2,447
∙ r ¸
1 1
I = (X − Y ) ± tα/2;nX +nY −2 Sp + ⇒
nX nY
" r r #
2 2
⇒ P (15 − 19) − 2,447 × 1,88 ≤ μX − μY ≤ (15 − 19) + 2,447 × 1,88 ⇒
4 4
Por tanto, el contenido medio de nicotina difiere de un laboratorio a otro, siendo dicho
contenido mayor en el laboratorio B que en laboratorio A.
⎡ ⎤
⎢ ⎥
⎢ (X − Y ) − (μX − μY ) ⎥
⎢
P ⎢−Zα/2 ≤ s ≤ Zα/2 ⎥
⎥=
⎣ SX2 SY2 ⎦
+
nX nY
⎡ s s ⎤
2
SX SY2 2
SX SY2
= P ⎣(X − Y ) − Zα/2 + ≤ μX − μY ≤ (X − Y ) + Zα/2 + ⎦=1−α
nX nY nX nY
Respuesta:
⎡ s s ⎤
S12 S22 S12 S o22 ⎦
P ⎣(X 1 − X 2 ) − Zα/2 + ≤ μ1 − μ2 ≤ (X 1 − X 2 ) + Zα/2 + =
n1 n2 n1 n2
" r r #
6 4 6 4
= P (12 − 9) − 1,96 + ≤ μ1 − μ2 ≤ (12 − 9) + 1,96 + =
100 100 100 100
Por lo tanto, se tiene el 95 % de confianza de que μ1 − μ2 esté entre 2.38 y 3.62. Esto
sugiere que μ1 debe ser mayor que μ2 .
9.4 Intervalos de confianza para dos poblaciones normales independientes 281
o
p1 − pb2 ) − (p1 − p2 )
(b
r à N (0, 1) para n1 y n2 grandes
pb1 qb1 pb2 qb2
+
n1 n2
De esta forma el intervalo de confianza para la diferencia de proporciones se construye de
la siguiente manera:
" s s #
pb1 qb1 pb2 qb2 pb1 qb1 pb2 qb2
p1 − pb2 ) − zα/2
P (b + p1 − pb2 ) + zα/2
≤ p1 − p2 ≤ (b + =1−α
n1 n2 n1 n2
Ejemplo 9.12. Unos estudios sobre las ranas tigres en dos regiones de Méjico tienen como
objetivo comparar las proporciones de dichas ranas en cada una de las regiones. Para ello,
se toma una muestra al azar de 100 ranas observando que 5 son ranas tigres en la zona
A, mientras que de una muestra de 150 ranas en la zona B, 9 son ranas tigres. Construir
un intervalo de confianza al 95 % para la diferencia entre las verdaderas proporciones de
ranas tigres en las dos regiones.
Por tanto, hay un 95 % de confianza de que la diferencia entre las verdaderas proporciones
de ranas tigres en las dos regiones se encuentre entre −0,06717 y 0,04714. Como el intervalo
contiene al cero, no parece haber diferencia significativa entre las cantidades de ranas tigres
en las dos regiones.
282 Teoría de la estimación
α /2
α /2 £ ¤
1− α P F1−α/2;nX ,nY ≤ FnX ,nY ≤ Fα/2;nX ,nY = 1 − α
F1−α / 2; n , nY
Fα / 2;n ,nY
X X
Entonces, el intervalo de confianza para el cociente de varianzas se determina de la
siguiente forma:
⎡ ny ny ⎤
X X
⎢ (Yj − μY )2 (Yj − μY )2 ⎥
⎢ nX j=1 2
σY nX j=1 ⎥
⎢ ⎥
P ⎢F1−α/2;nX ,nY n ≤ ≤ Fα/2;n ,n n ⎥=1−α
⎢ nY Xx 2
σX X Y
nY Xx ⎥
⎣ (Xi − μX )2
(Xi − μX )2⎦
i=1 i=1
(nX − 1)SX 2
2 ⎫
(nX − 1)SX ⎪
à χ2nX −1 ⎪
⎪
⎪ σ 2X
σ 2X ⎬ SX2 σ2
nX − 1
2 σ 2 Ã FnX −1,nY −1
Y
⇒ 2 =
⎪
⎪ (n − 1)S S
(nY − 1)SY2 ⎪
⎪
Y Y Y X
à χ2nY −1 ⎭ σ 2Y
σ 2Y
nY − 1
Por tanto
∙ ¸
SY2 σ 2Y SY2
P F1−α/2;nX −1,nY −1 2 ≤ 2 ≤ Fα/2;nX −1,nY −1 2 = 1 − α
SX σX SX
Ejemplo 9.13. De dos poblaciones normales X e Y se han extraído muestras de tamaño
nX = 15 y nY = 10 cuyas cuasivarianzas valen s2X = 69 y s2Y = 44. Construir intervalos
de estimación para el cociente de las varianzas poblacionales a los niveles de confianza del
90 % y 98 %.
Respuesta:
a) 1 − α = 0,90 ⇒ α/2 = 0,05;
Fα/2;nX −1,nY −1 = F0,05;14,9 = 3,03
1 1
F1−α/2;nX −1,nY −1 = F0,95;14,9 = = = 0,38
F0,05;9,14 2,65
∙ ¸
S2 σ 2Y SY2
P F1−α/2;nX −1,nY −1 Y2 ≤ 2 ≤ Fα/2;nX −1,nY −1 2 =
SX σX SX
∙ ¸ ∙ ¸
44 σ 2Y 44 σ 2Y
P 0,38 × ≤ 2 ≤ 3,03 × == P 0,242 ≤ 2 ≤ 1,932 = 0,90
69 σX 69 σX
Por tanto, se tiene el 90 % de seguridad de que la relación de σ 2Y /σ 2X se encuentra
entre 0,242 y 1,932. Como el uno pertenece al intervalo, en realidad no hay razón
para sospechar que σ 2X es distinto de σ 2Y .
b) 1 − α = 0,98 ⇒ α/2 = 0,01;
Fα/2;nX −1,nY −1 = F0,01;14,9 = 5,01
1 1
F1−α/2;nX −1,nY −1 = F0,99;14,9 = = = 0,29
F0,01;9,14 4,03
∙ ¸ ∙ ¸
44 σ2 44 σ2
P 0,29 × ≤ 2Y ≤ 5,01 × = P 0,184 ≤ 2Y ≤ 3,194 = 0,98
69 σX 69 σX
Se llega a la misma conclusión que en apartado anterior pero con una confianza del
98 %.
284 Teoría de la estimación
La varianza de D es:
σ 2D = V ar(D) = V ar(X − Y )
Por lo tanto el problema original de realizar una inferencia sobre dos muestras se reduce al
problema de realizar la inferencia sobre una muestra que consiste en construir un intervalo
de confianza para la media de la población de diferencias. Para la realización de este
intervalo de confianza recurrimos a los métodos utilizados en la Sección 9.2. En particular,
construyamos el intervalo de confianza para μX − μY = μD . Para ello, consideremos la
variable aleatoria
D − μD
T = √
SD / n
que tiene una distribución t−Student con n − 1 grados de libertad.
Tenemos que determinar el valor del cuantil tα/2;n−1 tal que
∙ ¸
D − μD
P −tα/2;n−1 ≤ √ ≤ tα/2;n−1 =
SD / n
∙ ¸
SD SD
= P D − tα/2;n−1 √ ≤ μD ≤ D + tα/2;n−1 √ =1−α
n n
tomaron nuevamente muestras de sangre y se obtuvo una segunda lectura del nivel de
colesterol. Los resultados se muestran a continuación:
Nivel previo 182 230 160 200 160 240 260 480 263 240
Nivel posterior 190 220 166 150 140 220 156 312 240 250
Nivel previo 182 230 160 200 160 240 260 480 263 240
Nivel posterior 190 220 166 150 140 220 216 312 243 250
d=x−y -8 10 -6 50 20 20 44 168 20 -10
10
X ¡ ¢
di − d
268 i=1
d= = 30,8; sd = = 52,36
10 n−1
Para 1 − α = 0,90 =⇒ α/2 = 0,05; tα/2;n−1 = t0,05;9 = 1,833
∙ ¸
SD SD
P D − tα/2;n−1 √ ≤ μD ≤ D + tα/2;n−1 √ =
n n
∙ ¸
52,36 52,36
= P 30,8 − 1,833 √ ≤ μ ≤ 30,8 + 1,833 √ = P [0,4497 ≤ μ ≤ 61,150] = 0,90
10 10
. 10.87; 9.01; 22.50; 12.35; 17.39; 31.05; 17.19; 16.74; 20.33; 19.32; 23.18; 25.15; 15.49;
20.30; 2.38; 13.55; 9.33; 22.72; 10.96; 25.90; 27.66; 9.74; 18.65; 9.31; 24.60; 17.41;
24.86; 15.34; 23.34; 22.81; 17.86
6. En una muestra aleatoria de 900 personas con pelo oscuro se encontró que 150 de ellas
tenían los ojos azules. Construir un intervalo de confianza al 95 % para la proporción
de individuos que teniendo pelo oscuro en la población poseen ojos azules. ¿Son
9.6 Ejercicios propuestos: Relación IX 287
compatibles estos resultados con la suposición de que dicha proporción vale 1/4?
(Sol: [0,1423, 0,191]; No es compatible)
10. Se desea comparar dos métodos rápidos para estimar la concentración de una hor-
mona en una solución. Para ello, se dispone de 10 dosis preparadas en el laboratorio y
se mide la concentración de cada una con los dos métodos. Se obtienen los siguientes
resultados:
Dosis 1 2 3 4 5 6 7 8 9 10
Método A 10.7 11.2 15.3 14.9 13.9 15 15.6 15.7 14.3 10.8
Método B 11.1 11.4 15 15.1 14.3 15.4 15.4 16 14.3 11.2
12. En una piscifactoría se desea comparar el porcentaje de peces adultos que miden
menos de 20 cm con los que miden más de 40 cm. Para ello, se toma una muestra de
200 peces observando que 40 de ellos miden menos de 20 cm y una muestra de 200
288 Teoría de la estimación
peces de los que 57 miden más de 40 cm. Hallar un intervalo de confianza para la
diferencia de proporciones al nivel de confianza del 0.95.(Sol: (−0,1686, 0,001409))
13. Una compañía contrata 10 tubos con filamentos de tipo A y 10 con filamentos de
tipo B. Las duraciones de vida observadas, han sido:
A : 1614; 1094; 1293; 1643; 1466; 1270; 1340; 1380; 1028; 1497
B : 1383; 1138; 1092; 1143; 1017; 1061; 1627; 1021; 1711; 1065
Encontrar un intervalo de confianza para la diferencia de medias. Con α = 0, 05.
(Sol: [−80,33, 353,73]).
Fertilizante A: 30 25 28 29 30 31 24 22 25 27
Fertilizante B: 28 27 28 28 26 27 26 29
. Se pide:
Antes 25 20 25 28 30 30 26 15 18 22
Después 30 25 28 29 30 31 24 22 25 27
Abraham de Moivre