0% encontró este documento útil (0 votos)
60 vistas30 páginas

CAP9

Teoría de la estimación. La Inferencia Estadística es el conjunto de métodos mediante los cuales se puede obtener una conclusión sobre una población a través de la información proporcionada por una muestra. En el caso de que la información que se desea obtener de la población es el valor de alguno de sus parámetros, la técnica que se utiliza es la estimación. Siendo dicha técnica una forma de Inferencia Estadística. En este capítulo se estudiará la estimación de los parámetros poblaciones descon

Cargado por

ana
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
60 vistas30 páginas

CAP9

Teoría de la estimación. La Inferencia Estadística es el conjunto de métodos mediante los cuales se puede obtener una conclusión sobre una población a través de la información proporcionada por una muestra. En el caso de que la información que se desea obtener de la población es el valor de alguno de sus parámetros, la técnica que se utiliza es la estimación. Siendo dicha técnica una forma de Inferencia Estadística. En este capítulo se estudiará la estimación de los parámetros poblaciones descon

Cargado por

ana
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Autora: Ana María Lara Porras

Capítulo 9

Teoría de la estimación

Como ya hemos dicho anteriormente la Inferencia Estadística es el conjunto de métodos


mediante los cuales se puede obtener una conclusión sobre una población a través de la
información proporcionada por una muestra. En el caso de que la información que se desea
obtener de la población es el valor de alguno de sus parámetros, la técnica que se utiliza
es la estimación. Siendo dicha técnica una forma de Inferencia Estadística.
En este capítulo se estudiará la estimación de los parámetros poblaciones desconocidos
y se especificarán algunas propiedades deseables de los Estimadores (funciones de los
valores de la muestra).
La estimación de los parámetros se llevará a cabo de dos formas: la Estimación Puntual
y la Estimación por Intervalo.

Estimación Puntual. Mediante los estadísticos muestrales se estiman los parámetros


de la población, como por ejemplo, la media o la varianza. Es decir, se busca un
estimador que, con base en los datos muestrales, más se aproxime al valor verdadero
del parámetro.

Estimación por Intervalo. Mediante la distribución en el muestreo de la característica


estadística utilizada se determina un intervalo aleatorio que, de forma probable, con-
tiene el verdadero valor del parámetro. Este intervalo recibe el nombre de Intervalo
de Confianza.

9.1. Estimación puntual


Supongamos una variable aleatoria X que sigue una ley de probabilidad con función de
densidad f (x, θ), siendo θ el parámetro poblacional desconocido. El objetivo es encontrar
una función de los valores muestrales que proporcione la “mejor” estimación de θ.

261
262 Teoría de la estimación

Para ello, tomamos una muestra aleatoria, X1 , X2 , · · · , Xn , de tamaño n y sea u(X1 ,


X2 , · · · , Xn ) una función de los valores de la muestra. Recibe el nombre de Estimador u
de θ la función que hace corresponder los valores de la muestra con el valor del parámetro
θ
u(X1 , X2 , · · · , Xn ) = θ
Un estimador de un parámetro θ, que vamos a denotar por b θ (o θ∗ ), es una variable
aleatoria pues varía de muestra a muestra, así a cada muestra de tamaño n le corresponde
un valor de u.
El método descrito proporciona estimadores, pero no asegura que estos sean los mejores,
ni tan siquiera que sean buenos. A continuación mostramos una propiedad interesante de
los estimadores puntuales, como es la Insesgadez.

Estimadores insegados o centrados: Un estimador se dice que es Insesgado o


Centrado si la esperanza del estimador, E(b
θ), coincide con el valor del parámetro θ
que se desea estimar
E(bθ) = θ

• La media muestral es un estimador insesgado de la media poblacional.


En efecto, sea X1 , X2 , · · · , Xn una muestra aleatoria de tamaño n de una dis-
tribución X con media μ. (E(Xi ) = μ para todo i = 1, 2, · · · , n).
Comprobemos que: E(X) = μ
En efecto,
à n ! à n ! n n
1X 1 X 1X 1X 1
E(X) = E Xi = E Xi = E(Xi ) = μ = nμ = μ
n n n n n
i=1 i=1 i=1 i=1

El estimador X de μ tiene algunas buenas propiedades. En particular, que en un muestreo


repetido de una población con media μ los valores de el estimador X fluctuarán alrededor
de μ. También que para muestras de tamaño grande, los valores del estimador X variarán
muy poco de una muestra a otra. Así los valores del estimador X están centrados en μ,
valor que se pretende estimar a través de este estadístico, y para muestras grandes, se
espera que la mayoría de los valores observados caigan cerca de μ.

Estimadores segados o descentrados: Un estimador se dice que es Sesgado


o Descentrado si la esperanza del estimador, E(b
θ), no coincide con el valor del
parámetro θ que se desea estimar

E(b
θ) 6= θ o E(b
θ) = θ + b(θ)

donde b(θ) recibe el nombre de Sesgo o Excentricidad.


9.1 Estimación puntual 263

• La varianza muestral es un estimador sesgado de la varianza poblacional


En efecto, sea X1 , X2 , · · · , Xn una muestra aleatoria de tamaño n de una dis-
tribución X con media μ y varianza σ 2 , (E(Xi ) = μ ; Var(Xi ) = σ 2 para
todo i = 1, 2, · · · n).
Comprobemos que: E(b σ 2 ) 6= σ 2
En efecto, como
n n n ∙
2 1X 2 1 X£ ¤2 X (Xi − μ)2
b
σ = (Xi − X) = (Xi − μ) − (X − μ) = +
n n n
i=1 i=1 i=1
2
¸ X n 2
(X − μ) (Xi − μ)(X − μ) (Xi − μ)
+ −2 = + (X − μ)2 −
n n n
i=1
n
X n
X
(Xi − μ) (Xi − μ)2
− 2(X − μ) = − (X − μ)2
n n
i=1 i=1

Entonces
" n # n
X (Xi − μ)2 1X
2 2 2 2
E(b
σ ) = E − (X − μ) = E(Xi − μ) − E(X − μ) =
n n
i=1 i=1
n
X
1 σ2 σ2
= σ2 − = σ2 −
n n n
i=1

b2 es un estimador sesgado de la varianza poblacional y su sesgo


Por lo tanto, σ
es −σ 2 /n.

- La cuasivarianza muestral es un estimador insesgado de la varianza poblacional


En efecto
" n
# " n
#
1 X n X (X i − X)2
E(S 2 ) = E (Xi − X)2 = E =
n−1 n−1 n
i=1 i=1
µ ¶ µ ¶
n 2 n 2 σ2 n n−1 2
= E(bσ )= σ − = σ = σ2 .
n−1 n−1 n n−1 n

Vamos a fijar, a contuación una serie de conceptos: Un estadístico utilizado para aproximar
un parámetro de la población se denomina estimador del parámetro. El número obtenido
cuando se evalúa el estimador para una muestra en particular, es una estimación del
parámetro. Por ejemplo, el estadístico X es un estimador de μ; el valor que obtenemos al
264 Teoría de la estimación

sustituir los valores de la muestra es la estimación basada en dicha muestra. El estadís-


tico X se denomina estimador puntual de μ porque al evaluarlo para una muestra en
concreto da un solo número.
El estimador bθ del parámetro θ debe tener una distribución concentrada alrededor de
θ y la varianza debe ser lo menor posible. Para estudiar la variabilidad de los valores del
parámetro utilizaremos una cantidad llamada error cuadrático medio.
Definición: Sea b
θ el estimador de θ. Se define el error cuadrático medio, que se denota
por ECM , como:
h i h i h h ii2
ECM (b
θ) = E (b θ − θ)2 = V ar b
θ + (θ − E b
θ
£ ¤
Veamos que: ECM (X) = V ar X

à n
!
£ ¤ £ £ ¤¤2 (1) £ ¤ 1X
ECM (X) = V ar X + (μ − E X = V ar X = V ar Xi =
n
i=1
à n !
1 X nσ 2 σ2
= V ar (Xi ) = =
n2 n2 n
i=1

(1): La media muestral es un estimador insesgado de la media poblacional (E(X) = μ)

9.2. Estimación por intervalos de confianza: Intervalos de


confianza para una población Normal
Ya hemos dicho, en la sección anterior, que los estimadores puntuales sólo proporcionan el
“mejor” valor que se puede proponer como valor del parámetro poblacional desconocido
que se desea estimar, es decir dan una idea aproximada del verdadero valor del parámetro
poblacional pero no se sabe cómo de buena es dicha aproximación. Hemos visto que la
media muestral es un buen estimador de la media poblacional, pero un único valor ob-
servado X generalmente no es exactamente igual a μ, habrá una cierta diferencia entre x
y μ. Sería conveniente poder tener una idea de lo cerca que está nuestra estimación del
verdadero valor de la media poblacional y también poder dar información de los seguros
o confiados que estamos de la precisión de la estimación. Por medio de los intervalos de
confianza podemos no sólo tener una idea del valor de la media, sino también de la pre-
cisión del estimador (cuanto de alejado está el valor del estimador del verdadero valor del
parámetro).
El propósito es determinar un intervalo que con cierta seguridad contenga el parámetro
a estimar. Los extremos del intervalo son funciones θ∗1 (X1 , X2 , · · · , Xn ) y θ∗2 (X1 , X2 , · · · , Xn )
9.2 Estimación por intervalos de confianza: Intervalos de confianza para una
población Normal 265

de la muestra y por tanto variables aleatorias, siendo el objetivo de los intervalos de con-
fianza encontrar tales funciones de forma que con cierta seguridad se pueda afirmar que
θ∗1 ≤ θ ≤ θ∗2 .
En término generales, la construcción de un intervalo de confianza para un parámetro
desconocido θ consiste en encontrar dos funciones θ∗1 (X1 , X2 , · · · , Xn ) y θ∗2 (X1 , X2 , · · · , Xn )
de los valores muestrales (estadísticos) (θ∗1 ≤ θ∗2 ) tales que

P [θ∗1 ≤ θ ≤ θ∗2 ] = 1 − α. para algún α > 0,


entonces se puede decir que θ∗1 y θ∗2
determina un intervalo que tiene la
probabilidad 1 − α de contener al parámetro
poblacional θ.

Figura 9.1
donde

1 − α recibe el nombre de coeficiente de confianza o nivel de confianza. Es


la probabilidad de que un intervalo de confianza contenga el verdadero valor del
parámetro

α es un número pequeño comprendido entre 0 y 1, 0 < α < 1 (usualmente próximo


a 0). Es el riesgo de que el intervalo no contenga el valor del parámetro a estimar θ,
por lo que α recibe el nombre de riesgo del error del intervalo, nivel del error
del intervalo o nivel de significación del intervalo.

θ∗1 y θ∗2 reciben el nombre de límite inferior y superior de confianza, respecti-


vamente
Este intervalo recibe el nombre Intervalo de confianza con coeficiente de confianza
1 − α. Se desea que el coeficiente de confianza sea próximo a la unidad y que la
amplitud del intervalo sea lo más pequeña posible.

En esta sección vamos a estudiar, dentro de la distribución Normal, los intervalos de


confianza para los parámetros μ, σ, p.

9.2.1. Intervalo de confianza para la media de una distribución N (μ, σ)


con varianza conocida
Supongamos que interesa estimar la media poblacional μ para una población N (μ, σ) cuya
varianza es conocida. Para ello, se selecciona de esta población una m.a.s., X1 , X2 , · · · , Xn ,
266 Teoría de la estimación

y se calcula su media muestral, X, como “mejor” estimador puntual de μ. La construcción


del intervalo se hace tomando como base este estimador.
Dado un nivel de significación α,buscamos dos funciones de la media muestral, θ∗1 (X)
y θ∗2 (X), de modo que se verifique:
£ ∗ ∗
¤
P θ1 (X) ≤ μ ≤ θ2 (X) = 1 − α
Dado que
√ X −μ
X Ã N (μ, σ/ n) ⇒ Z = √ Ã N (0, 1)
σ/ n
Entonces
£ ¤ £ ¤
P θ∗1 (X) ≤ μ ≤ θ∗2 (X) = P −θ∗1 (X) ≥ −μ ≥ −θ∗2 (X) =
£ ¤
P −θ∗2 (X) ≤ −μ ≤ −θ∗1 (X) =
£ ¤
P X − θ∗2 (X) ≤ X − μ ≤ X − θ∗1 (X) =
(9.1)
∙ ¸
X − θ∗2 (X) X −μ X − θ∗1 (X)
P √ ≤ √ ≤ √ =
σ/ n σ/ n σ/ n
∙ ¸
X − θ∗2 (X) X − θ∗1 (X)
P √ ≤Z≤ √ = 1 − α.
σ/ n σ/ n
Para un nivel de significación dado, se determina, mediante la Tabla III del Apéndice B,
un valor zα/2 tal que


⎪ X − θ∗2 (X)

⎪ √ = −zα/2
£ ¤ ⎨ σ/ n
P −zα/2 ≤ Z ≤ zα/2 = 1−α ⇒



⎪ X − θ∗1 (X)
⎩ √ = zα/2
σ/ n

Figura 9.2
Por tanto las funciones muestrales θ∗1 (X) y θ∗2 (X) tienen las siguientes expresiones
σ σ
θ∗1 (X) = X − zα/2 √ y θ∗2 (X) = X + zα/2 √
n n
Sustituyendo estas expresiones en el primer miembro de la expresión (9.1) se tiene
∙ ¸
σ σ
P X − zα/2 √ ≤ μ ≤ X + zα/2 √ =1−α (9.2)
n n
9.2 Estimación por intervalos de confianza: Intervalos de confianza para una
población Normal 267

Por lo tanto, la probabilidad de que el intervalo aleatorio


∙ ¸
σ σ
X − zα/2 √ , X + zα/2 √ (9.3)
n n
contenga el verdadero valor de la media μ es 1 − α.
√ √
X −zα/2 (σ/ n) y X +zα/2 (σ/ n) reciben el nombre de límites de confianza inferiores
y superiores, respectivamente, para μ.
Ejemplo 9.1. De una cierta población se ha extraído una muestra de 64 individuos, cuyo
valor medio es x̄ = 1012. Se sabe por otras experiencias del mismo tipo, que la desviación
típica vale 25. Hallar intervalos de confianza para el valor medio de la población a los
niveles de confianza del 0.90, 0,95 y 0,99.
Respuesta:
a) Para un nivel de confianza del 90 % ⇒ 1 − α = 0,90 ⇒ α = 0,1 ⇒ α/2 = 0,05
∙ ¸ ∙ ¸
σ σ 25 25
P X − zα/2 √ ≤ μ ≤ X + zα/2 √ = P 1012 − 1,645 √ ≤ μ ≤ 1012 + 1,645 √ =
n n 64 64
= P [1006,86 ≤ μ ≤ 1017,14] = 0,90
Entonces, hay un 90 % de confianza de que el valor medio de la población se encuentre
entre 1006,86 y 1017,14.
b) Para un nivel de confianza del 95 % =⇒ 1 − α = 0,95 =⇒ α = 0,05 =⇒ α/2 = 0,025
∙ ¸ ∙ ¸
σ σ 25 25
P X − zα/2 √ ≤ μ ≤ X + zα/2 √ = P 1012 − 1,96 √ ≤ μ ≤ 1012 + 1,96 √ =
n n 64 64
= P [1005,875 ≤ μ ≤ 1018,125] = 0,95
Por tanto, se tiene el 95 % de confianza de que el intervalo [1005,875 , 1018,125] comprenda
al valor medio de la población.
En la expresión (9.3) del intervalo de confianza para μ observamos que:
i) Al aumentar el tamaño de la muestra disminuye la amplitud del intervalo, este
resultado es lógico ya que un tamaño grande de la muestra disminuirá el error

estándar, σ/ n.
Por lo tanto, una cuestión que se plantea es cuál debe ser el tamaño mínimo de la
muestra para obtener una estimación de la media con una precisión establecida de
antemano. Para determinar dicho tamaño muestral escribamos la expresión (9.2) de
la siguiente forma
∙ ¸ ∙ ¸
σ σ σ
P −zα/2 √ ≤ X − μ ≤ zα/2 √ = P | X − μ |≤ zα/2 √ =
n n n
£ ¤
= P | X − μ |≤ = 1 − α
268 Teoría de la estimación

donde es la precisión de la estimación o error.

σ ³ σ ´2
= zα/2 √ ⇒ n = zα/2
n

Ejemplo 9.2. Determinar el tamaño muestral correspondiente al apartado a) del Ejemplo


9.1 con una precisión de la estimación igual a 4.
Respuesta:
³ µ ¶
σ ´2 25 2
n = zα/2 = 1,645 = 105,704 ' 106
4
Se necesita una muestra de 106 individuos para estimar el valor medio de la población con
un error igual a 4.

ii) Al aumentar el coeficiente de confianza aumenta la amplitud del intervalo ya que un


nivel de confianza grande incrementa el valor del cuantil zα/2 dando como resultado
un intervalo más amplio.
Situación que se puede observar en el Ejemplo 9.1, donde la amplitud del intervalo

• para un coeficiente de confianza del 95 % es: 1018,125 − 1005,875 = 12,25 mien-


tras que
• para un coeficiente de confianza del 90 % es: 1017,14 − 1006,86 = 10,28.

Ejemplo 9.3. Ante la sospecha de una diferencia sistemática entre dos laboratorios A y
B en la determinación de la cantidad de albúmina sérica, expresada en gr./100ml., se ha
realizado una experiencia consistente en la extracción de sangre a 10 pacientes. Para cada
muestra de sangre se midió la albúmina sérica en ambos laboratorios y las diferencias entre
laboratorios (A—B) fueron las siguientes:

0.6, 0.7, 0.8, 0.9, 0.3, 0.5, —0.5, 1.3, 0.4, 0.8

Considerando normalidad. Se pide, al nivel de confianza 0.9:

a) Calcular un intervalo de confianza para la diferencia media de medición considerando


que la desviación típica de las diferencias poblacionales es 0.22.

b) ¿Qué tamaño mínimo de muestra deberíamos tomar para que la amplitud del inter-
valo fuese menor o igual que la mitad del anterior?
9.2 Estimación por intervalos de confianza: Intervalos de confianza para una
población Normal 269

Respuesta:
X: “Diferencia albúmina entre A y B”; n = 10; x = 0,58; σ = 0,22; X Ã N (μ, 0,22)
a) 1 − α = 0,90; α = 0,10; α/2 = 0,05; zα/2 = z0,05 = 1,645
∙ ¸ ∙ ¸
σ σ 0,22 0,22
P X − zα/2 √ ≤ μ ≤ X + zα/2 √ = P 0,58 − 1,645 √ ≤ μ ≤ 0,58 + 1,645 √ =
n n 10 10
= P [0,4656 ≤ μ ≤ 0,6944] = 0,90

b) Amplitud actual: 0,6944 − 0,4656


µ = 0,2288 ¶
σ σ σ
Amplitud teórica: X + zα/2 √ − X − zα/2 √ = 2zα/2 √
n n n
Se tiene que determinar n de forma que la amplitud del intervalo sea menor o igual que
la mitad de la amplitud del intervalo calculado en el apartado a)
µ ¶2
σ 0,2288 2σ √ 2σ
2zα/2 √ ≤ =⇒ z ≤ n =⇒ n ≥ z =⇒
n 2 0,114 α/2 0,1144 α/2
µ ¶2
2 × 0,22
=⇒ n ≥ 1,645 =⇒ n ≥ 40,3 =⇒ n = 40
0,114

El tamaño mínimo de muestra pedido es 40.

9.2.2. Intervalo de confianza para la media de una distribución N (μ, σ)


con varianza desconocida
Supongamos una muestra aleatoria, X1 , X2 , · · · , Xn , de una distribución Normal con media
μ, y varianza σ 2 , ambas desconocidas y vamos a hallar un intervalo de confianza para la
media poblacional μ. Para ello, consideremos la variable aleatoria

X −μ
T = √
b/ n − 1
σ

que tiene una distribución t−Student con n − 1 grados de libertad.


Tenemos que determinar el valor del cuantil tα/2;n−1 tal que
∙ ¸
X −μ
P −tα/2;n−1 ≤ √ ≤ tα/2;n−1 =
b/ n − 1
σ
∙ ¸
b
σ b
σ
= P X − tα/2;n−1 √ ≤ μ ≤ X + tα/2;n−1 √ =1−α
n−1 n−1
270 Teoría de la estimación

α /2 α/2
1−α

−t +t
α / 2, n −1 α / 2, n −1

También se puede expresar en función de la cuasidesviación típica muestral S.


b2 y S 2 es:
Dado que, la relación entre σ
σ 2 = (n − 1)S 2
nb
Tenemos la siguiente expresión del intervalo de confianza para μ
∙ ¸
S S
P X − tα/2;n−1 √ ≤ μ ≤ X + tα/2;n−1 √ =1−α
n n
Por lo tanto, la probabilidad de que el intervalo aleatorio
∙ ¸ ∙ ¸
b
σ b
σ S S
X − tα/2;n−1 √ , X + tα/2;n−1 √ o X − tα/2;n−1 √ , X + tα/2;n−1 √
n−1 n−1 n n
(9.4)
contenga el verdadero valor de la media μ es 1 − α.
Ejemplo 9.4. En una muestra de 9 preparados de jugo de tomate se ha obtenido una media
de 22 mg/100 cc y una cuasidesviación típica de 6,3 mg/100 cc. Supuesto que el contenido
de vitamina C del jugo de tomate se distribuye normalmente. Se pide:
a) Estimar el contenido medio, en vitamina C, del jugo de tomate.
b) Calcular un intervalo de confianza al 95 % para dicha cantidad.
Respuesta:
a) El estimador pedido es la media muestral x = 22
b) Para 1 − α = 0,95 =⇒ α/2 = 0,025; tα/2;n−1 = t0,025;8 = 2,307
∙ ¸
S S
P X − tα/2;n−1 √ ≤ μ ≤ X + tα/2;n−1 √ =
n n
∙ ¸
6,3 6,3
= P 22 − 2,307 √ ≤ μ ≤ 22 + 2,307 √ = P [17,1553 ≤ μ ≤ 26,8447] = 0,95
9 9
Por lo tanto, hay un 95 % de confianza de que el intervalo [17,1553, 26,8447] contenga
al contenido medio, en vitamina C, del jugo de tomate.
9.2 Estimación por intervalos de confianza: Intervalos de confianza para una
población Normal 271

9.2.3. Intervalo de confianza para una proporción


Dada una variable aleatoria X Ã B(n, p) con p desconocido, el objetivo es determinar un
intervalo de confianza para el parámetro p. El Teorema de Moivre, (Capítulo 7), dice que
para un tamaño muestral grande (n > 30), la distribución Binomial se aproxima a una
Normal

X Ã N (np, npq)

Denotamos por pb al estadístico proporción muestral que lo definimos como: pb = X/n .


pb es un estimador insesgado de p y se demuestra que la distribución de pb
µ r ¶
X pq
pb = ÃN p,
n n

o que la distribución de

pb − p
r à N (0, 1) para n grande
pbqb
n

De esta forma el intervalo de confianza para el parámetro desconocido p viene dado por
" r r #
pbqb pbqb
P pb − zα/2 ≤ p ≤ pb + zα/2 =1−α (9.5)
n n

en donde pb = X/n se obtiene a partir de la muestra aleatoria de tamaño n.


El intervalo " r r #
pbqb pbqb
pb − zα/2 , pb + zα/2
n n

es un intervalo aleatorio, para tamaño de muestra grande, que contiene a p con una proba-
bilidad 1 − α, donde pb = X/n.
Ejemplo 9.5. Una encuesta de 100 votantes para conocer sus opiniones respecto a dos
candidatos muestra que 55 apoyan a A y 45 a B. Se pide: Calcular un intervalo de confianza
para la proporción de votos de cada candidato, al nivel de confianza del 95 %.
Respuesta:

a) Intervalo de confianza para el candidato A


272 Teoría de la estimación

" r r #
pbqb pbqb
P pb − zα/2 ≤ p ≤ pb + zα/2 =
n n
" r r #
55 0,55 × 0,45 55 0,55 × 0,45
=P − 1,96 ≤p≤ + 1,96 =
100 100 100 100

= P [0,45 ≤ p ≤ 0,65] = 0,95

Hay un 95 % de confianza de que la proporción de votos del candidato A se encuentre


entre 0,45 y 0,65.

b) Intervalo de confianza para el candidato B


" r r #
pbqb pbqb
P pb − zα/2 ≤ p ≤ pb + zα/2 =
n n
" r r #
45 0,55 × 0,45 45 0,55 × 0,45
=P − 1,96 ≤p≤ + 1,96 =
100 100 100 100

= P [0,35 ≤ p ≤ 0,55] = 0,95

Por tanto, el intervalo de confianza para la proporción de votos del candidato B, al


95 %, es [0,35 , 0,55] .
Un problema que puede plantearse es el correspondiente a la estimación del tamaño mues-
tral necesario de manera que, con una confianza de 100(1 − α) % aproximadamente, el
estimador pb de la proporción p se encuentre a no más de unidades de p.
Para determinar el tamaño muestral escribamos la expresión (9.5) de la siguiente forma
" r #
pbqb
P |bp − p| ≤ zα/2 = P [|b
p − p| ≤ ] = 1 − α
n

donde es la precisión de la estimación o el error.


r à p !2
pbqb pbqb
= zα/2 ⇒ n = zα/2 con pb = X/n
n

Ejemplo 9.6. Unos grandes almacenes desean estimar la proporción de empleados que
están a favor de cambiar el convenio laboral. Para ello se realiza una encuesta a 100
trabajadores y resulta que la mitad está a favor del cambio y la otra mitad no. La estimación
9.2 Estimación por intervalos de confianza: Intervalos de confianza para una
población Normal 273

debe quedar a menos de 0.05 de la proporción verdadera de los que están a favor del
cambio del convenio, con un coeficiente de confianza del 90 %. ¿Cuántos empleados se
debe muestrear?.

Respuesta: El tamaño muestral se determina de la siguiente forma


à p !2 µ √ ¶2
pbqb 0,5 × 0,5
n= z0,05 = 1,645 = 270,6 ≈ 271
0,05

Es necesario una muestra de 271 empleados para estimar la proporción verdadera, que
está a favor del cambio del convenio laboral, con una exactitud de ±0,05.

Ejemplo 9.7. Un equipo de investigadores realiza unos estudios para estimar la proporción
de personas que padecen gripe A, en una región española, mediante un intervalo con un
error máximo de 0.015 y nivel de confianza 0.95. ¿A cuántas personas deben analizar para
alcanzar aproximadamente este objetivo, sabiendo que en un pequeño sondeo orientativo
(muestra piloto) resultó que el 15 % de las personas estaban afectadas por la enfermedad?

Respuesta:

X : “Número de personas con gripe A”; pb = 0,15; zα/2 = z0,025 = 1,96; = 0,015

à p !2 µ √ ¶2
pbqb 0,15 × 0,85
n= z0,025 = 1,96 = 2176,9
0,015

Es necesario una muestra de 2177 personas para estimar la proporción de ellas que padecen
gripe A, con una exactitud de ±0,015.

9.2.4. Intervalo de confianza para la varianza de una distribución N(μ,


σ) con media conocida
Consideremos la variable aleatoria
n
X
(Xi − μ)2
i=1
à χ2n
σ2

Se determinan los cuantiles χ2α/2;n y χ21−α/2;n , tales que:


274 Teoría de la estimación

α /2

1− α α /2 h i
χ2 ≤ χ2 ≤ χ2
P 1−α/2;n n α/2;n = 1 − α
2 2
χ1−α / 2,n χα / 2,n
Por tanto,

⎡ n ⎤ ⎡ n n ⎤
X 2
X 2
X 2
⎢ (Xi − μ) ⎥ ⎢ (Xi − μ) (Xi − μ) ⎥
⎢ 2 ⎥ ⎢ i=1 ⎥
P⎢ χ2α/2;n ⎥ ⎢ ⎥ = 1−α
i=1 i=1
⎢χ1−α/2;n ≤ ≤ ⎥= P⎢ ≤ σ2 ≤
⎣ σ2 ⎦ ⎣ χ2
α/2;n χ1−α/2;n ⎥
2

Entonces el intervalo aleatorio

⎡ n n ⎤
X 2
X 2
⎢ (Xi − μ) (Xi − μ) ⎥
⎢ i=1 ⎥
⎢ , i=1 ⎥
⎢ χ2α/2;n χ21−α/2;n ⎥
⎣ ⎦

contiene a σ 2 con una probabilidad 1 − α.

Ejemplo 9.8. Se estudia un nuevo proceso de fabricación de bombillas que se supone reduce
la dispersión de la duración de las mismas. Sabiendo que la duración media de las bombillas
es 1100 horas y suponiendo que su distribución es normal, construir intervalos de confianza
para la dispersión a los niveles del 90 % y 98 % a partir de una muestra de tamaño 20 que
ha dado Σi xi = 22160 y Σi x2i = 25000000.

Respuesta: Como Σi xi = 22160 y Σi x2i = 25000000 entonces

20
X 20
X 20
X
2 2 2
(xi − μ) = xi + 20μ − 2μ xi =
i=1 i=1 i=1
2
= 25000000 + 20(1100) − 2 × 1100 × 22160 = 448000
9.2 Estimación por intervalos de confianza: Intervalos de confianza para una
población Normal 275

a) 1 − α = 0,90 ⇒ α/2 = 0,05; χ20,05;20 = 31,4 : χ20,95;20 = 10,9


⎡ n n ⎤
X 2
X 2
⎢ (xi − μ) (xi − μ) ⎥ ∙ ¸
⎢ i=1 ⎥
P⎢ ≤ σ2 ≤ i=1 ⎥ = P 448000 ≤ σ 2 ≤ 448000 =
⎢ χ2 χ21−α/2;n ⎥ 31,4 10,9
⎣ α/2;n ⎦

£ ¤
= P 14262,97 ≤ σ 2 ≤ 41290,32 = 0,90

Por lo tanto el intervalo confianza para la desviación típica es:

I = [119,42 ; 203,2]

b) 1 − α = 0,98 ⇒ α/2 = 0,01; χ20,01;20 = 37,6 : χ20,99;20 = 8,26


∙ ¸
448000 2 448000 £ ¤
P ≤σ ≤ = P 11925,67 ≤ σ 2 ≤ 54237,28 = 0,98
37,6 8,26
Por lo tanto el intervalo confianza para la desviación típica es:

I = [109,20 ; 232,88]

9.2.5. Intervalo de confianza para la varianza de una distribución N(μ,


σ) con media desconocida
Consideremos las variables aleatorias
σ2
nb (n − 1)S 2
à χ2n−1 o à χ2n−1
σ2 σ2
donde
n
X n
X
(Xi − X)2 (Xi − X)2
i=1
b2 =
σ y S 2 = i=1
n n−1
Siguiendo el mismo razonamiento que en el caso anterior, tenemos que
∙ ¸ " #
2 2 2
nbσ nb
σ nbσ
P χ21−α/2;n−1 ≤ 2 ≤ χ2α/2;n−1 = P 2 ≤ σ2 ≤ 2 =1−α
σ χα/2;n−1 χ1−α/2;n−1
o
∙ ¸ " #
2 (n − 1)S 2 2 (n − 1)S 2 2 (n − 1)S 2
P χ1−α/2;n−1 ≤ ≤ χα/2;n−1 = P ≤σ ≤ 2 =1−α
σ2 χ2α/2;n−1 χ1−α/2;n−1
276 Teoría de la estimación

De esta manera, un intervalo de confianza que contenga a σ 2 con una probabilidad 1 − α


está dado por
" # " #
σ2
nb nbσ2 (n − 1)S 2 (n − 1)S 2
, o ,
χ2α/2;n−1 χ21−α/2;n−1 χ2α/2;n−1 χ21−α/2;n−1

Ejemplo 9.9. En unos laboratorios se realizan unos estudios para determinar el nivel de
nistamina que hay en un determinado ungüento. Se sabe que su distribución sigue una ley
Normal. Se toma una muestra de 16 ungüentos y se calcula su varianza resultando ser de
30. Estimar la varianza mediante un intervalo de confianza del 80 %.
Respuesta: 1 − α = 0,80 ⇒ α/2 = 0,1; χ20,1;15 = 22,3 : χ20,9;15 = 8,55

0.1

0.80 0.1

χ 02.9 ,15 = 8.55 2


χ 0.1,15 = 22.3

" # ∙ ¸
σ2
nb σ2
nb 16 × 30 16 × 30
P ≤ σ2 ≤ =P ≤σ ≤2 =
χ2α/2;n−1 χ21−α/2;n−1 22,3 8,55
£ ¤
= P 21,40 ≤ σ 2 ≤ 56,14 = 0,80

9.3. Intervalos de confianza para dos poblaciones normales:


Muestras independientes y muestras apareadas
En las sesiones siguientes los intervalos de confianza se efectuarán bajo dos tipos de
muestreo: muestras independientes y muestra apareadas.
Muestras independientes: Dos muestras se dicen que son independientes cuando las
observaciones de una de ellas no condicionan a las observaciones de la otra.
Muestras apareadas: Dos muestras se dicen apareadas cuando cada dato de una mues-
tra tiene su homónimo en la otra con el que está relacionado, cada observación de una
muestra está emparejada con una observación de la otra muestra. Ejemplos de esta clase de
emparejamiento ocurren por ejemplo en estudios en los que se suministra dos tratamientos
al mismo sujeto.
9.4 Intervalos de confianza para dos poblaciones normales independientes 277

9.4. Intervalos de confianza para dos poblaciones normales


independientes
Supongamos que X e Y son dos variables aleatorias independientes y tales que X Ã N (μX ,
σ X ) e Y Ã N (μY , σ Y ).

Sea (X1 , X2 , · · · , XnX ) una m.a.s. de tamaño nX extraída de la población N (μX ,


σ X ) y denotamos por X y σ b2X , a la media muestral y a la varianza muestral, respec-
tivamente.

Sea (Y1 , Y2 , · · · , YnY ) una m.a.s. de tamaño nY extraída de la población N (μY , σ Y )


y denotamos por Y y σ b2Y , a la media muestral y a la varianza muestral, respectiva-
mente.

Vamos a construir intervalos de confianza para la diferencia de medias, diferencia de pro-


porciones y cociente de varianzas.

9.4.1. Intervalos de confianza para la diferencia de medias


Supongamos que interesa comparar las dos medias poblaciones, para ello construyamos
intervalos de confianza para μX − μY para cada una de las situaciones siguientes:

Conocidas las varianzas σ 2X y σ 2Y

Desconocidas las varianzas pero supuestas iguales σ 2X = σ 2Y , y tamaños muestrales


pequeños.

Desconocidas las varianzas y tamaños muestrales grandes.

1) Conocidas las varianzas σ 2X y σ 2Y

Sabemos (Capítulo 8) que la diferencia de las medias muestrales X e Y


⎛ s ⎞
σ 2X σ 2Y
X − Y Ã N ⎝μX − μY ; + ⎠
nX nY

Por lo tanto, el intervalo de confianza para la diferencia de medias se determina de la


siguiente forma:
278 Teoría de la estimación

⎡ ⎤
⎢ ⎥
⎢ (X − Y ) − (μX − μY ) ⎥

P ⎢−Zα/2 ≤ s ≤ Zα/2 ⎥
⎥=
⎣ σ 2X σ 2Y ⎦
+
nX nY
⎡ s s ⎤
σ 2X σ 2Y σ 2X σ 2Y
= P ⎣(X − Y ) − Zα/2 + ≤ μX − μY ≤ (X − Y ) + Zα/2 + ⎦=1−α
nX nY nX nY

De esta forma, se tiene que un intervalo de confianza del 100(1 − α) % para μX − μY es


⎡ s s ⎤
2 2 2 2
⎣(X − Y ) − Zα/2 σ X + σ Y , (X − Y ) + Zα/2 σ X + σ Y ⎦
nX nY nX nY

Ejemplo 9.10. En una vaquería se utilizan dos tipos de piensos para alimentar a las vacas.
Se desea comparar la media de engorde con ambos piensos. Para ello, se alimenta a 10
vacas durante un cierto tiempo con el pienso A obteniéndose una ganancia media de peso
de 2 Kg por vaca. Simultáneamente a otras 12 vacas se les alimenta con el pienso B y se
obtiene un engorde medio de 2.4 Kg. Por experiencias anteriores se sabe que las variables
objeto de estudio, engorde con cada uno de los piensos siguen distribuciones normales con
desviación típica de 0.06 para el pienso A y 0.1 para el pienso B. Estimar la diferencia de
engorde a un nivel de confianza del 95 %.
Respuesta:
⎡ s s ⎤
σ 2A σ 2B σ 2A σ 2B ⎦
P ⎣(X A − X B ) − Zα/2 + ≤ μA − μB ≤ (X A − X B ) + Zα/2 + ⇒
nA nB nA nB

" r #
0,062 0,12
⇒ I = (2 − 2,4) ± 1,96 + = [−0,4677 , − 0,3323]
10 12
Por lo tanto, hay el 95 % de confianza de que μA − μB se encuentre entre −0,4577 y
−0,3323. El intervalo no contiene al cero, por lo tanto hay diferencia de engorde con cada
uno de los piensos, siendo el engorde medio mayor con el pienso B.
2) Desconocidas las varianzas pero supuestas iguales σ 2X = σ 2Y , y tamaños
muestrales pequeños, entonces la variable aleatoria
(X − Y ) − (μX − μY )
T = r à tnX +nY −2
1 1
Sp +
nX nY
9.4 Intervalos de confianza para dos poblaciones normales independientes 279

(nX − 1)SX2 + (n − 1)S 2


Y Y
donde Sp2 =
nX + nY − 2
Por lo tanto, el intervalo de confianza para la diferencia de medias se determina de
la siguiente forma
⎡ ⎤
⎢ (X − Y ) − (μX − μY ) ⎥
P⎢
⎣−tα/2;nX +nY −2 ≤ r ≤ tα/2;nX +nY −2 ⎥
⎦1 − α ⇒
1 1
Sp +
nX nY
∙ r ¸
1 1
⇒ I = (X − Y ) ± tα/2;nX +nY −2 Sp +
nX nY

Ejemplo 9.11. Dos laboratorios A y B realizan determinaciones de nicotina en 4 unidades


de tabaco, con los resultados siguientes:

Lab. A: 16, 14, 13, 17 Lab. B: 18, 21, 18, 19

Suponiendo que las dos poblaciones examinadas son normales e independientes con igual
varianza, estimar la diferencia del contenido medio en nicotina del tabaco a un nivel de
confianza del 95 %.
Respuesta:
16 + · · · + 17 (16 − 15)2 + · · · (17 − 15)2
A : nX = 4; x = = 15; σb2X = = 3,34
4 4
18 + · · · + 19 (18 − 19)2 + · · · (19 − 19)2
B : nY = 4; y = b2Y =
= 19; σ =2
4 4
s r
b2X + nY σ
nX σ b2Y 4 × 3,34 + 4 × 2
Sp = = = 1,88
nX + nY − 2 6
tα/2;nX +nY −2 = t0,025;6 = 2,447

∙ r ¸
1 1
I = (X − Y ) ± tα/2;nX +nY −2 Sp + ⇒
nX nY
" r r #
2 2
⇒ P (15 − 19) − 2,447 × 1,88 ≤ μX − μY ≤ (15 − 19) + 2,447 × 1,88 ⇒
4 4

⇒ P [−7,253 ≤ μX − μY ≤ −0,747] = 0,95


280 Teoría de la estimación

Por tanto, el contenido medio de nicotina difiere de un laboratorio a otro, siendo dicho
contenido mayor en el laboratorio B que en laboratorio A.

3) Desconocidas las varianzas y tamaños muestrales grandes, entonces el inter-


valo de confianza para la diferencia de medias se determina de la siguiente forma:

⎡ ⎤
⎢ ⎥
⎢ (X − Y ) − (μX − μY ) ⎥

P ⎢−Zα/2 ≤ s ≤ Zα/2 ⎥
⎥=
⎣ SX2 SY2 ⎦
+
nX nY
⎡ s s ⎤
2
SX SY2 2
SX SY2
= P ⎣(X − Y ) − Zα/2 + ≤ μX − μY ≤ (X − Y ) + Zα/2 + ⎦=1−α
nX nY nX nY

Ejemplo 9.12. Un fabricante de juguetes desea comparar el tiempo de producción medio


de dos máquinas que hacen soldaditos de plomo y se encuentran en dos fábricas distintas.
Los registros de la compañía, para 100 días seleccionados al azar para cada una de las
máquinas, dieron los siguientes resultados:

Máquina 1: n1 = 100; x1 = 12; s21 = 6; Máquina 2: n2 = 100; x2 = 9; s22 = 4

Construir un intervalo de confianza al 95 % para la diferencia de medias.

Respuesta:
⎡ s s ⎤
S12 S22 S12 S o22 ⎦
P ⎣(X 1 − X 2 ) − Zα/2 + ≤ μ1 − μ2 ≤ (X 1 − X 2 ) + Zα/2 + =
n1 n2 n1 n2

" r r #
6 4 6 4
= P (12 − 9) − 1,96 + ≤ μ1 − μ2 ≤ (12 − 9) + 1,96 + =
100 100 100 100

= P [2,38 ≤ μ1 − μ2 ≤ 3,62] = 0,95

Por lo tanto, se tiene el 95 % de confianza de que μ1 − μ2 esté entre 2.38 y 3.62. Esto
sugiere que μ1 debe ser mayor que μ2 .
9.4 Intervalos de confianza para dos poblaciones normales independientes 281

9.4.2. Intervalo de confianza para la diferencia de proporciones


Supongamos dos variables aleatorias independientes X e Y tales que X Ã B(n1 , p1 ) e
Y Ã B(n2 , p2 ) con p1 y p2 desconocidos y los tamaños muestrales grandes.
X Y
Sean pb1 = y pb2 = los valores estimados de p1 y p2 , respectivamente.
n1 n2
Entonces s
à !
pb1 qb1 pb2 qb2
pb1 − pb2 Ã N p1 − p2 , +
n1 n2

o
p1 − pb2 ) − (p1 − p2 )
(b
r à N (0, 1) para n1 y n2 grandes
pb1 qb1 pb2 qb2
+
n1 n2
De esta forma el intervalo de confianza para la diferencia de proporciones se construye de
la siguiente manera:
" s s #
pb1 qb1 pb2 qb2 pb1 qb1 pb2 qb2
p1 − pb2 ) − zα/2
P (b + p1 − pb2 ) + zα/2
≤ p1 − p2 ≤ (b + =1−α
n1 n2 n1 n2

Ejemplo 9.12. Unos estudios sobre las ranas tigres en dos regiones de Méjico tienen como
objetivo comparar las proporciones de dichas ranas en cada una de las regiones. Para ello,
se toma una muestra al azar de 100 ranas observando que 5 son ranas tigres en la zona
A, mientras que de una muestra de 150 ranas en la zona B, 9 son ranas tigres. Construir
un intervalo de confianza al 95 % para la diferencia entre las verdaderas proporciones de
ranas tigres en las dos regiones.

Respuesta: El intervalo de confianza pedido es:


" r #
0,05 × 0,95 0,06 × 0,94
I = (0,05 − 0,06) ± 1,96 + = [−0,01 ± 0,05717] =
100 150
= [−0,06717; 0,04714]

Por tanto, hay un 95 % de confianza de que la diferencia entre las verdaderas proporciones
de ranas tigres en las dos regiones se encuentre entre −0,06717 y 0,04714. Como el intervalo
contiene al cero, no parece haber diferencia significativa entre las cantidades de ranas tigres
en las dos regiones.
282 Teoría de la estimación

9.4.3. Intervalos de confianza para el cociente de varianzas


Supongamos que interesa comparar las dos varianzas poblaciones, para ello construyamos
intervalos de confianza para σ 2X /σ 2Y para cada una de las situaciones siguientes

Las medias μX y μY conocidas.

Las medias μX y μY desconocidas.

1) Las medias μX y μY conocidas


Del Capítulo 8 se recordará que las variables aleatorias
nx
⎫ X nx
X 2 ⎪
⎪ (Xi − μX )2
(Xi − μX ) ⎪


⎪ i=1 nx

⎪ X
i=1
à χ 2
nX ⎪⎪ σ 2
(Xi − μX )2
σX2 ⎪
⎬ X
2
nX nY σ Y i=1
⇒ ny = ny à FnX ,nY
Xny ⎪
⎪ X nX σ 2X X

⎪ (Yj − μY )2
(Yj − μY )2
(Yj − μY )2 ⎪



⎪ j=1 j=1
à χ2nY ⎪
j=1

⎭ 2
σY2 σ Y
nY
Vamos a determinar los cuantiles Fα/2;nX ,nY y F1−α/2;nX ,nY , tales que:

α /2

α /2 £ ¤
1− α P F1−α/2;nX ,nY ≤ FnX ,nY ≤ Fα/2;nX ,nY = 1 − α

F1−α / 2; n , nY
Fα / 2;n ,nY
X X
Entonces, el intervalo de confianza para el cociente de varianzas se determina de la
siguiente forma:

⎡ ny ny ⎤
X X
⎢ (Yj − μY )2 (Yj − μY )2 ⎥
⎢ nX j=1 2
σY nX j=1 ⎥
⎢ ⎥
P ⎢F1−α/2;nX ,nY n ≤ ≤ Fα/2;n ,n n ⎥=1−α
⎢ nY Xx 2
σX X Y
nY Xx ⎥
⎣ (Xi − μX )2
(Xi − μX )2⎦

i=1 i=1

2) Las medias μX y μY desconocidas


Del Capítulo 8 se recordará que las variables aleatorias
9.4 Intervalos de confianza para dos poblaciones normales independientes 283

(nX − 1)SX 2
2 ⎫
(nX − 1)SX ⎪
à χ2nX −1 ⎪

⎪ σ 2X
σ 2X ⎬ SX2 σ2
nX − 1
2 σ 2 Ã FnX −1,nY −1
Y
⇒ 2 =

⎪ (n − 1)S S
(nY − 1)SY2 ⎪

Y Y Y X
à χ2nY −1 ⎭ σ 2Y
σ 2Y
nY − 1
Por tanto
∙ ¸
SY2 σ 2Y SY2
P F1−α/2;nX −1,nY −1 2 ≤ 2 ≤ Fα/2;nX −1,nY −1 2 = 1 − α
SX σX SX
Ejemplo 9.13. De dos poblaciones normales X e Y se han extraído muestras de tamaño
nX = 15 y nY = 10 cuyas cuasivarianzas valen s2X = 69 y s2Y = 44. Construir intervalos
de estimación para el cociente de las varianzas poblacionales a los niveles de confianza del
90 % y 98 %.
Respuesta:
a) 1 − α = 0,90 ⇒ α/2 = 0,05;
Fα/2;nX −1,nY −1 = F0,05;14,9 = 3,03
1 1
F1−α/2;nX −1,nY −1 = F0,95;14,9 = = = 0,38
F0,05;9,14 2,65
∙ ¸
S2 σ 2Y SY2
P F1−α/2;nX −1,nY −1 Y2 ≤ 2 ≤ Fα/2;nX −1,nY −1 2 =
SX σX SX
∙ ¸ ∙ ¸
44 σ 2Y 44 σ 2Y
P 0,38 × ≤ 2 ≤ 3,03 × == P 0,242 ≤ 2 ≤ 1,932 = 0,90
69 σX 69 σX
Por tanto, se tiene el 90 % de seguridad de que la relación de σ 2Y /σ 2X se encuentra
entre 0,242 y 1,932. Como el uno pertenece al intervalo, en realidad no hay razón
para sospechar que σ 2X es distinto de σ 2Y .
b) 1 − α = 0,98 ⇒ α/2 = 0,01;
Fα/2;nX −1,nY −1 = F0,01;14,9 = 5,01
1 1
F1−α/2;nX −1,nY −1 = F0,99;14,9 = = = 0,29
F0,01;9,14 4,03
∙ ¸ ∙ ¸
44 σ2 44 σ2
P 0,29 × ≤ 2Y ≤ 5,01 × = P 0,184 ≤ 2Y ≤ 3,194 = 0,98
69 σX 69 σX

Se llega a la misma conclusión que en apartado anterior pero con una confianza del
98 %.
284 Teoría de la estimación

9.5. Intervalo de confianza para dos poblaciones normales:


Muestras apareadas
En las muestras apareadas, cada observación de una muestra está emparejado con una
observación de la otra muestra, por lo tanto consideramos parejas de valores (x, y).
Supongamos que X e Y son dos variables aleatorias tales que X Ã N (μX , σ X ) e
Y Ã N (μY , σ Y ) y consideremos la diferencia de poblaciones D = X − Y . Entonces,
D Ã N (μD , σ D )
Se selecciona una muestra aleatoria de diferencias, Di = Xi − Yi ; i = 1, 2, · · · , n
El valor medio de D es la diferencia de los valores medios de X e Y :

μD = E(D) = E(X − Y ) = E(X) − E(Y ) = μX − μY

La varianza de D es:

σ 2D = V ar(D) = V ar(X − Y )

Por lo tanto el problema original de realizar una inferencia sobre dos muestras se reduce al
problema de realizar la inferencia sobre una muestra que consiste en construir un intervalo
de confianza para la media de la población de diferencias. Para la realización de este
intervalo de confianza recurrimos a los métodos utilizados en la Sección 9.2. En particular,
construyamos el intervalo de confianza para μX − μY = μD . Para ello, consideremos la
variable aleatoria
D − μD
T = √
SD / n
que tiene una distribución t−Student con n − 1 grados de libertad.
Tenemos que determinar el valor del cuantil tα/2;n−1 tal que
∙ ¸
D − μD
P −tα/2;n−1 ≤ √ ≤ tα/2;n−1 =
SD / n
∙ ¸
SD SD
= P D − tα/2;n−1 √ ≤ μD ≤ D + tα/2;n−1 √ =1−α
n n

donde D y SD son la media muestral y la cuasidesviación típica muestral de la muestra


de diferencias, respectivamente.
Ejemplo 9.14. Se realiza un estudio, en el que participan 10 individuos, para investigar el
efecto del ejercicio físico en el nivel de colesterol en plasma. Antes del ejercicio se tomaron
muestras de sangre para determinar el nivel de colesterol de cada individuo. Después, los
participantes fueron sometidos a un programa de ejercicios. Al final de los ejercicios se
9.6 Ejercicios propuestos: Relación IX 285

tomaron nuevamente muestras de sangre y se obtuvo una segunda lectura del nivel de
colesterol. Los resultados se muestran a continuación:

Nivel previo 182 230 160 200 160 240 260 480 263 240
Nivel posterior 190 220 166 150 140 220 156 312 240 250

Construir un intervalo de confianza de μD para un nivel de confianza del 90 %.


Respuesta:

Nivel previo 182 230 160 200 160 240 260 480 263 240
Nivel posterior 190 220 166 150 140 220 216 312 243 250
d=x−y -8 10 -6 50 20 20 44 168 20 -10

10
X ¡ ¢
di − d
268 i=1
d= = 30,8; sd = = 52,36
10 n−1
Para 1 − α = 0,90 =⇒ α/2 = 0,05; tα/2;n−1 = t0,05;9 = 1,833
∙ ¸
SD SD
P D − tα/2;n−1 √ ≤ μD ≤ D + tα/2;n−1 √ =
n n
∙ ¸
52,36 52,36
= P 30,8 − 1,833 √ ≤ μ ≤ 30,8 + 1,833 √ = P [0,4497 ≤ μ ≤ 61,150] = 0,90
10 10

Por lo tanto, podemos tener un 90 % de confianza en que la diferencia media de niveles


de colesterol en plasma está entre 0.4497 y 61.150. Es decir, podemos tener un 90 % de
confianza de que el nivel medio de colesterol se reducirá como mínimo en 0.45 unidades.

9.6. Ejercicios propuestos: Relación IX


1. En el análisis de un pigmento contenido en una cierta flor de una planta vegetal se ob-
tuvieron los siguientes resultados experimentales, expresados como mg de pigmento
por gramo de flor: 2.08; 2.11; 2.39; 2.08; 2.12; 2.23; 2.17 y 2.11.
Considerando normalidad, calcular un intervalo de confianza para el número medio
de mg de pigmento por gramo de flor, así como para su varianza a un nivel de
confianza del 99 %. (Soluciones: (2,0313, 2,2913); (0,003808, 0,0782))
286 Teoría de la estimación

2. Para evaluar la viabilidad de un proyecto de reforestación de una zona sometida a


stress turístico, para el que se ha solicitado una subvención pública, se analiza la
composición en mg. por cm3 de desechos orgánicos del territorio. Los datos que se
obtienen son:

. 10.87; 9.01; 22.50; 12.35; 17.39; 31.05; 17.19; 16.74; 20.33; 19.32; 23.18; 25.15; 15.49;
20.30; 2.38; 13.55; 9.33; 22.72; 10.96; 25.90; 27.66; 9.74; 18.65; 9.31; 24.60; 17.41;
24.86; 15.34; 23.34; 22.81; 17.86

. Considerando normalidad, estimar mediante un intervalo de confianza la dispersión


de la distribución de los datos al nivel de confianza del 95 %. (Sol: (27,9543, 78,2054).

3. Si la desviación típica de la duración de los tubos de televisión se estima en 100


horas, ¿Qué tamaño de muestra deberá tomarse para que la amplitud del intervalo
de confianza de la duración media no exceda de 40 horas a los niveles de confianza
del 90, 95 y 99 %? (Sol: 68; 97; 167).

4. Para investigar el coeficiente intelectual medio de una cierta población estudiantil, se


propuso un test a 400 estudiantes. La media y cuasidesviación típica de ese estudio
fueron, respectivamente, 86 y 10,2. A partir de estos datos, determinar intervalos de
estimación para el coeficiente de inteligencia medio a los niveles de confianza del 90,
95 y 98 %. (Sol: [86 ± 0,83895]; [86 ± 0,9996]; [86 ± 1,3158])

5. La siguiente tabla proporciona datos sobre la precipitación total registrada en 11


estaciones meteorológicas de dos provincias españolas. Suponiendo independencia
y normalidad, dar una estimación mediante un intervalo de confianza al nivel de
con-fianza de 0.8 para:

a) Cociente de varianzas de la pluviosidad entre las dos provincias;


b) Diferencia de las medias de la pluviosidad entre las dos provincias;
c) Diferencia de las medias de pluviosidad si se sabe por experiencia previa que la
varianza de las precipitaciones en la provincia A es de 475 y en la provincia B
de 350.

Prov. A 100 89 84 120 130 105 60 70 90 108 130


Prov. B 120 115 96 115 140 120 75 90 108 130 135

(Soluciones: a) (0,5808, 3,1261); b) (−26,4436, −2,2836); c) (−28,6097. −0,1175))

6. En una muestra aleatoria de 900 personas con pelo oscuro se encontró que 150 de ellas
tenían los ojos azules. Construir un intervalo de confianza al 95 % para la proporción
de individuos que teniendo pelo oscuro en la población poseen ojos azules. ¿Son
9.6 Ejercicios propuestos: Relación IX 287

compatibles estos resultados con la suposición de que dicha proporción vale 1/4?
(Sol: [0,1423, 0,191]; No es compatible)

7. ¿Entre qué margénes oscilará el cociente de las cuasivarianzas de muestras indepen-


dientes de tamaño 10 y 20 de una población Normal al nivel de 90 % ? y ¿ al 98 % ?
(Supongamos que las varianzas son iguales). (Sol: [0,34, 2,4]; [0,2, 3,46]).

8. En una piscifactoría hay una proporción desconocida de peces de una especie A.


Para obtener información sobre esa proporción se sacan 145 peces de los cuales 29
son tipo A. Estimar dicha proporción mediante un intervalo de confianza al nivel de
confianza 0.95. (Sol: (0,1349, 0,2651))

9. En una experiencia genética se extraen 20 moscas de una caja experimental. Medida


la longitud del ala en cada mosca se obtuvieron los siguientes valores: 93; 90; 97; 90;
93; 91; 96; 94; 91; 91; 88; 93; 95; 91; 89; 92; 87; 88; 90; 86.
Suponiendo que la longitud del ala sigue una distribución normal, hallar un intervalo
de confianza de nivel 0.9 para los parámetros μ y σ 2 . (Soluciones: (89,8761, 92,6239);
(4,9772, 18,3780))

10. Se desea comparar dos métodos rápidos para estimar la concentración de una hor-
mona en una solución. Para ello, se dispone de 10 dosis preparadas en el laboratorio y
se mide la concentración de cada una con los dos métodos. Se obtienen los siguientes
resultados:

Dosis 1 2 3 4 5 6 7 8 9 10
Método A 10.7 11.2 15.3 14.9 13.9 15 15.6 15.7 14.3 10.8
Método B 11.1 11.4 15 15.1 14.3 15.4 15.4 16 14.3 11.2

. Calcular un intervalo de confianza al nivel 0.9 para el cociente de varianzas y la dife-


rencia de concentraciones medias (considerar normalidad e independencia). (Solu-
ciones: (0,3531, 3,5709); (−1,7158, 1,3558))

11. Se estudian dos tipos de neumáticos con los resultados siguientes:


A : n1 = 121 x̄1 = 27465 Km; s1 = 2,500
B : n2 = 121; x̄2 = 27572 Km; s2 = 3,000.
Calcular, para α = 0,01, los intervalos de confianza para a) σ 21 /σ 22 ; b) μ1 − μ2 .
(Soluciones: a) [0,4325, 1,1149]);b) [107 ± 916])

12. En una piscifactoría se desea comparar el porcentaje de peces adultos que miden
menos de 20 cm con los que miden más de 40 cm. Para ello, se toma una muestra de
200 peces observando que 40 de ellos miden menos de 20 cm y una muestra de 200
288 Teoría de la estimación

peces de los que 57 miden más de 40 cm. Hallar un intervalo de confianza para la
diferencia de proporciones al nivel de confianza del 0.95.(Sol: (−0,1686, 0,001409))

13. Una compañía contrata 10 tubos con filamentos de tipo A y 10 con filamentos de
tipo B. Las duraciones de vida observadas, han sido:
A : 1614; 1094; 1293; 1643; 1466; 1270; 1340; 1380; 1028; 1497
B : 1383; 1138; 1092; 1143; 1017; 1061; 1627; 1021; 1711; 1065
Encontrar un intervalo de confianza para la diferencia de medias. Con α = 0, 05.
(Sol: [−80,33, 353,73]).

14. Se desea comprobar el efecto de 2 fertilizantes (A y B) sobre la producción de árboles


frutales, para ello se toman dos grupos de 8 y 10 árboles seleccionados aleatoriamente
y se le añade al agua de riego de cada uno de los grupos de árboles el fertilizante A
y B, respectivamente. La producción en ese año fue la siguiente (en Kg):

Fertilizante A: 30 25 28 29 30 31 24 22 25 27
Fertilizante B: 28 27 28 28 26 27 26 29

. Se pide:

a) Obtener un intervalo de confianza al 99 % para la producción media de los


árboles tratados con el Fertilizante A y para la producción media de los árboles
tratados con el Fertilizante B;
b) Obtener un intervalo de confianza al 98 % para la diferencia entre la producción
media de los árboles tratados con el Fertilizante A y con el Fertilizante B;
c) La producción de los árboles tratados con el Fertilizante A en el año anterior
viene reflejada en la siguiente tabla.

Antes 25 20 25 28 30 30 26 15 18 22
Después 30 25 28 29 30 31 24 22 25 27

. Obtener un intervalo de confianza al 99 % para la diferencia de medias, en la pro-


ducción antes y después de tratar los árboles con dicho fertilizante. (Soluciones: a)
(24.02, 30.18) y (26.06, 28.69) ; b) (—3.020, 2.470); c) (-6.369, -0.031) )
9.7 Comentarios bibliográficos
289

9.7. Comentarios bibliográficos

Abraham de Moivre

Nacido el 26 de mayo de 1667 en Vitry-le-François, Champagne, Francia


Muere el 27 de noviembre de 1754 en Londres

Abraham de Moivre nació en Vitry-le-François, donde su padre trabajaba como ciru-


jano. A los once años estuvo cuatro años estudiando griego en la Academia Protestante
de Sedán. Aunque el Edicto de Nantes había garantizado la libertad de culto en Fran-
cia desde 1598, la Academia Protestante de Sedán fue suprimida en 1682 y de Moivre se
trasladó a Saumur (1682-84) donde estudió lógica. Las matemáticas no formaban parte de
los estudios que realizó en Saumur, pero de Moivre leía textos de matemática. En parti-
cular, a Huygens “Tratado sobre los juegos de azar”. Continuó sus estudios en el Collège
de Harcourt en París (1684-85), donde tomó cursos en física y por primera vez formación
matemática, tomando clases particulares con Jacques Ozanam
La persecución religiosa de los protestantes se agravó cuando Louis XIV revocó el
Edicto de Nantes en 1685, dando lugar a la expulsión de los hugonotes. En este momento
de Moivre fue encarcelado por sus creencias religiosas en el convento de San Martín.
Viajó a Londres donde se convirtió en profesor particular de matemáticas. En Londres
de Moivre conoció la obra “Principia” de Newton y al comprobar que se trataba de una
obra mucho más profunda de las que había estudiado, en todo momento leía páginas
de la obra mientras iba de un alumno al siguiente. Este hecho nos pone de manifiesto
las capacidades de Moivre que rápidamente fue capaz de dominar la obra. Fue elegido
miembro de Royal Society de Londres en 1697.
290 Teoría de la estimación

De Moivre fue pionero en el desarrollo de la geometría analítica y la teoría de la pro-


babilidad. Publicó “La Doctrina de la Probabilidad: Un método de cálculo de las probabi-
lidades de los acontecimientos en el juego” en 1718, aunque una versión latina se presentó
a la Real Sociedad y se publicó en el Philosophical Transactions en 1711. La definición de
la independencia estadística aparece en este libro, junto con muchos problemas con
los dados y otros juegos.
La edición de 1756 de La Doctrina de la Probabilidad contenía la contribución más
significativa de Moivre, la aproximación a la distribución binomial por la distribu-
ción Normal en el caso de un gran número de ensayos. De Moivre publicó por primera
vez este resultado el 13 de noviembre de 1733 con el objetivo de mejorar la ley de los
grandes números de Jacob Bernoulli.
De Moivre también investigó las estadísticas de mortalidad y rentas vitalicias. Entabló
amistad con el matemático Edmund Halley quien publicó en 1693 un trabajo sobre la
producción de tablas de mortalidad con datos de cinco años de la ciudad de Breslau. Fue
uno de los primeros trabajos que se refieren a la mortalidad y la edad de una población
y fue muy influyente en la producción de tablas actuariales de los seguros de vida. De
la amistad con Halley llevó a de Moivre a publicar en 1724 “Anualidades en la vida”,
apareciendo nuevas ediciones 1743, 1750, 1752 y 1756.
Conocido por la fórmula de Moivre, que conecta números complejos y trigonometría,
y por su trabajo en la distribución Normal y probabilidad. Entabló amistad con Isaac New-
ton en tal grado que cuando iban a consultar a Newton sobre algún tema de matemáticas,
él los enviaba con de Moivre diciendo: "vayan con Abrahám de Moivre a consultar esto:
él sabe mucho más que yo de estas cosas ".
En Miscellanea Analytica (1730) aparece la fórmula de Stirling (atribuida errónea-
mente a Stirling) que de Moivre utilizó en 1733 para obtener la Curva Normal como una
aproximación a la Binomial. En la segunda edición del libro en 1738 de Moivre mejora la
fórmula de Stirling.
A pesar de la eminencia científica de Moivre su principal fuente de ingresos era como
un profesor particular de matemáticas y murió en la pobreza. Era cliente regular del
Slaughter’s Coffee House, en St. Martin Lane, en Cranbourn Street, donde ganaba algo de
dinero jugando al ajedrez. Desesperó por conseguir una plaza de profesor en Cambridge
pero tanto Leibniz que trató de obtener una cátedra para de Moivre en Alemania, como
Newton y Halley en Londres no pudieron ayudarlo a obtener un puesto universitario.
Murió en Londres, siendo enterrado en St Martin’s-in-the-Fields, aunque más tarde su
cuerpo fue trasladado.
De Moivre, como Cardano, es famoso por predecir la fecha de su propia muerte: se
dio cuenta de que cada día dormía 15 minutos más que el día anterior. A partir de ahí
conjeturó que moriría el día que durmiera durante 24 horas. Ese día, calculado por él
mismo, era el 27 de noviembre de 1754.

Autora: Ana María Lara Porras

También podría gustarte