Estimação
Estimação é o nome técnico para o processo que consiste em utilizar os
dados de uma amostra para avaliar parâmetros populacionais desconhecidos, ou,
como o próprio nome indica, estimar os mesmos. Dentre as diversas características
(parâmetros) de uma população que podem ser estimadas, as mais utilizadas são:
Média µ ; Variância σ² e Proporção π .
Estimativa por intervalo
Uma estimativa por intervalo para um parâmetro populacional é um intervalo
determinado por dois número, que podem ser obtidos a partir dos elementos
amostrais que se espera que contenham o valor do parâmetro com o nível de
confiança ou probabilidade de (1- α)%, onde alfa (α) é definida como a
probabilidade de erro.
Intervalo de confiança para a Variância Populacional (σ²)
Sabendo que o estimador não-tendencioso de σ² é S². Na distribuição de
probabilidade o estimador é denominado de distribuição Qui-Quadrado por χ ²(ν),
onde ν é denominado por grau de liberdade.
Distribuição Qui-Quadrado
É um modelo que pode ser obtida de uma soma de variáveis normais
padronizadas. A distribuição é assimétrica positiva (possui uma cauda à direita) e
depende do parâmetro ν .
Interpretação:
1- Se os limites do intervalo de confiança forem negativo e positivo,
implica que não há diferença significativa para este nível de
confiança, (obs: então procura-se diminuir o nível de confiança para
que os limites tenham o mesmo sinal).
2- Se ambos os limites do intervalo de confiança forem positivos,
significa que μ1 excede μ2.
3- Se ambos os limites do intervalo de confiança forem negativos,
significa que μ2 excede μ1.
A fórmula para o intervalo de confiança do intervalo populacional:
Problema 1:
Em um laboratório de pesquisa da Universidade Federal do Rio Grande, um
pesquisador necessita coletar uma amostra de um lago nas proximidades de Santo
Antônio da Patrulha.
Logo, uma amostra de 7 elementos foi recolhida deste lago (população de
distribuição normal) que concedeu uma variância de s²= 4,36. Determinar um
intervalo de confiança para a variância desta população. a) Para 96% e b) Para
98%
Solução:
a)
Dados: n=7 s²= 4,36 v= n-1 → v= 6 96% = 1- α
Assim,
χ ² 2 → v= 6
→ p= 0,02= 2% Procura-se na tabela Qui-Quadrado: χ ² 2=
15,033
χ ² 1 → v= 6
→ p= 0,96+ 0,02 = 98% Procura-se na tabela Qui-Quadrado: χ ² 1=
1,134
Aplicando a fórmula para encontrar o intervalo de confiança:
( 7−1 ) 4 ,36 ; (7−1) 4 , 36 =
[ 1,7401; 23,0687 ]
15,033 1,134
b)
Dados: n=7 s²= 4,36 v= n-1 → v= 6 98% = 1- α
Assim,
χ ² 2 → v= 6
→ p= 0,01= 1% Procura-se na tabela Qui-Quadrado: χ ² 2=
16,802
χ ² 1 → v= 6
→ p= 0,98+ 0,01 = 99% Procura-se na tabela Qui-Quadrado: χ ² 1=
0,872
Aplicando a fórmula para encontrar o intervalo de confiança:
( 7−1 ) 4 ,36 ; (7−1) 4 , 36 =
[ 1,5569 ; 30 ]
16,802 0,872
Intervalo de confiança quando ambas as variâncias populacionais
σ 1❑ e σ 2❑ são desconhecidas mas supostamente iguais
2 2
Sejam duas populações A e B onde sabe-se que as variâncias das
populações são iguais, entretanto, desconhecidas (σ 1❑2=σ 2 ❑2 ) e ambas as
amostras independentes obtemos que a variância combinada (S 2p) que é definida
como a variância ponderada pelos graus de liberdade das duas amostras é dada
por:
Assim o grau de liberdade da distribuição t é dado pela equação :
Um intervalo de confiança quando ambas as variâncias são iguais e
desconhecidas é dado por:
Neste caso, ambos as amostras são aleatórias e simples.
Interpretação:
1- Se os limites do intervalo de confiança forem negativo e positivo, implica que
não há diferença significativa para este nível de confiança, (obs: então
procura-se diminuir o nível de confiança para que os limites tenham o mesmo
sinal).
2- Se ambos os limites do intervalo de confiança forem positivos, significa
que μ1 excede μ2.
3- Se ambos os limites do intervalo de confiança forem negativos, significa
que μ2 excede μ1.
Problema 2
Um Engenheiro agroindustrial precisa analisar o conteúdo de cálcio em (mg)
de um leite integral e em desnatado. As estatísticas amostrais do conteúdo de cálcio
de leite integral ou desnatado são apresentadas na tabela abaixo. Construir um
intervalo de 90% e outro para 96% de populações com distribuição normal e que as
variâncias populacionais sejam iguais.
Conteúdo de Cálcio (mg)
Leite Integral Leite Desnatado
n1= 19 n2= 3
x 1= 0,76 x 2=1,43
s1= 0,27 s2= 0,11
Solução
Para um intervalo de 90%
90%= 1- α → Logo, p= 10% onde p/2 → 0,05
Para o grau de liberdade da distribuição t
v= n1+n2-2
v= 19+3-2 → 20
Assim, buscando na tabela de distribuição t Student
v= 20 ⇒ tα/2 =1,725
p= 10%
Encontrando a variância combinada através da seguinte fórmula:
( 19−1 ) (0 ,27)²+(3−1)(0 , 11)²
S2p= = 0,06682
19+3−2
Para encontrar o erro amostral amostral usaremos a seguinte fórmula:
E= 1,725√ ❑ = 0,2770
O intervalo de confiança é dado por:
Logo, o intervalo de confiança vai ser:
IC: 0,76-1,43-0,2770 < μ 1−μ 2 < 0,76-1,43+0,2770
IC: -0,947 < μ 1−μ 2 < -0,393
Interpretação: Logo, conclui-se que μ 2 excede μ 1 para um intervalo de confiança de
90%.
Para um intervalo de 96%
96%= 1- α → Logo, p= 4% onde p/2 → 0,02
Para o grau de liberdade da distribuição t
v= n1+n2-2
v= 19+3-2 → 20
Assim, buscando na tabela de distribuição t Student
v= 20 ⇒ tα/2 =2,197
p= 4%
Encontrando a variância combinada através da seguinte fórmula:
( 19−1 ) (0 ,27)²+(3−1)(0 , 11)²
S2p= = 0,06682
19+3−2
Para encontrar o erro amostral amostral usaremos a seguinte fórmula:
E= 2,197√ ❑ = 0,3526
O intervalo de confiança é dado por:
Logo, o intervalo de confiança vai ser:
IC: 0,76-1,43-0,3526< μ 1−μ 2 < 0,76-1,43+0,3526
IC: -1,0226 < μ 1−μ 2 < -0,3174
Interpretação: Logo, conclui-se que μ 2 excede μ 1 para um intervalo de confiança de
96%.
Intervalo de confiança para a diferença entre duas proporções
populacionais ( π 1 e π 2)
O intervalo de confiança para a proporção ^
p 1 é a proporção estimada de π1 e
^
p 2 é a proporção estimada de π2.
Vale ressaltar que será válido quando as amostras são independentes e
ambas cumpram a condição:
p= verdadeira proporção populacional de “sucessos”
n= Tamanho da amostra
f= ^p= estimador de p
q^ = Número de casos favoráveis na amostra
f
Fórmula: ^p= → q^ = 1- ^p
n
Já para o erro amostral máximo ou também conhecido como margem de erro utiliza-
se a fórmula:
Assim, o intervalo de confiança é determinado pela equação:
Interpretação:
1- Se os limites do intervalo de confiança forem negativo e positivo, implica que
não há diferença significativa para este nível de confiança, (obs: então
procura-se diminuir o nível de confiança para que os limites tenham o mesmo
sinal).
2- Se ambos os limites do intervalo de confiança forem positivos, significa
que π 1 excede π 2.
3- Se ambos os limites do intervalo de confiança forem negativos, significa
que π 2 exceda π 1.
Problema 3
Uma pesquisa realizada por uma entidade governamental busca dados sobre
o uso de um determinado aparelho de celular em duas comunidades indígenas.
Uma das comunidades que tinham 100 mulheres, verificou-se uma amostra de 30
mulheres que utilizam o determinado tipo de celular para se comunicar com as
demais aldeias. Já na outra comunidade, 70 mulheres em uma amostra aleatória de
300 mulheres preferem utilizar o mesmo tipo de celular. Construir um intervalo de
confiança para a diferença de 94% e outro de 97% das porcentagens populacionais.
Solução
Para um intervalo de 94%
Dados:
f1=30 f2=70
n1= 100 n2=300
f
Aplicando: ^p=
n
^ f1 30
p 1= = = 0,3
n1 100
^ f2 70
p 2= = = 0,233
n2 300
Aplicando: q^ = 1- ^p
q^1= 1- ^p 1→ q^1= 1-0,3 = 0,7
q^2 = 1- ^
p 2→ q^2 = 1-0,233 = 0,767
Graficamente podemos calcular:
0,5 - 0,03 = 0,470
Assim, buscando esse valor na tabela de Distribuição Normal Padrão temos:
Pegando os dois valores próximos temos:
z1= 1,88 e z2=1,89
A média entre z1 e z2 será:
α z 1+ z 2 1, 88+1 , 89
Z = = = 1,885
2 2 2
O erro amostral é dado pela seguinte fórmula:
Logo:
E= 1,885√ ❑= 0,0978
O intervalo de confiança é dado por:
0,3 - 0,233 - 0,0978 < π 1 −π 2 < 0,3- 0,233 + 0,0978
-0,0308< π 1 −π 2 < 0,1648
Interpretação:
Para estas amostras e considerando um intervalo de 94% NÃO HÁ uma diferença
significativa entre as duas proporções populacionais.
b) Para um intervalo de confiança de 97%
Calculado anteriormente:
^
p 1= 0,3 ^
p 2= 0,233 q^1= 0,7 q^2 = 0,767
Graficamente obtemos:
Graficamente podemos calcular:
0,5 - 0,015 = 0,485
Assim, buscando esse valor na tabela de Distribuição Normal Padrão temos:
z= 2,17
Logo, o erro amostral pode ser calculado:
E= 2,17√ ❑= 0,1126
O intervalo de confiança é dado por:
0,3 - 0,233 - 0,1126 < π 1 −π 2 < 0,3- 0,233 + 0,1126
-0,0456< π 1 −π 2 < 0,1796
Interpretação:
Para estas amostras e considerando um intervalo de 97% NÃO HÁ uma diferença
significativa entre as duas proporções populacionais.