Inferência Estatística
Estimação Pontual e Intervalar
Média
Variância
Proporção
Inferência Estatística
Conjunto de métodos de análise estatística que permitem
tirar conclusões sobre uma população com base em
somente uma parte dela, a amostra.
Parâmetros da População:
Média μ
Desvio-padrão σ
Proporção θ
Estatísticas da amostra:
Média ̄x
Desvio-padrão s
Proporção p
Tipos de Inferência Estatística
Inferência sobre o parâmetro μ
Estimação de μ - Intervalo de Confiança
Teste de Hipóteses sobre μ - Teste de Hipóteses
Estimação
Exemplo: de posse de uma amostra de 1000 eleitores de
um Estado, deseja-se estimar a proporção de eleitores
desse Estado que votarão no candidato Fulano.
O valor dessa proporção (θ) é desconhecido.
Este parâmetro pode ser estimado de duas formas:
Estimação pontual: somente um valor é dado como
estimativa para θ.
Exemplo: proporção amostral de eleitores de Fulano, p=0.60.
Estimação intervalar: um intervalo de valores é dado como
estimativa para θ.
Exemplo: [ p ± margem de erro ] = [0.60 ± 0.03] = [0.57 ; 0.63].
Alguns conceitos em Estimação
Parâmetro Valor populacional desconhecido:
Ex.: média, variância, proporção, etc.,
representado por letras gregas (μ, σ, θ, ...) .
Estimador Função das variáveis aleatórias X1,...,Xn
(do parâmetro) que compõem a amostra.
Ex.:
Estimativa Valor do estimador quando aplicado aos
(do parâmetro) dados observados na amostra.
Ex.: = 115.5.
Estimação Intervalar
Estimativa Intervalar = Estimativa pontual ± Margem de Erro
Exemplo:
Em uma amostra de 50 alunos da UFPR, encontrou-se uma
renda familiar média de 2100 reais (estimativa pontual),
com desvio-padrão de 361 reais.
A margem de erro foi calculada em 100 reais.
Assim, a estimativa intervalar para a renda familiar média do
aluno da UFPR é de
[2100 ± 100] = [2000 ; 2200] reais.
EXEMPLO: estimar μ, a média da renda familiar dos alunos
que ingressaram na UFPR este ano
Experimento:
1. Cada um de vocês tem acesso a uma amostra de
100 calouros;
2. Cada um calcula a estimativa pontual da média em
sua amostra;
3. Os valores da média irão variar de amostra para
amostra: 1400, 1890, 2900, 2100, 1700, 2450,...
Alguns valores da média serão próximos a μ, outros
não....
Nível de Confiança de uma Estimativa Intervalar
A estimativa intervalar é associada a um nível de confiança
(geralmente expresso em porcentagem).
Ex: nível de confiança de 95%.
Chamamos a Estimativa Intervalar de Intervalo de Confiança.
Ex: o intervalo de 95% de confiança para a renda familiar
média do aluno da UFPR vai de R$2000 a R$2200.
Interpretação:
Temos uma confiança de 95% de que o valor desconhecido da
renda familiar média do aluno da UFPR está entre R$2000 a
R$2200.
O que entendemos por confiança ?
EXEMPLO: estimar μ, a renda média familiar dos alunos que
ingressaram na UFPR este ano
Experimento:
1. Cada um de vocês tem acesso a uma amostra de 100 calouros;
2. Cada um construirá um intervalo de 95% de confiança
utilizando os dados da sua amostra.
Resultado esperado:
Intervalos de confiança com limites e comprimentos
diferentes. Cerca de 95% dos intervalos construídos por
vocês irão conter o valor desconhecido de μ.
Interpretação do Nível de Confiança na
Estimação Intervalar
95% dos ICμ95% construídos de diferentes amostras de
mesmo tamanho contêm o valor desconhecido de μ.
Intervalo de 100(1-α)% de Confiança
para a Média
ICμ100(1-α )% =
onde:
Estimativa pontual de μ;
Percentil da distribuição t-Student com (n -1) g.l.
que deixa acima dele uma probabilidade igual a α/2;
Estimativa da variabilidade da média entre
amostras de tamanho n;
Margem de erro.
Tabela t
(... continuação) Tabela t
Exemplo: Estimação do conteúdo médio
de ácido sulfúrico em contêineres
Os conteúdos de ácido sulfúrico em sete contêineres
similares são 9,8; 10,2; 10,4; 9,8; 10,0; 10,2 e 9,6 litros.
Determine um intervalo de confiança de 95% para a
média de todos os contêineres, assumido uma
distribuição aproximadamente normal.
Solução: A média e o desvio-padão amostrais para os
dados fornecidos são 10,0 e 0,283, respectivamente.
ICμ95% = [10 – (2,447) (0,283/ √ 7 ); 10 + (2,447) (0,283/ √ 7 )]
ICμ95% = [9,74; 10,26]
O conteúdo médio de ácido sulfúrico para esta população de
contêineres está entre 9,7 e 10.3 litros, com 95% de confiança.
Intervalo de 90% de confiança: 100(1-α)%=90%
1-α = 0.90 → α = 0.10 → α/2 = 0.05 → t (6;0,05) = 1.943
ICμ90% = [10 – (1,943) (0,283/ √ 7 ); 10 + (1,943) (0,283/ √ 7 )]
ICμ90% = [9,79; 10,21]
O conteúdo médio de ácido sulfúrico para esta população de
contêineres está entre 9,8 e 10.2 litros, com 90% de confiança.
Como diminuir o comprimento do IC ?
Reduzir o nível de confiança
Reduzir a variabilidade da população
Aumentar o tamanho da amostra
Intervalo de 100(1-α)% de Confiança para a
Variância σ2 de uma População Normal
Exemplo: Garrafas de refrigerente enchidas em máquinas
automáticas.
A variabilidade do volume do líquido dispensado deve ser controlada.
Em uma amostra de tamanho n=30, encontrou-se variância amostral
igual a s2 = 25 ml2 (desvio-padrão amostral igual s = 5 ml).
O Intervalo de Confiança de 95% para a variância σ2 é
ICσ2 95%
= [ 29 (25) / 45.7 ; 29 (25) / 16.1 ] = [ 725/45.7 ; 725/16.1]
ICσ2 95%
= [15.9 ; 45.0] ml2
Intervalo de Confiança para uma Proporção θ
ICθ100(1-α )% =
Onde:
100(1-α )% nível de confiança;
Estimativa pontual de θ;
percentil da distribuição Normal Padrão que
deixa acima dele probabilidade igual a α/2;
estimativa da variabilidade de p entre amostras
de tamanho n;
margem de erro.
* Válido somente quando n > 30 (amostras grandes)
Exemplo: Defeitos em semicondutores. Fabricante quer mostrar que
proporção de defeitos atende especificações de < 0.05.
Solução:
Parâmetro: θ - proporção de defeitos.
Amostra: n = 200, x = 4 e p = x/n = 4/200 = 0,02.
ICθ90% =
= 0,02 – 1,645
√ 0,02 ( 0,98 )
200
< θ < 0,02 + 1,645
√ 0,02 ( 0,98 )
200
= [0,02 – 0,016 ; 0,02 + 0,016]
= [0,004; 0,036].
Determinação do tamanho da amostra via IC
Encontrar o tamanho n da amostra para estimar uma proporção
θ por p com erro de no máximo e, com 100(1-α)% de confiança:
Problema: A fórmula depende de p. Possíveis soluções:
– Substituir por um chute, ou
– pensar no pior cenário, ou seja, usar o valor que produza
maior p(1-p), a saber, p =0.5.