0% acharam este documento útil (0 voto)
214 visualizações4 páginas

Inferencia Estatistica

Inferência é uma operação intelectual por meio da qual se arma a verdade de uma proposição em decorrência de sua ligação com outras já reconhecidas como verdadeiras.

Enviado por

João Aguiar
Direitos autorais
© © All Rights Reserved
Levamos muito a sério os direitos de conteúdo. Se você suspeita que este conteúdo é seu, reivindique-o aqui.
Formatos disponíveis
Baixe no formato PDF, TXT ou leia on-line no Scribd
0% acharam este documento útil (0 voto)
214 visualizações4 páginas

Inferencia Estatistica

Inferência é uma operação intelectual por meio da qual se arma a verdade de uma proposição em decorrência de sua ligação com outras já reconhecidas como verdadeiras.

Enviado por

João Aguiar
Direitos autorais
© © All Rights Reserved
Levamos muito a sério os direitos de conteúdo. Se você suspeita que este conteúdo é seu, reivindique-o aqui.
Formatos disponíveis
Baixe no formato PDF, TXT ou leia on-line no Scribd

1 Resumo da aula 1 e um pouco mais

Na aula 1 foi apresentada uma cena de assassinato. Um dos detetives do caso


conhecia, dada sua longa experiência, quais eram as chances de certas evidên-
cias surgirem para cada tipo de motivação. Seu modo de selecionar crimes é
apresentado abaixo:
Na cena do crime, busco por evidências. Não posso falar sobre a chance
destas ocorrerem nesta cena em particular, porque a mesma é 1. Deste modo, me
pergunto: considerando que innitas evidências de uma motivação em particular
foram observadas, em qual proporção destas ocorreram as mesmas evidências
desta cena? Ao variar a motivação do crime com o mesmo raciocínio, posso
deduzir qual motivação se encaixa melhor às evidências.
O método utilizado pelo detetive é conhecido como inferência

Inferência é uma operação intelectual por meio da qual se arma a


verdade de uma proposição em decorrência de sua ligação com outras
já reconhecidas como verdadeiras.

No caso descrito anteriormente, ele faz a inferência de que a motivação do


crime é a descoberta de um adultério, baseado no fato de que as evidências
observadas em assassinatos são mais frequentes neste tipo de motivação.
Pode-se escrever tal método de maneira mais geral. Há uma informação que
não pode ser diretamente medida, denominada θ. Realiza-se um experimento
para obter a amostra observada x1 , . . . , x n (ou seja, x1 é o primeiro valor obser-
vado, x2 o segundo, e assim por diante). Tais valores são utilizados para obter
realizar inferências sobre θ. Falta apenas determinar um modelo de probabili-
dades que una x1 , . . . , x n e θ.

2 Aula 2 - População e amostra

Por denição, população é um conjunto de pessoas em uma categoria partic-


ular e seu tamanho é o número de elementos neste conjunto. Por exemplo, a
população de Manaus se refere a todas as pessoas residentes nesse município.
Claro que é possível estender a noção de população. Por exemplo, pode-se
estar interessado em discutir sobre a população das baleias.
Contudo, na inferência estatística existem duas denições sobre população,
dependendo do modelo adotado.

2.1 Modelo de amostragem aleatória

Considere uma população de bolas em uma urna. Nesta urna há N bolas sendo
que destas, Nθ são brancas, com θ ∈ (0, 1).
É possível determinar exatamente o valor de θ ao se investigar todas as
bolas da urna (isto é denominado censo). Para tornar o problema interessante,
suponha que N é grande o suciente para deixar o censo caro demais. Então,
imagina-se que, ao observar apenas uma parte da urna, pode-se fazer inferências
sobre θ. A coleação destas observações sé denominada amostra.

1
É importante notar que as bolas já são brancas ou não, logo não há nada de
aleatório neste problema. Portanto, a probabilidade é induzida articialmente
na coleta da amostra, através de uma amostragem aleatória.

Em uma amostragem aleatória os indivíduos da população é uma


operação intelectual por meio da qual se arma a verdade de uma
proposição em decorrência de sua ligação com outras já reconhecidas
como verdadeiras.

Como será visto em um curso posterior, o sorteio das bolas ao acaso sem
reposição é uma amostragem aleatória importante. Considere as seguintes in-
formações

ˆ A população tem tamanho N


ˆ A amostra tem tamanho n
ˆ Ao observar a amostra, descobriu-se que n(x) bolas são brancas.

Como cada bola tem a mesma chance de ser selecionada em cada uma das n
retiradas, θ representa a probabilidade da bola ser branca. Então, o total de
bolas brancas da amostra de tamanho n segue o modelo Binomial
 
n
p(n(x)|θ) = θn(x) (1 − θ)n−n(x) .
n(x)
Em particular, sabemos que E(n(X)|θ) = θn mas, o que isso signica?
Voltemos à interpretação de inferência.

ˆ Proposição conhecida: se innitas amostras de tamanho n fossem obser-


vadas do modelo Binomial acima, a média de n(X) seria θn
ˆ O valor observado foi n(x) e, pela proposição conhecida, é natural imagi-
nar que ele está em torno de nθ.
ˆ Portanto, concluímos que é razoável supor que

n(x) ≈ nθ

o que implica que n(x)/n é uma estimativa para o valor de θ. e

n(x)
N
n
é uma estimativa para o total de bolas brancas.

Claro que este modelo é aplicável às mais diversas situações, como por ex-
emplo:

1. Considere a população de eleitores no Brasil. Quantos votam no candidato


A?
2. Considere a população de residências de uma cidade do Brasil, com suas
divisões administrativas. Quantos votam no candidato A? Quantas tem
acesso à esgoto?

2
2.2 Modelo de amostras aleatórias

O modelo de amostragem aleatória não pode ser utilizado para qualquer prob-
lema. Por exemplo, considere que você foi ao médico e este lhe passou um
exame de sangue. No laboratório, uma amostra do seu sangue é coletada em
um tubo para gerar alguma medida como quantidade de glicose. Pode-se até
aceitar que o sangue do seu corpo seja a população, mas como a probabilidade
foi induzida via amostragem? Houve algum mecanismo de sorteio? Nota-se que
é de fundamental importância introduzir um modelo probabilístico de outro
modo.
Ainda analisando o exemplo acima, sabe-se que a formação de glicose é
contínua no seu corpo, mas é relativamente estável em um intervalo não muito
grande de tempo. Há um processo biológico que gera tal quantidade. Veja como
a inferência pode ser utilizada neste caso:

1. Considere que a mesma quantidade de sangue de vários indivíduos com


perl saudável foram coletadas e as respectivas quantidades de glicose
foram obtidas.

2. Um histograma destes resultados foi construído, revelando uma forma de


sino, consistente com a distribuição normal, cuja densidade é

 
1 1 2
f (x|θ) = √ exp − (x − µ) ,
2πσ2 2
com θ = (µ, σ 2 ).
Deste modo, independente de como funciona o processo biológico em questão,
os valores que serão observados para a glicose são consistentes com uma dis-
tribuição de probabilidades. Em outras palavras, assumimos que a probabil-
idade necessária para realizar inferências já está induzida no processo gerador
dos dados.
Ao assumir que os dados são gerados a partir de um mecanismo probabilís-
tico, aqui denotado por f (x|θ), a população passa a ser todos os valores de x
que satisfazem f (x|θ) > 0. A amostra (de tamanho n) que será observada é
uma coleação de variáveis aleatórias com distribuição F (.|θ). Neste sentido, a
amostra observada x1 , . . . , xn é uma realização (ou seja, um sorteio seguindo
as probabilidades induzidas por f (x|θ)) da coleção X1 , . . . , Xn . Abaixo segue a
denição formal deste modelo.

Diz-se que as variáveis aleatórias X1 , . . . , Xn são uma amostra


aleatória de tamanho n da população f (x|θ) se X1 , . . . , Xn
são variáveis mutualmente independentes e cada Xi de distribuição
f (x|θ).

Portanto, no modelo de amostras aleatórias, as variáveis X1 , . . . , Xn são


independentes e identicamente distribuídas com função densidade ou de proba-
bilidade dada por f (x|θ), onde θ é um parâmetro (populacional) desconhecido.
No exemplo da glicose, os valores de referência para um indivíduo saudável
só podem ser calculados após a estimação de θ = (µ, σ 2 ). Considere a amostra
x1 , . . . , x n , observada da amostra aleatória X1 , . . . , Xn . Note que

3
n
1X
E(X̄|θ) = E(Xi |θ) = µ.
n i=1
Através da inferência, tem-se.

ˆ Proposição conhecida: as médias obtidas a partir de amostras aleatórias


de tamanho n se concentram em torno de µ
ˆ A média (amostral) observada é o valor de x̄, onde

n
1X
x̄ = xi ,
n i=1

e, pela proposição conhecida, é natural imaginar que ele está em torno de


µ.
ˆ Portanto, concluímos que é razoável supor que

x̄ ≈ µ

o que implica que x̄ é uma estimativa para o valor de µ.

2.3 Leitura complementar

ˆ Bussab e Morettin: Seções 10.1 e 10.2

ˆ Casella e Berger: Seção 5.1

3 Aula 3

Você também pode gostar