0% acharam este documento útil (0 voto)
19 visualizações5 páginas

21 Inferência Estatística

A inferência estatística é o processo de tirar conclusões sobre uma população com base em dados amostrais, utilizando raciocínios dedutivos e indutivos. Ela envolve a análise de distribuições de probabilidades e a realização de testes de hipóteses para determinar se as diferenças observadas entre grupos são significativas ou se ocorreram por acaso. Erros de tipo I e II podem ocorrer durante a tomada de decisões estatísticas, refletindo a possibilidade de conclusões incorretas baseadas em amostras não representativas.

Enviado por

fabiohh902
Direitos autorais
© © All Rights Reserved
Levamos muito a sério os direitos de conteúdo. Se você suspeita que este conteúdo é seu, reivindique-o aqui.
Formatos disponíveis
Baixe no formato PDF, TXT ou leia on-line no Scribd
0% acharam este documento útil (0 voto)
19 visualizações5 páginas

21 Inferência Estatística

A inferência estatística é o processo de tirar conclusões sobre uma população com base em dados amostrais, utilizando raciocínios dedutivos e indutivos. Ela envolve a análise de distribuições de probabilidades e a realização de testes de hipóteses para determinar se as diferenças observadas entre grupos são significativas ou se ocorreram por acaso. Erros de tipo I e II podem ocorrer durante a tomada de decisões estatísticas, refletindo a possibilidade de conclusões incorretas baseadas em amostras não representativas.

Enviado por

fabiohh902
Direitos autorais
© © All Rights Reserved
Levamos muito a sério os direitos de conteúdo. Se você suspeita que este conteúdo é seu, reivindique-o aqui.
Formatos disponíveis
Baixe no formato PDF, TXT ou leia on-line no Scribd

INFERÊNCIA ESTATÍSTICA

Inferência Estatística

Inferência significa tirar conclusões a partir de dados. A inferência estatística utiliza o método estatístico
em dados amostrais e tira conclusões sobre a população de interesse, descrevendo-a ou testando
hipóteses. Em outras palavras:

A inferência estatística é um processo de inferir características de uma população por meio da obser-
vação de uma amostra.

Por meio de uma distribuição de probabilidades de uma variável, é possível calcular a probabilidade de
ocorrer um determinado resultado dessa variável. Assim, é possível calcular a probabilidade de ocorrer
um número 6 quando um dado é jogado uma vez, ou a probabilidade de ocorrer um 6 e um 1 quando
jogado duas vezes, por exemplo, pois conhecemos a probabilidade de ocorrer cada um dos 6 números
dessa “população”, isto é, conhecemos a distribuição de probabilidades de ocorrências dos valores
possíveis, que nesse caso é 1/6 para cada um dos valores e a soma de todas as probabilidades é 1/6
+ 1/6 + 1/6 + 1/6 + 1/6 + 1/6 = 6/6 = 1.

Indução e Dedução

Essa forma de raciocínio, que procede do geral (conhecimento da distribuição de probabilidades da


variável) para o específico (predição da probabilidade de um determinado resultado), é chamada raci-
ocínio dedutivo.

Para a inferência estatística, utiliza-se outra forma de raciocínio, chamada indução. Enquanto na dedu-
ção o raciocínio vai do geral para o particular, na indução, o raciocínio é feito do particular para o geral.A
inferência estatística, a partir de informação obtida em uma amostra da população, procura inferir os
resultados para a população. Veja que o raciocínio indutivo tem por objetivo ampliar o conhecimento
se as conclusões feitas para os resultados da amostra estiverem corretas.

Entretanto, como visto anteriormente, em quase todas as situações precisamos utilizar amostras de
populações de estudo e, a partir dos dados obtidos nessas amostras, tirar conclusões para as popula-
ções das quais as amostras foram retiradas.

Por exemplo, se quisermos investigar se existe diferença na distribuição dos sexos com o aumento da
idade e não temos os dados da população, podemos utilizar uma amostra e verificar a frequência de
homens e mulheres em diversas faixas etárias. Com base nos resultados obtidos na amostra, a esta-
tística auxilia na decisão sobre a resposta a essa pergunta: existe ou não diferença na frequência de
sexos com o aumento da idade?

Uma das formas de testar a significância de diferenças entre grupos é utilizar o chamado teste de
hipóteses.

WWW.DOMINACONCURSOS.COM.BR 1
INFERÊNCIA ESTATÍSTICA

Antes de vermos o que é um teste de hipóteses e como ele deve ser estruturado, é necessário lembrar
o que é uma distribuição de probabilidades. Existem diversos padrões de distribuição de probabilidades
reconhecidos, dependendo do tipo de variável envolvida.

Por exemplo, para muitas das variáveis contínuas, como altura ou peso, as medidas dos indivíduos de
uma população tem uma distribuição normal. Você já estudou essa distribuição e suas características,
a sua forma padronizada, que é a distribuição z, e também a distribuição t, na disciplina Genética e
Bioestatística. Este é o momento de você reler o assunto no conteúdo já estudado, se não se lembrar
dessas distribuições de probabilidades.

As distribuições de probabilidades e suas características têm um papel importante para auxiliar a to-
mada de decisão por meio da inferência estatística e isso porque qualquer medida feita com amostras,
mesmo quando ela é aleatória, vai diferir do verdadeiro valor da população por causa do processo
aleatório, que tem associado a ele um erro aleatório. Isso significa que, toda vez que um experimento
for realizado, os resultados vão ser diferentes, dependendo dos indivíduos que são selecionados para
compor a amostra. Então, ao comparar resultados obtidos em dois grupos, é preciso decidir se a dife-
rença observada entre os resultados de cada grupo ocorreu pelo acaso ou é real.

Por exemplo, ao avaliar se os níveis de colesterol total observados em uma amostra que representa
pessoas vegetarianas e outra de carnívoros são iguais ou diferentes, é necessário decidir se a diferença
observada nas médias das duas amostras ocorreu apenas pelo acaso, decorrente da variabilidade de
medidas nos indivíduos que compõem os dois grupos, ou se essa diferença é real, isto é, se os níveis
de colesterol médio são diferentes nas duas populações.

Existem diferentes técnicas estatísticas que permitem calcular qual a probabilidade de as diferenças
observadas serem devidas ao acaso. Antes de vermos como isso é feito, vamos primeiro supor um
jogo de moedas.

Exemplo 01

Neste jogo de moedas, o interesse é saber o número de caras obtidos após a moeda ser jogada 100
vezes. É esperado que, ao final do jogo, o resultado seja de aproximadamente 50 caras (e, portanto,
de 50 coroas), pois sabemos que a probabilidade de ocorrência de cada um dos lados é de 50%.
Entretanto, é possível que o resultado tenha ao final 51 caras (e 49 coroas), ou 48 caras (e 52 coroas),
ou ainda 53 (e 47 coroas). Isso acontece porque o acaso pode interferir nesses resultados.

Ao obtermos qualquer um desses resultados, não desconfiamos que essa moeda esteja viciada, pois
não esperamos obter exatamente 50 caras, mas um valor próximo a esse valor. Entretanto, não sabe-
mos só por intuição a partir de que valor devemos suspeitar de que o resultado diferente de 50 não
esteja ocorrendo apenas pelo acaso. Por exemplo, se obtivermos 40 caras no final, isso ainda pode ser
só pelo acaso? E se forem 20 caras, ainda aceitamos que essa diferença em relação ao valor esperado
(50) seja pelo acaso?

Vamos aproveitar esse exemplo para aprender sobre mais um tipo de distribuição de probabilidades –
a distribuição binomial –, que é para o tipo de variável em que são possíveis apenas dois valores.

Distribuição Binominal

Os dois valores, nesse exemplo, são cara ou coroa. Uma variável que mede presença e ausência de
uma doença também vai ter distribuição binomial, assim como qualquer variável em que são possíveis
apenas duas respostas, que comumente são chamadas de “sucesso” (nesse nosso exemplo: “sair
cara”) e “fracasso” (nesse nosso exemplo:“não sair cara”), ou simplesmente de “sim” e “não”.

A curva de probabilidade binomial é caracterizada por dois parâmetros: a probabilidade de ocorrer o


evento de interesse e o tamanho da amostra.

Por exemplo, a probabilidade de sair cara ao jogar uma moeda é de 0,5 ou de sair o valor 1 ao se jogar
um dado é de 1/6 ou 0,17. O tamanho da amostra significa o número de observações que serão reali-
zadas; por exemplo, o número de vezes que a moeda será jogada. Com esses dois parâmetros é
possível estabelecer a distribuição binomial de probabilidades para todos os resultados possíveis para
o tamanho definido da amostra.

WWW.DOMINACONCURSOS.COM.BR 2
INFERÊNCIA ESTATÍSTICA

A título de curiosidade, a fórmula utilizada para essa estimativa é:

Onde é a probabilidade de ocorrer o valor x, por exemplo, 48 moedas, em 100 vezes que
se joga uma moeda; n é o tamanho da amostra (no exemplo do jogo de moedas, 100); n! é o fatorial
do tamanho da amostra e x! o fatorial do número de “sucessos” e p é a probabilidade de “sucesso” em
cada evento (0,5 de sair cara em cada jogada).

Para lembrar, o fatorial de um número natural n (representado por n!) é o produto de todos os inteiros
positivos menores ou iguais a n. Por exemplo, 5! = 5  4  3  2  1 = 120. Mas esses cálculos são
feitos por programas de computador, que calculam as probabilidades de qualquer resultado x se esses
dois parâmetros (probabilidade de “sucesso” e tamanho da amostra) foram fornecidos.

Vamos ver outro exemplo.

Exemplo 02

Suponha uma determinada população em que 30% dos indivíduos são fumantes. A probabilidade de
um indivíduo aleatoriamente selecionado ser fumante é  = 0,30. Se uma amostra aleatória de n indi-
víduos é selecionada, usando a distribuição binomial, é possível verificar qual é a probabilidade de ter
x fumantes nessa amostra para qualquer valor de , n e x.

Nós não vamos nos ater aos detalhes matemáticos (sabemos que os cálculos podem ser feitos por
programas estatísticos), mas consideraremos alguns exemplos que nos ajudarão a entender a relação
entre esses parâmetros ( e n).Vamos considerar amostras de diferentes tamanhos obtidas dessa po-
pulação em que 30% é fumante ( = 0,30), com n = 5, 20 e 50.

O Gráfico 2.1 mostra, para cada valor de n, a distribuição de probabilidades para o número de fumantes
x.

WWW.DOMINACONCURSOS.COM.BR 3
INFERÊNCIA ESTATÍSTICA

Gráfico 2.1: Distribuição de probabilidades para o número de fumantes x, sendo o valor de n = 5 (a),20
(b) e 50 (c).

A proporção de fumantes nessa amostra é p = x/n (lembre-se de que a proporção da população é


denotada pela letra grega  e da amostra pela letra p), isto é, o número de fumantes encontrado na
amostra (x) dividido pelo tamanho da amostra (n).

Somente quando temos muita sorte é que p será igual a , isto é, a amostra vai estimar o valor verda-
deiro sem desvio na estimativa. Em qualquer amostra aleatória haverá alguma variação amostral de p.

Vamos olhar a distribuição de probabilidades para uma amostra com 5 indivíduos(Gráfico 2.1a). Seria
esperado encontrar nessa amostra 1,5 indivíduo (30% de 5), se isso fosse possível. Podemos observar
que as maiores probabilidades de ocorrência são para os valores próximos ao esperado, isto é,1 ou 2
indivíduos fumantes.

Entretanto, existe uma possibilidade de 16,8% de não encontrar nenhum fumante (a coluna de proba-
bilidade apresenta 0 fumante), por exemplo, e nesse caso a estimativa seria a de não haver fumantes
nessa população. Embora muito pequena, existe a possibilidade de que todos sejam fumantes nessa
amostra de 5 indivíduos. Essa probabilidade é de 0,002, isto é, se forem feitas 1.000 amostras de 5
indivíduos nessa população, em duas dessas amostras pode ocorrer que todos os 5 indivíduos sejam
fumantes.

Veja como a proporção estimada pelas amostras pode variar em relação à verdadeira proporção popu-
lacional  = 0,30. Mas veja também que, na grande maioria das vezes, as amostras vão estimar uma
proporção próxima à da população (de 30%), uma vez que são maiores as possibilidades de obter um
número de fumantes próximo ao número esperado (próximo a 7 na amostra de 20 indivíduos ou de 15
na amostra de 50), e como diminuem bastante à medida que se afastam do valor correspondente,
nesse caso, a 30% da amostra.

Voltando ao jogo de moedas, como os dois parâmetros (probabilidade de 50% e n de 100 jogadas) são
conhecidos, é possível estimar a probabilidade de resultarem 48 caras em 100 jogadas, ou 40 ou qual-
quer um dos valores possíveis, que podem ir de zero (em nenhuma das jogadas sair cara) até 100 (em
todas as vezes saírem caras). A distribuição de probabilidades de números de caras em 100 jogadas
de uma moeda (probabilidade de 0,5) é mostrada no Gráfico 2.2.

Veja que, na maioria das amostras, o resultado é muito próximo de 50, que é o valor esperado em 100
jogadas. Mas todos os valores no intervalo de 0 a 100 são possíveis e, mesmo sem calcularmos a
probabilidade de cada um dos resultados, seria intuitivo esperar que resultados próximos ao valor es-
perado sejam mais prováveis do que aqueles que se distanciam muito, isto é, embora seja possível
apenas pelo acaso obter 35 caras nesse jogo, imaginamos que a probabilidade de ocorrer esse resul-
tado deve ser menor do que um resultado com 48 caras, por exemplo.

De fato, a probabilidade de 35 caras em 100 jogadas de uma moeda é de apenas 0,003 ou de 3 vezes
em cada 1.000 jogos. Embora esse seja um resultado possível, fica muito difícil aceitá-lo sem desconfiar
de que a moeda não esteja bem calibrada.

Gráfico 2.2: Distribuição de probabilidades de números de caras em 100 jogadas de uma moeda.

Utilizando as distribuições de probabilidades apropriadas para cada teste específico, a estatística auxi-
lia a tomada de decisão, pois permite calcular a probabilidade de um resultado obtido em uma amostra
ter ocorrido apenas pelo acaso.

WWW.DOMINACONCURSOS.COM.BR 4
INFERÊNCIA ESTATÍSTICA

Por exemplo, para comparar o efeito de dois tipos de tratamento quando ocorre um episódio de infarto
do miocárdio, uma possibilidade é verificar se existe diferença no tempo de sobrevida dos pacientes
tratados com cada um dos dois tratamentos. Para isso, é necessário decidir se a diferença observada
entre os dois grupos de pacientes é devida ao acaso ou se existe de fato uma diferença entre os dois
tratamentos. O valor da chance de o resultado ser ao acaso é utilizado para fazer a inferência.

Nós vamos estudar o processo dos testes estatísticos para auxiliar esse tipo de decisão na próxima
aula. Uma vez que a tomada de decisão é feita com resultados de uma amostra (uma parte da popula-
ção) e não a população inteira, é possível ocorrer dois tipos de erro:

Um erro de tipo I acontece quando se conclui que os grupos comparados são diferentes, quando na
verdade são iguais, e as diferenças observadas são apenas pela variabilidade dos indivíduos que com-
puseram os dois grupos.

Por exemplo, se não aceitássemos como possível um resultado de 35 caras em 100 jogadas da moeda
e exigíssemos que a moeda fosse conferida (ou trocada), desconfiando de que estávamos sendo en-
ganados nesse jogo e esse resultado tivesse ocorrido pelo acaso (embora com chance muito pequena
de ocorrer, ela existe!), estaríamos cometendo um erro do tipo I.Também cometeríamos um erro tipo I
se concluíssemos que um dos tratamentos testados para infarto do miocárdio é melhor que o outro, se
as diferenças observadas nos tempos de sobrevida avaliados tivessem ocorrido apenas pelo acaso.

Já um erro tipo II ocorre quando a decisão é por considerar que não há diferença entre os grupos e na
verdade ela existe. Por exemplo, se fosse concluído que não existe diferença entre os dois tratamentos
realizados para pacientes com infarto e, na verdade, eles forem diferentes. Esses erros podem ocorrer,
pois pode-se ter uma amostra que não represente bem a população, levando a uma conclusão que não
corresponde à realidade.

A Tabela 2.1 descreve essas situações:

Tabela 2.1: Tipos de erros em tomadas de decisão estatística por meio de amostra de uma população

_________________________________________________________________________________

_________________________________________________________________________________

_________________________________________________________________________________

_________________________________________________________________________________

_________________________________________________________________________________

_________________________________________________________________________________

_________________________________________________________________________________

_________________________________________________________________________________

_________________________________________________________________________________

_________________________________________________________________________________

_________________________________________________________________________________

_________________________________________________________________________________

_________________________________________________________________________________

WWW.DOMINACONCURSOS.COM.BR 5

Você também pode gostar