0% acharam este documento útil (0 voto)
17 visualizações18 páginas

Inferência Estatística: Testes de Hipóteses

O documento discute os processos de inferência estatística sobre médias a partir de amostras. Aborda tópicos como escolha do teste estatístico, hipóteses, significância estatística, intervalos de confiança e distribuição t de Student.

Enviado por

tecoluigi
Direitos autorais
© © All Rights Reserved
Levamos muito a sério os direitos de conteúdo. Se você suspeita que este conteúdo é seu, reivindique-o aqui.
Formatos disponíveis
Baixe no formato PDF, TXT ou leia on-line no Scribd
0% acharam este documento útil (0 voto)
17 visualizações18 páginas

Inferência Estatística: Testes de Hipóteses

O documento discute os processos de inferência estatística sobre médias a partir de amostras. Aborda tópicos como escolha do teste estatístico, hipóteses, significância estatística, intervalos de confiança e distribuição t de Student.

Enviado por

tecoluigi
Direitos autorais
© © All Rights Reserved
Levamos muito a sério os direitos de conteúdo. Se você suspeita que este conteúdo é seu, reivindique-o aqui.
Formatos disponíveis
Baixe no formato PDF, TXT ou leia on-line no Scribd

Inferências sobre médias – uma

amostra

• 1º passo: Escolha do teste a usar;


• 2º passo: Definição de hipóteses;
• 3º passo: Indicação do nível de significância;
• 4º passo: Valor observado;
• 5º passo: Valor tabelado;
• 6º passo: Conclusões;

2
• Muitas vezes é também usado o valor prova (valor -
p) para concluir num teste de hipóteses;
• Este valor- p é uma probabilidade;
– Probabilidade de obter um valor tão ou mais extremo do
que o valor observado sob a hipótese nula verdadeira;
– probabilidade de os dados concordarem com H0, sendo
H0 verdadeira;

• 1º passo: Escolha do teste a usar;


• 2º passo: Definição de hipóteses;
• 3º passo: Indicação do nível de significância;
• 4º passo: Valor p;
• 5º passo: Conclusões;

4
• Se valor p < α Rejeitar H0

• Se valor p ≥ α Não rejeitar H0

• A escolha do teste a usar, depende entre outros:


– A natureza da variável em estudo;

– A natureza da amostra.

6
• Uma amostra:
– Exemplo: Através de um relatório europeu supõe-se
que a média de idades dos técnicos de saúde a
desempenhar funções em locais públicos seja 35
anos. Será que o mesmo se verifica em Portugal?

• Duas amostras emparelhadas:


– Exemplo: Será que a quantidade de oxigénio no
sangue difere antes e após um treino cardio-
respiratório?

8
• Duas amostras independentes:
– Exemplo: Será que a idade de diagnóstico de tumor
gástrico é diferente entre indivíduos do sexo
masculino e indivíduos do sexo feminino?

• Muitos dos métodos de Inferência Paramétrica


pressupõem a normalidade dos dados (i.e., que os
dados têm uma distribuição Normal), o que pode ser
verificado através de testes de hipóteses, tais como:
– Shapiro-Wilk;
– Kolmogorov-Smirnov;

10
• Objectivo - testar as seguintes hipóteses:

H0: A variável segue uma distribuição normal


versus

H1: A variável não segue uma distribuição normal

11

Se a dimensão amostral for pequena (n<30), a


utilização não adequada do teste t pode dar
origem a valores de prova inferiores ao valor
correcto ou intervalos de confiança mais
pequenos.

12
Iremos rejeitar mais vezes a hipótese nula e
concluir erradamente que existe diferença
mais frequentemente do que é explicitamente
suposto por α.

13

• Quando temos menos de 30 casos!

• Comandos: Analyze -> Descriptive Statistics ->


Explore
– Dependent list: Variável a testar

– Botão Plots: Normality Plots with tests

14
• Teste de Kolmogorov –Shapiro
– Hipóteses:
H0: A variável idade segue uma distribuição normal
H1: A variável idade não segue uma distribuição normal

• Conclusão: Como p ≈ 0,2 > 0,05 não rejeitamos H0. Não existem evidências
estatísticas para afirmar que a variável idade não segue uma distribuição normal.

• Vamos assumir que a variável idade segue uma distribuição normal na população.

15

Processo inferencial sobre a média da população


µ (desconhecida) a partir de uma amostra (quando
a população segue uma distribuição normal).

16
• Baseia-se na distribuição Normal N(0,1), quando o
desvio padrão da população, σ, é conhecido;
• Baseia-se na distribuição t de Student, quando o
desvio padrão da população, σ, não é conhecido,
mas apenas é conhecida a sua estimativa, s,
calculada a partir da amostra.

17

Se a distribuição das médias amostrais seguir a


distribuição normal e se σ for conhecido o cálculo de
intervalos de confiança e os testes de significância para µ
são calculados a partir de:
X −µ
z=
σ
n

A estatística z segue a distribuição N(0,1).


18
Na prática desconhecemos σ e estimamo-lo a partir
do desvio padrão da amostra, s.

Ou seja, estimamos o erro padrão da média σ X = σ n


s
a partir de n . s → σ
s σ

n n
19

Mas agora a estatística

X −µ
t=
s
n

segue a distribuição t de Student.

20
A distribuição t é semelhante à distribuição normal:

• simétrica em relação à média (0), mas com um


desvio padrão dependente de um parâmetro
denominado graus de liberdade (gl).

gl=f(n), onde n é a dimensão amostral.

21

 Existe uma distribuição t Student diferente para cada


valor da dimensão amostral.
22
Exemplo:

Supõe-se que o peso médio de indivíduos com tumor


gástrico é 60 Kg. Será que podemos afirmar que a
nossa amostra provém de uma população com a
mesma média de peso?

23

− Como o número de observações é 35, não é necessário fazer o


teste à normalidade (usamos o TLC).

24
• Hipóteses:
H0: µ = 60
H1: µ ≠ 60
• Nível de significância: 0,05
• Escolha do teste a usar:
− Como não conhecemos o desvio padrão da
população -> teste t;

25

• Comandos SPSS: Analyze -> Compare Means ->


One Sample t test

26
• O valor t da tabela do output do SPSS
corresponde ao valor observado da estatística;

• O valor de Sig. (2-tailed) é o valor prova, ou


seja, valor – p ou p-value.

27

• O valor de “95% Confidence Interval of the


Difference” é o intervalo de confiança a 95%
para a diferença entre a média da população
e a média a testar.
• O valor de “Std. Error Mean” é o valor do erro
padrão médio.

28
• Conclusões:
– Como o valor de p ≈ 0,010 < 0,05 (nível de
significância), rejeita-se H0. Logo existem evidências
estatísticas, ao nível de significância de 0,05,para
afirmar que a média de peso da população de onde
provém a amostra é significativamente diferente de
60 kg.

29

Note que:

Estas conclusões podiam ser obtidas a partir da


construção do intervalo de confiança, usando a
mesma distribuição, o mesmo número de graus
de liberdade e assumindo o mesmo valor de α.

30
A fórmula geral para os limites de confiança a (1-
α)100% para a média da população, µ, usando a
média de uma amostra de dimensão n é:

• Se σ conhecido

• Se σ desconhecido

31

“95% Confidence Interval of the Difference“


Intervalo de confiança a 95% para a diferença µ - 60 (valor a
testar)
]0,752; 5,243[

Intervalo de confiança a 95% a média da população


]0,752+60; 5,243 + 60 [

32
] 0,752+60; 5,243 + 60 [

]60,752 ; 65,243[

Alternativa: Analyze -> Descriptive Statistics ->


Explore

33

34
• Estamos 95% confiantes que o intervalo de 60,752 a
65,243 contem a verdadeira média de peso da população
de onde retiramos a amostra.

• Assim podemos afirmar, com 95% de confiança, que esta


é significativamente diferente de 60 Kg (uma vez que o
valor 60 não pertence ao IC).

35

• Média da amostra: X = 62,997

I.C. = ]60,752; 65,243[

H0: µ ≤ 60
• Valor a testar: 60 Kg
H1: µ > 60

36

Você também pode gostar