Testes Paramétricos: Fundamentos e Aplicações
Testes Paramétricos: Fundamentos e Aplicações
________________________________________________________________________________
Para testar estes pressupostos é essencial que os resultados dos sujeitos sejam
medidos de uma forma numérica, ainda que nem sempre baseados numa escala intervalar
“natural”. De facto, é frequente serem atribuídos números a todos os tipos de escalas, para
as quais é simplesmente suposto que existem intervalos iguais entre os pontos duma escala
contínua.
________________________________________________________________________________
________________________________________________________________________________
Exercício 1*
"Estudos efectuados com recém-nascidos sugerem que as características sensoriais se desenvolvem com
ritmos diferentes. Por exemplo, enquanto que a visão de formas bem definidas ocorre apenas a partir das 4-8
semanas de vida, o olfacto encontra-se completamente desenvolvido ao fim da 1ª semana. Para testar a influência do
olfacto no sono dos recém-nascidos, um investigador efectuou um estudo em que mediu o tempo que bebés com 1
semana, de três maternidades diferentes da capital, demoram a adormecer e a duração da sesta após terem sido
amamentados pela mãe. Num 1º grupo colocou-se no berço uma peça de roupa utilizada pela mãe e no 2° grupo foi
colocada no berço uma peça de roupa utilizada por outra parturiente que não a mãe. Os resultados obtidos foram os
seguintes:
Maternidade Peça de roupa da mãe Tempo demorado a Duração da Sesta (min)
adormecer (min)
Alf.Costa Sim 2 240
Alf.Costa Sim 5 230
Alf.Costa Sim 4 223
Alf.Costa Sim 6 243
Alf.Costa Sim 5 235
Alf.Costa Não 9 200
Alf.Costa Não 7 225
Alf.Costa Não 5 245
Alf.Costa Não 6 198
Alf.Costa Não 5 201
Amad.Sintra Sim 3 250
Amad.Sintra Sim 6 235
Amad.Sintra Sim 6 255
Amad.Sintra Sim 5 265
Amad.Sintra Sim 5 242
Amad.Sintra Não 9 232
Amad.Sintra Não 7 199
Amad.Sintra Não 5 255
Amad.Sintra Não 6 222
Amad.Sintra Não 5 123
Estefânia Sim 9 245
Estefânia Sim 7 240
Estefânia Sim 7 251
Estefânia Sim 4 268
Estefânia Sim 5 235
Estefânia Não 9 159
Estefânia Não 9 200
Estefânia Não 8 196
Estefânia Não 9 238
Estefânia Não 7 189
*
Maroco J.( 2003), Análise Estatística Com utilização do SPSS, 1ª edição, Edições Sílabo, pág.115
________________________________________________________________________________
Pretende-se saber se Tempo demorado a adormecer segue uma distribuição normal e se as variâncias nos dois
grupos de bebés – com e sem peça de roupa da mãe – são ou não iguais.
Resolução
Utilizando o SPSS , temos
1º introduzir as variáveis no editor de dados e codificar as variáveis nominais em variáveis quantitativas:
Maternidade Peça de roupa da mãe
-1 : Alf.Costa -1 : Sim
0 : Amad.Sintra 1 : Não
1 : Estefânia
2º determinar os testes de Kolmogorov-Smirnov e de Levene:
Analyse → Descriptive Statistics →Explore
dentro do Explore temos:
Dependent List : tempo demorado a adormecer
Factor List : Peça de roupa da mãe (var. independente)
Plots
→ Normality plots whith tests (realiza o teste de Kolmogorov-Smirnov )
→ Spread vs. Level with Levene test→
→Untransformed
(realiza o teste de Levene )
3º analisando o 3º quadro do output obtemos o teste K-S para o Tempo demorado a adormecer nas duas amostras da
variável roupa da mãe “Sim” e “Não” com p-value (sig.) de 0,200 e 0,073 respectivamente.
4º concluímos com uma probabilidade de erro de 5% que o Tempo demorado a adormecer nas duas amostras tem
uma distribuição Normal ( p-value (sig.) > α (0,05) )
5º analisando o 4º quadro do output obtemos o teste de Levene. Podemos concluir que as variâncias populacionais
estimadas a partir das duas amostras são homogéneas ( p-value (sig.) > α (0,05) )
_________________________________________________________________________________
Admita-se que, sob uma certa hipótese, a distribuição amostral de uma estatística X é
normal, com a média µ e o desvio padrão σ. Então, a distribuição da variável reduzida (ou
X -µ
valores z), dado por Z= é a distribuição normal reduzida (com média 0 e variância 1).
σ
________________________________________________________________________________
Figura 1
Os valores –1,96 e 1,96 são ditos valores críticos (zc ) para o nível de significância
0,05.
Baseada nas observações acima, pode ser formulada a seguinte regra de decisão:
Rejeição da hipótese no nível de significância 0,05, quando o valor z da estatística Z se
situa fora do intervalo de -1,96 a 1,96. Isso equivale a dizer que a estatística amostral
observada é significativa no nível 0,05.
Aceitação da hipótese Quando o valor z da estatística Z se situar dentro do intervalo de
–1,96 a 1,96.
abreviadamente z .
p
________________________________________________________________________________
O teste estudado acima, em que a rejeição é feita a partir dos valores extremos z
para cada um dos lados é bilateral ou bicaudal. Para certos casos em que interessa rejeitar
apenas a partir de valores extremos para um dos lados (testes unilaterais, ou unicaudais)
temos a zona de rejeição apenas de um dos lados, como está representada na Figura 5.
Tabela 1
Como o valor z representa um papel tão importante nos testes de hipóteses e na
significância, ele é também denominado estatística do teste.
________________________________________________________________________________
calcula-se um valor de p-value a partir do qual é “seguro” rejeitar H0. Para um determinado
α, a regra geral é
Rejeitar de H0 se p-value ≤ α
Por exemplo, quando p-value = 0,0001 rejeita-se H0, pois este valor é muito inferior
aos níveis de significância usuais. Por outro lado, se p=0,048 pode haver dúvida pois, embora
o valor seja inferior, ele está muito próximo do nível usual de 5%.
Exercício1... continuação
Sabendo que num estudo semelhante efectuado no Porto se obteve uma média populacional do tempo
demorado a adormecer nos bebés de 5,1 minutos, será que a estimativa do tempo médio demorado a
adormecer dos bebés da capital deste estudo é significativamente diferente do tempo médio demorado
a adormecer dos bebés do Porto ?
Resolução
Teste Bilateral : H0 : µ = 5,1
H1 : µ ≠ 5,1
Recorrendo ao SPSS:
Analyse → Compare Means →One Sample T-test...
dentro do One Sample T-test... temos:
Test variable(s) : tempo demorado a adormecer
Test value : 5,1
O segundo quadro dos resultados obtidos apresenta p-value (sig.) =0,004. Concluímos que se rejeita H0
pois p-value < α (0,05), ou seja, com uma probabilidade de erro de 5%, a nossa média é
significativamente diferente de 5,1.
__________________________________________________________________________________________
________________________________________________________________________________
Tabela 2
n< 30 tn-1 −
2 X −µ
σ conhecido
σ n
−
n≥30 N(0,1) 2 X −µ
σ desconhecido
s n
_________________________________________________________________________________
Exemplo 1 O Ministério da Saúde afirma que, com os meios agora postos à disposição dos
hospitais civis, o número médio de dias de internamento é mais de oito. Quem o afirmou
baseou-se em estudos recentes com um conjunto de 225 doentes onde se observou que o
número médio de dias de internamento tinha sido de nove e desvio padrão um. Quer
comentar?
Se, no teste, não for possível provar que µ = 8 , e, portanto rejeitar H0, então a média
amostral de 9 dias de internamento será a melhor estimativa possível, condicionada ao erro
tipo I que se poderá ter cometido.
Se H0 não for rejeitada, pode-se afirmar que é provavelmente verdadeira, embora
podendo ter-se cometido um erro tipo II.
Consideremos α=5%.
________________________________________________________________________________
−
X −µ
Estatística: ~ N (0, 1)
σ n
critico para z será zc = 1,645 (ver tabela 1) podendo estabelecer-se a seguinte região
x -µ 9 −8
O valor z da estatística será dado por zp = = = 15
σ 1
n 225
Região Crítica (RC) = [ 1,645; +oo[
Região Admissão (RA) = ]–oo ;1,645]
Como z = 15,9 > 1,645 = z , decide-se rejeitar H0 , isto é rejeita-se que o número
p c
médio de dias de internamento é de oito.
_________________________________________________________________________________
________________________________________________________________________________
Tabela 3
2
s 21 s 22
+
n1 n 2
com v =
2 2 2
1 s1 1 s 22
× + ×
n1 − 1 n1 n 2 − 1 n 2
__________________________________________________________________________________________
Exemplo 2 Num ensaio clínico comparou-se dois anorexígenos e registaram-se as perdas de peso.
Pretende-se testar se a diferença observada nas duas amostras é estatisticamente significativa,
assumindo-se α de 1%.
________________________________________________________________________________
Vamos supor que a distribuição não é Normal mas há homogeneidade das variâncias.
Grupo A Grupo B
Média 2 6
Variância 0.784 1.52
n 6 7 Hipóteses a testar: H0: µA=µB
H1: µA‡µB
x1 − x 2 6−2
t= ⇔ t= = 6, 603
2 2
( n1 − 1)s + ( n 2 − 1)s
1 2 1 1 0, 606
× +
n1 + n 2 − 2 n1 n 2
Conclusão: Como t > tc, rejeita-se H0 e aceita-se que as diferenças são estatísticamente significativas.
__________________________________________________________________________________________
_________________________________________________________________________________
Exemplo 3(SPSS) Foram medidas as desitometrias ósseas (medição da densidade mineral
óssea) de indivíduos com e sem fractura do colo do fémur, estando indicadas as médias de
densidade mineral óssea (BMD) para os dois grupos na Tabela. Perante este resultado
poderemos afirmar que os indivíduos que fracturam o colo do fémur têm um BMD mais baixo
do que os indivíduos sem fractura?
n
_ s
x
não fracturado 1981 0.96 0.17
________________________________________________________________________________
________________________________________________________________________________
H0: µA=µ
µB x1 − x 2 6−2
t= ⇔ t= = 6, 603
H1: µA‡µ
µB 2 2
( n1 − 1)s + ( n 2 − 1)s
1 2
×
1 1
+
0, 606
n1 + n 2 − 2 n1 n 2
CONCLUSÃO: Como t > tc, rejeita-se H0 e aceita-se que as diferenças são estatísticamente significativas.
_____________________________________________________________________________________
_________________________________________________________________________________
_________________________________________________________________________________
Exercício1... continuação
Como foi visto anteriormente, as condições de aplicabilidade de testes paramétricos foram verificadas
logo o teste t-student pode aplicar-se. Recorrendo ao SPSS:
Analyse → Compare Means →Independent Samples T-test
dentro do Independent Samples T-test temos:
________________________________________________________________________________
O segundo quadro dos resultados obtidos apresenta p-value (sig.) =0,007. Concluímos que se rejeita H0
pois p-value < α (0,05), ou seja, os tempos médios para adormecer são significativamente diferentes
nos dois grupos de bebés.
_________________________________________________________________________________
_________________________________________________________________________________
Exemplo 4 Um hipnótico foi aplicado num grupo de pacientes que de tinham submetido
anteriormente a um tratamento padrão. Foi observado o número de horas de sono de cada
paciente nos dois momentos. Deseja-se testar se a diferença média observada é não nula,
considerando-se um nível de significância de 5%.
________________________________________________________________________________
Horas de sono
Di
D = 0, 433, S D = 0, 27 →
Paciente Droga Trat. Padrão
EPM D = 0, 27
1 8.6 8.2 0.4
2 8.8 8.3 0.5
= 0, 09
9
3 8.1 7.6 0.5
4 9.8 9.4 0.4
5 9.7 8.9 0.8 0, 433
t= =4,81 e gl = 8
6 8.0 7.2 0.8 0, 09
7 8.4 8.5 -0.1
8 9.5 9.3 0.2 → tc 2,5% = 2,30 ⇒ Rejeita-se H 0
9 9.5 9.1 0.4
H 0 : µD = 0 H A : µD ≠ 0
_________________________________________________________________________________
____________________________________________________________
Exemplo 5 (SPSS)
A tabela seguinte refere-se aos dados para uma amostra de 12 casais relativamente ao número de filhos
que tem e o número de filhos que desejavam ter por ocasião do seu casamento.
Pretende-se saber se existem diferenças significativas do número médio de filhos por casal e
do número médio de filhos desejados.
________________________________________________________________________
_________________________________________________________________________________
________________________________________________________________________________
1. Avaliar pressupostos
2. Analisar resultados
_________________________________________________________________________________
________________________________________________________________________________
Para testar a igualdade de médias, a ANOVA recorre à análise das variâncias: compara
a proporção relativa da variância dentro das amostras ou grupos populacionais ( variância
residual ) com a variância entre as amostras ou grupos populacionais ( variância do factor ).
Se a variância residual for significativamente inferior à variância do factor, então as médias
populacionais estimadas a partir das amostras, são significativamente diferentes.
Quando na ANOVA se rejeita H0, pode-se concluir que existe pelo menos uma média
populacional que é significativamente diferente das restantes. No entanto, a ANOVA não
________________________________________________________________________________
indica qual ou quais as médias diferentes. Assim, temos que testar à posteriori qual ou quais
os pares de médias diferentes.
O procedimento para comparar k médias, duas a duas, designa-se por “Comparação
múltipla de médias”. De entre vários testes existentes para comparar k médias, um dos mais
utilizados é o teste de Tukey.
_________________________________________________________________________________
Exercício 1 … continuação
Pretende-se saber se existem diferenças significativas entre o tempo médio que os bebés demoram a
adormecer nas três maternidades estudadas.
Pelo 2º quadro do output concluímos, com uma probabilidade de erro de 5%, que apenas as
maternidades Alf.Costa e Estefânia têm médias significativamente diferentes ( sig = 0,04 ).
__________________________________________________________________________________________
__________________________________________________________________________________________
Exercício 7 Pretende-se estudar se existe relação entre o número de anos que um individuo adulto fuma
e as suas habilitações literárias. Os resultados obtidos estão na Tabela abaixo.
________________________________________________________________________________
Descriptives
número de anos que fuma
N Mean Std. Deviation Std. Error Lower Bound Upper Bound Minimum Maximum
1.º Ciclo 11 23,18 7,373 2,223 18,23 28,14 14 40
2.º Ciclo 10 15,80 10,465 3,309 8,31 23,29 4 35
3.º Ciclo 27 13,89 7,433 1,431 10,95 16,83 2 30
Ensino Secundário 39 12,13 7,331 1,174 9,75 14,50 2 35
Licenciatura 19 11,89 8,755 2,009 7,67 16,11 3 32
Total 106 14,03 8,490 ,825 12,39 15,66 2 40
Resultados:
________________________________________________________________________________
ANOVA
número de anos que fuma
= 1180,864/7568,915=o,156
________________________________________________________________________________