TESTES ESTATÍSTICOS
Estatística inferencial: testes paramétricos ou não paramétricos, a escolha é
baseada no tipo de variável (quantitativa ou qualitativa) e na distribuição da
variável.
Os testes estatísticos Paramétrico ou Não Paramétricos podem ser agrupado
de acordo com o número de variáveis envolvidas:
Univariado: uma variável como desfecho. Ex: estudos de prevalência.
Bivariado: duas variáveis, sendo uma o desfecho e a outra a exposição.
Multivariado: Mais de duas variáveis, sendo um o desfecho e as outras
os fatores de exposição.
TESTE ESTATÍSTICO
O teste de estatístico (hipótese) testa a probabilidade de erro (p-valor) ao
rejeitar a H0 (sem significância estatística) e aceitar a H1 (existe significância
estatística) baseado nos dados amostrais considerando o nível de significância
(α).
A pesquisa é realizada com uma amostra da população, os testes
avaliam a probabilidade de erro.
P valor: indica a significância, então avalia se há
diferença/correlação/associação entre fatores. Se p for 0,005 então há 5% de
chance de estar errado em rejeitar H0 e aceitar H1 (baixo risco de erro).
Ex: PA em homens e mulheres
H0 (hipótese nula): não há diferença entre PA de homens e mulheres.
H1 (hipótese alternativa): há diferença entre PA de homens e mulheres.
* Se houver até 5% de chance de erro (p<0,05), indica que há diferença
significativa, assim, rejeita-se H0. Se houver mais de 5% aceita H0 pois não há
diferença significativa.
* Erro do tipo I: dizer que há diferença (rejeitar H0) sendo que na verdade não é
significativo.
Principais testes:
Relação entre duas variáveis quantitativas ou ordinais (bivariado)
Perguntas:
A variável independente (fator de exposição) tem efeito sobre a variável
dependente (desfecho).
Existe relação entre as variáveis independentes (fator de exposição).
Hipóteses:
H0: Não existe correlação significativa entre as variáveis.
H1: Existe correlação significativa entre as variáveis.
Testes:
Pearson (paramétrico): Variáveis numéricas com distribuição normal.
Spearman (não paramétrico): Variáveis numéricas sem distribuição
normal e variáveis categóricas ordinais. Usado em amostras maiores.
Kendall (não paramétrico): Variáveis numéricas sem distribuição normal
e variáveis categóricas ordinais para amostra pequenas (n<50).
Testes de normalidade (somente para variável numérica): Shapiro-Wilk
P-valor do Shapiro-Wilk > 0,050 tem distribuição normal. Usar teste de
Pearson.
P-valor do Shapiro-Wilk ≤ 0,050 não tem distribuição normal. Usar teste
de Spearman ou Kendall.
Comparação de duas medidas numéricas em grupos independentes
(bivariado)
Pergunta:
A variável independente categórica (fator de exposição) tem efeito sobre
a variável dependente numérica ou categórica ordinal (desfecho).
Ex: IMC é categorizado – baixo peso, eutrofico, sobrepeso e obeso. Cada
categoria de resposta está ordenada de forma que quem está na mesma
categoria tem valores semelhantes do que outras categorias, mas não se sabe
o valor de cada um.
Testes:
t Student independente (paramétrico): desfecho numérico com
homogeneidade das variâncias.
Mann-Whitney (não paramétrico): desfecho numérico sem
homogeneidade das variâncias ou categórico ordinal.
Teste de Homogeneidade (somente para variáveis numéricas): Levene
P-valor do Levene > 0,050 tem homogeneidade, pois não há diferença
significativa. Usar teste de t Student;
P-valor do Levene ≤ 0,050 não tem homogeneidade. Usar teste de
Welch (correção para t Student) ou Mann-Whiteny.
Comparação de duas medidas numéricas pareadas (bivariado)
Pergunta:
Existe diferença entre duas medidas do desfecho (variável dependente
numérica ou categórica ordinal).
O fator de exposição é o momento das medidas do desfecho. Assim,
faz-se duas medidas repetidas no mesmo indivíduo (pré e pós). Ex:
aferir PA em um momento e após determinado tempo de tratamento
(intervenção) realiza-se novamente a medida.
Testes:
t Student pareado (paramétrico): desfecho numérico com distribuição
normal da diferença.
Wilcoxon (não paramétrico): desfecho numérico sem distribuição normal
da diferença ou categórico ordinal.
Teste de normalidade (somente para variável numérica): Shapiro-Wilk;
P-valor do Shapiro-Wilk > 0,050 tem distribuição normal. Usar teste de t
Student.
P-valor do Shapiro-Wilk ≤ 0,050 não tem distribuição normal. Usar teste
de Wilcoxon.
Comparação de 3 ou mais medidas numéricas em grupos independentes
(multivariado)
Pergunta:
A variável independente categórica (fator de exposição) tem efeito sobre
a variável dependente numérica ou categórica ordinal (desfecho).
Testes:
Anova-one-way (paramétrico): desfecho numéricos com homogeneidade
das variâncias.
Kruskal-Wallis (não paramétrico): desfecho numérico sem
homogeneidade das variâncias ou categórico ordinal.
Teste de Homogeneidade das variâncias para variáveis numéricas: Levene
P-valor do Levene > 0,050 tem homogeneidade. Usar teste de Anova
(Fisher);
P-valor do Levene ≤ 0,050 não tem homogeneidade. Usar teste de
Welch (correção para Anova) ou Kruskal-Wallis.
Teste Post-hoc (comparação par a par para localização das diferenças):
Homogeneidade assumida: Bonferroni, Turkey ou Sidak.
Homogeneidade violada: Dunn ou Games-Howel.
Exemplo: Diferença de peso entre categoriais dos estados nutricionais.
Primeiramente aplica-se Levene para avaliar a homogeneidade. Se houver
homogeneidade, usa-se anova. Caso este dê diferença significativa entre os
pesos, aplica-se teste post-hoc para avaliar a diferença entre cada categoria.
Caso a homogeneidade seja violada, realiza-se teste de Kruskal-Wallis e, caso
dê diferença significativa, faz-se teste Post-hoc para avaliar diferença entre
cada categoria.
Comparação de 3 ou mais medidas numéricas pareadas (multivariado):
Pergunta:
Existe diferença entre três ou mais medidas do desfecho (variável
dependente numérica ou categórica ordinal). O fator de exposição é o
momento das medidas do desfecho.
Testes:
Anova de medidas repetidas (paramétrico): desfecho numérico com
esfericidade.
Frideman (não paramétrico): desfecho numérico sem esfericidade ou
categórico ordinal.
Teste de Esfericidade (variáveis numéricas): Teste de Mauchly’s.
P-valor do Mauchly’s > 0,050 esfericidade assumida. Usar teste de
Anova de medidas repetidas;
P-valor do Mauchly’s ≤ 0,050 esfericidade violada. Usar teste de
Greenhouse-Gesseir ou teste de Frideman.
Teste Post-hoc: comparação par a par para localização das diferenças.
Bonferroni, Turkey ou Sidak.
Para Frideman: Durbin.
Concordância entre métodos de diagnósticos de desfecho numérico
(bivariado)
Pergunta:
Existe concordância entre as medidas de um desfecho numérico entre
dois métodos diagnósticos ou para o mesmo método entre dois
avaliadores diferentes ou entre dois momentos diferentes.
Teste de Bland Altman
Variáveis numéricas.
Baseado na comparação do intervalo de confiança da diferença.
Embora não exista necessidade de distribuição normal da diferença,
dados com distribuição favorecem maior precisão para análise.
Ex1: Comparar métodos de glicemia de jejum e glicemia capilar. Não há valor
de p nesse caso. O teste é baseado na estimativa do erro – se for pequeno,
existe concordância (ambos os métodos seriam aceitáveis), então tanto a
glicemia de jejum quanto a capilar servem para dosagem.
Ex2: Comparar a estimativa da hemoglobina glicada pelo exame de sangue
(HbA1c) e glicada por monitoramento contínuo de glicemia (A1C). Quando o
intervalo de confiança inclui o valor 0 é bom, pois isso indica que existe a
possibilidade do 0 ser um valor (baixa chance de erro).
Analisar o efeito de mais de um fator de exposição sobre um desfecho
numérico (multivariado)
Pergunta:
Existe efeito de fatores de exposição (covariáveis independentes) sobre
um desfecho numérica ou categórica ordinal (variável dependente).
Observa-se mais de um fator para saber como eles interagem para
modificar um desfecho.
Teste de regressão linear múltipla:
Covariáveis independentes: numéricas ou categóricas ordinal ou
categórica nominal dicotômica.
Desfecho: variável dependente numérica.
Distribuição de normalidade de variáveis numéricas não é impeditivo,
mas melhoram a precisão da previsão do desfecho.
Multicolinariedade: correlação elevada entre dois ou mais fatores de
exposição.
Homocedasticidade: a variância entre os fatores de exposição é
semelhante.
Ex: Efeito de fatores de exposição (glicemia, PA, idade, sexo, doenças
crônicas) sobre a intensidade da dor. O R 2 indica o quanto as variáveis
influenciam, como o valor não e grande – 0,148 (14,8%) – então os fatores em
conjunto não explicam mudanças na intensidade da dor. O p de 0,058 indica
que não há correlação entre os fatores e a intensidade da dor.
Como idade tem p=0,004 ela é significativa. Se o valor das estimativas
(coeficiente de regressão) forem positivas, indica que quanto menor a
idade maior a intensidade da dor, caso o valor das estimativas seja
negativo, indica que quanto menor a idade menor a intensidade da dor.
Coeficiente de regressão: função de prever e calcular riscos baseados
nos fatores de exposição. Ex: fórmulas geradas para calcular risco
cardiovascular. Fórmula para calcular intensidade de dor baseado na
idade.
Analisar a distribuição de proporção de uma variável categórica
(univariado)
Pergunta:
Existe diferença na distribuição de proporção das categorias de resposta
da variável categórica.
Teste (não paramétricos univariados):
Teste Binominal (teste dos sinais): variáveis dicotômicas.
Teste do Qui-quadrado para proporção: variáveis nominais e ordinais
dicotômicas ou não. Se houver 4 categorias espera-se que cada uma
tenha 25% (dividido igual). O Qui-quadrado compara esse esperado com
o que é observado na realidade. O p<0,005 indica que há diferença na
distribuição de proporção das categorias.
Analisar a relação entre duas variáveis categóricas independentes
(bivariado)
Pergunta:
Existe associação ou efeito da variável independente (fator de
exposição) sobre a distribuição de proporção das categorias da variável
dependente (desfecho).
Relação entre duas variáveis qualitativas é chamada de associação ou
efeito (Ex: entre sexo e DM). Para variáveis quantitativas chama-se de
correlação.
Testes:
Qui-quadrado: amostra com frequência esperada mínimo de 5 por
categoria de resposta. Recomendado para amostras grandes, que
podem variar na literatura em >30 a >60.
Exato de Fisher: amostras pequenas ou que apresente frequência
esperada <5 por categoria de resposta ou frequência observada menor
que 5 para uma das categorias de resposta.
Analisar a distribuição de proporção de uma variável categórica em duas
medidas parearas (bivariado)
Pergunta:
Existe diferença na distribuição de proporção das categorias de resposta
da variável dependente (desfecho) entre os momentos pré-pós (fator de
exposição).
Teste: McNemar
Variáveis categóricas dependentes categórica ordinal ou nominal
dicotômica.
Ex: categorizar PA (normal ou hipertenso) realizando medida de pré e pós. Ao
avaliar a tabela, é possível observar que não houve efeito em 50 indivíduos (33
estavam normotensos e se mantiveram assim; 17 estavam hipertensos e se
mantiveram assim). Além disso, 37 pessoas melhoraram e 13 pioraram. H0
não há diferença de PA entre pré e pós.
Analisar concordância entre métodos de diagnóstico de desfecho
categórico (bivariado)
Pergunta:
Existe concordância entre os métodos diagnóstico ou entre os
avaliadores (fator de exposição) quanto a distribuição de proporção das
categorias de resposta da variável dependente (desfecho).
Teste de kappa:
Variáveis categóricas dependentes categórica ordinal ou nominal com
ou sem dicotomia.
Avalia concordância e discordância entre métodos.
Analisar o efeito de mais de um fator de exposição sobre um desfecho
categórico dicotômico (multivariado)
Pergunta:
Existe efeito de fatores de exposição (covariáveis independentes) sobre
um desfecho categórico dicotômico nominal ou categórica ordinal
(variável dependente).
Teste: Regressão logística binária (variável qualitativa; regressão linear avalia
variável quantitativa).
Covariáveis independentes: numéricas ou categóricas ordinal ou
categórica nominal dicotômica.
Desfecho: variável dependente categórica dicotômica nominal ou
ordinal.
Distribuição de normalidade de variáveis numéricas não é impeditivo,
mas melhoram a precisão da previsão do desfecho.
Multicolinariedade: correlação elevada entre dois ou mais fatores de
exposição.
Ex: variáveis para prever quem é obeso ou não. Sexo, idade, glicemia.
Canal do YouTube: pesquisar (vídeos curtos explicando cada teste estatístico).
Canalpesquise: https://www.youtube.com/canalpesquise