Conteúdos desta unidade
Análise na distribuição dos dados:
avaliação da normalidade.
Análise e interpretação dos resultados
dos seguintes testes:
Unidade II
Teste t para uma amostra.
Teste t pareado.
Teste t para amostras independentes.
Teste de ANOVA.
BIOESTATÍSTICA Teste de Friedman.
Teste de correlação.
Teste de regressão linear.
Profa. Dra. Carina Helena Wasem Fraga.
Distribuição normal (Gauss) Distribuição normal (Gauss)
Características: Indica a probabilidade de ocorrência de
distribuição característica de variáveis um evento numa população.
biológicas. Exemplo: qual a probabilidade de uma
distribuição normal não significa que pessoa apresentar um valor de
ocorra apenas em pessoas sadias. hemoglobina entre 14,5 e 15,5?
maior frequência em valores centrais e
menor incidência em valores baixos e
altos
CALLEGARI-JACQUES, 2003
PASQUALI (2007)
Frequência de ocorrência 24%.
1
Distribuição normal (Gauss) Distribuição normal (Gauss)
Propriedades: A média, a mediana e a moda coincidem.
apresenta o formato de um sino.
a curva é simétrica em torno da média.
A média e o DP são representativos de
dados de distribuição normal.
A curva apresenta 2 pontos de inflexão:
CALLEGARI-JACQUES, 2003
média somada e subtraída ao DP.
Distribuição normal (Gauss) Distribuição normal (Gauss)
Área total sob a curva totaliza 100%. O gráfico mostra distribuição normal
Área entre pontos de inflexão representa rigorosamente simétrica, que tem como
aproximadamente 68% (2/3) dos valores. característica englobar 99,73% das
ocorrências no intervalo entre a média ± 3
DP.
CALLEGARI-JACQUES, 2003
Fonte: UFRGS
2
Distribuição normal na prática Distribuição normal na prática
Distribuição normal é uma curva teórica: Distribuição normal → testes
tentativa de encaixar histogramas paramétricos (apresentam maior poder
parecidos com a curva normal. estatístico).
Existem inúmeras variáveis de
distribuição assimétrica ou descontínua
que não apresentam curva normal de
distribuição dos dados.
Identificar se os dados apresentam uma
distribuição normal é importante para a
determinação dos tipos de testes
estatísticos a serem empregados.
PASQUALI (2007)
Distribuição normal na prática Testes de normalidade
Distribuição não-normal → testes Testes de normalidade averiguam a
não-paramétricos. assimetria da curva de dados em relação
à curva normal.
Curva normal
sobreposta
ao histograma
indicando a
(a) Assimetria positiva ou esquerda (b) Assimetria negativa ou direita distribuição que os
dados deveriam
Dificilmente os dados apresentarão uma apresentar para
atender aos
distribuição normal perfeita, por isso pressupostos
de normalidade
determina-se a normalidade dos dados
por meio dos testes de normalidade.
CALLEGARI-JACQUES, 2003
CALLEGARI-JACQUES, 2003
3
Testes de normalidade Interatividade
Realizada a partir das medidas de São exemplos de curvas normais:
assimetrias e curtoses (achatamentos)
Pode-se utilizar diversos pacotes
estatísticos.
Teste de Shapiro – Wilk: conjunto de até
50 observações.
Teste de Kolmogorov Smirnov demais
situações.
Nível de significância é inferior ao
estabelecido (geralmente 0,05), rejeita-se a) A, B, C e D
a normalidade. b) Apenas C
CALLEGARI-JACQUES, 2003
c) Apenas A e C
d) A, B e C
e) Apenas D
Resposta Teste estatísticos
Alternativa “d”
A curva normal é unimodal (apenas 1 pico)
e simétrica (idêntica em ambos os lados da
média). Mas pode ter diferentes níveis de
curtoses: platicúrtica (A), leptocúrtica (B) e
mesocúrtica (C). BARROS e REIS , 2003
4
Formulando hipóteses Formulando hipóteses
A hipótese é o resultado esperado. Duas hipóteses são formuladas: a
Ao elaborar um procedimento hipótese alternativa (H1) e a hipótese
experimental para um estudo, nula (H0).
geralmente há uma idéia de qual será o A hipótese alternativa é o resultado
resultado. esperado pelo experimento que irá ser
O resultado esperado é elaborado com conduzido.
base na revisão de literatura feita A hipótese nula é usada na análise
previamente. estatística e considera que não há
A hipótese deve ser formulada de diferença entre os tratamentos ou
maneira que possa ser aceita ou relação entre as variáveis analisadas.
refutada.
Teste t para uma amostra Teste t para uma amostra
Situações em que características de um Exemplo 1: Comparação entre a média de
único grupo precisam ser comparadas desempenho dos alunos do curso de
com um valor de referência. Graduação em Educação no teste de 12
Desenvolvido para comparar duas minutos, em relação à média esperada para
médias em um experimento. a faixa etária na população.
Necessita atender aos critérios de A hipótese estatística a ser formulada é:
normalidade de distribuição. H0 → A média dos resultados no grupo
avaliado é semelhante à média do
referencial estipulado.
H1 → A média dos resultados no grupo
avaliado não é igual a média do
referencial estipulado.
5
Teste t para uma amostra Teste t pareado
Exemplo 2: Comparação entre a média Situações nas quais um mesmo grupo é
nacional de desempenho dos alunos de avaliado em 2 condições e o objetivo é
graduação do curso de Educação Física, comparar estas 2 médias entre si.
com a média de desempenho dos alunos e Necessita atender aos critérios de
Educação Física da UNIP, que estejam normalidade de distribuição.
cursando o último ano.
Condição fundamental: a amostra de
Média dos alunos da UNIP: 9,63 ± 0,7. dados nas duas condições (antes e
Média nacional: 8,20 ± 0,9. depois) deve ter o mesmo tamanho, caso
Neste caso, a hipótese alternativa (H1) foi contrário, a relação de dependência ou
confirmada pois após aplicação do teste pareamento será perdida.
foi verificada diferença entre a média dos
alunos da UNIP e média nacional.
Teste t pareado Teste t pareado
Exemplo 1: Um grupo de trabalhadores Nos 2 exemplos anteriormente citados,
foi submetido a um período de os grupos terão seus desempenhos
treinamento e de ginástica laboral e comparados antes e depois do período
objetiva-se analisar alguma condição de treinamento para investigar se houve
pré- e pós-treinamento. diferença nos resultados e se essa
Exemplo 2: Um grupo de pessoas idosas diferença foi estatisticamente diferente.
foi submetido a uma série de testes nos Uma forma de análise é observar
quais foram avaliados em sua condição diferença das médias pré e pós
física e posteriormente submetidos a um tratamento. Se os dois conjuntos de
período de treinamento para melhorar as médias forem iguais, então a diferença
capacidades físicas, para depois (subtração das médias) será igual a zero.
novamente serem reavaliados.
6
Interatividade Resposta
Um grupo de trabalhadores submetido a um Alternativa “e”.
período de exercícios de alongamento Para comparar os valores correspondentes
aumentou significativamente os valores de ao desempenho em teste de flexibilidade de
flexibilidade entre a condição pré e pós- um mesmo grupo antes e depois de um
treinamento. período de treinamento, o teste mais
a) Pode-se concluir esse resultado indicado é o teste t pareado.
calculando o CV;
b) O valor do DP é o mais importante para Condições:
esse cálculo; amostra de dados nas duas situações
c) O teste de normalidade assegura o (antes e depois) deve ter o mesmo
cálculo dessa diferença; tamanho.
d) O teste mais indicado é o teste t para distribuição de dados normal.
uma amostra;
e) O teste mais indicado é o teste t
pareado;
Teste t para amostras Teste t para amostras
independentes independentes
Utilizado em situações de comparação Aplicável em grupos cuja distribuição
de uma característica comum de dois dos dados seja suficientemente parecida
grupos que são compostos por a uma curva normal.
indivíduos diferentes (grupos são Exemplo 1: Comparação da altura de
independentes). salto vertical de uma amostra composta
Os sujeitos de um grupo não devem por jogadores de basquete com uma
estar relacionados aos sujeitos de outro amostra composta por lutadores de judô.
grupo. Exemplo 2: Comparação da força
Comparação da média dos valores de um máxima do grupo muscular quadríceps
grupo com a média de valores de outro de atletas halterofilistas com atletas
grupo. jogadores de futebol.
7
Análise de Variância (ANOVA) Análise de Variância (ANOVA)
Numa situação de comparação de 4 Método para comparar mais de duas
grupos com relação a uma variável médias de um experimento em um único
quantitativa, poderiam ser usados vários teste.
testes t entre os grupos para compará- Identifica diferenças entre os grupos,
los dois a dois. mantendo controle sobre o nível de
Realizar este procedimento seria significância do teste.
inadequado estatisticamente, pois Cada possível causa de variação é
aumenta o erro de se concluir chamada de fator.
inadequadamente que existe diferença
entre as médias. Um experimento pode conter um ou mais
fatores, com diferentes níveis.
Por isso, o procedimento correto
consistiria em usar uma técnica
chamada Análise de Variância.
Análise de Variância (ANOVA) Análise de Variância (ANOVA)
Os níveis de um fator representam as Tabela ilustrativa da estatura (metros) de
características diferentes deste fator. estudantes de ensino médio, graduação
O procedimento detecta qual a influência e pós-graduação, do sexo masculino e
destes fatores na variação dos grupos feminino. Os alunos do sexo masculino
analisados, ou seja, identifica qual ou são estatisticamente mais altos que os
quais fatores são as possíveis causas de alunos do sexo feminino, mas o fator
variação observada. nível de escolaridade não mostrou
diferenças significativas.
Ex: gênero é um fator, com dois níveis,
masculino e feminino. Nível de
escolaridade poderia ser outro fator, com
três níveis, ensino médio, graduação e
pós-graduação.
8
Considerações que permitem o uso
Teste de Friedman
da ANOVA
Os dados devem apresentar distribuição Utilizado para comparar os resultados de
normal. três ou mais amostras.
Variações amostrais semelhantes nas Teste não paramétrico correspondente à
diferentes amostras dos grupos. ANOVA para medidas repetidas.
Tamanho das amostras dos grupos Este teste ordena os resultados para
necessitam ser semelhantes. cada um dos casos e depois calcula a
Mais confiável com grandes amostras. média das ordens para cada amostra.
Se não existem diferenças entre as
amostras, as suas médias das ordens
devem ser similares.
Interatividade Resposta
A partir da aplicação da ANOVA os dados
abaixo mostraram diferença entre os gêneros,
mas não entre a escolaridade. O que isso
significa?
a) o fator gênero foi determinante para as
diferenças observadas.
b) a escolaridade e o gênero são fatores.
a) O fator gênero foi determinante para as
c) o fator gênero É importante.
diferenças observadas; d) o fator escolaridade NÃO foi mais
b) A escolaridade é um nível e o gênero é um importante.
fator; e) Gênero e escolaridade são FATORES, E
c) O fator gênero não é importante; NÃO níveis.
d) O fator escolaridade foi mais importante;
Alternativa “a”.
e) Gênero e escolaridade são níveis.
9
Correlação Correlação
É usada para avaliar se existe
associação entre duas variáveis numa
determinada amostra.
Se a variação no resultado de uma das
variáveis afeta de forma específica o
resultado da outra variável, as variáveis
estão correlacionadas.
Diagrama de dispersão: avalia a
correlação entre duas variáveis.
Para cada indivíduo o valor de uma
variável é apresentado em relação ao
valor da outra variável.
Exemplo 1: impulsão vertical X
circunferência da coxa.
Correlação Correlação
Exemplo 2: número de horas de estudo X O coeficiente de correlação pode variar
nota obtida na prova. de -1 a +1.
Pelo exemplo, o número de horas será Valores negativos indicam uma
apresentado no eixo de X e a nota da correlação inversa.
prova será apresentada no eixo de Y. Valores positivos indicam uma
A correlação pode ser avaliada correlação direta.
quantitativamente por meio do O valor numérico do coeficiente indica
coeficiente de correlação de Pearson. quão forte é a correlação:
O coeficiente de correlação indica a 1) 1 correlação perfeita.
intensidade de associação existente
entre duas variáveis. O símbolo para 2) acima 0.70 indica uma forte correlação.
representar o coeficiente é a letra r. 3) 0.30 a 0.7 indica correlação moderada.
4) 0 a 0.30 fraca correlação.
5) 0 indica correlação nula
10
Regressão linear simples Regressão linear simples
Na regressão, é considerado que o Exemplo: numa piscina com 15 pessoas
comportamento de uma variável Y aleatoriamente paradas, a linha de
depende das mudanças ocorridas em regressão representaria a corda de uma
outra variável x. bóia que seria arremessada na piscina à
O comportamento de dependência pode menor distância possível de cada
ser representado por uma linha chamada banhista.
de linha de regressão.
A linha de regressão expressa o
comportamento esperado de uma
variável em função de outra, e se
encontra na menor distância possível de
cada um dos pontos no diagrama de
dispersão.
BARROS e REIS , 2003
Interatividade Resposta
Em qual dos gráficos apresentados a seguir r = -1 r=0
encontra-se uma correlação classificada como
moderada? r=1
r = -1 r=0
r=1
r = 0,8 r = 0,6 r=0
Alternativa “b”
r = 0,8 r = 0,6 r=0 a. correção perfeita direta
b. correlação perfeita inversa
BARROS e REIS , 2003 c. correlação nula
d. correlação forte direta
a) figuras a; b b) figura e c) figura a
e. correlação moderada direta
d) figuras d; e e) figura d f. correlação nula
11
ATÉ A PRÓXIMA!
12