0% acharam este documento útil (0 voto)
39 visualizações24 páginas

Fundamentos da Bioestatística e Análise de Dados

O documento apresenta conceitos básicos de estatística, incluindo definições de variável, amostra, população e métodos descritivos como média, mediana, moda, variância e desvio padrão.
Direitos autorais
© © All Rights Reserved
Levamos muito a sério os direitos de conteúdo. Se você suspeita que este conteúdo é seu, reivindique-o aqui.
Formatos disponíveis
Baixe no formato PDF, TXT ou leia on-line no Scribd
0% acharam este documento útil (0 voto)
39 visualizações24 páginas

Fundamentos da Bioestatística e Análise de Dados

O documento apresenta conceitos básicos de estatística, incluindo definições de variável, amostra, população e métodos descritivos como média, mediana, moda, variância e desvio padrão.
Direitos autorais
© © All Rights Reserved
Levamos muito a sério os direitos de conteúdo. Se você suspeita que este conteúdo é seu, reivindique-o aqui.
Formatos disponíveis
Baixe no formato PDF, TXT ou leia on-line no Scribd

16/07/2013

CURSO DE
BIOESTATÍSTICA

PROF. DR. ÁLVARO CAMPOS C MACIEL


Departamento de Fisioterapia - UFRN

CONCEITOS BÁSICOS
DE ESTATÍSTICA

CONCEITO DE ESTATÍSTICA

Estatística é a ciência que se ocupa da


coleta e tratamento da informação (dado). Tem
como objetivo analisar os dados recolhidos,
descrevendo-os e organizando-os, para
posterior interpretação e eventual utilização na
previsão de acontecimentos futuros.

1
16/07/2013

DIVISÕES DA ESTATÍSTICA

A Estatística divide-se em dois ramos


distintos: a Estatística Descritiva, responsável pelo
estudo das características de uma dada
população; e a Estatística Indutiva ou inferencial,
que generaliza um conjunto de resultados, tendo
por base uma amostra de uma dada população
ou universo, enunciando a(s) conseqüente(s)
lei(s).

Por que a Bioestatística?


• Variabilidade
– Tudo (ou quase) varia
– O que não varia não interessa

• Se há variabilidade
– Necessitamos de ferramentas adequadas
• Para descrição dos fenômenos
– Estatística descritiva
• Para comparação de grupos
– Estatística analítica

• Exemplos
– Pressão arterial, glicemia, sexo, força, etc.

Exemplo...
• O que acontece com diferentes amostras?
– estimar média de peso ao nascer
• Tomo uma amostra nesta semana
• Tomo uma amostra na semana que vem

Resultados
• Na primeira semana
– Média de 3250g
• Na segunda semana
– Média de 3290g

Interpretação
• As crianças estão ficando mais pesadas ou não?
• Ou ainda, o que aconteceu?

2
16/07/2013

Conceitos Fundamentais
• Elemento: é cada uma das unidades
consideradas no estudo
• Variável : é aquilo que varia entre os sujeitos,
uma característica de interesse que se pode
medir
– Ex: idade gestacional, sexo e peso
• Observação: é a informação sobre a variável
para um elemento específico
• Caso: é o conjunto de observações de um
elemento determinado
• Conjunto de dados: é composto por
informações sobre as características de
interesse de cada elemento

Tabela: Conjunto de Dados de Recém-nascidos de


baixo peso
Nome Idade Sexo Peso (g)
Gestacional
Variável
(semanas)
José 26 M 1500
Maria 37 F 1180
Mário 28 M 1450
Sheila 36 F 1205
Josué 38 M 1360
Carlos 38 M 1420 Observação
Mariana 39 F 1390
Caso
Elemento

VARIÁVEL ESTATÍSTICA

Variável é a característica de interesse


que é medida em cada elemento da amostra ou
população. Como o nome diz, seus valores
variam de elemento para elemento. As
variáveis podem ter valores numéricos ou não
numéricos.

3
16/07/2013

CLASSIFICAÇÃO DAS
VARIÁVEIS
TIPO CLASSE SUB-CLASSE
- EXEMPLOS

CATEGÓRICAS Nominal Exaustivas Tipos de tratamento fisiot.

Mutuamente Sexo, Cor dos Olhos,


Exclusivas Etnia

Ordinal Escolaridade, grau de TMM

QUANTITATIVAS Contínua Intervalar Temperatura

Racional Idade, Peso, Altura

Discreta N° de sessões de fisiot.

CLASSIFICAÇÃO DAS
VARIÁVEIS
Variável dependente (VD): Mede o fenômeno que se estuda e que
se quer explicar. São aquelas cujos efeitos são esperados de
acordo com as causas. Elas se situam, habitualmente, no fim do
processo causal e são sempre definidas na hipótese ou na
questão de pesquisa.
Variável independente (VI): São aquelas variáveis candidatas a
explicar a(s) variável(eis) dependente(s), cujos efeitos queremos
medir. Aqui devemos ter cuidado, pois mesmo encontrando
relação entre as variáveis isto, não necessariamente, significa
relação causal.

ANÁLISE DESCRITIVA
Variáveis Quantitativas
Medidas do Centro da Distribuição
Média Aritmética
Mediana
Moda

Medidas de Posição da Variabilidade


Quantis (decil, quartil, tercil, percentil, etc.)

Medidas de Variabilidade ou Dispersão


Amplitude de total Desvio-Padrão
Amplitude semiquartil Coeficiente de Variação

Variância Escore padronizado

4
16/07/2013

ANÁLISE DESCRITIVA
Variáveis Categóricas
Frequências absolutas e relativas (na
maioria das vezes em percentual)

Análise de Variáveis Quantitativas

Média Aritmética - Propriedades


A média é o valor que todas as observações teriam se fossem todas
iguais entre si
Se aos valores de uma variável X for somada ou subtraída uma
constante c, a média aritmética de X, x (xis barra) ficará acrescida ou
diminuída desta constante c
O mesmo vale para as operações de multiplicação e divisão

x
x i fi
n

Análise de Variáveis Quantitativas

Mediana
É o valor que divide a seqüência em duas partes
iguais
Variável quantitativa e n é impar
n 1
M
2
Variável quantitativa e n é par

Média entre n e n2


2 2
Moda
É o valor da variável que representa a freqüência máxima

5
16/07/2013

COMPARAÇÃO ENTRE MÉDIA, MEDIANA E MODA

Amplitude total

É uma medida de dispersão dada


pela diferença entre o maior e o
menor valor da série.
quanto maior a amplitude total,
maior a dispersão ou variabilidade
dos valores da variável.

A Variância

A variância mede a dispersão dos


dados em torno da média
É dada pela diferença entre o valor de
um dado e o valor da média da
amostra de onde este dado proveio

 x  x 
2

s 2

n 1

6
16/07/2013

A Variância
Cálculos intermediários para a obtenção da variância e
desvio-padrão da variável A
i xi xi – x (xi – x)2
1 3,2 0,1 0,01
2 3,2 0,1 0,01
3 2,8 -0,3 0,09
4 2,1 -1,0 1,00
5 2,9 -0,2 0,04
6 3,1 0,0 0,00
7 3,2 0,1 0,01
8 3,0 -0,1 0,01
9 3,5 0,4 0,16
10 4,0 0,9 0,81
Total 3,1 0,0 2,14

A Variância

Transportando os valores para a


fórmula, temos:

2,14
s2   0,24
9

O Desvio-Padrão

- Sendo a variância uma medida que expressa um desvio


quadrático médio, a unidade dela é o quadrado da
unidade dos dados, e isto pode causar algumas
dificuldades de interpretação.
- Para contornar esta situação, costuma-se usar a raiz
quadrada da variância, o que é denominado de desvio
padrão.

 x  x 
2

s
n 1

7
16/07/2013

O Coeficiente de Variação

É a razão entre o desvio-padrão e


a média
s
CV  100
x
Não existe uma regra, mas CV aceitáveis
em fisioterapia devem ser, no máximo, de
25%.

Baixa dispersão: CV  15%


Média dispersão: CV 15-30%
Alta dispersão: CV  30%

O Erro padrão

O erro padrão é uma medida da


precisão da média amostral
calculada, em relação a uma
média populacional.

s
EP 
n

Então…

 Se o objetivo é descrever a casuística, o dp


parece mais adequado, pois avalia as
distâncias dos indivíduos em relação à
média do grupo.
 Caso o objetivo seja fazer inferências sobre
as médias, como por exemplo, comparar
médias de diferentes populações, o EP é
considerado mais adequado.

8
16/07/2013

Logo…

 O desvio padrão representa a


variabilidade dos dados
individuais.

O erro padrão representa a


variabilidade das estimativas
amostrais.

O escore padronizado

O escore padronizado é utilizado na


comparação da posição relativa da medida
de um indivíduo dentro do grupo ao qual
pertence, o que justifica sua grande
aplicação como medida de avaliação de
desempenho.

O escore padronizado
Exemplo:
Qual dos sujeitos teve um desempenho melhor no
seu teste de força, o que teve um valor 78,4 N para
extensão de joelho ou um que teve 67,3 para flexão
de cotovelo? Considerando que:
- Extensão de joelho:
• média: 65,3 N
• dp: 4,5

- Flexão de cotovelo:
•média: 54,3
•dp: 4,2

9
16/07/2013

A Distribuição quantil
- É utilizada para expressar a dispersão dos dados quando a
medida de tendência central é a Mediana.
- Logo, quando distribuição dos dados não é simétrica.
- O mais utilizado é o quartil (Q1, Q2 e Q3) que divide a
amostra, depois de ordenada, em quatro partes iguais (ou o
mais iguais possível).

2 3 3 4 4 4 5 5 6 6 6 6 7 7 7 8 8 9

Mínimo Q25 Mediana Q75 Máximo

Amplitude inter-quartil

OBSERVAÇÃO…

PERCENTIL: Dividem um conjunto


de dados em cem partes iguais

DECIL: Dividem um conjunto de


dados em dez partes iguais

TERCIL: Dividem um conjunto de


dados em três partes iguais

ONDE ENCONTRAMOS...

10
16/07/2013

Análise Descritiva de Variáveis Categóricas

Homens Mulheres

Brancos
Tabulação

Pardos

Negros
Organização

Amarelos

Amostra
Dados Brutos

Análise Descritiva de Variáveis Categóricas

Portanto...

Uma distribuição de freqüência é um método de se


agrupar dados em classes de modo a fornecer a
quantidade (e/ou a percentagem) de dados em
cada classe.

Com isso, podemos resumir e visualizar um conjunto


de dados sem precisar levar em conta os valores
individuais.

Uma distribuição de freqüência (absoluta ou


relativa) pode ser apresentada em tabelas ou
gráficos

Análise Descritiva de Variáveis Categóricas

Brancos Pardos Negros Amarelos Total

Masculino

Feminino

Total

11
16/07/2013

Análise Descritiva de Variáveis Categóricas

Frequência simples ou absoluta (fi): é o número


de observações de um valor individual (ou de
uma classe).

Frequência relativa (fr): representa a proporção


de observações de um valor (ou de uma
classe) em relação ao número total de
observações, o que facilita a observação.

Frequência acumulada (Fi): é a soma de todas as


frequências abaixo do limite superior de uma
classe considerada.

Análise Descritiva de Variáveis Categóricas

Brancos Pardos Negros Amarelos Total

Masculino 3 6 3 3 15

Feminino 5 5 3 1 14

Total 8 11 6 4 29

Análise Descritiva de Variáveis Categóricas

Amarelo
Brancos Pardos Negros Total
s

n % n % n % n % n %

Masculino 3 20,0 6 40,0 3 20,0 3 20,0 15 100

Feminino 5 35,7 5 35,7 3 21,4 1 7,1 14 100

Total 8 27,6 11 37,9 6 20,7 4 13,8 29 100

12
16/07/2013

Análise Descritiva de Variáveis Categóricas

Distribuição da amostra estudada de acordo com sexo e etnia -


Natal, RN, 2005.

Etnia Brancos Pardos Negros Amarelos Total

Sexo n % n % n % n % n %

Masculino 3 20,0 6 40,0 3 20,0 3 20,0 15 100

Feminino 5 35,7 5 35,7 3 21,4 1 7,1 14 100

Total 8 27,6 11 37,9 6 20,7 4 13,8 29 100

DÚVIDAS…

"Há três espécies de mentiras:


mentiras, mentiras deslavadas e
estatísticas."

A DISTRIBUIÇÃO NORMAL
Características da Distribuição Normal
1. O campo de variação de X é de -  a + 
2. A distribuição é simétrica em torno da média (m
3. A média, a mediana e a moda são iguais
4. A distribuição possui dois pontos de inflexão, m -  e m + 
5. A área total sob a curva é igual à unidade, ou 100%
6. A área sob curva compreendida entre m - (-1,0) e m + (+1,0)
é igual a 2/3 da distribuição, ou seja, aproximadamente 68%
7. A área sob curva compreendida entre m – 1,96  e m + 1,96  é
igual a 95%
8. A área sob curva compreendida entre m – 2,58  e m + 2,58  é
igual a 99%

13
16/07/2013

m = média
M = mediana
Mo = moda

Caracterização gráfica da curva normal

m- m = média m+


M = mediana
Mo = moda

Caracterização gráfica da curva normal

99%

95%

68%

m – 2,58  m – 1,96  m- m = média m+ m + 1,96  m + 2,58 


M = mediana
Mo = moda

Caracterização gráfica da curva normal

14
16/07/2013

O INTERVARLO DE CONFIANÇA

-Um intervalo de confiança (IC) é um


intervalo estimado de um parâmetro
estatístico. Ou seja, em vez de estimar o
parâmetro por um único valor, é dado um
intervalo de estimativas prováveis.
-Quão prováveis são estas estimativas é
determinado pelo coeficiente de confiança.
Quanto maior a probabilidade do intervalo
conter o parâmetro, maior será o intervalo.

O INTERVARLO DE CONFIANÇA

-Por exemplo, um IC pode ser usado para


descrever o quanto confiáveis são os
resultados de uma pesquisa. Sendo todas
as outras coisas iguais, uma pesquisa que
resulte num IC pequeno é mais confiável
do que uma que resulte num IC maior.

O INTERVARLO DE CONFIANÇA

15
16/07/2013

O INTERVARLO DE CONFIANÇA

- Neste sentido, os parâmetros


adotados para se calcular o IC são a
medida obtida (X), o erro-padrão
(ep), tamanho da amostra (n) e o
valor de z.
IC= X ± [Link]

O INTERVARLO DE CONFIANÇA

- Para dados categóricos se


utiliza a fórmula abaixo:

O INTERVARLO DE CONFIANÇA

- Para dados quantitativos se


utiliza a fórmula abaixo:

16
16/07/2013

CALCULEMOS…
-Para uma amostra de pesos com
n=20, média de 75,5 kg e desvio-
padrão de 10,2, qual o intervalo
de confiança a 95%.

- Para uma amostra de


prevalência de 25% de doentes
em 150 indivíduos, qual o
intervalo de confiança a 99%.

DÚVIDAS...

INTRODUÇÃO A
ESTATÍSTICA INFERENCIAL

17
16/07/2013

ESTATÍSTICA INFERENCIAL

-A estatística inferencial compreende as


técnicas por meio das quais são tomadas
decisões sobre uma amostra, buscando a
inferência populacional ou a testagem de
hipóteses.
- Ela ocorre a partir de vários testes estatísticos,
cujas essências se traduzem na comparação
entre valores encontrados e esperados, a partir
das hipóteses formuladas pelo pesquisador.
- Neste sentido, para realizarmos um teste
estatístico devemos partir das hipóteses nulas e
verdadeiras.

QUAL HIPÓTESE DEVO


ACEITAR, A NULA OU A
VERDADEIRA???

18
16/07/2013

A REGRA BÁSICA É...

Qual o nível ou tamanho do risco


estou disposto a aceitar para rejeitar
a hipótese nula e aceitar a hipótese
verdadeira

DECISÕES E ERROS DE TESTES DE HIPÓTESE


Decisão H0 é verdadeira H0 é falsa
do Teste (H1 é falsa) (H1 é verdadeira)

Aceita H0 Decisão Correta


Erro tipo II
(Rejeita Probabilidade: 1 – a
Probabilidade: b
H1 ) Nível de Confiança
Erro tipo I
Probabilidade: a Decisão Correta
Rejeita H0
Nível de Probabilidade: 1 – b
(Aceita H1)
Significância Poder
p – valor
H0 : P 1 = P 2
H1 : P 1 < P 2

ERRO TIPO I: Ocorre quando rejeitamos a


hipótese nula e ela é verdadeira, ou seja,
afirmamos que existe uma diferença quando
na verdade ela não existe. Este erro
também é denominado de α ou nível de
significância

ERRO TIPO II: Ocorre quando não


rejeitamos uma hipótese nula que é falsa, ou
seja, afirmamos que não existe uma
diferença quando na verdade ela existe. Este
erro também é denominado de β

19
16/07/2013

O que um p valor?
(a) É a probabilidade da hipótese nula de um
teste ser verdadeira.
(b) É a probabilidade de um dado resultado,
como a diferença entre dois grupos, ter sido
obtido de um "acaso".
(c) É a probabilidade da hipótese nula ter sido
enganosamente rejeitada.
(d) É a significância de um efeito observado.

ZONA DE REJEIÇÃO DA HIPÓTESE NULA

OBSERVAÇÃO...
-Se aceitarmos a rejeição em apenas
um dos lados dizemos que ela é
unicaudal.

20
16/07/2013

OBSERVAÇÃO...
-Se aceitarmos a rejeição em qualquer
um dos lados dizemos que ela é
bicaudal.

COMO CALCULAR...

α= 0,05

POR EXEMPLO...

21
16/07/2013

CALCULEMOS...
Supondo que um pesquisador está querendo
saber qual a média de força muscular em sujeitos
extremamente sedentários. Ele sabe que a média
populacional é de 120 kgf. Ao realizar o estudo em
132 sujeitos, ele encontrou uma média 112 kgf,
com dp ±18 kgf. Qual hipótese o pesquisador deve
aceitar, considerando um α= 0,05. Se fosse
realizado outro estudo, agora com 18 sujeitos, os
resultados seriam iguais?

22
16/07/2013

PRINCÍPIO PARA APLICAÇÃO DE


TESTES ESTATÍSTICOS
A aplicação adequda de um teste
estatístico depende de alguns fatores:
O tipo de pergunta que se deseja
responder.
A classificação da variável dependente e
da independente.

PRINCÍPIO PARA APLICAÇÃO DE


TESTES ESTATÍSTICOS
Desse modo, são possíveis várias combinações em
função destes fatores:

Variável Variável
Pergunta
Dependente Independente

Quantitativa As variáveis se
Quantitativa correlacionam entre si? Com
Contínua/
Contínua/ Discreta que magnitude?
Discreta
As variáveis se associam
Categórica Categórica entre si?
Com que magnitude?
As médias (ou medianas) da
Quantitativa
variável dependente diferem
Contínua/ Categórica
entre as categorias da
Discreta
variável independente?

Pergunta da Pesquisa: As médias da variável


dependente diferem entre os grupos estudados?
1a Pergunta: Os dados apresentam distribuição normal?
Sim – Testes Não – Testes
Paramétricos Não-Paramétricos

2a Pergunta: Com quantos grupos ou com quantas


categorias da variável estou trabalhando?

Mais de Mais de
2 grupos 2 grupos
2 grupos 2 grupos

3a Pergunta: Existe vinculação entre as categorias da variável?

Sim Não Sim Não Sim Não Sim Não

4a Pergunta: Qual teste devo usar?

Teste “t” Análise Análise Mann- Kruskal-


Teste “t” Wilcoxon Friedman
Pareado Variância Variância Whitney Wallis

23
16/07/2013

Pergunta da Pesquisa: As variáveis dependente e


independente se correlacionam entre si? Qual a
magnitude?
1a Pergunta: Qual o tipo de variável?

Quantitativa Categórica

2a Pergunta: Com quantos grupos ou com quantas


categorias da variável estou trabalhando?

Mais de Mais de
2 grupos 2 grupos
2 grupos 2 grupos

3a Pergunta: Os dados apresentam distribuição normal?

Sim Não Sim Não Não Não

4a Pergunta: Qual teste devo usar?

Correlação Correlação Regressão Regressão Qui- Exato de Regressão


Pearson Spearman Múltipla Múltipla Quadrado Fisher Logística
n > 20 n < 20

DÚVIDAS...

Prof. Dr. Álvaro Campos


email: alvarohuab@[Link]
Facebook: Álvaro Campos
tel: 3342-2017

24

Você também pode gostar