Bioestatística
Material Teórico
Medidas de Tendência Central e de Dispersão
Responsável pelo Conteúdo:
Prof.ª Me. Priscila Bernardo Martins
Revisão Textual:
Prof.ª Dr.ª Luciene Oliveira da Costa Granadeiro
Medidas de Tendência
Central e de Dispersão
• Introdução;
• Medidas de Tendência Central;
• Medidas de Dispersão;
• Conclusão.
OBJETIVO DE APRENDIZADO
• Ampliar seu conhecimento sobre as Medidas de Tendência Central (Média, Moda e a
Mediana) e Medidas de Dispersão: Variância e Desvio Padrão.
Orientações de estudo
Para que o conteúdo desta Disciplina seja bem
aproveitado e haja maior aplicabilidade na sua
formação acadêmica e atuação profissional, siga
algumas recomendações básicas:
Conserve seu
material e local de
estudos sempre
organizados.
Aproveite as
Procure manter indicações
contato com seus de Material
colegas e tutores Complementar.
para trocar ideias!
Determine um Isso amplia a
horário fixo aprendizagem.
para estudar.
Mantenha o foco!
Evite se distrair com
as redes sociais.
Seja original!
Nunca plagie
trabalhos.
Não se esqueça
de se alimentar
Assim: e de se manter
Organize seus estudos de maneira que passem a fazer parte hidratado.
da sua rotina. Por exemplo, você poderá determinar um dia e
horário fixos como seu “momento do estudo”;
Procure se alimentar e se hidratar quando for estudar; lembre-se de que uma
alimentação saudável pode proporcionar melhor aproveitamento do estudo;
No material de cada Unidade, há leituras indicadas e, entre elas, artigos científicos, livros, vídeos
e sites para aprofundar os conhecimentos adquiridos ao longo da Unidade. Além disso, você tam-
bém encontrará sugestões de conteúdo extra no item Material Complementar, que ampliarão sua
interpretação e auxiliarão no pleno entendimento dos temas abordados;
Após o contato com o conteúdo proposto, participe dos debates mediados em fóruns de discus-
são, pois irão auxiliar a verificar o quanto você absorveu de conhecimento, além de propiciar o
contato com seus colegas e tutores, o que se apresenta como rico espaço de troca de ideias e de
aprendizagem.
UNIDADE Medidas de Tendência Central e de Dispersão
Introdução
Vamos abordar um assunto importante a respeito da transmissão das infor-
mações relativas à amostra ou à população estudada. Em se tratando dos dados
obtidos, a condensação deles facilita a compreensão das características essenciais
de uma amostra ou população. Para viabilizar essa etapa, usamos as medidas de
tendência central e de dispersão. Hoje vamos conhecer um pouco mais sobre
essas medidas.
Figura 1
Fonte: Getty Images
Medidas de Tendência Central
As medidas de tendência central são confiáveis quanto mais representativo for o
conjunto de elementos da amostra ou da população. Se o conjunto de elementos for
bem selecionado, se guardar características semelhantes às características da popu-
lação que foi extraída, e se for suficientemente grande, os dados refletirão melhor
o que poderíamos encontrar na população. Pode-se dizer também que essas medi-
das – de tendência central e de dispersão – são uma primeira caracterização dos
conjuntos populacionais ou amostrais.
Média Aritmética
A média aritmética consiste na soma dos valores de um conjunto de dados, di
vididos pelo número de elementos.
Veja o exemplo abaixo. Considere o seguinte conjunto de dados:
11 10 10 12 23 24 30
8
A média aritmética será = 11 + 10 + 10 + 12 + 23 + 24 + 30 / 7 = 17,14
Observação 1: Frequentemente a média aritmética vem acompanhada de outra medida, o desvio padrão.
Essa é uma medida de dispersão e indica o quanto os valores se afastam ou se aproximam da média.
Observação 2: A média aritmética é muito influenciada por valores extremos, ou seja, valores muito
menores ou maiores influenciam de forma marcante o valor real da média.
Figura 2
Fonte: Getty Images
Dividir a conta em um bar (“rachar a conta”) é um bom exemplo prático de mé-
dia aritmética.
A fórmula para cálculo da média aritmética é:
x + x2 ++ xn i =1
∑x i
x= 1 =
n n
Onde o X com uma barra significa média aritmética de uma amostra e n o
número de indivíduos da amostra.
Exercício resolvido:
Uma nutricionista decidiu investigar a circunferência abdominal de 10 gerentes
de uma grande empresa multinacional interessados em perder peso por meio de
um programa de reeducação alimentar. As medidas seguem abaixo:
Gerentes 1 2 3 4 5 6 7 8 9 10
Circunferência 88 83 79 76 78 70 80 82 86 105
9
9
UNIDADE Medidas de Tendência Central e de Dispersão
Devemos primeiro determinar qual o tamanho da amostra (n):
Como no caso temos 10 gerentes, então dizemos que n = 10.
Cada gerente representa um valor de x, como segue:
x1 = 88
x2 = 83
x3 = 79
x4 = 76
x5 = 78
x6 = 70
x7 = 80
x8 = 82
x9 = 86
x10 = 105
Substituindo na fórmula, teremos:
88 + 83 + 79 + 76 + 78 + 70 + 80 + 82 + 86 + 105
x=
10
827
x=
10
x = 82 , 7
Dizemos então que: a média aritmética da circunferência abdominal dos 10
gerentes é de 82,7 cm.
Mediana
A mediana é outra medida que indica a caracterização do conjunto de valores.
Ela indica o valor que divide ao meio o conjunto de valores, ou seja, indica o valor
que ocupa a posição central desse conjunto, não sofrendo qualquer interfe
rência dos valores extremos. O seu cálculo depende da ordenação dos dados, o
que corresponde a colocá-los em ordem crescente ou decrescente.
Continuando com o exemplo usado no calculo da média aritmética:
10
11 10 10 12 23 24 30
A mediana seria assim calculada: Essa é a mediana, pois é o valor
central de um conjunto de dados.
10 10 11 12 23 24 30
Quando o número de valores for
ímpar (como no caso acima), a
mediana será sempre o valor do meio.
Segue um exemplo com n par:
Como o n é par, soma-se os dois
11 10 12 23 24 valores centrais e divide-se por “2”.
10+12=22
22 2=11
Portanto, nesse exemplo, 11 é a mediana da distribuição apresentada.
Moda
A moda é o valor que ocorre com maior frequência. Essa medida, juntamente
com a média e a mediana, ajudam a compreender o padrão homogêneo dos dados.
Quando essas três medidas estão próximas, podemos dizer que o conjunto de
dados é homogêneo, ou seja, não há valores extremos, mas sim uma tendência de
que boa parte dos números se localizem próximos a essas três medidas.
Figura 3
Fonte: Getty Images
11
11
UNIDADE Medidas de Tendência Central e de Dispersão
Se um conjunto de dados possui um único valor que se repete com maior frequên-
cia, diz-se que o conjunto é unimodal; quando dois números aparecem com maior
frequência, é bimodal; se três ou mais números aparecem com maior frequência, é
multimodal. A ausência de moda caracteriza um conjunto amodal.
Veja o exemplo abaixo. Considere o seguinte conjunto de dados:
0 1 1 2 3 4 4 4 5
Analisando os dados, observa-se que o número 4 é o número que se repete com
maior frequência (3 vezes). Dessa forma, dizemos que o conjunto é unimodal.
Vamos analisar outro conjunto de dados:
0 1 1 1 3 4 4 4 5
Analisando os dados, observa-se que os números 1 e 4 se repetem com maior
frequência (3 vezes cada um). Dessa forma, dizemos que o conjunto é bimodal.
Medidas de Dispersão
As medidas de tendência central, vistas anteriormente, ajudam a explicar a ten-
dência central dos dados, ou seja, o quanto esse conjunto é homogêneo. Essas
medidas precisam estar acompanhadas de outras informações que indiquem a
VARIABILIDADE dos dados, isto é, o quanto os valores divergem em relação aos
valores de caracterização geral da população ou amostra.
Considere a situação apresentada no livro Introdução à bioestatística, da autora
Sônia Vieira (2008):
Considerando 2 domicílios, sendo que em um deles moram 7 pessoas,
todas com 22 anos de idade. A média de idade será de 22 anos. No ou-
tro domicilio, poderíamos ter a mesma média de idade, no entanto,
nesse s egundo domicilio, moram uma garota de 17 anos, um garoto
com 23 anos, duas crianças de 2 e 3 anos, respectivamente, além de
uma mulher de 38 anos, outra criança de 8 anos e uma senhora de
65 anos.
Nesse exemplo acima, temos dois conjuntos de valores, cuja variabilidade é diferente, embora a média
seja a mesma. No primeiro conjunto de valores, a variabilidade é bem menor, condição contrária à que
ocorre no segundo grupo, no qual a variabilidade é maior, pois as idades variam de 2 até 65 anos.
12
Quartis e Percentis
Já aprendemos que a mediana é o valor que divide ao meio o conjunto de valores.
Poderíamos dizer também que a mediana indica que, abaixo daquele valor, temos 50%
das observações dos valores. Mas há situações em que podemos dividir o conjunto de
valores em partes menores: quartis, decis e percentis indicam essa possibilidade.
Sendo assim, o primeiro quartil indica que 25% dos valores estão abaixo desse
valor; o segundo quartil indica que 50% da amostra está abaixo desse valor; e assim
por diante. Veja o modelo abaixo:
1º quartil 2º quartil 3º quartil 4º quartil
25% 25% 25% 25%
50% DOS VALORES
75% DOS VALORES
Já os percentis consideram as posições dividindo o conjunto de valores em 100
partes. Da mesma forma que o quartil, o percentil 70, por exemplo, indica que 70%
dos valores de um conjunto encontram-se abaixo desse valor.
Observação: percebam, no modelo esquemático abaixo, que uma posição (ou
valor) pode ser indicada de mais de uma forma.
25% 25% 25% 25%
50% 2º quartil
50% Percentil 50
13
13
UNIDADE Medidas de Tendência Central e de Dispersão
Amplitude, Mínimo e Máximo
A amplitude explica a variabilidade de valores, e por isso é considerada uma
medida de dispersão. É definida como a diferença entre o maior e o menor valor de
um determinado conjunto de valores.
Menor, também chamado de mínimo, é o menor valor de um determinado con-
junto de valores.
Maior, também chamado de máximo, é o maior valor de um determinado con-
junto de valores.
Maior _ menor
A M P L I T U D E
Importante! Importante!
Assim como a média, a amplitude é muito influenciada por valores extremos, isto é, um
valor muito baixo ou muito alto altera facilmente essa medida e pode, em determinados
casos, não representar a real variabilidade do conjunto de valores, pois houve o compro-
metimento em razão desse(s) valor(es) extremo(s).
Variância e Desvio Padrão
Essas duas medidas indicam a variabilidade, distância dos valores em torno do
valor médio encontrado para um determinado conjunto de dados (valores). Se meno
res, a variância e o desvio padrão indicam pouca variabilidade dos valores, caracteri-
zando um conjunto de valores mais homogêneo, ou seja, de variabilidade pequena.
Considere as informações abaixo:
∑(x − x ) ∑(x − x )
2 2
Variância = Desvio Padrão =
n −1 n −1
∑ : somatória
x : o valor de cada uma das observações
x : a média da amostra
n : o número de obsservações (tamanho da amostra)
Perceba que tanto a variância quanto o desvio padrão partem do cálculo da
distância de um valor em relação a media (x – x). Faz-se a somatória dessas
distâncias e, por “necessidades” matemáticas, eleva-se ao quadrado (para eliminar
os valores negativos das distâncias) ou extrai-se a raiz quadrada (pois queremos
eliminar a elevação ao quadrado de uma determinada medida).
14
Definiremos como variância a soma dos quadrados dos desvios de cada observação em relação a media,
dividida por (n – 1).
E desvio padrão como a raiz quadrada da variância.
Exercício Resolvido:
Vamos considerar o seguinte conjunto de notas de um determinado aluno:
5,0 6,0 5,0 9,0
Calcule a Variância e o Desvio Padrão.
Variância é representada por s. Pela fórmula dada, precisamos subtrair cada
valor de x da média da amostra, somar todos esses valores, elevar o resultado ao
quadrado e depois dividir por n – 1.
Vamos fazer passo a passo:
Abaixo a fórmula do desvio padrão:
s=
∑( x − x ) 2
n −1
Vamos calcular em primeiro lugar a média:
x = (5 + 6 +5 + 9) ÷ 4
x = 25 ÷ 4
x = 6 , 25
Vamos subtrair cada valor de x da média amostral:
Notas dos alunos Média calculada x menos a média
x x ( x –x )
5 – 6,25 –1,25
6 – 6,25 –0,25
5 – 6,25 –1,25
9 – 6,25 +2,75
Agora, vamos elevar os valores obtidos ao quadrado:
x x ( x –x ) ( x –x )2
5 – 6,25 –1,25 1,5625
6 – 6,25 –0,25 0,0625
5 – 6,25 –1,25 1,5625
9 – 6,25 +2,75 7,5625
15
15
UNIDADE Medidas de Tendência Central e de Dispersão
Precisamos, então, somar os quadrados obtidos:
x x ( x –x ) ( x –x )2
5 – 6,25 –1,25 1,56
6 – 6,25 –0,25 0,0625 +
5 – 6,25 –1,25 1,5625
9 – 6,25 +2,75 7,5625
= 10,75
A fórmula pede que esse valor (10,75), seja dividido por n – 1.
Em nosso exemplo, n = 4 (quatro notas), então 4 – 1 = 3
Então:
10,75 ÷ 3 = 3,58
Portanto:
s (variância) é igual a 3,58.
O desvio padrão é representado por s2.
s2 é igual a raiz quadrada de s (variância), então:
s2 = s
s2 = 3,58
s2 = 1,89 ou seja, o desvio padrão das notas desse aluno é 1,89, sendo que a
média foi 6,25.
Coeficiente de Variação
Essa medida indica a dispersão dos valores em relação à média. Para se calcular
o coeficiente de variação, usamos o desvio padrão e a média:
CV= desvio padrão / média x 100
Percebam que o CV não possuirá unidade de medida (é adimensional). Dessa
forma, podemos comparar a dispersão de valores para dados quantitativos que
utilizaram medidas diferentes, como metros e quilogramas. O uso de coeficientes
não é tão frequente quanto o uso das outras medidas discutidas neste capítulo.
Os c oeficientes são importantes na elaboração de indicadores de saúde.
16
Em Síntese Importante!
As medidas de tendência central e de dispersão são úteis na compreensão e caracteri-
zação dos dados populacionais ou amostrais. A apresentação dessas medidas ajuda a
entender o caráter homogêneo ou não dos dados, bem como a forma de dispersão dos
mesmos em relação a um determinado valor médio.
17
17
UNIDADE Medidas de Tendência Central e de Dispersão
Material Complementar
Indicações para saber mais sobre os assuntos abordados nesta Unidade:
Vídeos
Moda, Média e Mediana
[Link]
Média e Mediana de dados agrupados
[Link]
Propriedades da Média e Desvio Padrão
[Link]
Cálculo do desvio padrão e da variância
[Link]
18
Referências
ARANGO, H. G. Bioestatística – Teórica e Computacional. 2. ed. Rio de Janeiro:
Guanabara Koogan, 2005. (acompanha CD demonstrativo)
VIEIRA, S. Princípios de Estatística. São Paulo: Pioneira Thomson Learning, 2003.
VIEIRA, S. Introdução à Bioestatística. 4. ed. Rio de Janeiro: Elsevier, 2008.
TRIOLA, M. F. Introdução à Estatística. Rio de Janeiro: LTC, 2005.
19
19