0% acharam este documento útil (0 voto)
78 visualizações69 páginas

Medidas de Localização e Dispersão em Estatística

Este documento discute várias medidas estatísticas de localização e dispersão de dados, incluindo quartis, decís, percentis, amplitude, desvio médio, variância e desvio padrão. O documento também aborda medidas de assimetria e curtose.

Enviado por

Lissane
Direitos autorais
© © All Rights Reserved
Levamos muito a sério os direitos de conteúdo. Se você suspeita que este conteúdo é seu, reivindique-o aqui.
Formatos disponíveis
Baixe no formato PPTX, PDF, TXT ou leia on-line no Scribd
0% acharam este documento útil (0 voto)
78 visualizações69 páginas

Medidas de Localização e Dispersão em Estatística

Este documento discute várias medidas estatísticas de localização e dispersão de dados, incluindo quartis, decís, percentis, amplitude, desvio médio, variância e desvio padrão. O documento também aborda medidas de assimetria e curtose.

Enviado por

Lissane
Direitos autorais
© © All Rights Reserved
Levamos muito a sério os direitos de conteúdo. Se você suspeita que este conteúdo é seu, reivindique-o aqui.
Formatos disponíveis
Baixe no formato PPTX, PDF, TXT ou leia on-line no Scribd

Disciplina: Estatística

Domingos Neto Joao Joaquim e – mail: [email protected] ou [email protected]


Fidel Jose: [email protected] ou [email protected]
Outras medidas de localização, quartis, decís e
percentis
Os quartis dividem um conjunto de dados
estatísticos em quatro partes iguais. São, por isso,
em numero de três e representam-se,
respectivamente, por Q1, Q2 e Q3.
Outras  O segundo quartil corresponde a mediana, ou
medidas de seja, Q2=Me. Para a determinação dos quartis,
localização teremos que atender ao tipo de distribuição
apresentada.
 O cálculo de Q2 = Me já foi tratado
anteriormente vejamos como determinar Q1 e
Q3
Para dados não agrupados
O primeiro quartil é a mediana da primeira metade da distribuição.
Supondo que esta apresenta um número de observação igual a N` , ordem
de Q1 será:
N  1 Se N’ e impar.
2

Outras N' N'


 1
medidas de 2 2 Se N’ for par
2
localização
O terceiro, quartil é a mediana da última metade da
distribuição. A ordem de Q3 pode ser obtida do seguinte modo:
N
 Ordem de Q1 se N for par.
2
N 1
 Ordem de Q1 se N for impar.
2

Nota: se alguma das ordens encontradas não for


inteira, o quartil respectivo determina-se pela média
Outras aritmética de xk e xk 1 (ou seja, xk  xk 1 ),
2
medidas de sendo K o número inteiro imediatamente inferior ao
localização número encontrado.
Exemplo:
Na distribuição de dados simples: 23 24 26 28 30 31 32 34 37
Q2  M e  x5  30
Como N´ = 4, então o índice de Q1 é:

Outras N' N'


medidas de  1
2 2 23
  2,5 logo
localização 2 2
x2  x3 24  26
Q1    25
2 2
A ordem de Q3 é :

N 1 4 1
 2,5   2,5  5  2,5  7,5
2 2
x7  x8 32  34
Outras Portanto, Q3    33
medidas de 2 2
Exemplo:
localização
Consideramos, agora, a distribuição:
20 22 25 28 29 30
x3  x4
Q2  M e   26,5
2
N '1 3  1
Ordem de Q1 : Q1   2
2 2
Q1  x2  22
N
Ordem de Q3 : Q3   2  3 2  5
Outras Q  x  29 2
3 5
medidas de Exemplo
localização Seja dada a distribuição de dados agrupados apresentada na
tabela: Classes fi fa

1,55  1,60 5 5

1,60  1,65 11 16
1,65  1,70 23 39

1,70  1,75 8 47
1,75  1,80 3 50
Total N = 50 -
Q1  x N  x12,5  o primeiro quartil encontra-se na classe
4 1,60  1,65

Q3  x 3 N  x37 ,5  O terceiro quartil encontra – se na classe


4
Outras 1,65  1,70
medidas de Tratando – se de dados agrupados em classes obtêm – se os quartis através da
localização formula:

N
C  N i 1
Qc  4  hi C  1,2,3  Q1 , Q2 , Q3
Fi
As letras que entram nessa formula têm o mesmo significa que na mediana.
Amplitude interquartis
Chama – se amplitude interquartis á diferença entre o terceiro e primeiro quartis.
AQ = Q3 – Q1
Diagrama de extremos e quartis
O diagrama de extremos e quartis é um esquema que nos permite ver se há
concentração ou dispersão dos dados ao longo de toda a distribuição.

Outras
medidas de
localização
Outras
medidas de
localização
Medidas de Dispersão ou de Variabilidade
As medidas de dispersão mais usadas são:
Amplitude total, Desvio quartílico, desvio médio, variância e
desvio padrão.
Amplitude total (range) – é a diferença entre o valor máximo
Medidas de e mínimo.
Dispersão ou R  X max  X min
de Interquartil – é a diferença entre o 3º e o 1º quartil, isto é, Q3  Q1
Q3  Q1
Variabilidade Semi amplitude quartílíca é a metade do interquartil.
2
Q3  Q1
Desvio quartilíco relativoQ
Q2
Desvio de xi em relação a media x é a diferença entre os valores observados e
o valor médio.

d  xi  x
Chama – se desvio médio de uma distribuição (Dx) a média aritmética dos valores
absolutos dos desvios em relação a média.

 fi  x 
n

i x
D( x )  i 1
N
Medidas de
Dispersão ou Chama – se Variância, a média aritmética dos quadrados dos desvios em

 fi  x 
relação a média aritmética. n
de 2
i x
Variabilidade V( x )  i 1
N
A variância também pode ser dada pela fórmula.


2
fi xi
2
V( x )  i 1
x
N
Nota: a variância é tanto maior quanto maior for a dispersão.
A representatividade dos valores centrais diminui quando a variância
aumenta.
Chama-se desvio padrão, a raiz quadrada da variância.

 fi  x 
n 2

Medidas de i x
  V( x ) ou   i 1
Dispersão ou N
de Importância do desvio padrão
Variabilidade - O desvio padrão informa sobre dispersão, isto é, sobre o afastamento dos dados
em relação a média.


- O intervalo x   , x    contém sempre mais de 50% dos dados; isto
significa que mais de metade dos dados se situam a uma distância da média que é
inferior a um desvio padrão.
Coeficiente de variação ou de dispersão
O coeficiente de variação Cv, é uma medida de dispersão útil para a comparação
em termos relativos, do grau de concentração em

torno da média de séries distintas, e é dado por: Cv 
x
Medidas de As vezes o Cv é dado em percentagem.

Dispersão ou Exemplos: VER O MODULO PAGINA 75, 76

de
Variabilidade
Medidas de Assimetria e Curtose
Assimetria: é o grau de desvio em relação a uma
distribuição simétrica. Em outros termos, assimetria é
o grau de deformação de uma curva de frequências.
Medidas de Do ponto de vista desse último aspecto, as
Assimetria e características mais importantes são o grau de
Curtose deformação (assimetria) e o grau de achatamento ou
afilamento (curtose) da curva de freqüências ou do
histograma. Porém, para estudar as medidas de
assimetria e curtose, é necessário o conhecimento de
certas quantidades conhecidas como momentos.
Para dados agrupados, representados por uma curva
de frequência, as diferenças entre os valores da
Medidas de média, da mediana e da moda, são indicadores da
Assimetria e forma da curva em termos de assimetria, ou seja:
Curtose
Neste caso a média apresenta um valor maior do que
a mediana, e esta será maior do que a moda.

1º Caso:

Distribuição Com Assimetria Positiva ou Distribuição Unimodal


Positivamente Assimétrica
Medidas de Estamos perante uma distribuição simetria.

Assimetria e
Curtose

Mo  Me  x
2º Caso .

Perante uma distribuição assimétrica a esquerda ou negativa.

Medidas de
Assimetria e
Curtose x  Me  Mo
3º Caso:

x  Me  Mo
Medidas de
Assimetria e Estamos perante uma distribuição simetria.

Curtose Coeficiente de Assimetria (As)


Karl Pearson propôs duas maneiras de avaliar o grau de achatamento ou de
formação da curva de uma distribuição de frequências, cujo objectivo principal
é justamente indicar a grandeza do afastamento em termos relativos.
a) Primeiro coeficiente

x  Mo
As 

Onde:
x  Média Aritmetica
Medidas de
M o  Moda
Assimetria e
Curtose   Desvio padrão da amostra
  ou A
b) Segundo coeficiente

3 x  Med 3x  3Med
As  
 
s

Onde Med = mediana


Em função dos resultados de (As), é possível
determinar o comportamento da curva de cada
distribuição. Assim, se:
Medidas de
Assimetria e
Curtose As  0 distribuição é simétrica.
As  0 distribuição é assimétrica positiva.
As  0 distribuição é assimétrica negativa.
Exemplo
Ver os exemplos no documento – Exemplos – Coeficientes de Assimetria

Medidas de Achatamento – Curtose


Medidas de A curtose ou excesso indica até que ponto a curva de
freqüências de uma distribuição se apresenta
Assimetria e mais afilada ou mais achatada do que uma curva-
Curtose padrão, denominada curva normal.
Observação: A curva normal (curva padrão), apresenta
um coeficiente de curtose igual a 0,263
e recebe o nome de mesocúrtica. Se o coeficiente for
maior que 0,263 recebe o nome de platicúrtica e se
menor que 0,263 chamará leptocúrtica.
Graficamento temos

Medidas de
Assimetria e
Curtose
Calculo de coeficiente de Curtose

Q3  Q1
2 Dq
C ou As  Onde Dq é desvio quartilico
Medidas de C90  C10 C90  C10
Assimetria e
Curtose
Distribuições bidimensionais

O estado estatístico refere-se muitas vezes a


dois caracteres da mesma população visando
Distribuições
bidimensionais investigar em que medida eles se relacionam,
isto é, de que modo a variação de um deles
exerce influência na variação do outro.
DEFINIÇÃO

As distribuições estatísticas
envolvendo o estudo da relação entre
Distribuições duas variáveis chamam-se
bidimensionais distribuições bidimensionais.
Por exemplo:
1. Os gastos em publicidade e o volume de venda.
2. Altura média de um casal e a altura dos filhos.
3. Altura de um local e a respectiva pressão atmosférica.
Distribuições 4. Hora do dia e a temperatura atmosférica.
bidimensionais 5. O peso dos alunos e a respectiva nota em filosofia.
6. Peso e o preço do telemóvel.
 Caracteres independentes – São os quais é
impossível descobrir qualquer relação, como por
exemplo, o peso dos alunos e a respectiva nota em
filosofia.
Distribuições
bidimensionais O maior ou menor grau de dependência estatística
entre duas variáveis traduz-se por um número – o
coeficiente de correlação que só varia de -1 a 1.
 Correlação positiva – as variáveis evoluem em geral no
mesmo sentido.
Exemplo: altura e o peso das pessoas.

 Correlação negativa – as variáveis evoluem em sentido


Distribuições contrário quando uma aumenta a outra tende a diminuir.
bidimensionais Exemplo: intensidade da chuva e a temperatura do ar.

 Correlação nula – não há influência de uma variável na


outra, as variáveis são independentes.
Exemplo: a idade do pai e a nota de desenho de cada aluno.
Se o coeficiente de correlação for igual a 1 ou a -1,
então a dependência entre duas variáveis é tão
rigorosa que se pode traduzir por uma lei
matemática: diz – se que há uma dependência
Distribuições
bidimensionais funcional.

A dependência funcional é um caso extremo da


dependência estatística.
De uma distribuição bidimensional de variáveis xi e yi podemos
fazer uma representação gráfica num sistema de eixo dos x x’
e os da outra variável no eixo dos y y’.

A essa representação chama – se diagrama de dispersão.

Distribuições Se todos os pontos desse diagrama se situar nas proximidades


bidimensionais de uma recta (recta de regressão), a correlação diz – se linear.
Distribuições
bidimensionais
Distribuições
bidimensionais
Coeficiente de Correlação
Intuitivamente podemos prever a existência de
correlação entre duas variáveis. Para quantificar a
relação usa - se o coeficiente de correlação linear de
Pearson que se representa por:
C x, y
 , Onde :
Distribuições  x  y  Co – variância ou
bidimensionais n variância conjunta das
 fi  xi  yi Variáveis x e y.
C x, y  i 1
 x y
N
 x  Desvio Padrão da var iável x
 y  Desvio Padrão da var iável y
O coeficiente de correlação é um número  1, 1
do intervalo

Exemplo:
A tabela seguinte mostra a classificação de 12
alunos em dois testes cotados de o a 100.
Distribuições
bidimensionais Classificação 30 18 70 20 80 45 70 100 50 85 70 40
em Estatística
(x)
Classificação 75 24 60 54 70 40 90 90 65 10 80 37
em Inglês (y) 0
a) Desenhe o diagrama de dispersão.

b)Calcule o coeficiente de correlação


Distribuições entre x e y.
bidimensionais
c) Interprete o resultado obtido em b).
Resolução:
a)

Distribuições
bidimensionais
Resolução:
b)   678,  x  46074
2
x

  785  y  57411
y
2

  49492
x, y

C 
 xy  x  y
   428,3
x, y
12 12 12
Distribuições x 
 y    x   22,4
2 2

bidimensionais 12  12 
 

 y2 y
2

y     0,75
12  12 
 

c) Há correlação posetiva entre as variáveis.


Noção intuítiva e frequencista das probabilidades

Noção intuitiva das probabilidades


Os jogos de azar que se praticam há milhares de anos,
estão na origem das primeiras obras escritas sobre
Probabilidade probabilidades e que começaram a surgir no século
XVIII.
O dado é um instrumento dos jogos de azar por
excelência, a tal ponto que duas das palavras mais
usadas para lidar com o que é casual, ou fortuito, ou
contingente são:
Azar de az – zãr e Aleatório de álea, ambas com
origem na palavra dado, respectivamente em árabe
e latim.

Por esta sua origem concreta, a teoria das


Probabilidade probabilidades utiliza uma linguagem própria que é
preciso conhecer.

Uma experiência diz-se aleatória se pode ter vários


resultados cujo aparecimento, em cada prova da
experiência, é impossível prever.
Diz-se que o resultado depende do “acaso”
ou da “sorte” ou do “azar”.

Os fenómenos aleatórios são o objecto de


Probabilidade
estudo da teoria das probabilidades.

Acaso significa ausência de causa


conhecida.
São aleatórias todas as experiências que se
fazem nos jogos:

Probabilidade - Tirar uma carta no baralho; atirar um


dado; comprar uma rifa; rodar a roleta;
jogar no totoloto…
Mas há muitos outros como:
- Abrir um livro e ver o número de página,
perguntar a um aluno qualquer quantos
irmãos tem…
Probabilidade
- As experiências do laboratório que se
fazem na escola, cujo resultado já é
conhecido e é sempre o mesmo, não são
experiências aleatórias.
Terminologias
Toda teoria está fundamentada numa
terminologia própria. No caso da teoria
das probabilidades, são usadas as
seguintes expressões:
Probabilidade a) Experimento
É o fato ou fenômeno que está sendo
estudado.
Ex.: O lançamento de uma moeda; a
extração de uma carta de um baralho; a
análise do clima e o estudo da economia.
b)Espaço Amostral ou Conjunto Universo
( W = S = Space)

É o conjunto de todos os resultados


Probabilidade possíveis de um certo experimento.
Ex.: 1º) Se o evento consistir no
lançamento de um dado, qual será o
espaço amostral?
 = {1, 2, 3, 4, 5, 6} ou seja =
Se o experimento consistir no lançamento de 3
moedas consecutivas, qual será o espaço
amostral?
Probabilidade c) Evento Elementar
É cada um dos resultados possíveis do
espaço amostral do experimento.
Ex.: Cara, num lançamento de moeda; Ás,
numa extração de carta.
Classificação dos eventos:
Dois ou mais eventos elementares de certo
espaço amostral são ditos:

Probabilidade Evento Composto


Formado por mais de um elemento do espaço
amostral ( W = S ).
Ex.: ocorrência de face par no lançamento de
um dado.
3º) Evento Certo
É aquele que ocorre em qualquer realização do
experimento.
Ex.: no lançamento de um dado fatalmente sairá a
face 1, 2, 3, 4, 5 ou 6
Probabilidade
4º) Evento Impossível
É aquele que não ocorre em qualquer realização do
experimento.
Ex.: No lançamento de um dado sair a face 75º
5º) Evento Complementar
Para um evento A qualquer, o complementar de A,
denotado por A é dado por A = S – A, ou seja, é um
outro conjunto formado pelos elementos que
pertencem a S e não pertencem a
Probabilidade A. O resultado da reunião de A e A é exatamente o
espaço amostral.
Ex.: Coroa é complementar de cara (e vice-versa); o
conjunto de cartas de paus, ouros e copas é
complementar do conjunto de espadas.
6º) Evento Independente
Dizemos que dois ou mais eventos são
independentes quando não exercem ações
recíprocas, comportando-se cada um de maneira
que lhe é própria sem influenciar os demais.
Caracteriza-se, portanto, quando a ocorrência de
Probabilidade um evento não for afetada pela ocorrência do outro,
sendo a recíproca verdadeira.
Ex.: Consideremos o lançamento de duas moedas:
Temos: S = {Ca, Ca; Ca, Co; Co, Co; Co, Ca}
Os resultados dos eventos são independentes de
uma moeda para outra.
Podemos dizer que:
A probabilidade de um acontecimento
associado a certa experiência é a frequência
relativa esperada desse acontecimento
quando o número de provas for muito
Probabilidade elevado.
A probabilidade de um acontecimento é um
número de 0 a 1 (em
percentagem: de 0% a 100%)

0  P ( A)  1
Probabilidade = 1: o acontecimento é certo
nessa experiência que se realize sempre.
Exemplo: «sair menos de sete» = {1, 2, 3, 4, 5,
6}, no lançamento de um dado

Probabilidade Probabilidade = 0: o acontecimento nunca se


dá nesta experiência, é um acontecimento
impossível.
Exemplo: «sair zero» no lançamento de um
dado.
Definição axiomática das Probabilidades
A cada acontecimento A de espaço de
acontecimentos faz-se corresponder um número
real que se chama probabilidade de A, escreve-se P
(A), o qual cumpre os seguintes axiomas:
Probabilidade
A1 : P ( A)  0A   ( E )
A2: P (E) = 1 (acontecimento certo)
A3: Se A B = Ø (A, B incompatíveis) então P ( A
B ) = P (A) + P(B)
Os axiomas A1 e A3 fazem com que a
probabilidade seja uma «mediana». O axioma
A2 fixa a «quantidade» total da probabilidade
Probabilidade em 1, a semelhança das frequências
relativas.
Assim, podemos dizer que a probabilidade mede
até que ponto se pode esperar que ocorra um
acontecimento e que a medida máxima é 1
Primeiras consequências dos axiomas
(propriedades)
T1: A probabilidade do acontecimento contrário
a A é dada por P
Probabilidade
Corolário 1: P (Ø) = 0

A probabilidade de um acontecimento
impossível é zero.
Corolário 2: P ( A)  1
T2: Quaisquer que sejam os acontecimentos A,
B, C,….
Probabilidade Incompatíveis dois a dois tem-se
P ( A  B  C  ...) = P(A) + P(B) + P(C) +…
Acontecimentos equiprováveis

Os acontecimento equiprovaveis estão ligadas a


jogos de azar que usam objectos regulares
Probabilidade construídos com grande perfeição como dados,
roletas, urnas com bolas, moedas, baralho de
cartas, … nestes casos a experimentação
reiterada, limita-se a confirmar os cálculos feitos
a priori.
Exemplo:

Se é perfeito, P(1) = P(2) = P(3) = P(4) = P(5) = P(6),


isto é, os acontecimentos elementares são
equiprováveis.
Probabilidade
Como são 6, a probabilidade de cada um deles é 1/6.
Definição clássicas de probabilidade
(ou lei de LAPLACE)
P (A) = Sendo os «casos favoráveis a A» os elementos
de A.
Se uma experiência aleatória tem n resultado
possíveis incompatíveis e equiprovaveis, a
Probabilidade probabilidade dum acontecimento A é dada por:
 P (A) = n º de casos favoraveis a A  # A  # A
n º de casos possiveis n #E

Sendo os «casos favoráveis a A» os elementos de A.


Probabilidade Condicional
Exemplo 1:

Ao jogarmos um dado não viciado e observarmos a face de cima,


consideremos o evento B = {o resultado é ímpar}. Temos que P(B)=3/6=0,5.
Essa é a probabilidade antes que a experiência se realize.
Suponhamos agora que, realizada a experiência, alguém nos
Probabilidade informe que o resultado não foi o número 6, isto é, que A={o resultado é
diferente de 6} ocorreu.
Observemos agora que passamos a ter apenas 5 casos possíveis,
dos quais 3 são favoráveis à ocorrência de B. Passamos a ter uma
probabilidade de B na certeza de A,

P(B|A)=3/5=0,6.
Exemplo 2:
A tabela abaixo dá a distribuição dos alunos de uma turma, por sexo
e por disciplina que está cursando.
Disciplina Homens(H) Mulheres(F) Total
Cálculo I (C) 15 4 19
Estatística (E) 16 15 31
Física (F) 6 0 6
Probabilidade Outros (O) 4 2 6
Total 41 21 62

Escolhe-se, ao acaso, um aluno. Defina os eventos:


H: o aluno selecionado é do sexo masculino
C: o aluno selecionado é do cálculo.
Exemplo 2:

Note que P(H) = 41/62, P(C)=19/62, mas, dentre os alunos do


cálculo, temos que a probabilidade de ele ser do sexo masculino é:
15/19. Isto é,

Probabilidade
P(H|C)=15/19
Definição

Dados dois eventos A e B, com P(A) ≠ 0, a probabilidade condicional


de B, na certeza de A é o número

P A  B 
P B | A   .
P A 
Probabilidade Se P(B)  0, decretamos P(A | B)  0.

É muito comum o uso dessa fórmula para o cálculo de P(A∩B).


Pois, P(A∩B)=P(A).P(B|A)
Exemplo 3:
Numa caixa, contendo 4 bolas vermelhas e 6 bolas brancas, retiram-
se, sucessivamentem e sem reposição, duas bolas dessa urna.
Determine a probabilidade de ambas serem vermelhas.

Probabilidade Solução: Sejam A = {a primeira bola é vermelha} e B = {a segunda


bola é vermelha}, temos:

4 3 2
PA  B   P A  P B | A    
10 9 15
Exemplo 4:
Numa caixa, contendo 4 bolas vermelhas e 6 bolas brancas, retiram-
se, sucessivamente e sem reposição, duas bolas dessas, urna.
Determine a probabilidade da primeira bola ser vermelha, sabendo
que a segunda bola é vermelha.

Probabilidade Solução: Sejam A = {a primeira bola é vermelha} e B = {a segunda


bola é vermelha}, temos:

P A  B 
PA | B   .
P B 
Exemplo 4: (continuação)

Sabemos que P(A∩B) = 2/15 (exemplo anterior) e que


P(C) = {a primeira bola é branca}. Então, basta calcular P(B).
Logo, P B   PA  B   C  B 
  P A  B   P C  B 
2
Probabilidade 
15
 P C  P B | C 

2 6 4 2
   
15 10 9 5
Então,
P A  B  2 2 1
P A | B      .
P B  15 5 3
Exemplo 4: (continuação)
Outra abordagem que podemos dar a problemas com vários
estágios é o uso das árvores de probabilidade.

3
9 A
4
A
Probabilidade 10
6 B
9
4
6 9 A
10 B
5
9
B
Exemplo 4: (continuação)
P(A∩B) = 4/10 . 3/9 = 2/15

P(B) = 4/10 . 3/9 + 6/10 . 4/9 = 2/5

Então,
Probabilidade P A  B  2 2 1
P A | B      .
P B  15 5 3

Você também pode gostar