0% acharam este documento útil (0 voto)
41 visualizações61 páginas

Estatística 2024 - Parte 1

O documento apresenta uma introdução à Estatística, abordando suas duas principais áreas: Estatística Descritiva e Inferência Estatística. Ele discute tipos de dados, como primários e secundários, qualitativos e quantitativos, além de apresentar conceitos de medidas de posição, como média, mediana e moda. Exemplos práticos e gráficos são utilizados para ilustrar a aplicação de técnicas estatísticas na análise de dados.

Enviado por

Barbara Furiati
Direitos autorais
© © All Rights Reserved
Levamos muito a sério os direitos de conteúdo. Se você suspeita que este conteúdo é seu, reivindique-o aqui.
Formatos disponíveis
Baixe no formato PDF, TXT ou leia on-line no Scribd
0% acharam este documento útil (0 voto)
41 visualizações61 páginas

Estatística 2024 - Parte 1

O documento apresenta uma introdução à Estatística, abordando suas duas principais áreas: Estatística Descritiva e Inferência Estatística. Ele discute tipos de dados, como primários e secundários, qualitativos e quantitativos, além de apresentar conceitos de medidas de posição, como média, mediana e moda. Exemplos práticos e gráficos são utilizados para ilustrar a aplicação de técnicas estatísticas na análise de dados.

Enviado por

Barbara Furiati
Direitos autorais
© © All Rights Reserved
Levamos muito a sério os direitos de conteúdo. Se você suspeita que este conteúdo é seu, reivindique-o aqui.
Formatos disponíveis
Baixe no formato PDF, TXT ou leia on-line no Scribd

FGV/EPGE - Mestrado em Finanças e Economia Empresarial

Disciplina: Estatística/2024 (parte 1) - Professor: Eduardo Lima Campos

• O Que é Estatística?

ESTATÍSTICA Estatística é a ciência que permite obter


informações sobre um fenômeno, a partir
do registro de observações deste fenômeno.
Professor: Eduardo Campos
ESTATÍSTICA:
DADOS → INFORMAÇÃO

1 2

Estatística Descritiva ou
A estatística divide-se Análise Exploratória de Dados
em duas áreas:

A estatística descritiva ocupa-se da


- Estatística Descritiva análise/descrição de um conjunto de
dados por intermédio de tabelas, gráficos
e/ou medidas-resumo, com o objetivo de
- Inferência Estatística
facilitar sua visualização e compreensão.

3 4

Inferência Estatística ou
Exemplo: Estatística Inferencial

Cálculo do coeficiente de rendimento


(c.r.) = média ponderada das notas em A inferência estatística consiste de um
cada disciplina → medida-resumo do conjunto de técnicas para, a partir de uma
desempenho acadêmico de um aluno. amostra selecionada de um universo,
formular conclusões para este universo.

5 6

1
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2024 (parte 1) - Professor: Eduardo Lima Campos

• Tipos de Dados
Exemplo:
Dados = matéria prima da estatística.
Pesquisa eleitoral → estimação dos
percentuais de intenções de voto em todo A identificação da ferramenta estatística
o universo eleitoral, a partir de uma adequada para tratá-los depende da
amostra de, digamos, 2.000 pessoas. identificação correta do tipo dos dados.

A seguir são apresentadas as tipologias


mais importantes para classificar dados.

7 8

1 - Dados Primários x Secundários 2 - Dados em Corte x Séries Temporais

• Dados primários são aqueles obtidos • Dados em corte (transversal) são aqueles
de forma direta, mediante observação, referentes ao mesmo instante de tempo.
pesquisas ou experimentos controlados.
• Dados de séries temporais são aqueles
• Dados secundários são aqueles que não registrados ao longo de um período de
são obtidos diretamente, e sim mediante tempo, com determinada frequência.
publicações (como relatórios ou artigos).

9 10

3 - Dados Qualitativos x Quantitativos


Obs - Dados que possuem ambas as
dimensões (de corte e de tempo) são • Dados qualitativos são aqueles que
denominados longitudinais ou em painel. representam um atributo ou qualidade.
Exemplos: profissão, gênero, raça, estado
civil, classe social, nível de educação, etc.
• Dados em painel consistem no registro de
informações ao longo do tempo para um • Dados quantitativos são números que
conjunto de unidades em corte transversal. resultam de uma contagem ou medida.
Exemplos: idade, peso, altura, renda, número
de filhos, número de banheiros em casa, etc.

11 12

2
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2024 (parte 1) - Professor: Eduardo Lima Campos

Exemplo 1.1 - Faturamento bruto no mês


passado, em milhões de R$, das 30 filiais
de uma determinada empresa de varejo:

1. ESTATÍSTICA 11,8 3,6


8,9 9,1
16,6 13,5 4,8 8,3
7,7 2,3 12,1 6.1
10,2 8,0 11,4 6,8 9,6 19,5
DESCRITIVA 15,3 12,3 8,5 15,9 18,7 11,7
6,2 11,2 10,4 7,2 5,5 14,5

Que conclusões você pode tirar?

13 14

Esses dados estão na chamada forma Distribuição de Frequências


bruta, difícil de analisar diretamente.
Precisamos usar técnicas adequadas para A distribuição de frequências é
resumí-los ou facilitar sua visualização. uma tabela que agrupa os dados
em classes (intervalos), indicando o
número ou a proporção de observações
É disto que trata a que pertencem a cada uma das classes.
estatística descritiva!
As classes não precisam
ter amplitudes iguais.

15 16

• Distribuição de Frequências Absolutas • Distribuição de Frequências Relativas


Classe Frequência Representa a proporção ou o percentual
2 ⎯| 5 3 de observações que caem em cada classe.
5 ⎯| 8 7 Classe Frequência Relativa
8 ⎯| 11 7
2 ⎯| 5 3/30 = 0,1 = 10%
11 ⎯| 14 7 5 ⎯| 8 = 7/30 ou 23,33%
14 ⎯| 17 4 8 ⎯| 11 23,33%
17 ⎯| 20 2 11⎯| 14 23,33%
Total: 30 14 ⎯| 17 13,33%
A notação ⎯| significa que o extremo inferior da classe 17 ⎯| 20 6,67%
não está incluído, e o extremo superior está incluído! Total: 1 = 100%

17 18

3
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2024 (parte 1) - Professor: Eduardo Lima Campos

Histograma (Frequências Absolutas) - ex. 1.1:


Histograma
Frequências
10
O histograma é uma representação 8
gráfica da distribuição de frequências. 6
4

Como obter o histograma? 2


0 Classes
Colocar as classes no eixo horizontal, 2-|5 5-|8 8-|11 11-|14 14-|17 17-|20
as frequências no eixo vertical,
e traçar um diagrama de barras. O histograma de frequências relativas tem o
mesmo formato, com o eixo vertical modificado.
19 20

Exemplo 1.2
• Gráfico de Barras
Distribuição do número diário de
picos de energia no Grajaú, em um mês.
Representação gráfica apropriada para
variáveis que representam contagens. Muito cuidado
com a
interpretação
deste gráfico!
Consiste de barras verticais centradas
nos valores assumidos pela variável,
e com espaços separando as barras.

21 22

Exemplo 1.3:
• Gráfico de Pizza ou de Setores

O gráfico de pizza, ou de setores, é um


diagrama estatístico bastante popular.

É apropriado quando o objetivo


é identificar partes de um todo.

23 24

4
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2024 (parte 1) - Professor: Eduardo Lima Campos

• Medidas de Posição
Média
Uma medida de posição é um valor em
torno do qual os dados estão concentrados. É a soma das observações dividida
pelo número de observações:
n
Sinônimos: medida de localização x i x 1 + x 2 + ... + x n
ou de tendência central. = i =1
= .
n n
Principais medidas de posição:
no de i-ésima
Média , Mediana e Moda. observações observação

25 26

Exemplo 1.4:
No exemplo 1.1, o faturamento médio
é  = 307,7/30 = 10,3 milhões. Salários de economistas recém-formados
(em R$ 1.000): 2,8; 6,0; 2,6; 3,1; 3,0.
Note que o valor 10,3 não ocorre.
Salário médio (destes 5 economistas):
 = 3,5 (R$ 3.500,00).
Nenhum problema!
A média de um conjunto de dados não
Este número é representativo
precisa ser um dos valores observados.
dos salários desses 5 economistas?

27 28

R: Não, pois está bem acima


Conclusão:
de 4 dos 5 valores.

A média é uma medida de posição


Claramente, o valor responsável muito sensível à presença de outliers!
por esta distorção foi o “6,0”.

O “6,0” é um valor atípico ou discrepante, Neste caso, é recomendável utilizar outra


tecnicamente denominado outlier. medida de posição, chamada mediana!

29 30

5
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2024 (parte 1) - Professor: Eduardo Lima Campos

Exemplo 1.4 (cont.):


Mediana
Salários ordenados:
É o valor Md que divide os dados 2,6; 2,8; 3,0; 3,1; 6,0.
ordenados em duas partes iguais.

Se n for ímpar: Md = observação central. Md = 3,0.

Se n for par: Nota-se que 3,0 é mais representativo da


Md = média das duas observações centrais. posição ou tendência central dos salários.

31 32

Em algumas situações, nem a média nem


a mediana serão medidas apropriadas.
Obs - A mediana é uma medida de posição
robusta ou resistente. O sentido é que ela resiste Exemplo 1.5 - O gerente de uma loja de
(mantém seu valor) na presença de outliers. calçados está interessado em saber qual
tamanho de calçado ele deve priorizar na
hora de planejar seu estoque, a partir dos
tamanhos dos calçados vendidos no último
mês. Qual a medida de posição adequada?

33 34

Moda E se o aluno que tirou 6,0 conseguir, via


revisão de prova, alterar sua nota pra 7,0?

A moda é o valor que ocorre com Qual passaria a ser o valor da moda?
maior frequência em um conjunto
de observações (notação: Mo).

Um conjunto de dados que possua 2 modas


Exercício 1.1 - As notas de uma turma
é chamado bimodal. Se possui mais de 2,
foram: 9, 7, 8, 6, 3, 8, 7 e 8. Obtenha a
multimodal. Se não possui moda, amodal.
média, a mediana e a moda das notas.

35 36

6
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2024 (parte 1) - Professor: Eduardo Lima Campos

Exemplo 1.2 (revisitado)


• Outras Medidas de Posição
Distribuição do número diário de
picos de energia no Grajaú, em um mês. Embora as três medidas de posição
Qual o número apresentadas até aqui sejam as medidas
máximo de picos de posição mais “populares”, existem
em um dia? algumas outras que também são
Qual a moda do
número de picos
importantes, como, por exemplo, a
de energia? média ponderada e a média geométrica.

37 38

Exemplo 1.6 - Em uma pequena empresa,


os salários dos 12 funcionários estão Média Ponderada
distribuídos da seguinte forma:
A média ponderada, p, é definida como:
k
5 ganham R$ 2.500,00;   jx j
2 ganham R$ 3.000,00; j=1 1x1 + 2 x 2 + ... + k x k
p = = .
3 ganham R$ 4.000,00;
k
 j 1 + 2 + ... + k
2 ganham R$ 4.500,00. j=1

peso do j-ésimo valor distinto de x (no


Calcule o salário médio dos exemplo = frequência do j-ésimo salário)
funcionários desta empresa. Resposta do exemplo 1.6: R$ 3.291,67.

39 40

Exercício 1.2 - Um investidor dispõe de


R$ 8.000,00, dos quais aplica R$ 1.000,00 Média Geométrica
em ações, R$ 3.000,00 em um fundo
multimercado e R$ 4.000,00 na poupança,
por um ano. A média geométrica g é
definida da seguinte forma:
Se a rentabilidade projetada para as ações é
de 15%, contra 10% do fundo multimercado
 g = (x1 x 2 ...x n )n .
1
e 5% da poupança, calcule a rentabilidade
esperada (=média) do investidor, em %.

R: p = 8,125%.
41 42

7
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2024 (parte 1) - Professor: Eduardo Lima Campos

Exemplo 1.7 - Imagine um fundo cujas


taxas de retorno sejam conhecidas (na A média simples (aritmética) dos retornos
prática, projetadas) para cada um dos é 15%. Isto poderia levar à impressão de
próximos n anos, e a partir desses dados que alguém que invista neste ativo por 2
se queira a rentabilidade anual. anos obteria um retorno de 15% ao ano,
uma conclusão totalmente equivocada.

Por exemplo, taxas de retorno de 10 e 20%


a.a. em 2022 e 2023, respectivamente.

43 44

Para ilustrar, considere um capital de O retorno médio efetivo ou equivalente


R$ 1000,00 investido no início do ano 1. Req é o retorno por período que levaria
ao mesmo valor final caso os retornos
de todos os períodos fossem iguais.
Qual o valor capitalizado ao final dos 2 anos?

1.000*(1+R1)*(1+R2) = 1.000*1,1*1,2 =
R$ 1.320,00. Para obter o Req, é necessário calcular,
primeiramente, o fator de
fator de capitalização fator de capitalização
capitalização equivalente.
no ano 1 no ano 2

45 46

O fator de capitalização equivalente No exemplo:


referente aos 2 períodos é obtido por meio
da média geométrica dos fatores de
capitalização referentes à cada período: (1 + R eq ) = (1 + R1 )(1 + R 2 ) = 1,32 = 1,148913,
Para n = 2:
(1+Req)2 = (1+R1)(1+R2) de tal forma que Req = 14,8913%.

(1+Req) = (1+R1)(1+R2)
Interpretação: para obter o valor final de R$
e: 1.320,00 com a mesma taxa de retorno em
Req = (1+R1)(1+R2) - 1 cada ano, esta taxa teria que ser 14,8913%.

47 48

8
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2024 (parte 1) - Professor: Eduardo Lima Campos

Para n anos (fórmula geral):


• Medidas de Dispersão

(1+Req)n = (1+R1)(1+R2)...(1+Rn) Frequentemente, uma medida de posição


 não fornece todas as informações de que
(1+Req) = [(1+R1)(1+R2)...(1+Rn)]1/n precisamos para tomar uma certa decisão.

Req = [(1+R1)(1+R2)...(1+Rn)]1/n - 1 Por exemplo, uma pessoa com metade


do corpo em um forno, e a outra metade
em um freezer, “na média” estará bem!
média geométrica

49 50

Exemplo 1.8 - Dois fornecedores, A e


B, apresentaram os seguintes prazos de Naturalmente, você escolheria o fornecedor B
entrega, referentes aos últimos 5 clientes (pois possui menor risco ou dispersão
(em dias): inerente ao prazo de entrega).

Fornecedor A – 18; 10; 17; 3; 2.


Fornecedor B – 9; 10; 10; 9; 12.
Mas como medir “dispersão”?
Com base nos prazos acima, qual dos
fornecedores você escolheria: A ou B?

51 52

Seja (xi-) o desvio de xi em relação à média.


A medida de dispersão mais simples é a
amplitude total = máximo - mínimo. Possíveis medidas de dispersão seriam:
n

n  ( x − )
i

 ( x − ) ou i
i =1
.
Uma forma mais completa de definir i =1 n
uma medida de dispersão é: valor que Solução:
nos informa o quanto os dados variam Problema: trabalhar com
os módulos
em torno de uma medida de posição. n ou quadrados
 (x − ) = 0, sempre!
i =1
i
dos desvios!

53 54

9
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2024 (parte 1) - Professor: Eduardo Lima Campos

Variância (2) Forma alternativa para o cálculo de 2:

É a média dos quadrados dos desvios:


n
σni=1 xi2
 (x i
− ) 2
σ2 = − μ2 .
2 = i =1
. n
n

Exercício 1.3 - Seja um conjunto de 3 dados:


x1 = 2, x2 = 5 e x3 = 8. Ache a variância. R: 6.

55 56

Exemplo 1.8 (cont.) - Prazos de A variância apresenta um sério problema: ela


entrega aos últimos 5 clientes: é expressa no quadrado da unidade original,
em geral uma unidade que sequer faz sentido.

Para o fornecedor A: 2 = 45,2. Como consequência, a variância


Para o fornecedor B: 2 = 1,2. não possui interpretação direta.

Interpretação? Por esta razão o desvio padrão, apresentado


a seguir, é adotado com maior frequência.

57 58

Interpretação de , válida apenas se os dados


Desvio Padrão () seguem distribuição Normal (capítulo 5):

Regra básica
 = 2 . para definir
outliers:
valores fora de
O desvio padrão preserva a unidade original
[-3,+3].
dos dados (no exemplo, é expresso em dias).
Adicionalmente, em certos casos,
ele possui interpretação direta.

59 60

10
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2024 (parte 1) - Professor: Eduardo Lima Campos

Abaixo, o retorno médio, ou esperado, da ação


• Aplicação em Análise de Investimentos B é claramente maior do que o da ação A.
RETORNOS DIÁRIOS DE 2 AÇÕES

É usual analisar a média e o desvio padrão dos 12


10
retornos (variações de preço) de um ativo. 8
6
4 Ação A
2
0 Ação B

29
13

17

21

25

33

37

41

45

49
1

9
-2
Neste contexto, o desvio padrão é uma medida -4
-6
do risco do ativo, chamada volatilidade. -8
DIAS
média da
ação A Porém, a flutuação dos retornos da
ação B é bem maior → maior risco.
média da
ação B

61 62

Exemplo 1.9 - Suponha que estejamos


Coeficiente de Variação (CV) interessados em estudar a variabilidade de
salários em diferentes ramos de atividade
Quando queremos comparar dados profissional. Como um caso extremo,
expressos em diferentes unidades ou considere a comparação entre salários
magnitudes, o uso do desvio padrão de gerentes e de auxiliares de escritório.
leva a conclusões equivocadas, sendo
necessário utilizar uma outra medida Sabe-se que o salário médio dos
chamada coeficiente de variação. gerentes é de R$ 5.000,00 e o dos
auxiliares de escritório é de R$ 500,00.

63 64

Suponha agora que o desvio padrão Fórmula do Coeficiente de Variação:


calculado para os salários dos gerentes e
dos salários dos auxiliares de escritório 
tenha sido o mesmo, ambos iguais a 100. CV = .

Isto indica variabilidade alta ou baixa?

No caso dos auxiliares de escritório, cujos CV dos salários dos auxiliares de


salários estão em torno de R$ 500,00, é alta. escritório: 100/500 = 0,2 ou 20%.
CV dos salários dos gerentes: 100/5.000 =
Já para os gerentes, cujos salários estão em
0,02 ou 2%  dispersão relativa menor.
torno de R$ 5.000,00, é relativamente baixa.

65 66

11
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2024 (parte 1) - Professor: Eduardo Lima Campos

Propriedades do Coeficiente de Variação: • Outras Medidas Importantes

1 - É adimensional, isto é, não é expresso Medidas de posição e dispersão são


em nenhuma unidade de medida. importantes, mas não exaustivas para
representar um conjunto de dados.
2 - É uma medida de dispersão relativa.

3 - CV pequeno = dados homogêneos Estudaremos a seguir os conceitos


e CV grande = dados heterogêneos. de assimetria, percentis e quartis.

67 68

A figura a seguir ilustra as três possibilidades, e


Assimetria respectivas relações entre as medidas de posição:

A assimetria é uma medida do quanto a


distribuição dos dados está afastada de um
aspecto simétrico em relação ao eixo central.

Se a metade esquerda da curva é um “espelho” esta esta distribuição


esta distribuição
da metade direita, dizemos que os dados são distribuição apresenta assimetria apresenta assimetria
simétricos. Caso contrário, que são assimétricos. é simétrica positiva ou à direita negativa ou à esquerda

69 70

Percentis (ou Quantis) Quartis


São medidas Q1, Q2 e Q3 que
O p-ésimo percentil ou percentil p de
dividem os dados em 4 partes iguais.
um conjunto de dados é o valor x tal que
p% dos dados são menores ou iguais a x.

Os percentis 25, 50 e 75 são chamados quartis:


250 Percentil = primeiro quartil (Q1)
500 Percentil = segundo quartil (Q2) = mediana
750 Percentil = terceiro quartil (Q3).
71 72

12
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2024 (parte 1) - Professor: Eduardo Lima Campos

• Amplitude Interquartílica Box-Plot


É uma medida de dispersão dada pela É um diagrama que representa:
diferença entre o terceiro e o primeiro quartis:
- a mediana,
- os quartis Q1 e Q3,
Q = Q3 – Q1.
- uma linha que vai de Q3 até a maior
observação menor ou igual a LS = Q3+1,5Q,
Obs - não confundir com amplitude - outra linha que vai de Q1 até a menor
total = valor máximo - valor mínimo. observação maior ou igual a LI = Q1-1,5Q.
.
73 74

Exemplo 1.10 - Seja o seguinte conjunto de Aplicações do Box-Plot


dados (ordenado): 5, 10, 12, ... , 37, 42, 45.

Sabendo-se que os quartis são 20, 25 1. Comparar dispersões (via amplitudes


(mediana) e 28, obtenha o box-plot. interquartílicas) de dois conjuntos de dados.

2. Identificar a presença de assimetria


(e o tipo dela – se é positiva ou negativa).

75 76

Como detectar e identificar o tipo de assimetria?


Aplicações do Box-Plot (cont.)
A partir das distâncias da mediana aos quartis.
3. Detectar a presença de outliers:
Se a mediana está mais próxima de Q1,
os dados apresentam assimetria positiva. Valores acima de LS são outliers (superiores)

Se a mediana está mais próxima de Q3, Valores abaixo de LI são outliers (inferiores)
os dados apresentam assimetria negativa.
Os outliers costumam ser assinalados com *.
Uma distância igual entre a mediana e cada um
dos quartis é condição necessária para simetria.

77 78

13
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2024 (parte 1) - Professor: Eduardo Lima Campos

Solução:

Exercício 1.4 - As idades das mulheres com


40 anos ou mais, em uma localidade,
apresentam Q1 = 49, Md = 54 e Q3 = 63. A
mais velha tem 71 anos. Obtenha o box-plot. ou

79 80

Diagrama de Dispersão
• Análise Bidimensional
Diagrama de Dispersão
É a análise estatística que envolve 2 variáveis.
Por exemplo: Um diagrama de dispersão é um
gráfico de pontos {(xi,yi); i = 1,2,...,n}.
1) gasto com alimentação e renda

2) nota em uma prova e horas de estudo

3) vendas e investimento em publicidade cada ponto desses representa o valor


de X e de Y para a i-ésima observação
etc.

81 82

Questões que o diagrama de


dispersão permite responder: 3 - Havendo relação linear, ela é perfeita?
(os pontos estão todos sobre uma reta?)
1 - É possível observar algum padrão que
indique uma associação entre X e Y?
4 - No caso de relação linear imperfeita,
2 - Em caso positivo, a relação aparente:
o grau de associação é forte ou fraco?
2.1 - É crescente ou decrescente?
2.2 - É linear ou não-linear?
Uma relação é mais forte à medida que os
Uma relação é linear quando podemos traçar uma reta que se ajuste bem pontos estejam mais concentrados
aos pontos, descrevendo satisfatoriamente sua disposição no diagrama. em torno da reta.

83 84

14
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2024 (parte 1) - Professor: Eduardo Lima Campos

Covariância
O diagrama de dispersão permite
visualizar uma relação de associação. A covariância é uma medida que
informa se X e Y variam no mesmo
sentido ou em sentidos opostos.
Para medir a força dessa associação, Fórmula:
precisamos de medidas-resumo.
σni=1(xi − μX )(yi − μY )
σXY =
n
85 86

Interpretação da Covariância: Exemplo 1.11 - Considere 3 alunos cujos


números X de faltas a um curso e notas Y
Uma covariância positiva nos diz que obtidas na prova são dados a seguir:
X e Y variam no mesmo sentido X Y
Aluno 1 4 3
Uma covariância negativa nos diz que Aluno 2 4 4
X e Y variam em sentidos opostos Aluno 3 1 8

Uma covariância zero significa que Calcule a covariância entre faltas e notas.
não há relação linear entre X e Y. R: XY = -3.

87 88

A covariância evidencia o sentido da relação Coeficiente de Correlação


entre as variáveis, mas o interesse maior
costuma ser medir a força desta associação.
O coeficiente de correlação é um
número entre -1 e 1, que mede a força
da associação linear entre X e Y.
No caso de relações lineares (isto é, aquelas
que são bem representadas por uma reta), o Fórmula:
coeficiente de correlação resolve o problema.  XY
 XY = .
XY

89 90

15
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2024 (parte 1) - Professor: Eduardo Lima Campos

Interpretação do Se a relação linear entre X e Y for positiva,


Coeficiente de Correlação: mas não perfeita, a correlação está entre 0 e 1.

- Se a relação linear entre X e Y for positiva Neste caso, quanto maior a intensidade da
e perfeita, a correlação é igual a 1. associação, mais próximo XY está de 1.

- Se a relação linear entre X e Y for negativa Por exemplo, um coeficiente de correlação


e perfeita, a correlação é igual a -1. igual a 0,95 indica uma relação linear
positiva e forte entre X e Y.

91 92

Exemplo 1.11 (cont.) - Calcule a correlação


Se a relação linear entre X e Y for negativa, entre as notas e as faltas. Os desvios
mas não perfeita, a correlação está entre -1 e 0. padrão são, respectivamente, 2,16 e 1,41.

Neste caso, quanto maior a intensidade da Resposta:


associação, mais próximo XY está de -1.  XY −3
 XY = =  −0,98.
 X  Y 2,16 *1,41
Por exemplo, um coeficiente de correlação
igual a -0,1 indica uma relação linear A associação linear entre o número de
negativa e fraca entre X e Y. faltas e a nota é negativa ou inversa (o
que era de se esperar), e bastante forte.

93 94

Resumo das Propriedades do • Correlação x Causalidade!


Coeficiente de Correlação:

1 - varia entre -1 e 1 O coeficiente de correlação não informa se


X causa Y, se Y causa X. Conclusões deste
2 - é adimensional (não possui unidade) tipo demandam um modelo teórico
3 - representa a força da relação subjacente, além do valor da correlação.
linear entre 2 variáveis. A correlação entre 2 variáveis pode ser
4 - não fornece informações elevada por razões espúrias, ou pelo efeito
sobre causalidade (próximo slide). de uma terceira variável que foi omitida.

95 96

16
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2024 (parte 1) - Professor: Eduardo Lima Campos

Os 3 conceitos fundamentais da teoria


da probabilidade são os seguintes:
2.
1 - Experimento Aleatório
PROBABILIDADE 2 - Espaço Amostral
3 - Evento.
(CONCEITOS E
LEIS BÁSICAS) Cada um deles é apresentado
e exemplificado a seguir.
Notas de Aula - Professor Eduardo
Lima Campos.

97 98

Experimento Aleatório
Embora o resultado de um experimento
aleatório não possa ser pré-determinado,
Um experimento aleatório é uma ação
é possível descrever o conjunto dos
cujo resultado não pode ser previsto.
resultados que podem ocorrer.
Exemplos:
2.1 - Lançar um dado e observar a
Este conjunto é chamado
face que fica voltada para cima.
espaço amostral.
2.2 - Selecionar uma bolinha de uma urna com
bolinhas vermelhas e azuis e verificar sua cor. Notas de Aula - Professor Eduardo
Lima Campos.

99 100

Espaço Amostral Evento

O espaço amostral associado a um Um evento é um


experimento aleatório é o conjunto subconjunto do espaço amostral.
de todos os seus possíveis resultados.
No exemplo 2.1, alguns possíveis eventos são:
Notação: S. A = ´face par` = {2,4,6};
No exemplo 2.1 – S = {1,2,3,4,5,6}. B = ´face>3` = {4,5,6};
No exemplo 2.2 – S = {´azul`,´vermelha`}. C = ´face=2` = {2}.
Notas de Aula - Professor Eduardo
Lima Campos.

101 102

17
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2024 (parte 1) - Professor: Eduardo Lima Campos

Um evento ocorre quando o resultado do • União e Interseção de Eventos


experimento é um ponto que pertence a ele.

Exemplos com os eventos do slide anterior:


No exemplo 2.1, considere os eventos:
Se a face observada foi o 5,
dizemos que B ocorreu,
Se a face observada foi o 4, A: ´Face par` = {2,4,6}
dizemos que A e B ocorreram, B: ´Face > 3` = {4,5,6}

e assim por diante...


Notas de Aula - Professor Eduardo
Lima Campos.

103 104

O evento ´A ou B ocorre` é dado pela Probabilidade – Definição


união do evento A com o evento B.

AB = {2,4,5,6}.
Seja A um evento definido em um espaço
amostral S. A probabilidade de A, denotada
O evento ´A e B ocorrem` é dado pela por P(A), é uma função que satisfaz a 3
interseção do evento A com o evento B. Axiomas, os quais são apresentados a seguir.

AB = {4,6}.
Notas de Aula - Professor Eduardo
Lima Campos.

105 106

Propriedades da Probabilidade: • Eventos Especiais e suas Probabilidades


Axiomas da Probabilidade
O espaço amostral S é o evento
quanto mais perto de 1, maior a probabilidade de que A ocorra.
certo, cuja probabilidade é 1 (Axioma 2).
1) 0  P(A)  1, p/ todo A definido em S.
O conjunto  (vazio) é o evento
este é um evento
especial, chamado
impossível, cuja probabilidade é 0.
2) P(S) = 1. evento certo.
O evento composto de todos os pontos
não favoráveis a A é chamado evento
3) P(AB) = P(A) + P(B), se AB = .
complementar de A e denotado por Ac.
O Axioma 3 pode ser generalizado para mais de 2 eventos. Por exemplo,
P(ABC) = P(A)+P(B)+P(C), se os 3 pares possíveis têm interseções vazias.
Sua probabilidade é: P(Ac) = 1-P(A).

107 108

18
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2024 (parte 1) - Professor: Eduardo Lima Campos

Exemplo 2.3 - Seja o experimento: lançar 3


• Atribuição de Probabilidades moedas e observar as faces voltadas para cima.

Se os elementos do espaço amostral são Seja: ´CA` = cara e ´CO` = coroa.


todos equiprováveis, a probabilidade de
O espaço amostral associado
um evento A é obtida da seguinte forma:
a este experimento aleatório é:

casos favoráveis
S = {(CA,CA,CA);(CA,CA,CO);
#A (CA,CO,CA);(CO,CA,CA);(CA,CO,CO);
P( A) = ao evento A
(CO,CA,CO);(CO,CO,CA);(CO,CO,CO)},
#S casos possíveis
totalizando #S = 8 casos possíveis.

109 110

Seja o evento: A = ´2 caras`.


Obtenha a probabilidade de A. Obs - A abordagem anterior para obter
probabilidades é chamada clássica.
Solução:
A = {(CA,CA,CO);(CA,CO,CA);(CO,CA,CA)}
Existem duas outras abordagens, mas que por
#A = 3 casos favoráveis. enquanto não serão importantes para nós.
#A 3
P(A ) = = .
#S 8
Notas de Aula - Professor Eduardo
Lima Campos.

111 112

Lei da Adição Exemplo 2.4 - Um geólogo tem


(Probabilidade do ´OU`) informações sobre as probabilidades
Sejam A e B dois eventos, com interseção de encontrar petróleo em 2 terrenos
AB. Qual a probabilidade de AB? próximos. No primeiro terreno, há 30%
de probabilidade de achar petróleo. No
(ou seja, de que A ou B ocorram) segundo, 28%. A probabilidade de achar
A Lei da Adição fornece a solução deste petróleo em ambos os terrenos é de 24%.
problema, por meio da seguinte fórmula:
Qual a probabilidade de que se encontre
P(AB) = P(A) + P(B) - P(AB) petróleo em pelo menos um dos terrenos?
Notas de Aula - Professor Eduardo Notas de Aula - Professor Eduardo
Lima Campos. Lima Campos.

113 114

19
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2024 (parte 1) - Professor: Eduardo Lima Campos

Solução: Seja A = ´encontrar petróleo no Exemplo 2.4 (cont.) - Calcule a


primeiro terreno` e B = ´encontrar petróleo probabilidade de que não seja encontrado
no segundo terreno`. petróleo em nenhum dos dois terrenos.
Pede-se P(AB).
São dados no enunciado:
P(A) = 0,30, P(B) = 0,28
e P(AB) = 0,24.
Aplicando-se a Lei da Adição:
P(AB) = 0,30 + 0,28 – 0,24 = 0,34. R: 0,66.
Notas de Aula - Professor Eduardo
Lima Campos.

115 116

Exemplo 2.5 - Distribuição por sexo dos


Eventos Mutuamente Exclusivos funcionários promovidos em uma empresa:

2 eventos A e B são mutuamente


exclusivos (ou disjuntos) se a ocorrência Promovidos Não-Promovidos Total

de um impede a ocorrência do outro. Se B Masc. 46 184 230


ocorre, então A não ocorre, e vice-versa. Fem. 8 72 80
Total 54 256 310
Em outras palavras, são aqueles que não
possuem pontos em comum, ou seja:
AB = , o que implica P(AB) = 0. Responda as perguntas a seguir.
Notas de Aula - Professor Eduardo Notas de Aula - Professor Eduardo
Lima Campos. Lima Campos.

117 118

a) Qual a probabilidade de um funcionário ser b) Qual a probabilidade de um funcionário


do sexo masculino e ter sido promovido? do sexo masculino ter sido promovido?

Solução: sejam os eventos: A = ´ter sido


O que está sendo pedido é a
promovido` e B = ´ser do sexo masculino`.
probabilidade (condicional) de A
Diretamente da tabela, temos que 46 dado B, denotada por P(A|B).
indivíduos satisfazem ambas as condições.
Obs - Perceba a diferença entre P(A|B) e
Assim: P(AB) = 46/310 = 0,1483.
P(AB). Esta é uma confusão comum!
Notas de Aula - Professor Eduardo
Lima Campos.

119 120

20
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2024 (parte 1) - Professor: Eduardo Lima Campos

A idéia é que somente os casos favoráveis


ao evento condicionante (B = ´ser do sexo A probabilidade de A dado B
masculino`) passam a ser os casos possíveis. é, portanto, 46/230 = 0,2.

Promovidos Não-Promovidos Total


Se dividirmos numerador e denominador
Masc. 46 184 230 acima pelo total de funcionários (310),
Fem. 8 72 80 obtemos P(A|B) em função de P(AB)
Total 54 256 310 e P(B), conforme apresentado a seguir.
Notas de Aula - Professor Eduardo Notas de Aula - Professor Eduardo
Lima Campos. Lima Campos.

121 122

Probabilidade Condicional Exemplo 2.6 - Considere novamente


o exemplo 2.1, e sejam os eventos:

Sejam 2 eventos A e B, A: ´Face par` e B: ´Face > 3`.


tais que P(B)>0.
a) Calcule P(A|B).
A probabilidade de A dado B é:

P(A|B) = P(AB)/P(B). R: 2/3.

Notas de Aula - Professor Eduardo


Lima Campos.

123 124

Eventos Independentes Exemplo 2.6 (cont.) - b) A: ´face par` e


B: ´face > 3` são eventos independentes?
2 eventos são independentes se a
ocorrência de um não interfere na
R: não, pois P(A|B)  P(A).
probabilidade de ocorrência do outro.

Ou seja, se: Obs - Não confunda eventos


independentes com eventos
P(A|B) = P(A). mutuamente exclusivos!
Notas de Aula - Professor Eduardo Notas de Aula - Professor Eduardo
Lima Campos. Lima Campos.

125 126

21
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2024 (parte 1) - Professor: Eduardo Lima Campos

Exercício 2.1 - Em uma classe, os percentuais Solução:


de aprovados em álgebra e literatura são,
respectivamente, 75% e 84%. 63% são Sejam A = ´ter passado em álgebra`
aprovados em ambas as disciplinas. e B = ´ter passado em literatura`.
a) Qual a probabilidade de um aluno ter
passado em álgebra ou em literatura? a) P(AB) = P(A) + P(B) - P(AB)
= 0,75 + 0,84 – 0,63 = 0,96.
b) Se um aluno passou em literatura, qual a
probabilidade de ter passado em álgebra? b) P(A|B) = P(AB)/P(B) = 0,75.
c) Ter passado em álgebra e ter passado c) Sim, pois P(A|B) = P(A) = 0,75.
em literatura são eventos independentes?
Notas de Aula - Professor Eduardo Notas de Aula - Professor Eduardo
Lima Campos. Lima Campos.

127 128

Exemplo 2.7 - Seja uma urna com 8 Para revolver o problema, basta inverter a
bolinhas azuis e 4 vermelhas. 2 bolinhas fórmula da probabilidade condicional para
são selecionadas ao acaso desta urna. obter P(AB) como função de P(A|B) e
a) Qual a probabilidade de que a primeira P(B).
bolinha retirada da urna seja vermelha
e que a segunda seja azul? P(A|B) = P(AB)/P(B).
Seja A = segunda bolinha azul e
B = primeira bolinha vermelha.

P(AB) = P(A|B)P(B).
Queremos P(AB).
Notas de Aula - Professor Eduardo Notas de Aula - Professor Eduardo
Lima Campos. Lima Campos.

129 130

Lei da Multiplicação
(Probabilidade do ´E`) Solução do exemplo 2.7, item a:

Sejam A e B dois eventos, com P(B)>0. Qual A = segunda bolinha azul e B = primeira
a probabilidade de que A e B ocorram? bolinha vermelha. Do enunciado, temos
que: P(A|B) = 8/11 e P(B) = 4/12.
A Lei da Multiplicação fornece a solução
deste problema, por meio da fórmula a seguir:
Assim:
P(AB) = 8/33.
P(AB) = P(A|B)P(B)
Notas de Aula - Professor Eduardo
Lima Campos.

131 132

22
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2024 (parte 1) - Professor: Eduardo Lima Campos

Diagrama de Árvore: • Evento AB no Diagrama de Árvore:

P(A|B) A P(A|B) A

P(B) B P(B) B
P(Ac|B) Ac P(Ac|B) Ac

P(A|Bc) A P(A|Bc) A
P(Bc) P(Bc)
Bc Bc

P(Ac|Bc) Ac P(Ac|Bc) Ac
Notas de Aula - Professor Eduardo Notas de Aula - Professor Eduardo
Lima Campos. Lima Campos.

133 134

• Forma-Produto para Independência Exercício 2.2 - Sejam 2 eventos A e B


tais que P(A) = 0,3 e P(AB) = 0,5.
Vimos que, pela Lei da Multiplicação:
P(AB) = P(A|B)P(B). Determine o valor de P(B) se:

Por outro lado, vimos que 2 eventos A e B


a) A e B são mutuamente exclusivos.
são independentes se: P(A|B) = P(A).
b) A e B são independentes.

Pode-se concluir que A e B são


independentes se: P(AB) = P(A)P(B). Respostas: a) 0,2. b) 2/7.
Notas de Aula - Professor Eduardo
Lima Campos.

135 136

• Evento A no Diagrama de Árvore


Exemplo 2.7 (cont.)
P(A|B) A
b) Qual a probabilidade de que a segunda B
P(B)
bolinha selecionada seja azul?
P(Ac|B) Ac
Considere novamente:
P(A|Bc) A
A = segunda bolinha azul e P(Bc)
Bc
B = primeira bolinha vermelha.
P(Ac|Bc) Ac
Notas de Aula - Professor Eduardo Notas de Aula - Professor Eduardo
Lima Campos. Lima Campos.

137 138

23
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2024 (parte 1) - Professor: Eduardo Lima Campos

Lei da Probabilidade Total Solução do exemplo 2.7, item b:

Sejam A e B dois eventos, em que A Do enunciado, temos que:


possa ocorrer condicionado a B ou a Bc. P(A|B) = 8/11, P(B) = 4/12,
A probabilidade “total” do evento A pode P(A|Bc) = 7/11 e P(Bc) = 8/12.
ser calculada por meio da seguinte fórmula:

Assim:
P(A) = P(A|B)P(B) + P(A|Bc)P(Bc) P(A) = 2/3.
Notas de Aula - Professor Eduardo Notas de Aula - Professor Eduardo
Lima Campos. Lima Campos.

139 140

a) Qual a probabilidade de que a concorrente


Exemplo 2.8 - A empresa X lança uma
introduza rota semelhante e que, ainda assim,
nova rota de escoamento de diesel. Ela
a rota seja lucrativa para a empresa X?
calcula que esta nova rota gera lucro no
primeiro ano com probabilidade 0,6, caso a b) Qual a probabilidade de que a nova
concorrente não introduza rota semelhante. rota seja lucrativa para a empresa X?
Caso contrário, a probabilidade de lucro
é 0,3. Suponha ainda que exista 50% de
chances de que a concorrente introduza c) Qual a probabilidade de que a nova
uma rota semelhante naquele ano. rota seja lucrativa para a empresa X ou a
concorrente introduza rota semelhante?

141 142

Uma dica aqui é começar identificando Solução:


os possíveis eventos de interesse, e as a) Pela Lei da Multiplicação, temos que:
probabilidades fornecidas no enunciado: P(AB) = P(A|B)P(B) = 0,3*0,5 = 0,15.

A: ´rota é lucrativa p/ a empresa X` b) Pela Lei da Probabilidade Total:


B: ´concorrente introduz rota semelhante`. P(A) = P(A|B)P(B) + P(A|Bc)P(Bc)
= 0,3*0,5 + 0,6*0,5 = 0,45.
São fornecidas no enunciado
as seguintes probabilidades: c) Pela Lei da Adição:
P(A|B) = 0,3; P(A|Bc) = 0,6 e P(B) = 0,5. P(AB) = P(A) + P(B) – P(AB)
= 0,45 + 0,5 – 0,15 = 0,8.

143 144

24
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2024 (parte 1) - Professor: Eduardo Lima Campos

Exemplo 2.9 - 2 máquinas (M1 e M2) são


Um item é selecionado aleatoriamente.
usadas para fabricar o mesmo tipo de item.
Suponha que:
60% dos itens tenham sido fabricados por M1,
a) Qual a probabilidade de
40% dos itens tenham sido fabricados por M2, que ele seja defeituoso?
e que:
1% dos itens fabricados por M1 têm defeito,
2% dos itens fabricados por M2 têm defeito.
Notas de Aula - Professor Eduardo Notas de Aula - Professor Eduardo
Lima Campos. Lima Campos.

145 146

Os eventos de interesse são: Solução do item a:


Sejam A = ´ser defeituoso` e
B = ´ter sido produzido por M1`. Pede-se P(A)

São fornecidas no enunciado Aplicando a Lei da Probabilidade Total:


as seguintes probabilidades:
P(B) = 0,6, P(Bc) = 0,4, P(A) = P(A|B)P(B) + P(A|Bc)P(Bc)
P(A|B) = 0,01 e P(A|Bc) = 0,02. = 0,01*0,6 + 0,02*0,4 = 0,014.
Notas de Aula - Professor Eduardo Notas de Aula - Professor Eduardo
Lima Campos. Lima Campos.

147 148

Solução do item b: pede-se P(B|A), que


pode ser obtida da seguinte forma:

b) Se (= dado que) o item selecionado P(B|A) = P(AB)/P(A)


é defeituoso, qual a probabilidade de = P(A|B)P(B)/P(A)
que ele tenha sido produzido por M1?
= 0,01*0,6/0,014 = 0,429.

A fórmula acima, que permite obter P(B|A) a


partir de P(A|B) é chamada Teorema de Bayes.
Notas de Aula - Professor Eduardo Notas de Aula - Professor Eduardo
Lima Campos. Lima Campos.

149 150

25
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2024 (parte 1) - Professor: Eduardo Lima Campos

Exemplo 2.10 - Um candidato que


Teorema de Bayes cursou o MFEE tem probabilidade 0,9
de ser selecionado para uma vaga em
Sejam A e B eventos definidos em S, sendo um cargo gerencial. Caso contrário,
A dependente de B, na sequência: B  A. esta probabilidade é de apenas 0,3.
O Teorema de Bayes (p/ 2 eventos) se ocupa 70% dos candidatos cursaram o MFEE.
da sequência reversa: A  B, fornecendo:
obtida a) Calcule a probabilidade de que um candidato
P(A | B)P(B)
P(B | A) = . pela Lei da
Probabilidade
ao acaso seja selecionado para a vaga.
P(A) Total
Notas de Aula - Professor Eduardo
Lima Campos.

151 152

Os eventos de interesse são: Solução do Item a:

A = ´ser selecionado`
B = ´ter cursado o MFEE`. Pede-se P(A).

São fornecidas no enunciado Aplicando a Lei da Probabilidade Total:


as seguintes probabilidades:

P(A|B) = 0,9, P(A|Bc) = 0,3 e P(B) = 0,7. P(A) = P(A|B)P(B) + P(A|Bc)P(Bc)


= 0,9*0,7 + 0,3*0,3 = 0,72.
Notas de Aula - Professor Eduardo Notas de Aula - Professor Eduardo
Lima Campos. Lima Campos.

153 154

Solução do Item b:
Exemplo 2.10 (cont.)

Pede-se P(B|A)
b) Se um candidato foi selecionado
para a vaga, qual a probabilidade P(B|A) = P(A|B)P(B)/P(A)
de que ele tenha cursado o MFEE?
= 0,9*0,7/0,72 = 0,875.

O Teorema de Bayes pode ser ampliado


para mais de 2 Eventos, fazendo, por
exemplo: B1, B2 e B3, ao invés de B e Bc.
Notas de Aula - Professor Eduardo
Lima Campos.

155 156

26
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2024 (parte 1) - Professor: Eduardo Lima Campos

• Teorema de Bayes para 3 Eventos


Uma fonte é selecionada
aleatoriamente.
Exemplo 2.11 - Em um país existem 3
fontes de energia renováveis: geotérmica, a) Qual a probabilidade de que
eólica e solar. Estas fontes podem ocupar seja uma fonte primária?
papéis primários ou secundários. Sabemos
que 20% das fontes são geotérmicas, 30%
são eólicas e 50% são solares. 1% do total b) Dado que é primária, qual a
de geotérmicas, 2% do total de eólicas probabilidade de que seja eólica?
e 3% do total de solares são primárias.

157 158

Os eventos de interesse são: Solução do Item a - Ampliando a Lei


da Probabilidade Total para 3 eventos:
A = ser primária
B1 = ser geotérmica P(A) = P(A|B1)P(B1) + P(A|B2)P(B2) +
B2 = ser eólica P(A| B3)P(B3) = 0,01*0,2 + 0,02*0,3 +
B3 = ser solar 0,03*0,5 = 0,002 + 0,006 + 0,015 = 0,023.

e são fornecidas no enunciado Solução do Item b:


as seguintes probabilidades:

P(B1) = 0,2, P(B2) = 0,3, P(B3) = 0,5, P(B2|A) = P(A|B2)P(B2)/P(A)


P(A|B1) = 0,01, P(A|B2) = 0,02, P(A|B3) = 0,03. = 0,02*0,3/0,023 = 0,2609.

159 160

Variável Aleatória (V.A.)

Uma variável aleatória (v.a.) é uma


3. VARIÁVEIS representação numérica dos resultados
possíveis de um experimento aleatório.
ALEATÓRIAS
Exemplo 3.1 - Seja o experimento
do exemplo 2.3 (lançar três moedas
e observar o número de caras). A v.a.
adequada é: X = número de caras observadas.
161 162

27
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2024 (parte 1) - Professor: Eduardo Lima Campos

S (espaço amostral): Valores de X: • V.A.`s Discretas x Contínuas


(CO,CO,CO) 0
(CA,CO,CO) A v.a. do exemplo anterior
assume valores contáveis.
(CO,CA,CO) 1
(CO,CO,CA)
Este tipo de v.a. é chamada discreta.
(CA,CA,CO) 2
(CA,CO,CA)
Uma v.a. que assuma valores em um
(CO,CA,CA) 3
intervalo contínuo é chamada contínua.
(CA,CA,CA)

163 164

• Distribuição de Probabilidade Distribuição de


Probabilidade Discreta
Representa como as probabilidades
distribuem-se de acordo com os valores de X. É uma função P(X=x) que associa,
a cada valor possível x de uma v.a.
Notação: discreta X, a sua probabilidade.

Para a v.a. em si → X (maiúscula). Propriedades de uma distribuição discreta:


1) P(X = x )  0, x
Para os valores de X → x (minúscula).
2)  P(X = x ) = 1
x

165 166

Exemplo 3.2 - Na situação do exemplo 3.1, Distribuição de Probabilidade


qual a distribuição de probabilidade de X? Contínua (Função de Densidade)
Solução - a distribuição de probabilidade de X é: Uma distribuição contínua f(x) é
uma função que permite calcular
x P(X=x)
a probabilidade de que uma v.a.
0 1/8 contínua pertença a um intervalo.
1 3/8
2 3/8 P(aXb) é a área sob o gráfico de f(x)
3 1/8 que corresponde ao intervalo [a,b].

167 168

28
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2024 (parte 1) - Professor: Eduardo Lima Campos

Exemplo 3.3 - Seja X = peso de um


Propriedades de uma função de densidade:
carregamento em Kg, com distribuição:

f(x) O cálculo desta área 1) f(x)  0, para todo x.


envolve uma integral:
8.000

 f ( x )dx
6.000
2) A área total sob o gráfico é igual a 1.

3) P(X=x) = 0, para todo x.

x
A figura mostra: P(6.000X8.000).

169 170

Exemplo 3.4 - O consumo diário de


energia elétrica de uma localidade, em
Valor Esperado de uma V.A.
MWh, apresenta a seguinte distribuição:
O valor esperado de uma v.a. X, E(X),
f(x) = cx2, 0<x<2. é a média dos valores que X assumiria
em infinitas repetições do experimento.
a) Qual o valor da constante c?
Você tem que igualar a integral a 1.
Fórmula para o caso discreto:
E(X) =  xP(X = x).
b) Calcule P(X>1) (e interprete).
R: a) 3/8 b) 7/8. x

171 172

Exemplo 3.5 - Considere a distribuição: Observações:


P(X=0) = 1/2
1 - E(X) é também chamado média de X.
P(X=1) = 1/3
P(X=2) = 1/6. 2 - E(X) não é um valor que se espera que
ocorra, podendo ser (e em geral é) um
Calcule o valor esperado de X. valor que não ocorre, como neste caso!
Solução: 3 - E(X) pode ser interpretado como o
E(X) = 0*1/2 + 1*1/3 + 2*1/6 = 2/3. ponto de equilíbrio da distribuição, em
que as probabilidades são os pesos.

173 174

29
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2024 (parte 1) - Professor: Eduardo Lima Campos

Exemplo 3.6 - Um investimento de risco Solução:


oferece, em um ano, rentabilidade de 10%
com probabilidade 0,4 e rentabilidade de O retorno de (- 4)% ocorre com
-4% com probabilidade 0,6. probabilidade 0,6.
O retorno de 10% ocorre com
Qual a rentabilidade esperada ao final probabilidade 0,4.
do ano? O investimento compensa?
O retorno esperado é: (- 4)*0,6 + 10*0,4
= 1,6%, bem inferior, por exemplo,
Obs - trata-se de um investimento,
à rentabilidade anual da poupança.
de tal forma que é imprescindível
Portanto, o investimento não compensa.
considerar o custo de oportunidade.

175 176

Fórmula do valor esperado para o caso contínuo:


E(X) =  x f ( x )dx. No R:

Exemplo 3.7 - Calcule E(X), f <- function(x) {x*(3/8)*x^2}


sendo X a v.a. definida no exemplo 3.4.
RESULT <- integrate(f,0,2)
2
3
E (X) =  x x 2 dx = f(x)
0 8 RESULT$value
4 2
32 3 3x 3
 x dx = = .
80 8 4 0
2

177 178

• Moda de uma V.A. Exemplo 3.7 - Calcule a mediana


da v.a. definida no exemplo 3.4.
No caso discreto, é o valor que ocorre com
maior probabilidade. No caso contínuo, é
definida como x tal que f(x) seja máxima. Solução:

• Mediana de uma V.A.


k3 2 3k 2
 x dx = 0,5   x dx = 0,5 
08 80
É o valor que divide a distribuição em 2 3
k
intervalos com probabilidades iguais (0,5). = 0,5  k 3 = 4  k = 3 4.
8
No caso contínuo, divide f(x) em 2 áreas iguais.

179 180

30
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2024 (parte 1) - Professor: Eduardo Lima Campos

Exemplo 3.4
Por qual dos projetos você optaria?
Exemplo 3.8 - O retorno de um projeto
depende da conjuntura macroeconômica. Se soubéssemos ao certo o que ocorrerá
Dois projetos X e Y são avaliados sob no futuro, a decisão seria imediata:
3 cenários, em relação ao seu retorno:
Sob os cenários I ou II, escolhemos X.
Cenário  Retorno X  Retorno Y  Sob o cenário III, escolhemos Y.
I R$ 50.000 R$ 0
II R$ 150.000 R$ 100.000
III R$ 200.000 R$ 300.000 No entanto, o cenário futuro
não é conhecido com certeza!

181 182

A decisão, portanto, deve se basear no Seguem os cálculos necessários:


retorno esperado de cada projeto.
E(X) = 50.000*0,2 + 150.000*0,5 +
Para isto, definam-se variáveis aleatórias X 200.000*0,3 = 145.000;
e Y, representando os retornos dos projetos.
Adicionalmente, sejam as seguintes E(Y) = 0*0,2 + 100.000*0,5 +
probabilidades associadas a cada cenário: 300.000*0,3 = 140.000.

P(Cenário I) = 0.2;
P(Cenário II) = 0,5; Conclusão: o projeto X será escolhido.
P(Cenário III) = 0.3.

183 184

Obs - valor esperado x risco Obs - valor esperado x risco


No exercício anterior, qual importante
Ao avaliar decisões sob diferentes cenários,
dimensão do problema foi ignorada?
é imprescindível avaliar o risco associado.
Por exemplo, pense sobre qual seria sua
decisão se o cenário fosse o seguinte: Medidas de dispersão são adequadas para
isso, e portanto é fundamental defini-las
Cenário  Retorno X  Retorno Y  no contexto de variáveis aleatórias.
I R$ -500.000 R$ 0
II R$ 220.000 R$ 100.000 Passamos a falar da variância, desvio padrão
e coeficiente de variação de uma V.A..
III R$ 450.000 R$ 300.000

185 186

31
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2024 (parte 1) - Professor: Eduardo Lima Campos

Exemplo 3.9 - Calcule V(X),


Variância de uma V.A. sendo X a v.a. definida no exemplo 3.5.

A variância V(X) de uma v.a. X Solução:


é o valor esperado de [X-E(X)]2.

A variância costuma ser obtida mediante a


E(X2) = 02*1/2 + 12*1/3 + 22*1/6 = 1.
forma equivalente: V(X) = E(X2) - E2(X)
E(X 2 ) =  x 2 P(X = x ), no caso discreto
x V(X) = E(X2) - E2(X) = 1-(2/3)2 = 1 - 4/9 = 5/9.
e E(X ) =  x f(x) dx , no caso contínuo.
2 2

187 188

Exemplo 3.10 - Calcule V(X),


sendo X a v.a. definida no exemplo 3.4. No R:
2 f(x)
3 f <- function(x) {(x^2)*(3/8)*(x^2)}
E(X ) =  x x 2 dx =
2 2

0 8
2
RESULT = integrate(f, 0, 2)
32 4 3 x5 12
 x dx = = . RESULT$value - (3/2)^2
80 8 5 0 5
2
12  3  3
V(X) = E(X ) − E (X) = −   = .
2 2

5 2 20

189 190

• Desvio Padrão de uma V.A. • Algumas Propriedades Importantes


do Valor Esperado e da Variância
É a raiz quadrada de V(X):
(1) Se b é uma constante, e Y = b:
DP(X) = V(X) E(Y) = b e V(Y) = 0.

(2) Se a é uma constante, e Y = aX:


• Coeficiente de Variação de uma V.A. E(Y) = aE(X) e V(Y) = a2V(X).
DP ( X )
CV (X ) = . (3) Se a e b são constantes, e Y = aX + b:
E(X)
E(Y) = aE(X) + b e V(Y) = a2V(X).

191 192

32
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2024 (parte 1) - Professor: Eduardo Lima Campos

Exemplo 3.11 - Seja um produto importado


Solução do item a:
cujo preço, em dólares, apresenta, ao longo
de um período, média 80 e desvio padrão 8.
a) Seja X o preço do produto em dólares.
Então: E(X) = 80, DP(X) = 8 e V(X) = 64.
a) Se a taxa de câmbio for 2 R$/Dólar,
calcule o valor esperado, a variância, Seja Y o preço do produto em R$.
o desvio padrão e o CV do preço em R$.
Então: Y = 2X. Logo, E(Y) = 2E(X) =
b) Se o preço do produto aumenta 10 dólares,
R$ 160, V(Y) = 22V(X) = 4*64 = 256 R$2,
calcule a média, a variância, o desvio padrão
DP(Y) = R$ 16 e CV(Y) = 16/160 = 0,1 = 10%.
e o CV do preço (em dólares), após o aumento.

193 194

Solução do item b: • Padronizando uma V.A.

Seja X uma v.a. tal que E(X) =  e


b) Seja Z o preço em dólares após o V(X) = 2. Seja Z = (X-)/. Então:
aumento. Então: Z = X + 10.
E(Z) = 0 e V(Z) = 1.
Logo, E(Z) = E(X) + 10 = 90 dólares,
V(Z) = V(X) = 64 dólares2, DP(Z) = Isto se chama padronizar a v.a. X (ou seja,
8 dólares e CV(Z) = 8/90 = 8,88%. transformá-la em uma nova v.a., chamada
de Z, que possui média zero e variância 1).

195 196

Demonstração:
Função de Distribuição
(Acumulada)
Z pode ser escrito da seguinte forma:
aX+b, sendo a = 1/ e b = -/.
Função F(x) que associa, a cada valor
Agora basta usar as propriedades: x, a probabilidade de que X seja
E(aX+b) = aE(X) + b e V(aX+b) = a2V(X). menor ou igual a x, isto é: P(Xx).

Assim:
Exemplo 3.12 - Ache F(x) para a v.a. do
E(Z) = E(X)/ - / = 0 e exemplo 3.5 (relembrando a distribuição:
V(Z) = (1/)2V(X) = 1, C.Q.D.. P(X=0) = 1/2, P(X=1) = 1/3, P(X=2) = 1/6).

197 198

33
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2024 (parte 1) - Professor: Eduardo Lima Campos

Exemplo 3.13 - Considere a distribuição de


Solução:
probabilidade: f(x) = 2x, 0<x<1. Ache F(x).

Para x < 0, F(x) = 0. Solução:

Para 0  x < 1, F(x) = 1/2. Para x < 0, F(x) = 0.

Para 1  x < 2, F(x) = 1/2 + 1/3 = 5/6. Para 0  x < 1:


x x
F( x ) = P(X  x ) =  f ( x )dx =  2xdx = x 2 .
Para x  2, F(x) = 1/2 + 1/3 + 1/6 = 1. 0 0

Para x  1, F(x) = 1.

199 200

Propriedades de F(x): Exercício 3.1 - Considere a seguinte


função de distribuição acumulada:
1. Lim F( x ) = 0 e Lim F( x ) = 1.
x → − x →

2. No caso discreto, F(x) é contínua à F(x) = 0, x < 0.


direita. No caso contínuo, é contínua. F(x) = 1-e-x, x  0.
3. No caso contínuo, é possível, a partir
da f.d.a., obter a função de densidade f(x) Ache f(x).
original, derivando F(x) com respeito a x:
dF( x ) R: f(x) = e-x, x  0.
f (x) = .
dx

201 202

• Distribuição Uniforme Discreta


É a distribuição discreta mais simples
possível. Considera que todos os valores
de X possuem a mesma probabilidade:
4. DISTRIBUIÇOES 1
P(X = x ) = , x = 1, 2, ..., k.
DISCRETAS k

Exemplo 4.1 - No lançamento de um dado,


a v.a. que representa a face voltada para
cima segue distribuição uniforme discreta.

203 204

34
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2024 (parte 1) - Professor: Eduardo Lima Campos

• Distribuição de Bernoulli
Um dos resultados é chamado
Experimento de Bernoulli é um “sucesso”, e o outro, “fracasso”.
experimento aleatório que possui
apenas dois resultados possíveis.
A probabilidade de sucesso
é designada por p.
Exemplos:
4.2 - Lançar uma moeda e Como consequência, a
observar a face voltada para cima. probabilidade de fracasso é 1-p.
4.3 - Observar se um atirador acerta o alvo. .

205 206

Seja agora uma v.a. X que assume valor Fórmula da Distribuição de Bernoulli:
0, se ocorre um fracasso, e 1, se ocorre
um sucesso. A distribuição desta v.a. é:

x P(X=x) P(X=x) = px(1-p)1-x, x = 0,1; 0<p<1.


0 1-p
1 p
Notação usual: X ~ Bernoulli(p).
A distribuição acima é chamada o “~” significa
distribuição de Bernoulli. “segue distribuição”

207 208

• Distribuição Binomial Exemplo 4.4 - Ao lançar 3 moedas, qual


a probabilidade de obtermos 2 caras?
Sejam agora n realizações independentes
de experimentos de Bernoulli com a Façamos:
mesma probabilidade de sucesso p. {CA} = sucesso e {CO} = fracasso.

Considere que estejamos interessados


no número de sucessos observados. Neste problema, a v.a. X de interesse
representa o número de sucessos (caras).

209 210

35
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2024 (parte 1) - Professor: Eduardo Lima Campos

Fórmula da Distribuição Binomial:


A distribuição da v.a. que representa o número
de sucessos em n realizações independentes de
n x
P(X = x) =   p (1 − p) , x = 0,1,..., n; 0  p  1.
n −x
experimentos de Bernoulli, todos com mesma
probabilidade de sucesso p, chama-se binomial.  
x

probabilidade de
n! obter x sucessos
n (número de realizações) e p (probabilidade = . em n realizações
x!(n − x )!
de sucesso) são os parâmetros da distribuição. independentes

Notação usual: X ~ Bin(n,p).

211 212

Solução:
Exemplo 4.5 - Qual a probabilidade de
que um atirador acerte o alvo 3 vezes em 5 A v.a. de interesse é:
tentativas, se a probabilidade dele acertar X = número de acertos.
um tiro em uma tentativa qualquer é 2/3?

Se considerarmos que as tentativas são


independentes, então: X ~ Bin(5,2/3).

Daí:

213 214

Valor Esperado e Variância da Binomial:


 5  2   1 
3 2

P(X = 3) =      = 0,3292.


 3  3   3  E(X) = np
V(X) = np(1-p)
No R:

P(X=3) = dbinom(3,5,2/3)
Exemplo 4.5 (cont.) - Calcule o valor
esperado do número de acertos do atirador.

215 216

36
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2024 (parte 1) - Professor: Eduardo Lima Campos

Exercício 4.1 - Considere um exame Solução:


com 20 questões de múltipla escolha,
cada uma com 5 alternativas. Se um A v.a. de interesse é: X = número de acertos.
aluno que não estudou nada resolve
“chutar” todas as respostas: Logo: X ~ Bin(20;0,2). Daí:

 20 
P(X = 6) =  (0,2 ) (0,8) = 0,1091.
a) Qual é a probabilidade de que acerte 6 14
30% da prova (isto é, 6 questões)?  
6

217 218

b) Qual é a probabilidade de que acerte


c) Qual o valor esperado do número de
pelo menos 30% da prova (6 questões)?
questões que o aluno acerta?
No R:
a) P(X=6) = dbinom(6,20,0.2)
b) P(X6) =1-P(X5) = 1-F(5) =
1-pbinom(5,20,0.2) = 0,1958. R: E(X) = np = 20*0,2 = 4.
Comandos no Excel:
a) distr.binom(x;n;p;0) = Note que, neste caso, o resultado foi um
distr.binom(6;20;0.2;0) número observável (por mero acaso!).
b) distr.binom(x;n;p;1) =
distr.binom(6;20;0.2;1)
219 220

• Distribuição Hipergeométrica
Em princípio, poderíamos pensar na
extração de cada bolinha como um
Exemplo 4.6 - Considere 4 extrações sem experimento de Bernoulli, e a v.a. X de
reposição de bolinhas, de uma urna que interesse (número de bolinhas azuis na
contém 8 bolinhas azuis e 5 vermelhas. amostra) seguindo distribuição binomial.

Calcule a probabilidade de que 3 sejam azuis. Pergunta: o que nos impede de fazer isto?

221 222

37
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2024 (parte 1) - Professor: Eduardo Lima Campos

De forma geral, considere uma população


Resposta: (no exemplo, urna) com N elementos
(no exemplo, bolinhas), dentre os quais
temos r sucessos (no exemplo, ser azul).
A amostragem é sem reposição, o que faz
com que sucessivas extrações sejam Seja então uma amostra de
dependentes e as probabilidades de tamanho n, obtida sem reposição.
sucesso mudem a cada extração.
Qual é a probabilidade de que tenhamos
exatamente x sucessos nesta amostra?

223 224

Fórmula da Distribuição Hipergeométrica:


A distribuição da v.a. que representa o
número de sucessos na amostra chama-
se hipergeométrica, c/ parâmetros N, r e n.  r  N − r 
  
 x  n − x 
P(X = x ) = .
 N
 
Para obter a fórmula da distribuição n
hipergeométrica é só fazer: P(A) = #A/#S
(casos favoráveis sobre casos possíveis). probabilidade de que ocorram x sucessos, em
uma amostra sem reposição de tamanho n.

225 226

Solução do exemplo 4.6:


Notação usual: X ~ Hiper(N,r,n).
Seja X o número bolas azuis
No R: na amostra de tamanho 4. Então:

P(X=x) = dhyper(x,r,N-r,n)  8 13 − 8   8  5 


     
P(Xx) = F(x) = phyper(x,r,N-r,n)  3  4 − 3   3  1 
P(X = 3) = = = 0,3916.
13  13 
No Excel:    
4 4
P(X=x) = DIST.HIPERGEOM.N(x;n;r;N;0)
P(Xx) = DIST.HIPERGEOM.N(x;n;r;N;1) No R: P(X=3) = dhyper(3,8,5,4)

227 228

38
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2024 (parte 1) - Professor: Eduardo Lima Campos

Solução:
Exercício 4.2
Seja X o número de peças defeituosas
na amostra de tamanho 5. Então:
Considere um lote de 10 peças, das quais  4  6 
4 são defeituosas. Se extrairmos 5 peças,   
P(X = 2) =    = 0,4762.
2 3
sem reposição, qual a probabilidade de
que 2 sejam defeituosas? 10 
 
5

No R: P(X=2) = dhyper(2,4,6,5)

229 230

Exemplo 4.7 - Para tentar passar pela


alfândega, um traficante esconde 5 pílulas
de narcóticos em um vidro que contém Solução: seja X = número de pílulas
10 pílulas de aspirina. O fiscal fica de narcóticos na amostra. Que valores X tem
desconfiado, e decide tomar uma amostra que assumir para que o traficante seja preso?
de 4 pílulas, para inspeção. Qual a
probabilidade do traficante ser preso?

231 232

O traficante é preso se X1. Mas P(X1) = Valor Esperado e Variância


1-P(X=0), sendo P(X=0) calculada a seguir: da Hipergeométrica:
 5 10 
  
P(X = 0) =    = 0,1539.
0 4 r
E( X ) = n
15  N
 
4  r  r  N − n 
V(X) = n  1 −  
Logo: P(X1) = 1 – 0,1539 = 0,8461.  N  N  N − 1 

No R: P(X1) = 1-dhyper(0,5,10,4).

233 234

39
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2024 (parte 1) - Professor: Eduardo Lima Campos

• Aproximação da
Hipergeométrica pela Binomial

Exemplo 4.7 (cont.) - Se lhe perguntassem


Se N é muito maior do que n (N  20n),
o que é “esperado” que aconteça com o
a distribuição hipergeométrica pode ser
traficante, como você responderia, à luz
aproximada pela distribuição binomial
dos seus conhecimentos de estatística?
(cujas probabilidades são mais simples
de calcular), com parâmetros n e p = r/N.

235 236

Exemplo 4.8 - Em uma eleição, suponha Solução: A probabilidade exata seria


que 300 dos 1000 habitantes de um calculada da seguinte forma:
município são eleitores de um candidato  300  700 
A. Toma-se uma amostra de 10 eleitores.   
 5  5 
P(X = 5) = .
1000
Qual a probabilidade de que exatamente 5  
 10 
deles pretendam votar no candidato A?
Note que as combinações envolvidas
são bastante chatas de se calcular...
No R: P(X=5) = dhyper(5,300,700,10) = 0,1026
237 238

• Distribuição Geométrica
A probabilidade aproximada pode ser calculada
utilizando a distribuição binomial, Considere, como na definição da
com n = 10 e p = 300/1000 = 0,3. Binomial, realizações independentes
de experimentos de Bernoulli, todos
10 
P(X = 5)   (0,3) 5 (0,7) 5 = 0,1029. com mesma probabilidade de sucesso p.
5
A distribuição da v.a. que representa
No R: P(X=5)  dbinom(5,10,0.3) o número de realizações necessárias
até que ocorra o primeiro sucesso
Compare com o resultado exato! chama-se geométrica, com parâmetro p.

239 240

40
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2024 (parte 1) - Professor: Eduardo Lima Campos

Fórmula da Distribuição Notação: X ~ Geom(p).


Geométrica:
No R:
P(X = x ) = (1 − p) x −1 p, x = 1,2,...; 0  p  1.
P(X=x) = ((1-p)^(x-1))*p
probabilidade de que o primeiro sucesso
venha a ocorrer na x-ésima realização. ou:

Parâmetro: p. P(X=x) = dgeom(x-1,p)


P(Xx) = F(x) = pgeom(x-1,p)

241 242

Exemplo 4.9 - A probabilidade de um


indivíduo acertar um alvo é 2/3. Se ele No R:
deve atirar até que acerte o alvo pela P(X=5) = dgeom(4,2/3)
primeira vez, qual a probabilidade de
que sejam necessários exatamente 5 tiros?
No Excel:
Solução: Seja X o número de tiros até o
P(X=x) = DIST.BIN.NEG.N(x-1;1;p;0)
primeiro acerto. Então: X ~ Geom(2/3). = DIST.BIN.NEG.N(4;1;2/3;0)
4
 2 2 P(Xx) = DIST.BIN.NEG.N(x-1;1;p;1)
P(X = 5) = 1 −    = 0,0082.
 3 3

243 244

Valor Esperado e Variância da Geométrica:


Exercício 4.3 - Um jogador converte
10% dos pênaltis que cobra.

E(X) = 1/p a) Qual a probabilidade de que ele acerte


apenas uma cobrança em 5 tentativas?
V(X) = (1-p)/p2

b) Qual a probabilidade de que ele precise


bater 5 pênaltis até acertar o primeiro?
No exemplo 4.9, qual o número de tiros
esperado até que ocorra o primeiro acerto?

245 246

41
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2024 (parte 1) - Professor: Eduardo Lima Campos

Solução:
b) Seja X o número de cobranças até que
a) Seja X o número de pênaltis o jogador acerte a primeira. Então:
que o jogador acerta. Então: X ~ Geom(0,1).
X ~ Bin(5;0,1).
Pede-se:
Pede-se P(X=1).
P(X = 5) = (0,9) 4 (0,1) = 0,06561.
 5
P(X = 1) =  (0,1)1 (0,9) 4 = 0,32805.
1

247 248

Exemplo motivador para a próxima • Distribuição Binomial Negativa


distribuição a ser apresentada: Considere novamente realizações
independentes de experimentos de
Bernoulli com probabilidade de sucesso p.
Exemplo 4.10 - Na situação do exemplo A distribuição da v.a. que representa o número
4.9, calcule a probabilidade de que o de realizações necessárias até que ocorra o
atirador precise de 4 tiros para acertar pela r-ésimo sucesso (r = 1, 2, 3, ...) chama-se
segunda vez o alvo (ou seja, de que o binomial negativa, com parâmetros r e p.
segundo acerto ocorra no quarto tiro).
Se r = 1, caímos na distribuição
geométrica (caso particular).

249 250

Fórmula da Distribuição Notação usual: X ~ BNeg(r,p).


Binomial Negativa:
No R:
 x − 1 P(X=x) = dnbinom(x-r,r,p)
P(X = x ) =  (1 − p) x − r p r , x = r, r + 1,...; 0  p  1.
 r − 1  P(Xx) = F(x) = pnbinom(x-r,r,p)
probabilidade de que o r-ésimo
Obs - dnbinom(x-1,1,p) = dgeom(x-1,p)
sucesso venha a ocorrer na x-
ésima realização. No Excel:
P(X=x) = DIST.BIN.NEG.N(x-r;r;p;0)
Parâmetros: r e p. P(Xx) = DIST.BIN.NEG.N(x-r;r;p;1)

251 252

42
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2024 (parte 1) - Professor: Eduardo Lima Campos

Solução do exemplo 4.10:


• Distribuição de Poisson
Se X é o número de tentativas até o
segundo sucesso, então X ~ BNeg(2,2/3) e: Seja  a taxa de ocorrência de um evento
por unidade de tempo ou de espaço. Por
 3  2   2 
2 2

P(X = 4) =  1 −    = 0,1481. exemplo, acidentes/hora em uma estrada.


 1  3   3 
No R: P(X=4) = dnbinom(2,2,2/3). A distribuição da v.a. que representa
o número de ocorrências de um evento
Valor Esperado e Variância da Binomial Negativa:
com taxa , no intervalo correspondente,
E(X) = r/p e V(X) = r(1-p)/p2 chama-se Poisson, com parâmetro .

253 254

Fórmula da Distribuição de Notação usual: X ~ Poi().


Poisson:
No R:
x e −  P(X=x) = dpois(x,)
P(X = x ) = , x = 0,1,...;   0. P(Xx) = F(x) = ppois(x,)
x!
No Excel:
probabilidade de que ocorram x P(X=x) = DIST.POISSON(x;;0)
eventos, em um intervalo no qual P(Xx) = DIST.POISSON(x;;1)
ocorrem, em média,  eventos
Valor Esperado e Variância da Poisson:
Parâmetro: . E(X) =  e V(X) = 

255 256

Exemplo 4.11 - Em determinada rodovia, Solução:


ocorrem, em média, 3 acidentes por hora.
32 e −3
a ) P ( X = 2) = = 4,5e −3 .
2!
Supondo distribuição de Poisson,
calcule as seguintes probabilidades: b) Aqui deve - se converter o  para o período de
20 minutos (= 1/3 de hora)  se ocorrem, em média,
a) De que ocorram 2 acidentes em uma hora. 3 acidentes em uma hora, então ocorre em média 1 a
b) De que ocorram pelo menos 2 acidentes cada 20 minutos. Assim, o  para 20 minutos é 1, e :
em 20 minutos (20 minutos = 1/3 de hora).
P(X  2) = 1 − [P(X = 0) + P(X = 1)] = 1 − 2e −1.

257 258

43
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2024 (parte 1) - Professor: Eduardo Lima Campos

• Aproximação da Binomial pela Poisson


No R:

a) P(X=2) = dpois(2,3). Se n for grande e p for pequeno, o


número de sucessos em n realizações
independentes de experimentos de
b) P(X≥ 2) = 1- P(X1) = Bernoulli pode ser aproximado pela
1 - F(1) =1 - ppois(1,1). distribuição de Poisson, com  = np.

259 260

Solução exata:
Exemplo 4.12 - Uma companhia de
seguros de automóveis descobriu que
somente cerca de 0,005% da população Logo: X ~ Bin(20.000;0,00005). Daí:
está incluída em um certo tipo de sinistro 20.000
P(X = 3) = 0,00005 3 (0.99995)19.997 .
cada ano. Se seus 20.000 segurados são 3
escolhidos ao acaso na população, qual é
a probabilidade aproximada de que 3 Solução aproximada:
clientes venham a ser incluídos nesta
13 e−1
categoria de sinistro no próximo ano? P X=3  .
3!

261 262

Solução: Exercício 4.4 (combinando conteúdos dos


capítulos 2 e 4)
No R:

Pela binomial: P(X=3) = Considere a situação do exercício 4.3.


dbinom(3,20000,0.00005) Dado que são necessárias mais que 3
= 0.06131171. tentativas até o primeiro acerto, qual
é a probabilidade de que este acerto
Pela Poisson: P(X=3)  ocorra em, no máximo, 5 tentativas?
dpois(3,1) = 0.06131324.

263 264

44
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2024 (parte 1) - Professor: Eduardo Lima Campos

Solução:
P(X  5)  (X  3)
P(X  5 | X  3) = =
P(X  3)
Um olhar desatento poderia nos levar a
calcular P(X=4) + P(X=5), quando o que
é pedido é uma probabilidade condicional:
P(X = 4 ) + P(X = 5)
P(X  5 | X  3), =
1 − P(X = 1) + P(X = 2 ) + P(X = 3)
sendo X ~ Geom(0,1).
0,1385
Esta probabilidade é = 0,19.
0,729
calculada da seguinte forma:

265 266

• Árvore Binomial Solução:


Exemplo 4.13 - O preço de uma ação a
A trajetória da ação pode ser representada
cada dia é uma v.a., com probabilidade
em uma árvore, chamada árvore binomial.
0,4 de descer R$ 1,00 e probabilidade 0,6
de subir R$ 1,00. As variações de preço
A v.a. de interesse é:
a cada dia são independentes, e as
X = número de vezes que a ação sobe.
probabilidades de aumento ou queda de
preço se mantém fixas. Se, no primeiro
Qual a distribuição de X?
dia, o preço da ação é R$ 100,00, calcule
o valor esperado do preço no quinto dia.

267 268

Seja agora Y uma outra v.a.,


x P(X=x) representando o preço final da ação.
0 0,0256
Note que, se a ação cair todos os dias
1 0,1536 (X=0), Y será igual a R$ 96,00.
2 0,3456
3 0,3456 Por outro lado, se a ação subir todos os
dias (X=4), Y será igual a R$ 104,00.
4 0,1296
E nos casos intermediários?

269 270

45
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2024 (parte 1) - Professor: Eduardo Lima Campos

O valor esperado de Y pode ser


calculado de 2 formas.
y P(Y=y)
96 0,0256 Forma 1 - diretamente da distribuição de Y,
aplicando a definição de valor esperado:
98 0,1536
100 0,3456 E(Y) =  yP(Y = y) = 96 * 0,0256 + 98 * 0,1536 +
y
102 0,3456
100 * 0,3456 + 102 * 0,3456 + 104 * 0,1296 = 100,8.
104 0,1296
R: o valor esperado do preço (preço esperado)
da ação no quinto dia é R$ 100,80.

271 272

Forma 2 - escrevendo Y como função de X: E(aX+b) = aE(X) + b.

Y = 2X+96, No caso, a = 2, b = 96 e E(X) = np = 2,4.

Assim:
e aplicando a fórmula do valor
esperado de aX+b (capítulo 3):
E(Y) = 2*2,4+96 = 100,8.

273 274

• Distribuição Uniforme Contínua

É a distribuição contínua
5. DISTRIBUIÇOES mais simples que existe.

CONTÍNUAS Pressupõe que as probabilidades estejam


distribuídas de maneira uniforme pelo
intervalo de variação de X (de  a ).

275 276

46
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2024 (parte 1) - Professor: Eduardo Lima Campos

Fórmula da Uniforme: Cálculo de Probabilidades


Utilizando a Uniforme:
f(x) = 1/(-), <x<.

P(aXb) = (b-a)/(-)
Parâmetros:  e .

Notação: X ~ Unif(,).

277 278

Exemplo 5.1 - A energia elétrica gerada


Valor Esperado e Variância da Uniforme: diariamente por uma pequena usina segue
distribuição uniforme entre 1.5 e 2 GWh.

Calcule a probabilidade de que a energia


E(X) = (+)/2 gerada por esta usina, em um determinado
V(X) = (-)2/12 dia, seja superior a 1.7 GWh.

R: 0,6.
No R: 1-punif(1.7,1.5,2).

279 280

• Distribuição Exponencial Parâmetro: .

Distribuição definida para valores de X Notação: X ~ Expo().


estritamente positivos, usual para
representar tempo (duração, espera, etc.). Valor Esperado e Variância:

Fórmula da Exponencial:
E(X) = 1/
f (x) = e , x  0;   0.
− x V(X) = 1/2

281 282

47
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2024 (parte 1) - Professor: Eduardo Lima Campos

Demonstração do Valor Esperado:


  e − x  e − x 


  E (X) =  − x −  − dx 
E (X ) =  xe −x dx =   xe −x dx.    0 0  
0 0

= (− xe −x ) 0 +  e −x dx

0
Esta integral deve ser resolvida por partes, 
 e 
− x
1
= (− xe )
fazendo u = x e dv = e-xdx. 
− x
+ −  = .
Temos então que: du = dx e v = -e-x/.   0 
0

Assim:

283 284

Demonstração da Variância:
Função Distribuição
V(X) = – E(X2) E2(X). Acumulada da Exponencial:
E(X2) é calculado da seguinte forma:
 

E ( X ) =  x e dx =   x 2 e −x dx.
2 2 − x

F(x) = P(Xx) = 0, x0


0 0
= 1-e-x, x>0.
Esta integral também deve ser resolvida
por partes, mas agora fazendo u = x2 e
dv = e-xdx.

285 286

Demonstração da F.D.A.: Exemplo 5.2 - O tempo de espera de um


cliente em uma fila de atendimento
telefônico, em minutos, é bem representado
Para x0, F(x) = P(Xx) = 0.
por uma v.a. com distribuição exponencial.
Para x>0: Se o tempo médio de espera é de 10 minutos,
x qual é a probabilidade de que a espera:
F( x ) = P(X  x ) =  e −x dx =
0
a) não ultrapasse 12 minutos?
x
1 − e − x b) não ultrapasse 7 minutos?
  e −x dx =  = 1 − e − x . c) fique entre 7 e 12 minutos?
0 

287 288

48
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2024 (parte 1) - Professor: Eduardo Lima Campos

No R: Solução:
P X  x = F(x)
a) P(X  12) = F(12) = 1-e-1,2 =
= 1 − exp(−λx)
pexp(12,0.1) = 0.6988.
ou:
F(x) = pexp(x,λ) b) P(X  7) = F(7) = 1-e-0,7 =
pexp(7,0.1) = 0.5034.
No Excel:
c) P(7  X  12) = F(12)-F(7) = 0.1954.
F(x) = DISTR.EXPON(x;λ;1)

289 290

d) Que a espera seja maior que 10 minutos Exemplo 5.3 - O tempo (em horas) de
(isto é, maior do que a média E(X))? duração das lâmpadas de uma marca segue
uma distribuição exponencial com  = 0,01.
R: e-1 = 0,3679 (qualquer que seja ).
Calcule a mediana do tempo
No R: de duração das lâmpadas.
P(X>10) = 1-pexp(10,0.1)
R: 69,31 horas.
No R: qexp(percentil, lambda) ou qexp(0.5, 0.01).
O resultado do item d) indica que a média da
exponencial é sempre maior que a mediana! Interpretação: 50% das lâmpadas desta
marca duram mais do que 69,31 horas.

291 292

Interpretação: se uma lâmpada já durou x


• Falta de Memória horas, a probabilidade dela durar mais s
horas a partir dali é a mesma que ela teria
É uma importantíssima propriedade de durar s horas a partir da sua fabricação.
da distribuição exponencial. Ela diz que:
Em outras palavras, não há desgaste.
P(X>x+s|X>x) = P(X>s).
Isto é considerado uma crítica ao uso da
exponencial para este tipo de aplicação.

293 294

49
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2024 (parte 1) - Professor: Eduardo Lima Campos

Exercício 5.1 - Uma TV de LED possui


Demonstração da Falta de Memória: vida útil estimada em 500 dias. Suponha
que você comprou a TV há 200 dias e
P(X>x+s|X>x) = ela continua funcionando. Qual é a
probabilidade de que ela venha a
P[(X>x+s)(X>x)]/P(X>x) =
durar pelo menos mais 100 dias?
P(X>x+s)/P(X>x) =
e-(x+s)/e-x = e-s R: P(X>300|X>200) = P(X>100) =
= P(X>s), C.Q.D. 1-F(100) = 1-pexp(100,1/500) = 0.8187.

295 296

Distribuição Normal para diferentes valores de :


• Distribuição Normal

( x − ) 2
1 −
f (x) = e 22
; x  ;   ,  2  0.
 2
Distribuição Normal para diferentes valores de :
Parâmetros:  (=E(X)) e 2 (=V(X)).
Notação: X ~ N(,2).
O gráfico da distribuição Normal apresenta
formato similar ao de um sino (bell shaped).

297 298

• Cálculo de Probabilidades Normais


A v.a. que representa o resultado
Exemplo 5.4 - Considere que as deste experimento é X ~ N(170,25).
alturas dos alunos desta turma sigam
distribuição Normal, com média igual
a 170 cm e desvio padrão igual a 5 cm. Qual a probabilidade de que a altura
do aluno esteja entre 170 e 172,3 cm?
Seja o experimento que consiste na
seleção de um aluno qualquer e na
medição de sua altura.

299 300

50
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2024 (parte 1) - Professor: Eduardo Lima Campos

Em princípio, você calcularia: Para calcular a probabilidade


altura de um aluno selecionado ao acaso solicitada, usaremos a tabela Normal.
1 −( x −50170)
2
172, 3

P(170  X  172,3) =  e dx
170 5 2 A tabela Normal fornece probabilidades
associadas a uma v.a. padronizada:
Problema:
X −
( x − ) 2 Z= ,
A integral de f ( x ) =
1
e

2 2 
 2
não possui solução analítica! que possui média 0 e variância 1
(como vimos no capítulo 3 do curso).

301 302

P(170  X  172,3) = Usando a Tabela Normal:

 170 −  X −  172,3 −  
P   =
    
 170 − 170 172,3 − 170 
P Z =
 5 5 
= P(0  Z  0,46).

P(0 < Z < 0,46) é encontrada na tabela.

303 304

Resposta final do item a): Neste caso:

A probabilidade de que a altura de P(170  X  175) =


um aluno selecionado ao acaso esteja  170 −  X −  175 −  
entre 170 e 172,3 cm é 0,1772. P   =
    
 170 − 170 175 − 170 
P Z =
b) Qual a probabilidade de que a altura  5 5 
do aluno esteja entre 170 e 175 cm? = P(0  Z  1).

305 306

51
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2024 (parte 1) - Professor: Eduardo Lima Campos

Ilustrando na Tabela Normal: Resposta final do item b): 0,3413.


k

c) Qual a probabilidade de que a altura do


aluno esteja entre 165 e 170 cm?

Solução:

Pela simetria da Normal, temos:


P(-1 < Z < 0) = P(0 < Z < 1) = 0,3413.

307 308

Ilustração da Simetria da Normal:


d) Qual a probabilidade de que a altura do
aluno esteja entre 165 e 175 cm?

P(-1 < Z < 0) P(0 < Z < 1)


Solução: do slide anterior,
P(-1 < Z < 1) = 0,6826.
P(-1 < Z < 1)

Esta é a probabilidade de X estar a no máximo


1 desvio padrão de distância da sua média.

309 310

Considerando = E(X) e  = DP(X): e) Qual a probabilidade de que a altura


99,72%
do aluno esteja entre 170 e 180 cm?

Solução: P(170 < X < 180) =


P(0 < Z < 2) = 0,4772.

f) E entre 160 e 180 cm?

Solução: P(160 < X < 180) =


P(-2 < Z < 2) = 2*0,4772 = 0,9544.

311 312

52
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2024 (parte 1) - Professor: Eduardo Lima Campos

g) Qual a probabilidade de que a altura do i) E menor do que 175 cm?


aluno seja maior do que 170 cm? P(Z < 0)

Solução: P(X > 170) = P(Z > 0). Solução: P(X < 175) = P(Z < 1) = 0,5 +
A área total sob a curva é igual a 1. P(0 < Z < 1) = 0,5 + 0,3413 = 0,8413.
Logo, a resposta é 0,5.
j) E menor do que 165 cm?
h) E maior do que 175 cm? P(Z > 0)

Solução: P(X > 175) = P(Z > 1) = 0,5 - Solução: P(X < 165) =
P(0 < Z < 1) = 0,5 - 0,3413 = 0,1587. P(Z < -1) = P(Z > 1) = 0,1587.

313 314

No R (distribuição acumulada):
Ou, melhor ainda,
P Z  z = F z = pnorm(z) sem precisar padronizar:

De tal modo que:


P(a  X  b) = p =
P(a  Z  b) = pnorm(b) - pnorm(a).
pnorm(b,,) -pnorm(a,,).
A probabilidade do item a), por
exemplo, é: pnorm(0.46) - pnorm(0).

315 316

Exercício 5.2 - O consumo residencial de


Por exemplo, o item a) fica:
energia elétrica em uma determinada
localidade segue distribuição Normal com
P(170  X  172,3) = p = média 80 GWh e desvio padrão 4 GWh.
pnorm(172.3,170,5) -
pnorm(170,170,5).
Calcule a probabilidade do
consumo em uma residência ser:

Muita atenção com o


separador de decimal!
a) maior que 80 GWh e menor que 83 GWh.
b) maior que 79 GWh e menor que 82 GWh.

317 318

53
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2024 (parte 1) - Professor: Eduardo Lima Campos

Solução: Ilustrando na Tabela Normal:


Consumo (em GWh)

a) P(80  X  83) =
 80 −  X −  83 −  
P   =
    
 80 − 80 83 − 80 
P Z =
 4 4 
= P(0  Z  0,75).

319 320

Resposta do item a) → 0,2734. Ilustrando na Tabela Normal:

b)
P(79  X  82) =
 79 − 80 X −  82 − 80 
P   =
 4  4 
P(− 0,25  Z  0,5) =
P(−0,25  Z  0) + P(0  Z  0,5) =
P(0  Z  0,25) + P(0  Z  0,5).
Resposta do item b):
Por causa da simetria!
0,0987+0,1915 = 0,2902.
321 322

No R: Exemplo 5.5 - A rentabilidade de uma


estratégia financeira no mercado futuro,
a) P(80  X  83) = pnorm(83,80,4) - referente a certo período, possui distribuição
pnorm(80,80,4) = 0.2734. Normal, com média 5% e desvio padrão 3%.

b) P(79  X  82) = pnorm(82,80,4) - Qual a probabilidade da rentabilidade


pnorm(79,80,4) = 0.2902. ser negativa, no período considerado?

323 324

54
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2024 (parte 1) - Professor: Eduardo Lima Campos

Solução: Ilustrando P(0 < Z < 1,67) na Tabela Normal:


Seja X1 = rentabilidade da estratégia. k

P ( X 1  0) =
 X − 0−
P 1  =
   
 0−5
P Z  =
 3 
P(Z  −1,67 ) =
0,0475.
325 326

Solução:
Exercício 5.3 - Considere a estratégia de Seja X2 = rentabilidade da nova estratégia.
investimento proposta no exemplo 5.5.
Compare-a com outra estratégia cuja P ( X 2  0) =
média é 6% e cujo desvio padrão é 4%.  X − 0−
Considere como critério de comparação a P 2  =
   
probabilidade de perda (rentabilidade < 0).
 0−6
P Z  = Considerando a
Considerando este critério, por  4  probabilidade de

P(Z  −1,5) =
qual das estratégias você optaria? perda, a estratégia
do exemplo 5.5. é
mais vantajosa.
0,0668.

327 328

• Busca de Quantis da Normal Obs - será necessário achar *


tal que: P(X > *) = 0,025.
Exemplo 5.6 - Sabe-se que, de cada 40
empresas avaliadas por uma agência de Buscaremos na tabela o valor k tal que:
rating, apenas 1 atinge a nota mínima para P(Z > k) = 0,025, denotado por z0,025. Mas
obter uma certificação. Supondo que as notas lembremos que a tabela fornece P(0<Z<k):
sejam normalmente distribuídas com média
8 e desvio padrão 1, calcule a nota mínima
para que uma empresa possa ser certificada.

329 330

55
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2024 (parte 1) - Professor: Eduardo Lima Campos

Temos que achar na tabela o valor de k


correspondente à probabilidade 0,475: No R:
k
#quantil 0.975
qnorm(.975,0,1)
Outros quantis que serão importantes a
partir do capítulo 9:
#quantil 0.95
qnorm(.95,0,1)
Assim: z0,025 = 1,96. #quantil 0.995
qnorm(.995,0,1)
Resposta do Exemplo 5.6: 9,96.
331 332

• Distribuição Lognormal Cálculo de probabilidades lognormais:

É conduzido usando que, se Y segue


Seja uma v.a. Normal distribuição lognormal com parâmetros 
X ~ N(,2) e seja Y = eX. e 2, então X = lnY segue distribuição
Normal com os mesmos parâmetros.
A distribuição de Y é chamada
lognormal, com parâmetros  e 2.

333 334

Solução: P(Y<164) = P(lnY<ln164) =


Exemplo 5.7 - O preço de um ativo = X ~ N(5,11;1).
financeiro segue distribuição lognormal
com parâmetros  = 5,11 e 2 = 1.  X − 5,11 ln 164 − 5,11 
P   = P(Z  −0,01) = 0,496.
 1 1 
Qual a probabilidade de que o preço  5,1.
deste ativo seja inferior a 164 dólares?
No R: P(Y<y) = plnorm(y,,)

No Excel:
P(Y<y) = DIST.LOGNORMAL.N(y,,,1)

335 336

56
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2024 (parte 1) - Professor: Eduardo Lima Campos

• Soma de V.A.`s
Exemplo 6.1 - Um elevador suporta
um peso máximo de 500Kg. Podemos
estar interessados na probabilidade do
6. FUNÇÕES peso limite ser ultrapassado quando 7
pessoas entram neste elevador.
LINEARES DE V.A.`s Neste caso, a v.a. de interesse é:
7 peso da
S =  Xi , i-ésima pessoa.
i =1

e a probabilidade de interesse é: P(S>500).

337 338

• Valor Esperado da Soma de n V.A.`s: • Soma de Normais Independentes


com Médias e Variâncias Iguais
n
E(S) =  E(Xi ). Considere a soma S de n v.a.`s Xi, i =
i =1 1,2,...,n, Normais e independentes,
c/ médias  e variâncias 2. Então:
• Variância da Soma de n
V.A.`s Descorrelacionadas:
S ~ N(n, n 2 ).
n
V(S) =  V(Xi ). E agora estamos aptos a calcular a
i =1 probabilidade de interesse do exemplo 6.1.

339 340

Exemplo 6.1 (cont.) Exemplo 6.2 - Uma máquina de café é


7
calibrada para produzir pacotes com peso
S =  Xi , e queremos P(S>500). 500g. Entretanto, na prática, os pesos reais
i =1
peso da i-ésima pessoa dos pacotes produzidos serão v.a.`s.
Supondo que os pesos das pessoas deste
universo tenham média  = 70 e variância Suponha que os pesos dos pacotes produzidos
2 = 100, temos que S ~ N(490,700), e: pela máquina sigam distribuição Normal
500 − 490 com média 500 g e variância 16 g2.
P(S  500) = P( Z  )=
700
P( Z  0,38) = 0,3520.

341 342

57
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2024 (parte 1) - Professor: Eduardo Lima Campos

Solução:
peso total = soma dos pesos
n
a) Se selecionarmos 100 pacotes (considere
S =  Xi ~ N(n, n2 ).
os pesos dos pacotes independentes), i =1
qual a probabilidade de que o peso
total seja maior do que 49,96 Kg?  49.960 − 50.000 
P(S  49.960) = P Z  
 40 
= P(Z  −1) = P(−1  Z  0) + 0,5 =
P(0  Z  1) + 0,5 = 0,8413.

343 344

• Média de V.A.`s • Média de Normais Independentes


com Médias e Variâncias Iguais
A média de n v.a.`s X1, X2, ..., Xn,
é definida da seguinte forma: Considere a média X de n v.a.`s Xi,
i = 1,2,...,n, independentes e Normais,
n c/ médias  e variâncias 2. Então:
 Xi
X= i =1
. 2
X ~ N(, ).
n n
Note que, assim como a soma, a média de n Em particular, assim como a soma, a média de
v.a.`s é, também uma variável aleatória. Normais independentes também é Normal.

345 346

Demonstração do Valor Esperado de x: Demonstração da Variância de x:


2
n 1 n 1 n
1 V( X ) = V(  X i ) =   V( X i ) =
E Xሜ = E ෍ Xi n i=1  n  i=1
n
i=1
1 2 2
2
1
n
1 1 n
= E(෍ Xi ) = nμ = μ.    V(X i ) = 2 n = .
n
i=1
n  n  i=1 n n

v.a.`s descorrelacionadas

347 348

58
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2024 (parte 1) - Professor: Eduardo Lima Campos

Exemplo 6.2 (cont.) - b) Qual a Exercício 6.1 - Um fabricante de


probabilidade do peso médio dos 100 baterias alega que seu produto tem uma
pacotes ser menor do que 500,7 g? vida esperada de 40 meses. Sabe-se que
Solução: peso médio = X ~ N(,  ).
2
os tempos de duração têm distribuição
média dos pesos. n Normal com desvio padrão de 8 meses.
Qual a probabilidade de que o tempo
 500,7 − 500 
P( X  500,7) = P Z  = médio de duração de 64 baterias
 0,4  selecionadas ao acaso esteja entre 38 e
P(Z  1,75) = 42 meses, se o fabricante estiver correto?
0,5 + P(0  Z  1,75) =
R: 0,9544.
0,5 + 0,4599 = 0,9599.
349 350

• Teorema Central do Limite (TCL) Exercício 6.2 - Uma prateleira suporta


200 Kg. 49 latas são colocadas sobre ela.
O peso das latas é uma v.a. com média
A soma e a média de n v.a.`s independentes, 4 Kg e desvio padrão 1 Kg.
com médias e variâncias finitas (quaisquer
que sejam suas distribuições), seguem Calcule a probabilidade aproximada de
distribuição aproximadamente Normal que a prateleira não suporte o peso.
se n é suficientemente grande (> 30).
R: 0,2843.

351 352

• Combinações Lineares de V.A.`s Valor esperado e variância para n = 2


(ou seja, para C = aX+bY):
Uma combinação linear de v.a.`s é uma
Valor Esperado:
nova v.a. C definida da seguinte forma:
E(C) = aE(X) + bE(Y).
n
C =  a i Xi .
i =1 Variância (supondo XY = 0):

pesos da combinação linear.


V(C) = a 2 V(X) + b 2 V(Y).

353 354

59
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2024 (parte 1) - Professor: Eduardo Lima Campos

Exemplo 6.3 - O lucro diário L de uma


corretora (em milhões de R$) é L = 2L1+3L2,
E se X e Y forem correlacionadas?
em que L1, o lucro da área industrial, é
uma v.a. com média 5 e variância 16, e
L2, o lucro da área comercial, é outra v.a. Neste caso, a fórmula da variância de uma
com média e variância iguais a 4. L1 e L2 combinação linear C = aX + bY torna-se:
são independentes. O valor esperado, a
variância e o desvio padrão de L são:
V(C) = a 2 V(X) + b 2 V(Y) + 2abCov(X, Y).
E(L) = 2E(L1) + 3E(L2) = 22 milhões de R$.
V(L) = (2)2V(L1) + (3)2V(L2) = 4*16 + 9*4 =
64 + 36 = 100  DP(L) = 10 milhões de R$.

355 356

Exercício 6.3 - Recalcule o desvio padrão


do lucro da corretora do exemplo 6.3,
considerando agora que o coeficiente de Observe que a correlação negativa contribuiu
correlação entre os lucros das áreas vale -3/8. para a redução da variabilidade total.

Qual a intuição por trás deste resultado?

R: 8.

357 358

Exemplo 6.4 - Seja X a v.a. que Considere uma carteira com 60% do capital
representa o retorno de uma ação 1, Y a alocado na ação 1 e 40% na ação 2.
v.a. que representa o retorno de uma ação
2, e C o retorno de uma carteira composta A ação 1 possui retorno esperado 3% e
pelas ações 1 e 2: C = aX+bY. volatilidade (desvio padrão) 7%. A ação 2
possui retorno esperado 6% e volatilidade
10%. Os retornos das ações possuem
coeficiente de correlação igual a -0,5.
pesos  proporções do
capital alocadas em cada ação.
Calcule o retorno esperado e a
volatilidade desta carteira.

359 360

60
FGV/EPGE - Mestrado em Finanças e Economia Empresarial
Disciplina: Estatística/2024 (parte 1) - Professor: Eduardo Lima Campos

O retorno esperado de C é: A variância da carteira é:


V(C) = a 2  2X + b 2  2Y + 2abCov(X, Y) =
E(C) = aE(X) + bE(Y) =
0,6*0,03 + 0,4*0,06 = 0,36*0,072+0,16*0,12 +
0,042 = 4,2%. 2*0,6*0,4*(-0,0035) = 0,0017.

E o desvio padrão (volatilidade):


A covariância entre X e Y é:
Cov(X,Y) = XYXY = C = V(C) = 0,041 = 4,1%.
-0,5*0,07 *0,1 = -0,0035. bem menor do que de ambas as ações!

361 362

A explicação é simples: quando uma ação Apêndice: Começamos mostrando que, se


cai, espera-se que a outra se valorize, XY = 1, a volatilidade da carteira é igual à
evitando um prejuízo muito grande. combinação linear das volatilidades de cada
uma das ações, ou seja: C = aX + bY.
No jargão do mercado, isto se
chama “hedge” (= proteção).
Demonstração: note da fórmula de V(C), que,
se XY = 1: V(C) = (aX + bY)2. Portanto,
Um ponto a destacar é que a diversificação o desvio padrão é C = aX + bY, c.q.d.
é vantajosa mesmo se XY  0 (contanto
que XY < 1) como mostrado no apêndice. Em particular, se X = Y = : C = .

363 364

Daí, é fácil ver que para qualquer XY < 1 :


Um problema complementar é o da
C < aX + bY. determinação dos pesos adequados.

Ou seja, para qualquer valor da correlação (<


1), a volatilidade da carteira será menor que a Neste caso, o objetivo é achar os pesos
combinação linear das volatilidades das ações. tal que a carteira tenha risco mínimo.
Em particular, se X = Y = : C < .

365 366

61

Você também pode gostar