Estatística Descritiva: Correlação e Regressão
Estatística Descritiva: Correlação e Regressão
Autor:
Equipe Exatas Estratégia
Concursos
23 de Junho de 2023
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
Índice
1) Correlação Linear
..............................................................................................................................................................................................3
2 - 2023 (Pó
Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
CORRELAÇÃO LINEAR
Neste tópico estudaremos a correlação linear. A correlação é usada para indicar a força que mantém unidos
dois conjuntos de valores. Por meio da análise da correlação linear, buscamos identificar se existe alguma
relação entre duas ou mais variáveis, ou seja, se as alterações nas variáveis estão associadas umas com a
outras.
Para avaliar a existência de correlação podemos recorrer a uma forma de representação gráfica bem simples,
que chamamos de gráfico de dispersão. Basicamente, ela é uma representação de pares ordenados em um
plano cartesiano, composto por um eixo vertical (ordenada) e um eixo horizontal (abcissa).
50
45
40
35
30
Eixo Y
25
20
15
10
5
0
0 10 20 30 40 50 60 70 80 90 100
Eixo X
A título exemplificativo, as informações da tabela a seguir referem-se ao número de questões resolvidas por
um determinado aluno e a nota obtida por ele em uma avaliação. Observe que quanto maior o número de
questões resolvidas, maior é a nota obtida na avaliação.
1 20 2
2 60 8
3 30 3
4 50 6
5 40 4
6 70 8
7 80 9
8 90 10
9 40 6
3 - 2023 (Pó
Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
10 30 4
11 10 1
12 60 6
13 50 5
14 70 6
15 90 9
16 100 10
17 20 3
18 40 5
19 60 7
20 50 4
A representação desses dados em formato de diagrama de dispersão sugere a existência de uma relação
linear positiva (variação no mesmo sentido) entre as duas variáveis:
11
10
9
8
Nota Obtida
7
6
5
4
3
2
1
0
0 10 20 30 40 50 60 70 80 90 100 110
Número de Questões
Neste exemplo, percebemos que a relação dos dados agrupados é quase linear. Por isso, se traçarmos uma
reta de tendência no gráfico, observaremos que os pontos se comportarão em torno da reta.
4 - 2023 (Pó
Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
Assim:
11
10
9
8
y = 0,0992x + 0,5441
Nota Obtida
7
6
5
4
3
2
1
0
0 10 20 30 40 50 60 70 80 90 100 110
Número de Questões
Há situações em que essa relação linear não é tão evidente. Um exemplo disso é quando os pontos estão
mais dispersos. Nesse caso, para identificarmos a relação existente entre as variáveis, usamos o coeficiente
de correlação linear de Pearson, definido por 𝑟.
Por fim, devemos ter em mente que a correlação linear pode ser:
a) direta ou positiva – quando temos dois fenômenos que variam no mesmo sentido. Se aumentarmos
ou diminuirmos um deles, o outro também aumentará ou diminuirá;
b) inversa ou negativa – quando temos dois fenômenos que variam em sentido contrário. Se
aumentarmos ou diminuirmos um deles, acontecerá o contrário com o outro, no caso, diminuirá ou
aumentará;
c) inexistente ou nula – quando não existe correlação ou dependência entre os dois fenômenos. Nessa
situação, o valor do coeficiente de correlação linear será zero (𝑟 = 0) ou um valor aproximadamente
igual a zero (𝑟 ≅ 0); e
5 - 2023 (Pó
Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
12 12
10 10
8 8
6 6
4 4
2 2
0 0
0 5 10 15 0 5 10 15
12 12
10 10
8 8
6 6
4 4
2 2
0 0
0 5 10 15 0 5 10 15
6 - 2023 (Pó
Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
O coeficiente de correlação linear de Pearson é adotado para medir o quão forte é a relação linear entre
duas variáveis. Esse coeficiente é calculado pela seguinte expressão:
̅ ) × (𝒀𝒊 − 𝒀
∑𝒏𝒊=𝟏[(𝑿𝒊 − 𝑿 ̅ )]
𝒓=
̅ )² × ∑𝒏𝒊=𝟏(𝒀𝒊 − 𝒀
√∑𝒏𝒊=𝟏(𝑿𝒊 − 𝑿 ̅ )²
Os somatórios dessa fórmula podem ser simplificados, o que facilita a resolução de muitas questões. Por
isso, é muito importante que vocês aprendam a expressão a seguir:
𝒏 𝒏
∑ ̅ ) × (𝒀𝒊 − 𝒀
[(𝑿𝒊 − 𝑿 ̅ )] = ∑ ̅ ×𝒀
(𝑿𝒊 × 𝒀𝒊 ) − 𝒏 × 𝑿 ̅
𝒊=𝟏 𝒊=𝟏
Para facilitar a compreensão e internalização, vou apresentar um raciocínio que podemos adotar
para deduzir a fórmula alternativa mostrada anteriormente.
Agora, precisamos separar as quatro parcelas desse somatório principal. Reparem que as médias
são constantes, portanto, podem sair do somatório:
𝑛 𝑛 𝑛 𝑛 𝑛
∑ [(𝑋𝑖 − 𝑋̅) × (𝑌𝑖 − 𝑌̅)] = ∑ (𝑋𝑖 × 𝑌𝑖 ) − 𝑌̅ × (∑ 𝑋𝑖 ) − 𝑋̅ × (∑ 𝑌𝑖 ) + 𝑋̅ × 𝑌̅ × ∑ 1
𝑖=1 𝑖=1 𝑖=1 𝑖=1 𝑖=1
7 - 2023 (Pó
Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
𝑛 𝑛
∑ [(𝑋𝑖 − 𝑋̅) × (𝑌𝑖 − 𝑌̅)] = ∑ (𝑋𝑖 × 𝑌𝑖 ) − (𝑛 × 𝑋̅ × 𝑌̅) − (𝑛 × 𝑋̅ × 𝑌̅) + (𝑛 × 𝑋̅ × 𝑌̅)
𝑖=1 𝑖=1
Portanto,
𝑛 𝑛
∑ [(𝑋𝑖 − 𝑋̅) × (𝑌𝑖 − 𝑌̅)] = ∑ (𝑋𝑖 × 𝑌𝑖 ) − 𝑛 × 𝑋̅ × 𝑌̅
𝑖=1 𝑖=1
Utilizaremos essa fórmula alternativa para calcular o numerador do coeficiente de correlação. Reparem que
a expressão do lado esquerdo nos obriga a calcular todos os desvios (𝑋𝑖 − 𝑋̅) e (𝑌𝑖 − 𝑌̅), enquanto a
expressão do lado direito não. Nessa fórmula, 𝑛 indica o número de pontos no gráfico de dispersão, isto é, o
número de pares ordenados.
𝒏 𝒏
∑ ̅ )𝟐 = ∑
(𝑿𝒊 − 𝑿 ̅ )𝟐
𝑿𝟐𝒊 − 𝒏 × (𝑿
𝒊=𝟏 𝒊=𝟏
𝒏 𝒏
∑ ̅ )𝟐 = ∑
(𝒀𝒊 − 𝒀 ̅ )𝟐
𝒀𝟐𝒊 − 𝒏 × (𝒀
𝒊=𝟏 𝒊=𝟏
As últimas duas fórmulas são formas alternativas que podem ser empregadas no cálculo do denominador do
coeficiente de correlação.
O coeficiente de correlação de Pearson pode assumir quaisquer valores entre 1 e -1, ou seja:
−𝟏 ≤ 𝒓 ≤ 𝟏
Assim, quanto mais próximo 𝑟 estiver de 0, menor será a relação linear entre as duas variáveis. Por sua vez,
quanto mais próximo 𝑟 estiver de (1 ou -1), maior será a relação linear entre as duas variáveis.
8 - 2023 (Pó
Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
Correlação Positiva
18
16
14
12
10
0
-1 1 3 5 7 9 11 13 15
Se a correlação for positiva e todos os pontos estiverem sobre uma mesma reta, o valor de 𝑟 será exatamente
1. Nesse caso, dizemos que a correlação é positiva e perfeita.
14
12
10
0
-1 1 3 5 7 9 11 13 15
O valor de 𝑟 é negativo quando a variável 𝑌 tende a diminuir ou aumentar quando 𝑋 aumentar ou diminuir,
respectivamente. Nessa situação, dizemos que as variáveis estão negativamente correlacionadas. No
9 - 2023 (Pó
Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
exemplo a seguir, os dados estão praticamente em cima de uma reta, indicando a existência de uma
correlação negativa forte, isto é, 𝑟 muito próximo de -1. No caso, o coeficiente de correlação foi de -0,9918.
Correlação Negativa
18
16
14
12
10
8
6
4
2
0
-1 1 3 5 7 9 11 13 15
Se a correlação for negativa e todos os pontos estiverem sobre uma mesma reta, o valor de r será exatamente
-1. Nesse caso, dizemos que a correlação é negativa e perfeita.
14
12
10
0
-1 1 3 5 7 9 11 13 15
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
O valor de 𝑟 é zero (ou um valor muito próximo de zero) quando não existe uma relação linear entre as
variáveis. No exemplo a seguir, o coeficiente de correlação é 0,1132. Nesse caso, dizemos que a correlação
linear é nula ou inexistente.
Correlação Nula
10
0
0 0,5 1 1,5 2 2,5 3 3,5 4
As questões normalmente informam os valores dos somatórios e exigem apenas a aplicação correta da
fórmula. Apesar disso, vamos considerar uma tabela com 5 pares ordenados, representando as notas de 5
alunos nas disciplinas X e Y, para calcular o coeficiente de correlação pelas duas fórmulas:
Aluno 𝑿𝒊 𝒀𝒊
1 6,50 7,00
2 7,50 8,00
3 8,00 8,00
4 8,50 9,00
5 9,50 10,00
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
Aluno 𝑿𝒊 𝒀𝒊 ̅
𝑿𝒊 − 𝑿 ̅
𝒀𝒊 − 𝒀
Aluno 𝑿𝒊 𝒀𝒊 ̅ 𝒀𝒊 − 𝒀
𝑿𝒊 − 𝑿 ̅
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
Nesse ponto, teremos que calcular o numerador e o denominador do coeficiente de correlação. Para tanto,
precisaremos multiplicar os desvios de X pelos desvios de Y, bem como calcular os quadrados dos desvios:
Aluno 𝑿𝒊 𝒀𝒊 ̅ 𝒀𝒊 − 𝒀
𝑿𝒊 − 𝑿 ̅ ̅ ) × (𝒀𝒊 − 𝒀
(𝑿𝒊 − 𝑿 ̅) ̅ )²
(𝑿𝒊 − 𝑿 ̅ )²
(𝒀𝒊 − 𝒀
1 6,50 7,00 -1,50 -1,40 (-1,50) x (-1,40) = 2,10 (-1,50)² = 2,25 (-1,40)² = 1,96
2 7,50 8,00 -0,50 -0,40 (-0,50) x (-0,40) = 0,20 (-0,50)² = 0,25 (-0,40)² = 0,16
3 8,00 8,00 0,00 -0,40 (0,00) x (-0,40) = 0,00 (0,00)² = 0,00 (-0,40)² = 0,16
4 8,50 9,00 0,50 0,60 (0,50) x (0,60) = 0,30 (0,50)² = 0,25 (0,60)² = 0,36
5 9,50 10,0 1,50 1,60 (1,50) x (1,60) = 2,40 (1,50)² = 2,25 (1,60)² = 2,56
Aluno 𝑿𝒊 𝒀𝒊 ̅ 𝒀𝒊 − 𝒀
𝑿𝒊 − 𝑿 ̅ (𝑿𝒊 − 𝑿
̅ ) × (𝒀𝒊 − 𝒀
̅ ) (𝑿𝒊 − 𝑿
̅ )² (𝒀𝒊 − 𝒀
̅ )²
5
∑ [(𝑋𝑖 − 𝑋̅) × (𝑌𝑖 − 𝑌̅)] = 2,10 + 0,20 + 0,00 + 0,30 + 2,40 = 5,00
𝑖=1
5
∑ (𝑋𝑖 − 𝑋̅)² = 2,25 + 0,25 + 0,00 + 0,25 + 2,25 = 5,00
𝑖=1
5
∑ (𝑌𝑖 − 𝑌̅)² = 1,96 + 0,16 + 0,16 + 0,36 + 2,56 = 5,20
𝑖=1
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
5,00
𝑟=
√5,00 × 5,20
𝑟 ≅ 0,9805
O coeficiente de correlação linear ficou muito próximo de 1, o que implica dizer que existe uma relação linear
intensa entre as notas das duas disciplinas. Vejamos o gráfico de dispersão das duas variáveis
10,5
10
9,5
Nota na disciplina Y
8,5
7,5
6,5
6
6 6,5 7 7,5 8 8,5 9 9,5 10
Nota na disciplina X
Pronto, agora utilizaremos as fórmulas alternativas para calcular o mesmo coeficiente de correlação. Vamos
relembrar a fórmula:
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
Por sua vez, o denominador pode ser calculado por meio das seguintes fórmulas:
𝑛 𝑛
∑ (𝑋𝑖 − 𝑋̅)2 = ∑ 𝑋𝑖2 − 𝑛 × (𝑋̅)2
𝑖=1 𝑖=1
𝑛 𝑛
∑ (𝑌𝑖 − 𝑌̅)2 = ∑ 𝑌𝑖2 − 𝑛 × (𝑌̅)2
𝑖=1 𝑖=1
Aluno 𝑿𝒊 𝒀𝒊
1 6,50 7,00
2 7,50 8,00
3 8,00 8,00
4 8,50 9,00
5 9,50 10,00
Já calculamos as médias de X e Y:
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
5
∑ (𝑋𝑖 × 𝑌𝑖 ) = 45,50 + 60,00 + 64,00 + 76,50 + 95,00 = 341,00
𝑖=1
5
∑ 𝑋𝑖2 = 42,25 + 56,25 + 64,00 + 72,25 + 90,25 = 325,00
𝑖=1
5
∑ 𝑌𝑖2 = 49,00 + 64,00 + 64,00 + 81,00 + 100,00 = 358
𝑖=1
5
∑ (𝑋𝑖 × 𝑌𝑖 ) − 5 × 𝑋̅ × 𝑌̅ = 341,00 − 5 × 8,00 × 8,40 = 5,00
𝑖=1
5
∑ 𝑋𝑖2 − 5 × (𝑋̅)2 = 325 − 5 × 8,002 = 5,00
𝑖=1
5
∑ 𝑌𝑖2 − 5 × (𝑌̅)2 = 358 − 5 × 8,402 = 5,20
𝑖=1
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
5,00
𝑟=
√5,00 × 5,20
𝑟 ≅ 0,9805
Portanto, o resultado produzido mediante a aplicação das fórmulas alternativas é exatamente o mesmo das
fórmulas tradicionais.
O coeficiente de correlação linear também pode ser definido por meio das seguintes expressões:
𝑆𝑋𝑌
𝑟=
√𝑆𝑋𝑋 × 𝑆𝑌𝑌
Em que 𝑆𝑋𝑌 = ∑𝑛𝑖=1[(𝑋𝑖 − 𝑋̅ ) × (𝑌𝑖 − 𝑌̅)]; 𝑆𝑋𝑋 = ∑𝑛𝑖=1(𝑋𝑖 − 𝑋̅ )2 e 𝑆𝑌𝑌 = ∑𝑛𝑖=1(𝑌𝑖 − 𝑌̅)2 .
𝐶𝑜𝑣(𝑋, 𝑌)
𝑟=
𝜎𝑋 × 𝜎𝑌
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
1ª Propriedade
• O coeficiente de correlação não sofre alteração quando uma constante é adicionada a
(ou subtraída de) uma variável.
𝒊 𝑿𝒊 𝒀𝒊
1 1 6
2 2 7
3 3 8
4 4 9
5 5 10
Como vimos, primeiro temos que encontrar as médias das duas variáveis:
1+2+3+4+5
𝑋̅ = =3
5
6 + 7 + 8 + 9 + 10
𝑌̅ = =8
5
Agora, vamos montar a tabela auxiliar com os desvios (𝑋𝑖 − 𝑋̅) e (𝑌𝑖 − 𝑌̅), e os respectivos produtos (𝑋𝑖 −
𝑋̅) × (𝑌𝑖 − 𝑌̅), (𝑋𝑖 − 𝑋̅)² e (𝑌𝑖 − 𝑌̅)².
̅ 𝒀𝒊 − 𝒀
𝒊 𝑿𝒊 𝒀𝒊 𝑿𝒊 − 𝑿 ̅ (𝑿𝒊 − 𝑿
̅ ) × (𝒀𝒊 − 𝒀
̅ ) (𝑿𝒊 − 𝑿
̅ )² (𝒀𝒊 − 𝒀
̅ )²
1 1 6 -2 -2 4 4 4
2 2 7 -1 -1 1 1 1
3 3 8 0 0 0 0 0
4 4 9 1 1 1 1 1
5 5 10 2 2 4 4 4
Total 10 10 10
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
10
𝑟=
√10 × 10
𝑟(𝑋, 𝑌) = 1
𝒊 𝑿𝒊 + 𝟑 𝒀𝒊 + 𝟓
1 4 11
2 5 12
3 6 13
4 7 14
5 8 15
4+5+6+7+8
𝑋̅ = =6
5
11 + 12 + 13 + 14 + 15
𝑌̅ = = 13
5
̅ 𝒀𝒊 − 𝒀
𝒊 𝑿𝒊 𝒀𝒊 𝑿𝒊 − 𝑿 ̅ (𝑿𝒊 − 𝑿
̅ ) × (𝒀𝒊 − 𝒀
̅ ) (𝑿𝒊 − 𝑿
̅ )² (𝒀𝒊 − 𝒀
̅ )²
1 4 11 -2 -2 4 4 4
2 5 12 -1 -1 1 1 1
3 6 13 0 0 0 0 0
4 7 14 1 1 1 1 1
5 8 15 2 2 4 4 4
Total 10 10 10
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
10
𝑟=
√10 × 10
𝑟(𝑋 + 3, 𝑌 + 5) = 1
Portanto, o coeficiente de correlação não sofreu alteração quando com a adição de 3 unidades à variável X
e 5 unidades à variável Y.
Essa propriedade simplifica a resolução de certas questões. Suponhamos que tivéssemos uma tabela
com os seguintes valores e precisássemos calcular a correlação entre as variáveis X e Y.
𝒊 𝑿𝒊 𝒀𝒊
1 201 301
2 202 302
3 204 308
4 205 309
Reparem que podemos subtrair 200 de todos os valores de X e 300 de todos os valores de Y.
Poderíamos, então, fazer uma transformação nessas variáveis, obtendo:
1 201 301 1 1
2 202 302 2 2
3 204 308 4 8
4 205 309 5 9
A propriedade estudada nos garante que 𝑟(𝑋, 𝑌) = 𝑟(𝑋 − 200, 𝑌 − 300). Logo, poderíamos calcular
a correlação por meio dos valores transformados.
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
1+2+4+5
𝑋̅ = =3
4
1+2+8+9
𝑌̅ = =5
4
𝒊 𝑿𝒊 𝒀𝒊 ̅ 𝒀𝒊 − 𝒀
(𝑿𝒊 − 𝟐𝟎𝟎) (𝒀𝒊 − 3𝟎𝟎) 𝑿𝒊 − 𝑿 ̅ (𝑿𝒊 − 𝑿
̅ ) × (𝒀𝒊 − 𝒀
̅ ) (𝑿𝒊 − 𝑿
̅ )² (𝒀𝒊 − 𝒀
̅ )²
1 201 301 1 1 -2 -4 8 4 16
2 202 302 2 2 -1 -3 3 1 9
3 204 308 4 8 1 3 3 1 9
4 205 309 5 9 2 4 8 4 16
Total 22 10 50
22
𝑟(𝑋 − 200, 𝑌 − 300) = ≅ 0,984
√10 × 50
De fato, se jogássemos a tabela inicial em um software de estatística, veríamos que 𝑟(𝑋, 𝑌) = 0,984.
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
2ª Propriedade
• O o coeficiente de correlação pode não sofrer alteração ou pode ter seu sinal alterado
quando uma variável é multiplicada (ou dividida) por uma constante. Caso as
constantes tenham o mesmo sinal, o valor do coeficiente de correlação não será
alterado. Por outro lado, se as constantes tiverem sinais contrários, o coeficiente
mudará de sinal, mas o valor permanecerá inalterado.
Ainda com relação ao exemplo trabalhado na propriedade anterior, vamos multiplicar a variável X por 2 e a
variável Y por 2.
𝒊 𝑿𝒊 × 𝟐 𝒀𝒊 × 𝟐
1 2 12
2 4 14
3 6 16
4 8 18
5 10 20
2 + 4 + 6 + 8 + 10
𝑋̅ = =6
5
12 + 14 + 16 + 18 + 20
𝑌̅ = = 16
5
̅ 𝒀𝒊 − 𝒀
𝒊 𝑿𝒊 𝒀𝒊 𝑿𝒊 − 𝑿 ̅ (𝑿𝒊 − 𝑿
̅ ) × (𝒀𝒊 − 𝒀
̅ ) (𝑿𝒊 − 𝑿
̅ )² (𝒀𝒊 − 𝒀
̅ )²
1 2 12 -4 -4 16 16 16
2 4 14 -2 -2 4 4 4
3 6 16 0 0 0 0 0
4 8 18 2 2 4 4 4
5 10 20 4 4 16 16 16
Total 40 40 40
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
40
𝑟=
√40 × 40
𝑟(2𝑋, 2𝑌) = 1
Logo, a multiplicação por constantes de mesmo sinal não alterou o valor do coeficiente de correlação, nem
implicou na alteração de seu sinal.
𝒊 𝑿𝒊 × (−𝟐) 𝒀𝒊 × (−𝟐)
1 -2 -12
2 -4 -14
3 -6 -16
4 -8 -18
5 -10 -20
𝒊 𝑿𝒊 𝒀𝒊 ̅ 𝒀𝒊 − 𝒀
𝑿𝒊 − 𝑿 ̅ (𝑿𝒊 − 𝑿
̅ ) × (𝒀𝒊 − 𝒀
̅ ) (𝑿𝒊 − 𝑿
̅ )² (𝒀𝒊 − 𝒀
̅ )²
1 -2 -12 4 4 16 16 16
2 -4 -14 2 2 4 4 4
3 -6 -16 0 0 0 0 0
4 -8 -18 -2 -2 4 4 4
5 -10 -20 -4 -4 16 16 16
Total 40 40 40
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
40
𝑟=
√40 × 40
Como as constantes possuíam sinais iguais, o sinal do coeficiente de correlação foi mantido.
𝑟(−2𝑋, −2𝑌) = 1
Novamente, a multiplicação por constantes de mesmo sinal não alterou o valor do coeficiente de correlação,
nem implicou na alteração de seu sinal.
Finalmente, vamos multiplicar a variável X por 2 e a variável Y por -2, constantes com sinais contrários.
==13272f==
𝒊 𝑿𝒊 × 2 𝒀𝒊 × (−2)
1 2 - 12
2 4 - 14
3 6 - 16
4 8 - 18
5 10 - 20
2 + 4 + 6 + 8 + 10
𝑋̅ = =6
5
𝒊 𝑿𝒊 𝒀𝒊 ̅ 𝒀𝒊 − 𝒀
𝑿𝒊 − 𝑿 ̅ (𝑿𝒊 − 𝑿
̅ ) × (𝒀𝒊 − 𝒀
̅ ) (𝑿𝒊 − 𝑿
̅ )² (𝒀𝒊 − 𝒀
̅ )²
1 2 -12 -4 4 -16 16 16
2 4 -14 -2 2 -4 4 4
3 6 -16 0 0 0 0 0
4 8 -18 2 -2 -4 4 4
5 10 -20 4 -4 -16 16 16
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
Total -40 40 40
−40
𝑟=
√40 × 40
Portanto, como as constantes possuem sinais contrários, o sinal do coeficiente de correlação foi invertido.
𝑟(2𝑋, −2𝑌) = −1
𝒊 𝑿𝒊 𝒀𝒊
1 200 300
2 350 350
3 400 450
4 450 500
Reparem que todos os valores podem ser divididos por 50. Poderíamos, então, fazer uma
transformação nessas variáveis, obtendo:
𝒊 𝑿𝒊 𝒀𝒊 𝑿𝒊 𝒀𝒊
𝟓𝟎 𝟓𝟎
1 200 300 4 6
2 350 350 7 7
3 400 450 8 9
4 450 500 9 10
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
𝑋 𝑌
A propriedade estudada nos garante que 𝑟(𝑋, 𝑌) = 𝑟 ,
50 50
. Logo, poderíamos calcular a correlação
por meio dos valores transformados.
4+7+8+9
𝑋̅ = =7
4
6 + 7 + 9 + 10
𝑌̅ = =9
4
𝒊 𝑿𝒊 𝒀𝒊 𝑿𝒊 𝒀𝒊 ̅ 𝒀𝒊 − 𝒀
𝑿𝒊 − 𝑿 ̅ (𝑿𝒊 − 𝑿
̅ ) × (𝒀𝒊 − 𝒀
̅ ) (𝑿𝒊 − 𝑿
̅ )² (𝒀𝒊 − 𝒀
̅ )²
𝟓𝟎 𝟓𝟎
1 200 300 4 6 -3 -2 6 9 4
2 350 350 7 7 0 -1 0 0 1
3 400 450 8 9 1 1 1 1 1
4 450 500 9 10 2 2 4 4 4
Total 11 14 10
𝑋 𝑌 11
𝑟( , )= ≅ 0,93
50 50 √14 × 10
De fato, se jogássemos a tabela inicial em um software de estatística, veríamos que 𝑟(𝑋, 𝑌) = 0,93.
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
Na regressão linear simples queremos calcular a expressão matemática que relaciona Y (variável
dependente) em função de X (variável independente). Como estamos falando de regressão linear simples,
trata-se da equação que representa uma reta. Essa equação pode ser escrita como:
𝑦 =𝑚∙𝑥+𝑏
O coeficiente 𝑚 é conhecido como taxa de variação ou coeficiente angular da reta. Esse coeficiente indica
que uma função é crescente se 𝒎 > 𝟎; decrescente se 𝒎 < 𝟎; ou constante se 𝒎 = 𝟎. Para uma reta que
passa pelos pontos (𝑥0 , 𝑦0 ) e (𝑥, 𝑦), o coeficiente angular é expresso por:
∆𝑦 𝑦 − 𝑦0
𝑚= =
∆𝑥 𝑥 − 𝑥0
O coeficiente b é conhecido como coeficiente linear da reta e determina o ponto em que a reta intercepta
o eixo 𝑦.
Vamos calcular a reta apresentada na figura abaixo, que passa pelos pontos (2, 7) e (4, 11).
14
13
12
11
10
(4, 11)
9
8
7
(2, 7)
6
5
4
3
2
1
0
0 1 2 3 4 5 6
O coeficiente angular da reta (𝒎) é o quociente entre a variação de 𝑦 e a variação de 𝑥. Podemos escolher
qualquer um dos pontos como referência para o cálculo da variação, desde que tenhamos atenção na hora
de aplicar os dados na fórmula. A ordem a ser considerada é sempre 𝑥 − 𝑥0 e 𝑦 − 𝑦0 , em que 𝑥0 e 𝑦0 são as
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
coordenadas do ponto tomado como referência. Assim, se adotarmos o ponto (2,7) como referência,
teremos:
∆𝑦 11 − 7
𝑚= = =2
∆𝑥 4−2
𝑦 =𝑚∙𝑥+𝑏
𝑦 = 2∙𝑥+𝑏
Para calcular o valor de 𝑏, podemos usar qualquer ponto da reta, a exemplo de (2, 7).
7=2∙2+𝑏
7= 4+𝑏
𝑏=3
𝑦 =2∙𝑥+3
14
13 y = 2x + 3
12
11
10
(4, 11)
9
8
7
(2, 7)
6
5
4
3
(0, 3)
2
1
0
0 1 2 3 4 5 6
Nesse caso temos uma correlação perfeita positiva. O que aconteceria se os pontos do gráfico tivessem um
pouco mais dispersos, não evidenciando uma correlação linear perfeita? Será se conseguiríamos determinar
uma reta que se ajustasse a esse tipo de gráfico? A resposta é sim. Basta fazermos um pequeno ajuste na
expressão usada para determinar a reta de regressão.
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
Observe:
𝒀𝒊 = 𝜶 + 𝜷𝑿𝒊 + 𝜺𝒊
Em que 𝑖 = 1, 2, 3, ⋯ , 𝑛.
O termo 𝛼 + 𝛽𝑋𝑖 é o componente de 𝑌𝑖 que varia linearmente, de acordo com 𝑋𝑖 . Por sua vez, 𝜀𝑖 é o
componente aleatório de 𝑌𝑖 que descreve os erros (ou desvios) cometidos quando tentamos aproximar uma
série de observações 𝑋𝑖 por meio de uma reta 𝑌𝑖 .
Nesse modelo, 𝑌𝑖 é a variável cujo comportamento desejamos prever ou explicar, sendo chamada de variável
dependente ou resposta. Por outro lado, a variável 𝑋𝑖 é utilizada para explicar o comportamento de 𝑌𝑖 , sendo
conhecida como independente, regressora, explanatória ou explicativa.
O modelo de regressão linear requer que sejam atendidos alguns pressupostos básicos quanto à variável
aleatória 𝜀𝑖 (erro ou desvio):
i) 𝑬(𝜺𝒊 ) = 𝟎. A média dos erros é igual a zero. Ou seja, os desvios "para cima da reta" igualam o valor dos
desvios "para baixo da reta" na média.
ii) 𝑽𝒂𝒓(𝜺𝒊 ) = 𝝈². A variância dos erros é constante. Essa propriedade é denominada de homocedasticia.
Isso só é possível se a variável 𝜀𝑖 tiver variância constante. Ou seja, se ela tiver sempre a mesma variância,
independente de qual o valor de 𝑋𝑖 . Quando o modelo apresenta variâncias diferentes para o erro, temos
uma situação de heterocedasticia.
iii) 𝑪𝒐𝒗(𝜺𝒊 , 𝜺𝒋 ) = 𝟎 𝒑𝒂𝒓𝒂 𝒊 ≠ 𝒋. Os erros cometidos não são correlacionados, isto é, os desvios 𝜺𝒊 são
variáveis aleatórias independentes. Quando os erros não são independentes, temos uma situação
denominada de autocorrelação.
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
Comentários:
No modelo de regressão linear simples, as seguintes suposições sobre o erro devem ser observadas:
𝐸(𝜖) = 0, isto é, em média, o erro do modelo deve ser 0;
𝑉𝑎𝑟(𝜖) = 𝜎 2 , a variância deve ser constante, isto é, deve existir homocedasticia;
𝐶𝑜𝑣(𝜖𝑖, 𝜖𝑗) = 0, os erros devem ser independentes, ou seja, não há correlação entre os erros.
Nessa questão, o único ponto que precisamos mostrar é que o 𝑉𝑎𝑟(𝝐) = 1. O enunciado afirmou que Y segue
distribuição normal padrão. De fato, 𝑌 tem distribuição 𝑁(𝑏 + 0,8𝑥 + 𝜇; 𝜎 2 ) = 𝑁(0,1) em que 𝜎 2 é a
variância do erro. Como 𝑌 segue uma normal padrão, então 𝜎 2 = 1. Consequentemente, o erro também
seguirá uma distribuição normal, 𝜖~𝑁(0,1).
Gabarito: Certo.
O método dos mínimos quadrados diz que a reta a ser adotada deverá ser aquela que torna mínima a soma
dos quadrados das distâncias da reta aos pontos experimentais, medidas no sentido da variação aleatória.
Em outras palavras, devemos encontrar uma reta que minimize o somatório dos quadrados das distâncias
(∑𝑛𝑖=1 𝑒𝑖2 ). O objetivo é minimizar a soma dos quadrados dos desvios.
𝑌𝑖 = 𝛼 + 𝛽𝑋𝑖 + 𝜀𝑖 .
𝑌̂𝑖 = 𝑎 + 𝑏𝑋𝑖
Os erros (desvios) resultantes da aplicação do modelo de regressão linear correspondem às diferenças entre
os valores observados e os valores estimados:
𝑒𝑖 = 𝑌𝑖 − 𝑌̂𝑖
O objetivo do método dos mínimos quadrados é minimizar o somatório dos quadrados dos desvios (∑𝑛𝑖=1 𝑒𝑖2 ):
𝑛 𝑛
2
∑ 𝑒𝑖2 = ∑(𝑌𝑖 − 𝑌̂𝑖 )
𝑖=1 𝑖=1
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
∑𝒏𝒊=𝟏[(𝑿𝒊 − 𝑿̅ ) × (𝒀𝒊 − 𝒀̅ )]
𝒃=
∑𝒏𝒊=𝟏[(𝑿𝒊 − 𝑿̅ )𝟐 ]
Logo,
̅ ×𝒀
∑𝒏𝒊=𝟏(𝑿𝒊 𝒀𝒊 ) − 𝒏 × 𝑿 ̅
𝒃=
̅²
∑𝒏𝒊=𝟏(𝑿𝟐𝒊 ) − 𝒏 × 𝑿
A reta de regressão passa pelos pontos médios (𝑋̅, 𝑌̅) das variáveis 𝑋 e 𝑌. Isso implica que o valor de 𝑎 pode
ser calculado substituindo o valor de 𝑏 em:
̅ − 𝒃𝑿
𝒂=𝒀 ̅
Aluno 𝑿 𝒀 ̅
𝑿−𝑿 ̅
𝒀−𝒀 ̅ ) × (𝒀 − 𝒀
(𝑿 − 𝑿 ̅ ) (𝑿 − 𝑿
̅ )² (𝒀 − 𝒀
̅ )²
1 5 9 -2 1 -2 4 1
2 5 8 -2 0 0 4 0
3 8 10 1 2 2 1 4
4 8 7 1 -1 -1 1 1
5 9 6 2 -2 -4 4 4
Média 7 8 Total -5 14 10
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
Calculando o valor de 𝑏:
−5
𝑏=
14
𝑏 ≅ −0,357
𝑎 = 𝑌̅ − 𝑏𝑋̅
𝑎 = 8 − (−0,357) × 7
𝑎 = 8 + 2,499
𝑎 = 10,499
𝑌̂ = 10,499 − 0,357 × 𝑋
Temos dessa reta estimada que a soma dos quadrados dos desvios é mínima. Podemos montar uma nova
tabela contendo os valores observados de (Y) e os valores estimados pela reta (𝑌̂):
Aluno 𝑿 𝒀 ̂
𝒀
1 5 9 8,714
2 5 8 8,714
3 8 10 7,643
4 8 7 7,643
5 9 6 7,286
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
12
10
8 y = -0,3571x + 10,5
==13272f==
0
3 4 5 6 7 8 9 10
Percebam que a reta tem uma correlação negativa. Os pontos azuis são os pares ordenados da amostra e a
reta vermelha é a reta de regressão que calculamos de tal forma que os desvios de estimativa cometidos se
comportem segundo a condição de mínimos quadrados.
𝑆𝑋𝑌
𝑏=
𝑆𝑋𝑋
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
(VUNESP 2019/MPE-SP). Um aluno teve as seguintes notas: 3; 5; 5,5; 6,5. O professor quer atribuir a nota
final, escolhendo uma nota representativa desse conjunto com base no método dos mínimos quadrados.
Desse modo, essa nota final será
a) 4.
b) 4,5.
c) 5.
d) 5,5.
e) 6.
Comentários:
Vamos montar uma tabela com os dados fornecidos:
𝑿 𝒀 ̅)
(𝑿 − 𝑿 ̅)
(𝒀 − 𝒀 ̅ ) (𝒀 − 𝒀
(𝑿 − 𝑿 ̅) ̅ )𝟐
(𝑿 − 𝑿
1 3 -1,5 -2 3 2,25
2 5 -0,5 0 0 0,25
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
𝑌̂ = 2,25 + 1,1𝑋
̅ 𝑌̅), então:
Sabendo que a reta de regressão passa pelo ponto (𝑋,
𝑌̂ = 2,25 + 1,1 × 2,5
𝑌̂ = 5
Gabarito: C.
(CESPE 2018/ABIN) Ao avaliar o efeito das variações de uma grandeza X sobre outra grandeza Y por meio
de uma regressão linear da forma 𝒀̂=𝜶 ̂+𝜷 ̂ 𝑿, um analista, usando o método dos mínimos quadrados,
encontrou, a partir de 20 amostras, os seguintes somatórios (calculados sobre os vinte valores de cada
variável):
∑𝑿 = 𝟑𝟎𝟎; ∑𝒀 = 𝟒𝟎𝟎; ∑𝑿𝟐 = 𝟔. 𝟎𝟎𝟎; ∑𝒀𝟐 = 𝟏𝟐. 𝟖𝟎𝟎 𝒆 ∑(𝑿𝒀) = 𝟖. 𝟒𝟎𝟎
A partir desses resultados, julgue o item a seguir.
Para 𝑋 = 10, a estimativa de 𝑌 é 𝑌̂ = 12.
Comentários:
Inicialmente, vamos calcular os valores de 𝑌̅ e de 𝑋̅:
∑ 𝑦 400
𝑌̅ = = = 20
𝑛 20
∑ 𝑥 300
𝑋̅ = = = 15
𝑛 20
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
(FCC 2018/Pref. São Luís) Analisando um gráfico de dispersão referente a 10 pares de observações (𝒕, 𝒀𝒕 )
com 𝒕 = 𝟏, 𝟐, 𝟑, . . . , 𝟏𝟎, optou-se por utilizar o modelo linear 𝒀𝒕 = 𝜶 + 𝜷𝒕 + 𝜺𝒕 com o objetivo de se
prever a variável Y, que representa o faturamento anual de uma empresa em milhões de reais, no ano
(𝟐𝟎𝟎𝟕 + 𝒕). Os parâmetros α e 𝜷 são desconhecidos e 𝜺𝒕 é o erro aleatório com as respectivas hipóteses
do modelo de regressão linear simples. As estimativas de 𝜶 e 𝜷 (𝒂 e 𝒃, respectivamente) foram obtidas
por meio do método dos mínimos quadrados com base nos dados dos 10 pares de observações citados. Se
𝒂 = 𝟐 e a soma dos faturamentos dos 10 dados observados foi de 64 milhões de reais, então, pela
equação da reta obtida, a previsão do faturamento para 2020 é, em milhões de reais, de
a) 11,6
b) 15,0
c) 13,2
d) 12,4
e) 14,4
Comentários:
A reta calculada é expressa por:
𝑌̂ = 𝑎 + 𝑏 × 𝑡
Sabemos que a soma dos faturamentos dos 10 dados observados foi de 64 milhões de reais, então,
calculando a média temos:
64
𝑌̅ = 10 = 6,4.
Agora, vamos calcular a média de 𝑡:
1 + 2 + 3 + 4 + 5 + 6 + 7 + 8 + 9 + 10
𝑡̅ = = 5,5
10
Sabemos que 𝑎 = 2 e que a reta de regressão passa pelo ponto (𝑡̅, 𝑌̅). Portanto, vamos encontrar o valor de
𝑏:
𝑌̅ = 𝑎 + 𝑏𝑡̅
6,4 = 2 + 𝑏 × 5,5
4,4
𝑏=
5,5
𝑏 = 0,8
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
Em determinadas situações, a reta de regressão deve passar pela origem para que consiga se ajustar
adequadamente ao modelo teórico. Quando isso ocorre, temos uma situação em que o coeficiente linear
da reta de regressão é nulo (𝜶 = 𝟎).
𝑌𝑖 = 𝛼 + 𝛽𝑋𝑖 + 𝜀𝑖
𝑌𝑖 = 0 + 𝛽𝑋𝑖 + 𝜀𝑖
𝒀𝒊 = 𝜷𝑿𝒊 + 𝜺𝒊 .
∑ 𝑿𝒊 × 𝒀𝒊
𝒃=
∑ 𝑿𝒊 𝟐
A reta de regressão ajustada é:
𝒀̂𝒊 = 𝒃𝑿𝒊 .
Os desvios ou resíduos são dados por:
̂𝒊.
𝒆𝒊 = 𝒀𝒊 − 𝒀
Nesse caso, não há garantia de que o somatório dos resíduos seja igual a zero.
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
Calcular a reta que passa pela origem e comparar os desvios dessa abordagem com os desvios do
modelo linear tradicional para os dados abaixo:
i 𝑿 𝒀
1 1 4
2 2 5
3 3 6
4 4 6
5 5 9
Se utilizássemos o modelo de regressão linear tradicional, a reta que iríamos obter seria a seguinte:
10
9
8
y = 1,1x + 2,7
7
6
5
4
3
2
1
0
0 1 2 3 4 5 6 7
Agora, vamos calcular a reta de regressão que passa pela origem e comparar com o modelo
tradicional. Para isso, adicionaremos duas colunas à tabela original:
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
i 𝑿 𝒀 𝑿×𝒀 𝑿²
1 1 4 4 1
2 2 5 10 4
3 3 6 18 9
4 4 6 24 16
5 5 9 45 25
Total 101 55
De posse dos totais dessas duas colunas, podemos estimar o valor de 𝛽 pelo método dos mínimos
quadrados:
∑ 𝑋𝑖 × 𝑌𝑖 101
𝑏= 2 = ≅ 1,836
∑ 𝑋𝑖 55
̂𝑖 = 𝑏𝑋𝑖
𝑌
̂𝑖 = 1,836 × 𝑋𝑖
𝑌
12
y = 1,8364x
10
0
0 1 2 3 4 5 6 7
Vamos, agora, comparar os resíduos da abordagem tradicional com os desvios do modelo que passa
pela origem:
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
i
𝒀𝒊 ̂𝒊
𝒀 ̂𝒊
𝒆𝒊 = 𝒀𝒊 − 𝒀 𝒀𝒊 ̂𝒊
𝒀 ̂𝒊
𝒆𝒊 = 𝒀𝒊 − 𝒀
3 6 6 0 6 5,5091 0,4909
Reparem que, no modelo que passa pela origem, não há garantia de que o somatório dos desvios
seja zero.
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
Se a redução é muito pequena, significa dizer que os dois modelos são praticamente equivalentes. Isso ocorre
quando a inclinação for zero ou um valor muito pequeno, não compensando usar um modelo mais
complexo. Assim, estamos interessados em testar a hipótese:
: =0
: ≠0
Se a hipótese nula é aceita, concluímos que não existe relação linear significativa entre as variáveis e .
O resultado da análise de variância da regressão é uma tabela que resume várias medidas usadas no teste
de hipóteses anterior. Para montar a tabela de análise de variância (ANOVA), precisamos conhecer: os graus
de liberdade, as somas dos quadrados e os quadrados médios do modelo, dos resíduos (erros ou desvios) e
total.
Graus de Liberdade
= −1
Como vimos anteriormente, a equação de regressão possui apenas dois parâmetros ( ). Portanto, o
número de graus de liberdade do modelo é:
= 2−1= 1
Agora, temos que descobrir o número de graus de liberdade dos resíduos. Para isso, utilizamos a seguinte
relação:
= + " #í % #
−1= 1+ " #í % #
" #í % # = −2
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
=2−1=1
" #í % # = −2
= −1
Somas de Quadrados
Como vimos, a reta de regressão linear fornece uma estimativa & para uma variável . Os erros (desvios)
resultantes da aplicação do modelo de regressão linear correspondem às diferenças entre os valores
observados e os valores estimados:
= – )( ⇒ = + )(
−+= + )( − +
, − + -² = , + )( − + -²
, − + -/ = + 0 )( − + 1 + 2 2 2 , )( − + -
/ /
3, − + -/ = 3 + 30 )( − + 1 + 2 2 3 2 , )( − + -
/ /
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
223 2 , )( − + - = 0
Logo,
3, − + -/ = 3 + 30 )( − + 1 .
/ /
Portanto, temos que o desvio total do modelo de regressão, ( – + ), é o desvio de cada valor de
à média + .
em relação
567 = 3, − + -/
9
Assim, a soma dos quadrados totais, definida por ∑, − + -/ , é igual a soma dos quadrados dos
resíduos/desvios/erros, definida por ∑ / , mais a soma dos quadrados do modelo de regressão, definida na
expressão por ∑0 )( − + 1 :
/
explicável". Essa parcela corresponde à a diferença entre cada valor previsto pelo modelo ( )( ) e o valor médio
A parcela do desvio total que o modelo de regressão é capaz de explicar é denominada de "desvio
56; = 30 )( − + 1
/
56; = = 2 3>, − + - 2 , − + -?
9
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
56; = = 2 3,
/
− + -/
9
explicável". Essa parcela corresponde à diferença entre cada valor de e o valor previsto pelo modelo )( .
A parcela do desvio total que o modelo de regressão não é capaz de explicar é chamada de "desvio não
56< = 30 – )( 1
/
Em algumas questões de concurso, a notação SQR é utilizada para representar a soma dos
quadrados do modelo de regressão, e não dos resíduos, como fizemos nesta aula. Na maioria das
questões, contudo, SQR representa a soma dos quadrados dos resíduos (erros).
A soma dos quadrados totais é calculada por meio das seguintes fórmulas:
567 = 3, − + -/
9
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
56; = 30 )( − + 1
/
56; = = 2 3>, − + - 2 , − + -?
9
56; = =/ 2 3, − + -/
9
56< = 30 – )( 1
/
Coeficiente de Determinação
O coeficiente de determinação mede a qualidade do ajuste proporcionado pela reta de regressão. Ele
determina a parcela da variação total de que é explicada pelo modelo de regressão, sendo calculado pela
fórmula:
56;
</ =
567
56;
<=@
567
A análise que queremos fazer segue o mesmo raciocínio do coeficiente de correlação, assim temos que:
0 ≤ </ ≤ 1
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
Portanto, quanto mais próximo de 1 estiver o coeficiente de determinação, mais forte será a correlação entre
seja, a reta de regressão é capaz de explicar as diferenças entre os valores observados ( ) e a média ( + ).
as variáveis. Implica dizer que grande parte da variação de é explicada pela modelo de regressão linear, ou
Por outro lado, quanto mais próximo de 0 estiver o coeficiente de determinação, mais fraca será a correlação
linear entre as variáveis. Significa dizer que grande parte da variação de não é explicada pelo modelo de
observados ( ) e a média ( + ).
regressão, ou seja, a reta de regressão é capaz de explicar muito pouco sobre as diferenças entre os valores
O coeficiente de determinação ajustado é mais utilizado quando estamos tratando de regressão múltipla.
Contudo, esse assunto também tem sido abordado em algumas questões de regressão linear simples. Assim,
é importante conhecermos essa medida.
Basicamente, essa medida ajusta o coeficiente de determinação aos graus de liberdade. Ela é obtida pela
divisão de 56< e 567 pelos respectivos graus de liberdade:
56<
B, − 2-
++++
< =1−
/
567
B, − 1-
, − 1-
++++/ = 1 − ,1 − < / - 2
<
, − 2-
Quadrados Médios
Os quadrados médios são obtidos pela divisão entre as somas dos quadrados e os respectivos graus de
liberdade. Assim, temos:
56;
6;; =
1
56<
6;< =
−2
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
567
6;7 =
−1
Estatística F (Razão F)
Para testar : = 0 contra : ≠ 0, usamos a seguinte estatística teste, denominada de estatística D (ou
razão F):
6;;
D∗ =
6;<
Dessa forma, para avaliar o teste de hipóteses, basta compararmos o valor da estatística teste com o valor
crítico tabelado:
O valor de DGHí G é consultado em uma tabela F de Snedecor com 1 grau de liberdade no numerador e −
2 graus de liberdade no denominador, para um determinado nível de significância.
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
Em geral, as questões de análise de variância da regressão fornecem uma tabela incompleta e pedem
alguma medida que está faltando. Para descobrir o valor da medida solicitada, você deve conhecer a
estrutura da tabela e as fórmulas apresentadas neste tópico. A estrutura da tabela de análise de variância
da regressão sempre terá o seguinte formato:
56; 6;;
1 SQM 6;; = D∗ =
1 6;<
Modelo
56<
−2 SQR 6;< =
−2
Resíduos
TQS
N−O SQT QRS =
N−O
Total
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
Comentários:
Na análise de variância (ANOVA) da regressão, o total de graus de liberdade corresponde a − 1, em que
representa o número total de amostras. Logo, podemos estabelecer que:
− 1 = 11
= 12 _` abícade.
Gabarito: Errado.
Comentários:
O coeficiente de correlação linear entre as variáveis X e Y é calculado por meio da seguinte expressão:
56<
<=@ ,
567
em que 56< indica a soma dos quadrados da regressão (modelo) e 567 a soma dos quadrados totais.
Pela tabela, verificamos que 567 = 1000 e 56< = 900. Substituindo esses valores na equação anterior,
teremos:
900
<=@ = g0,9
1000
Portanto, o coeficiente de determinação < / possui valor igual a 0,9, mas o coeficiente de correlação não.
Gabarito: Errado.
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
A razão F da tabela ANOVA refere-se ao teste de significância estatística do intercepto , em que se testa a
hipótese nula : = 0 contra a hipótese alternativa h : ≠ 0.
Comentários:
i
A estatística D =
i "
está relacionada com o teste de hipótese para o coeficiente angular da reta de
regressão, isto é:
: =0
: ≠0
Se a hipótese não é rejeitada, significa dizer que não existe uma relação linear significativa entre a variável
explicativa (X) e a variável dependente (Y).
Gabarito: Errado.
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
O desvio padrão amostral do número de leitos por habitante foi superior a 10 leitos por habitante.
Comentários:
A soma dos quadrados totais (SQT) é dada por:
8
567 = 3, − + -/
9
Como a variância amostral é menor que 100, o desvio padrão amostral será:
g90,90 I √100
g90,90 I 10
Gabarito: Errado.
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
Comentários:
A estimativa de C / equivale ao quadrado médio residual. Logo,
C / = 6;< = 10
Gabarito: Certo.
Comentários:
O coeficiente de determinação permite avaliar a qualidade do ajuste do modelo, quantificando,
basicamente, a capacidade do modelo de explicar os dados coletados. Ele é calculado por meio da expressão:
56; 56<
</ = =1− ,
567 567
em que 56; = Soma dos quadrados da regressão (modelo), 56< = Soma dos quadrados dos resíduos (erros)
e SQT = Soma dos quadrados totais. Além disso, para evitar dificuldades na interpretação de < / , alguns
estatísticos preferem usar o < / ajustado, definido para uma equação com 2 coeficientes como
++++ −1
</ = 1 − k l 2 ,1 − < / -.
−2
Pela tabela temos que 567 = 1000 e 56< = 900. Substituindo os valores apresentados na tabela nas
equações acima teremos:
900
</ = = 0,9.
1000
Além disso, como temos − 1 = 11 graus de liberdade totais, então
++++ −1
</ = 1 − k l 2 ,1 − < / -.
−2
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
++++ 11
< / = 1 − k l 2 ,1 − 0,9-.
10
++++ = 1 − 1,1 2 0,1
< /
++++
< / = 1 − 0,11
++++
< / = 0,89.
Gabarito: Certo.
==13272f==
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
RESUMO DA AULA
CORRELAÇÃO LINEAR
A correlação é usada para indicar a força que mantém unidos dois conjuntos de valores. A
correlação linear pode ser:
Gráfico Definição
Correlação Positiva
Direta ou positiva – quando temos dois fenômenos que
15
variam no mesmo sentido. Se aumentarmos ou
10
diminuirmos um deles, o outro também aumentará ou
diminuirá;
5
0
0 5 10 15
Correlação Negativa
Inversa ou negativa – quando temos dois fenômenos que
15
variam em sentido contrário. Se aumentarmos ou
10
diminuirmos um deles, acontecerá o contrário com o
outro, no caso, diminuirá ou aumentará;
5
0
0 5 10 15
Correlação Nula
Inexistente ou nula – quando não existe correlação ou
14
dependência entre os dois fenômenos. Nessa situação, o
valor do coeficiente de correlação linear será zero (𝑟 = 0)
9
4
ou um valor aproximadamente igual a zero (𝑟 ≅ 0);
-1
0 5 10 15
Correlação Perfeita
15
0
0 5 10 15
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
σ𝒏 ഥ ഥ
𝒊=𝟏ሾሺ𝑿𝒊 −𝑿ሻ×ሺ𝒀𝒊 −𝒀ሻሿ
É adotado para medir o quão forte é a 𝒓=
RELAÇÃO linear entre duas VARIÁVEIS. ටσ𝒏 ഥ 𝒏 ഥ
𝒊=𝟏ሺ𝑿𝒊 −𝑿ሻ²×σ𝒊=𝟏ሺ𝒀𝒊 −𝒀ሻ²
𝒏 𝒏
∑ ሾሺ𝑿𝒊 − 𝑿 ഥ ሻሿ = ∑
ഥ ሻ × ሺ𝒀𝒊 − 𝒀 ഥ×𝒀
ሺ𝑿𝒊 × 𝒀𝒊 ሻ − 𝒏 × 𝑿 ഥ
𝒊=𝟏 𝒊=𝟏
𝒏 𝒏
∑ ഥ ሻ𝟐 ሿ = ∑
ሾሺ𝑿𝒊 − 𝑿 ഥ𝟐
(𝑿𝟐𝒊 ) − 𝒏 × 𝑿
𝒊=𝟏 𝒊=𝟏
𝒏 𝒏
∑ ഥ ሻ𝟐 ሿ = ∑
ሾሺ𝒀𝒊 − 𝒀 ഥ𝟐
(𝒀𝟐𝒊 ) − 𝒏 × 𝒀
𝒊=𝟏 𝒊=𝟏
1º Propriedade
• O coeficiente de correlação não sofre alteração quando uma constante é adicionada a
(ou subtraída de) uma variável.
2º Propriedade
• O coeficiente de correlação pode não sofrer alteração ou pode ter seu sinal alterado
quando uma variável é multiplicada (ou dividida) por uma constante. Caso as
constantes tenham o mesmo sinal, o valor do coeficiente de correlação não será
alterado. Por outro lado, se as constantes tiverem sinais contrários, o coeficiente
mudará de sinal, mas o valor permanecerá inalterado.
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
- Propriedades
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
𝒀𝒊 = 𝜶 + 𝜷𝑿𝒊 + 𝜺𝒊
𝒀𝒊 = 𝟎 + 𝜷𝑿𝒊 + 𝜺𝒊
𝒀𝒊 = 𝜷𝑿𝒊 + 𝜺𝒊 .
Observar a redução no
resíduo (desvio) quando
comparado com um O resultado da análise de
modelo aproximadamente variância da regressão é
Estratégia para verificar se
uniforme 𝒀𝒊 = 𝝁 + 𝜺𝒊 . uma tabela que resume
compensa ou não utilizar
várias medidas usadas no
um modelo de regressão Testar a hipótese: teste de hipóteses anterior.
linear,
𝒀𝒊 = 𝜶 + 𝜷𝑿𝒊 + 𝜺𝒊 𝑯𝟎 : 𝜷 = 𝟎
൜
𝑯𝟏 : 𝜷 ≠ 𝟎
Graus de Liberdade
𝐺𝐿𝑀𝑜𝑑𝑒𝑙𝑜 = 2 − 1 = 1
𝐺𝐿𝑅𝑒𝑠í𝑑𝑢𝑜𝑠 = 𝑛 − 2
𝐺𝐿𝑇𝑜𝑡𝑎𝑙 = 𝑛 − 1
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
Somas de Quadrados
A soma dos quadrados totais é calculada por meio das seguintes fórmulas:
𝑖=1
Coeficiente de Determinação
𝑆𝑄𝑀
𝑅2 =
𝑆𝑄𝑇
𝑆𝑄𝑀
𝑅=√
𝑆𝑄𝑇
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
𝑆𝑄𝑅
⁄ሺ𝑛 − 2ሻ
̅𝑅̅̅̅2 = 1 −
𝑆𝑄𝑇
⁄ሺ𝑛 − 1ሻ
ሺ𝑛 − 1ሻ
̅̅
𝑅̅̅2 = 1 − ሺ1 − 𝑅 2 ሻ ×
ሺ𝑛 − 2ሻ
Quadrados Médios
𝑆𝑄𝑀
Quadrado médio do modelo (QMM): 𝑄𝑀𝑀 =
1
𝑆𝑄𝑅
Quadrado médio dos resíduos (QMR): 𝑄𝑀𝑅 =
𝑛−2
𝑆𝑄𝑇
Quadrado médio total (QMT): 𝑄𝑀𝑇 =
𝑛−1
Estatística F (Razão F)
𝑄𝑀𝑀
Estatística 𝑭 (ou razão F): 𝐹 ∗ = 𝑄𝑀𝑅
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
𝑆𝑄𝑀 𝑄𝑀𝑀
Modelo 1 SQM 𝑄𝑀𝑀 = 𝐹∗ =
1 𝑄𝑀𝑅
𝑆𝑄𝑅
Resíduos 𝑛−2 SQR 𝑄𝑀𝑅 =
𝑛−2
𝑺𝑸𝑻
Total 𝒏−𝟏 SQT 𝑸𝑴𝑻 =
𝒏−𝟏
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
Correlação Linear
Comentários:
A fórmula do coeficiente de correlação é expressa por:
𝐶𝑜𝑣(𝑥, 𝑦)
𝜌=
𝜎𝑥 × 𝜎𝑦
Em que 𝐶𝑜𝑣(𝑥, 𝑦),representa a covariância entre x e y, e 𝜎 representa o desvio padrão da variável
aleatória.
Substituindo os valores dados no enunciado, temos:
−1
𝜌(𝑥, 𝑦) =
2×1
𝜌(𝑥, 𝑦) = −0,5
Gabarito: B.
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
Comentários:
Tomemos a equação 𝑆̂ = 𝑎 + 𝑏𝑡 para a reta estimada. Sendo b é igual a 1,8.
A média dos salários dos 20 empregados é 2800 e o tempo médio de serviço é 2 anos.
Logo,
2,8 = 𝑎 + 1,8 × 2
2,8 = 𝑎 + 3,6
𝑎 = −0,8
A previsão para 5 anos fica:
𝑆̂ = (−0,8) + 1,8 × 5
𝑆̂ = (−0,8) + 9
𝑆̂ = 8,2
Que corresponde a R$ 8.200,00.
Gabarito: C.
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
Comentários:
==13272f==
𝑿 𝒀 ̅)
(𝑿 − 𝑿 ̅)
(𝒀 − 𝒀 ̅ ) (𝒀 − 𝒀
(𝑿 − 𝑿 ̅) ̅ )𝟐
(𝑿 − 𝑿
1 3 -1,5 -2 3 2,25
2 5 -0,5 0 0 0,25
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
̅ 𝑌̅), então:
Sabendo que a reta de regressão passa pelo ponto (𝑋,
𝑌̂ = 2,25 + 1,1 × 2,5
𝑌̂ = 5
Gabarito: C.
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
1. (VUNESP/EBSERH/2020) Numa regressão linear simples em que foi utilizada uma amostra
com 52 observações, a soma dos quadrados totais é de 50 e a soma dos quadrados dos resíduos
é de 20. O coeficiente de determinação e a estatística F dessa regressão são, respectivamente:
a) 0,6 e 75.
b) 0,6 e 12.
c) 0,8 e 1,5.
==13272f==
d) 0,8 e 12.
e) 0,8 e 75.
Comentários:
O coeficiente de determinação da regressão linear é expresso por:
𝑆𝑄𝑀 𝑆𝑄𝑅
𝑅2 = =1−
𝑆𝑄𝑇 𝑆𝑄𝑇
Quanto mais próximo de 1 estiver o coeficiente de determinação, mais forte será a correlação linear.
Implica dizer que as diferenças entre os valores observados (𝑌𝑖 ) e a média (𝑌̅) são quase totalmente
explicados pela reta de regressão. Por outro lado, quanto mais próximo de 0 estiver o coeficiente de
determinação, mais fraca será a correlação linear, isto é, a reta de regressão não é capaz de explicar as
diferenças entre os valores observados e a média.
Substituindo os valores, temos:
20
𝑅2 = 1 −
50
𝑅 2 = 1 − 0,4
𝑅 2 = 0,6
O coeficiente de determinação e a estatística 𝐹:
𝑆𝑄𝑀
𝑄𝑀𝑀 1 𝑆𝑄𝑀 × (𝑛 − 2)
𝐹= = =
𝑄𝑀𝑅 𝑆𝑄𝑅 𝑆𝑄𝑅
(𝑛 − 2)
Temos 52 observações, logo:
30 × (52 − 2)
𝐹=
20
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
𝐹 = 1,5 × 50
𝐹 = 75
Outra forma de fazer é:
𝑅 2 (𝑛 − 2)
𝐹=
1 − 𝑅2
030 × (52 − 2)
𝐹=
1 − 0,6
30
𝐹=
0,4
𝐹 = 75
Gabarito: A.
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
AVISO IMPORTANTE!
Informamos que não temos mais questões da banca, referente ao assunto tratado na aula de hoje, em
virtude de baixa cobrança deste tópico ao longo dos anos. No entanto, para complementar o estudo e deixar
sua preparação em alto nível, preparamos um caderno de questões inéditas que servirá como treino e
aprimoramento do conteúdo.
Bons estudos!
Estratégia Concursos
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
Correlação Linear
1. (INÉDITA/2022) Em um gráfico de dispersão, observa-se que a maioria dos pontos está situada no
primeiro e no terceiro quadrantes. Aqueles que não estão nessa posição, situam-se próximos da origem.
Então, a correlação linear entre as variáveis
a) poderá ser fracamente positiva.
b) será necessariamente fortemente positiva.
c) poderá ser fracamente negativa.
d) será necessariamente fortemente negativa.
e) será necessariamente nula.
Comentários:
O enunciado afirma que a maioria dos pontos estão no primeiro e no terceiro quadrantes, logo a reta que
representa os dados é crescente (correlação linear positiva). Se os pontos não estiverem necessariamente
sobre uma reta, a correlação poderá ser fracamente positiva.
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
2. (INÉDITA/2022) O coeficiente linear de Pearson indica a intensidade da correlação entre duas variáveis
e, ainda, o sentido dessa correlação. Assinale a alternativa que indica adequadamente a interpretação de
um determinado resultado obtido 𝒓 = −𝟎, 𝟗𝟏 para o coeficiente de correlação de Pearson:
a) Correlação linear negativa altamente significativa entre as variáveis.
b) Correlação linear positiva altamente significativa entre as variáveis.
c) Correlação linear positiva muito fraca entre as variáveis.
d) Correlação linear positiva relativamente fraca entre as variáveis.
e) Não há correlação linear positiva entre as variáveis.
Comentários:
O coeficiente de correlação varia entre -1 e 1, sendo que quanto mais próximo de zero estiverem os pares
ordenados, mais fraca será a correlação; e quanto mais próximo de 1 ou -1 estiverem os pares ordenados,
mais forte será a correlação. Na presente questão, temos uma correlação negativa e muito próxima de −1,
portanto, altamente significativa.
Gabarito: A.
3. (INÉDITA/2022) A tabela a seguir apresenta as penas de reclusão (P), em anos, cominadas a um grupo
de dez réus, e suas respectivas rendas familiares mensais per capitas (R), em número de salários-mínimos.
Réu 𝑷 𝑹 𝑷×𝑹 𝑷² 𝑹²
3 11 2 22 121 4
6 5 2 10 25 4
7 6 2,5 15 36 6,25
8 2 3 6 4 9
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
10 2 4 8 4 16
Dados:
𝟏𝟖𝟏𝟎, 𝟐𝟓 𝟏/𝟐 = 𝟒𝟐, 𝟓𝟒
𝟏𝟎𝟓, 𝟎𝟔𝟏/𝟐 = 𝟏𝟎, 𝟐𝟓
A partir das informações, o coeficiente de correlação linear entre as variáveis R e P é
a) – 0,31.
b) – 0,52.
c) – 0,66.
d) – 0,77.
e) – 0,82.
Comentários:
A fórmula do coeficiente de correlação linear que vamos utilizar é:
𝑛(∑ 𝑥𝑖 𝑦𝑖 ) − (∑ 𝑥𝑖 )(∑ 𝑦𝑖 )
𝜌(𝑥, 𝑦) =
√𝑛(∑ 𝑥𝑖2 ) − (∑ 𝑥𝑖 )2 √𝑛(∑ 𝑦𝑖2 ) − (∑ 𝑦𝑖 )2
Portanto, basta aplicarmos os valores apresentados na tabela. Assim, considerando P como a variável X e R
como a variável Y, temos:
10 × 113,25 − 68,5 × 21,75
𝜌(𝑥, 𝑦) =
√10 × 650,25 − 68,52 √10 × 57,8125 − 21,752
1132,5 − 1489,88
𝜌(𝑥, 𝑦) =
√6502,5 − 4692,25 √578,125 − 473,0625
−471,5
𝜌(𝑥, 𝑦) =
√1810,25 √105,0625
O enunciado também trouxe alguns dados importantes:
1810,25 1/2 = 42,54
105,061/2 = 10,25
Sabendo disso, podemos utilizar esses valores na fórmula de correlação, ficando assim:
−357,375
𝜌(𝑥, 𝑦) =
42,547 × 10,25
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
−357,375
𝜌(𝑥, 𝑦) =
436,1071
𝜌(𝑥, 𝑦) = −0,819
Gabarito: E.
Mês 𝑿 𝒀 𝑿×𝒀 𝑿² 𝒀²
2 8 14 112 64 196
4 5 9 45 25 81
5 3 17 51 9 289
Dados:
𝟐𝟔𝟔 𝟏/𝟐 = 𝟏𝟔, 𝟑𝟏
𝟏𝟗𝟒𝟏/𝟐 = 𝟏𝟑, 𝟗𝟑
A partir das informações, o coeficiente de correlação linear entre as variáveis X e Y é
a) 0,23.
b) 0,31.
c) 0,39.
d) 0,44.
e) 0,49.
Comentários:
A fórmula do coeficiente de correlação linear que vamos utilizar é:
𝑛(∑ 𝑥𝑖 𝑦𝑖 ) − (∑ 𝑥𝑖 )(∑ 𝑦𝑖 )
𝜌(𝑥, 𝑦) =
√𝑛(∑ 𝑥𝑖2 ) − (∑ 𝑥𝑖 )2 √𝑛(∑ 𝑦𝑖2 ) − (∑ 𝑦𝑖 )2
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
52
𝜌(𝑥, 𝑦) =
16,31 × 13,93
52
𝜌(𝑥, 𝑦) =
227,1651
𝜌(𝑥, 𝑦) = 0,23
Gabarito: A.
5. (INÉDITA/2022) A variável x tem desvio padrão igual a 1, enquanto a variável y tem desvio padrão igual
a 2. Se a covariância entre x e y é 0,5, então o coeficiente de correlação entre x e y é
a) 0,65.
b) 0,55.
c) 0,45.
d) 0,35.
e) 0,25.
Comentários:
A fórmula do coeficiente de correlação é expressa por:
𝐶𝑜𝑣(𝑥, 𝑦)
𝜌=
𝜎𝑥 × 𝜎𝑦
em que 𝐶𝑜𝑣(𝑥, 𝑦),representa a covariância entre x e y, e 𝜎 representa o desvio padrão da variável aleatória.
Substituindo os valores dados no enunciado, temos:
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
0,5
𝜌(𝑥, 𝑦) =
1×2
𝜌(𝑥, 𝑦) = 0,25
Gabarito: E.
6. (INÉDITA/2022) A variável x tem média 10 e desvio padrão 5, enquanto a variável y tem média 2 e desvio
padrão 1. Se a covariância entre x e y é 2, então o coeficiente de correlação entre x e y é
a) 0,4.
b) 0,5.
c) 0,8.
d) –0,4.
e) –0,6.
Comentários:
A fórmula do coeficiente de correlação é expressa por:
𝐶𝑜𝑣(𝑥, 𝑦)
𝜌=
𝜎𝑥 × 𝜎𝑦
em que 𝐶𝑜𝑣(𝑥, 𝑦),representa a covariância entre x e y, e 𝜎 representa o desvio padrão da variável aleatória.
Substituindo os valores dados no enunciado, temos:
2
𝜌(𝑥, 𝑦) =
5×1
𝜌(𝑥, 𝑦) = 0,4
Gabarito: A.
1 7 6
2 6 5
3 9 10
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
4 10 9
5 3 2
Comentários:
7 + 6 + 9 + 10 + 3 35
𝑋̅ = = =7
5 5
6 + 5 + 10 + 9 + 2 32
𝑌̅ = = = 6,4
5 5
̅ 𝒀𝒊 − 𝒀
Amostra 𝑿𝒊 𝒀𝒊 𝑿𝒊 − 𝑿 ̅
1 7 6 0 -0,4
2 6 5 -1 -1,4
3 9 10 2 3,6
4 10 9 3 2,6
5 3 2 -4 -4,4
Nesse ponto, teremos que calcular o numerador e o denominador do coeficiente de correlação. Para tanto,
precisaremos multiplicar os desvios de X pelos desvios de Y, bem como calcular os quadrados dos desvios:
̅ 𝒀𝒊 − 𝒀
Amostra 𝑿𝒊 𝒀𝒊 𝑿𝒊 − 𝑿 ̅ (𝑿𝒊 − 𝑿
̅ ) × (𝒀𝒊 − 𝒀
̅ ) (𝑿𝒊 − 𝑿
̅ )² (𝒀𝒊 − 𝒀
̅ )²
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
1 7 6 0 -0,4 0 0 0,16
Total 34 30 41,2
34
𝑟=
√30 × 41,2
𝑟 ≅ 0,967
Gabarito: B.
8. (INÉDITA/2022) A quantidade de metros de tecido vendidos por uma loja e o valor das vendas mensais
são apresentados na tabela a seguir, em que y representa os valores arrecadados com a venda de tecidos
no mês e x a quantidade de metros vendidos.
1 1 1
2 2 1
3 3 2
4 4 2
5 5 4
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
Comentários:
1 + 2 + 3 + 4 + 5 15
𝑋̅ = = =3
5 5
1 + 1 + 2 + 2 + 4 10
𝑌̅ = = =2
5 5
̅ 𝒀𝒊 − 𝒀
Mês 𝑿𝒊 𝒀𝒊 𝑿𝒊 − 𝑿 ̅
1 1 1 -2 -1
2 2 1 -1 -1
3 3 2 0 0
4 4 2 1 0
5 5 4 2 2
Nesse ponto, teremos que calcular o numerador e o denominador do coeficiente de correlação. Para tanto,
precisaremos multiplicar os desvios de X pelos desvios de Y, bem como calcular os quadrados dos desvios:
Mês ̅ 𝒀𝒊 − 𝒀
𝑿𝒊 𝒀𝒊 𝑿𝒊 − 𝑿 ̅ (𝑿𝒊 − 𝑿
̅ ) × (𝒀𝒊 − 𝒀
̅ ) (𝑿𝒊 − 𝑿
̅ )² (𝒀𝒊 − 𝒀
̅ )²
1 1 1 -2 -1 2 4 1
2 2 1 -1 -1 1 1 1
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
3 3 2 0 0 0 0 0
4 4 2 1 0 0 1 0
5 5 4 2 2 4 4 4
Total 7 10 6
6
𝑟=
√7 × 10
𝑟 ≅ 0,904
Gabarito: C.
9. (INÉDITA/2022) Uma empresa está aplicando métodos motivacionais para melhorar os resultados de
seus funcionários com as vendas. Sejam y os valores relativos à quantidade vendida de um produto e x as
despesas relativas aos valores investidos em métodos motivacionais apresentados na tabela a seguir.
x 2 6 10 3 7 5
Comentários:
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
2 + 6 + 10 + 8 + 3 + 7 + 5
𝑋̅ = = 5,5
6
𝑿𝒊 𝒀𝒊 ̅ 𝒀𝒊 − 𝒀
𝑿𝒊 − 𝑿 ̅
10 240 4,5 85
7 200 1,5 45
5 150 -0,5 -5
Nesse ponto, temos que calcular o numerador e o denominador do coeficiente de correlação. Para tanto,
precisaremos multiplicar os desvios de X pelos desvios de Y, bem como calcular os quadrados dos desvios:
𝑿𝒊 𝒀𝒊 ̅ 𝒀𝒊 − 𝒀
𝑿𝒊 − 𝑿 ̅ (𝑿𝒊 − 𝑿
̅ ) × (𝒀𝒊 − 𝒀
̅ ) (𝑿𝒊 − 𝑿
̅ )² (𝒀𝒊 − 𝒀
̅ )²
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
715
𝑟=
√41,5 × 14750
𝑟 ≅ 0,914
Gabarito: A.
10. (INÉDITA/2022) Os autores de um artigo apresentaram uma análise de correlação para investigar a
relação entre o nível máximo de lactato x e a resistência muscular y. Os dados a seguir foram obtidos
O coeficiente de correlação linear entre o nível máximo de lactato (x) e a resistência (y) é:
a) 0,11.
b) 0,23.
c) -0,13.
d) -0,06.
e) 0,16.
Comentários:
𝑿𝒊 𝒀𝒊 ̅ 𝒀𝒊 − 𝒀
𝑿𝒊 − 𝑿 ̅
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
750 4 0 -0,25
Nesse ponto, temos que calcular o numerador e o denominador do coeficiente de correlação. Para tanto,
precisaremos multiplicar os desvios de X pelos desvios de Y, bem como calcular os quadrados dos desvios:
𝑿𝒊 𝒀𝒊 ̅ 𝒀𝒊 − 𝒀
𝑿𝒊 − 𝑿 ̅ (𝑿𝒊 − 𝑿
̅ ) × (𝒀𝒊 − 𝒀
̅ ) (𝑿𝒊 − 𝑿
̅ )² (𝒀𝒊 − 𝒀
̅ )²
−45
𝑟=
√200000 × 2,355
𝑟 ≅ −0,065
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
Gabarito: D.
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
1. (INÉDITA/2022) A nota final de uma disciplina é calculada com base no valor médio obtido pelo método
dos mínimos quadrados. Se um aluno obtiver as notas 3,5; 5,5; 7; 8; a sua nota final deverá ser:
a) 5.
b) 5,5.
c) 6.
d) 6,5.
e) 7.
Comentários:
Vamos montar uma tabela com os dados fornecidos:
𝑿 𝒀 ̅)
(𝑿 − 𝑿 ̅)
(𝒀 − 𝒀 ̅ ) (𝒀 − 𝒀
(𝑿 − 𝑿 ̅) ̅ )𝟐
(𝑿 − 𝑿
̅ = 𝟐, 𝟓
𝑿 ̅=𝟔
𝒀 Total 7,5 5
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
2. (INÉDITA/2022) Um pesquisador, ao avaliar o efeito de uma variável X sobre outra Y por meio de uma
̂=𝜶
regressão linear da forma 𝒀 ̂+𝜷 ̂ 𝑿, usando o método dos mínimos quadrados, encontrou, a partir de
==13272f==
Comentários:
Inicialmente, vamos calcular os valores de 𝑌̅ e de 𝑋̅:
∑ 𝑦 200
𝑌̅ = = = 20
𝑛 10
∑ 𝑥 150
𝑋̅ = = = 15
𝑛 10
Agora, utilizaremos o método dos mínimos quadrados para determinar 𝛽̂ :
∑ 𝑋𝑖 𝑌𝑖 − 𝑛𝑋̅𝑌̅
𝛽̂ =
∑ 𝑋𝑖2 − 𝑛𝑋̅²
4500 − 10 × 15 × 20
𝛽̂ =
2750 − 10 × 15²
1500
𝛽̂ = =3
500
Conhecendo 𝛽̂ , podemos determinar o valor de 𝛼̂:
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
∑ 𝑌𝑖 − 𝛽̂ ∑ 𝑋𝑖
𝛼̂ =
𝑛
𝛼̂ = 20 − 3 × 15 = −25
Assim, o modelo de regressão é dado por:
𝑌̂ = −25 + 3 × 𝑋
Para 𝑋 = 10, temos o seguinte valor de 𝑌̂:
𝑌̂ = −25 + 3 × 10
𝑌̂ = 5
Para 𝑋 = 9, temos o seguinte valor de 𝑌̂:
𝑌̂ = −25 + 3 × 9
𝑌̂ = 2
Para 𝑋 = 8, temos o seguinte valor de 𝑌̂:
𝑌̂ = −25 + 3 × 8
𝑌̂ = −1
Gabarito: C.
Comentários:
Primeiro calculamos as médias de X e de Y:
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
∑ 𝑋 20
𝑋̅ = = =5
𝑛 4
∑𝑌 12
𝑌̅ = = =3
𝑛 4
O valor de 𝑏 é calculado pela seguinte relação:
∑𝑋𝑌 − 𝑛 × 𝑋̅ × 𝑌̅
𝑏=
∑𝑋 2 − 𝑛 × (𝑋̅)2
48 − 4 × 5 × 3
𝑏=
52 − 4 × 52
48 − 60
𝑏=
52 − 100
−12
𝑏=
−48
1
𝑏=
4
Gabarito: A.
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
1. (INÉDITA/2022) Em uma regressão linear simples em que foi utilizada uma amostra com 42 observações,
a soma dos quadrados totais é de 40 e a soma dos quadrados dos resíduos é de 10. O coeficiente de
determinação e a estatística F dessa regressão são, respectivamente:
a) 0,6 e 225.
b) 0,6 e 120.
c) 0,75 e 120.
d) 0,75 e 225.
e) 0,8 e 75.
Comentários:
O coeficiente de determinação da regressão linear é expresso por:
𝑆𝑄𝑀 𝑆𝑄𝑅
𝑅2 = =1−
𝑆𝑄𝑇 𝑆𝑄𝑇
Substituindo os valores, temos:
10
𝑅2 = 1 −
40
𝑅 2 = 1 − 0,25
𝑅 2 = 0,75
O coeficiente de determinação e a estatística 𝐹:
𝑆𝑄𝑀
𝑄𝑀𝑀 1 𝑆𝑄𝑀 × (𝑛 − 2)
𝐹= = =
𝑄𝑀𝑅 𝑆𝑄𝑅 𝑆𝑄𝑅
(𝑛 − 2)
Temos 42 observações, logo:
30 × (42 − 2)
𝐹=
10
𝐹 = 3 × 40
𝐹 = 120
Gabarito: C.
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
Modelo 1 275
Erro 89 125
Total 90 400
Comentários:
O coeficiente de determinação da regressão linear é dado por:
𝑆𝑄𝑀
𝑅2 =
𝑆𝑄𝑇
𝑆𝑄𝑀 → 𝑆𝑜𝑚𝑎 𝑑𝑜𝑠 𝑞𝑢𝑎𝑑𝑟𝑎𝑑𝑜𝑠 𝑑𝑜 𝑚𝑜𝑑𝑒𝑙𝑜 𝑑𝑒 𝑟𝑒𝑔𝑟𝑒𝑠𝑠ã𝑜
𝑆𝑄𝑇 → 𝑆𝑜𝑚𝑎 𝑑𝑜𝑠 𝑞𝑢𝑎𝑑𝑟𝑎𝑑𝑜𝑠 𝑡𝑜𝑡𝑎𝑙 (𝑆𝑄𝑇 = 𝑆𝑄𝑀 + 𝑆𝑄𝑅)
Substituindo pelos valores da tabela, temos:
275
𝑅2 =
400
𝑅 2 = 0,6875
𝑅 = √0,6875
𝑅 = 0,83
Gabarito: A.
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
Erro 250 10 25
Total 750 11
A partir das informações e da tabela apresentadas, a correlação linear de Pearson entre a variável resposta
Y e a variável regressora X é igual:
a) 0,416
b) 0,516
c) 0,616
d) 0,716
e) 0,816
Comentários:
O coeficiente de correlação linear entre as variáveis X e Y é calculado por meio da seguinte expressão:
𝑆𝑄𝑀
𝑅=√ ,
𝑆𝑄𝑇
em que 𝑆𝑄𝑀 indica a soma dos quadrados da regressão (modelo) e 𝑆𝑄𝑇 a soma dos quadrados totais.
Pela tabela, verificamos que 𝑆𝑄𝑇 = 750 e 𝑆𝑄𝑀 = 500. Substituindo esses valores na equação anterior,
teremos:
500
𝑅=√ = √0,666 = 0,816
750
Gabarito: E.
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
com média zero e variância 𝝈². A tabela a seguir representa a análise de variância (ANOVA) proporcionada
por esse modelo.
Erro 250 10 25
Total 750 11
A partir das informações e da tabela apresentadas, pode-se constatar que a variância amostral é
aproximadamente igual a:
==13272f==
a) 64,18
b) 66,18
c) 68,18
d) 70,18
e) 72,18
Comentários:
A soma dos quadrados totais (SQT) é dada por:
𝑛
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
com média zero e variância 𝝈². A tabela a seguir representa a análise de variância (ANOVA) proporcionada
por esse modelo.
Erro 250 10 25
Total 750 11
Comentários:
O coeficiente de determinação é calculado por meio da expressão:
𝑆𝑄𝑀 𝑆𝑄𝑅
𝑅2 = =1− ,
𝑆𝑄𝑇 𝑆𝑄𝑇
em que 𝑆𝑄𝑀 = soma dos quadrados da regressão (modelo), 𝑆𝑄𝑅 = soma dos quadrados dos resíduos e SQT
= soma dos quadrados totais.
O R2 ajustado é definido para uma equação com 2 coeficientes como
̅𝑅̅̅2̅ = 1 − (𝑛 − 1) × (1 − 𝑅 2 ).
𝑛−2
Pela tabela temos que 𝑆𝑄𝑇 = 750 e 𝑆𝑄𝑀 = 500. Substituindo os valores apresentados na tabela nas
equações acima, teremos:
500
𝑅2 = = 0,666.
750
Além disso, como temos 𝑛 − 1 = 11 graus de liberdade totais, então
̅𝑅̅̅2̅ = 1 − (𝑛 − 1) × (1 − 𝑅 2 ).
𝑛−2
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
̅̅
𝑅̅2̅ = 1 − 1,1 × 0,333
̅𝑅̅̅2̅ = 1 − 0,3666
̅𝑅̅̅2̅ = 0,6333.
Gabarito: B.
6. (INÉDITA/2022) Após estimar um modelo de regressão simples, um estatístico trabalha nos resultados,
obtendo a tabela a seguir:
Resíduos 200 8 25
Comentários:
Analisando-se cada alternativa, temos:
Letra A: Errado. Não é possível estimar o coeficiente angular, pois não há informações acerca de∑(𝑋𝑖 − 𝑋̅)2 .
Logo, não é possível afirmar que tal estimativa valha 5.
Letra B: Errado. Um estimador não viciado para a variância do erro 𝜎 2 é dado por
𝜎 2 = 𝑄𝑀𝑅𝑒𝑠 = 25
Letra C: Errado. O p-valor próximo de zero significa que o modelo proposto é adequado, pois fornece
evidências contra a hipótese nula. Contudo, com base nas informações dadas na questão, não podemos
afirmar que o modelo passa no teste de significância da estatística F.
Letra D: Correto. O coeficiente de determinação 𝑅 2 estima a proporção da variabilidade da variável
dependente que é explicada pelo conjunto das 𝑘 variáveis independentes do modelo de regressão. Devemos
lembrar que a definição do coeficiente é
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
𝑆𝑄𝑀
𝑅2 = .
𝑆𝑄𝑇
Com isso, teremos:
600
𝑅2 = = 0,75 = 75%.
800
Letra E: Errado. A variância da variável explicativa do modelo é dada pela soma dos quadrados do modelo.
Representa as distâncias quadráticas dos valores ajustados pelo modelo em relação à média aritmética.
Nessa questão, esse valor é igual a 600.
Gabarito: D.
7. (INÉDITA/2022) Um perito foi convocado para verificar se o valor de Y, número de pastilhas descoladas
de uma fachada, estava relacionado ao valor de X, tempo de exposição ao sol.
Modelo 1 4,80
Erro 5 1,20
Total 6 6,000
Considerando que ∑(𝒙𝒊 − 𝒙̅)𝟐 = 𝟐𝟎; 𝒆 𝟎, 𝟎𝟔𝟏/𝟐 = 𝟎, 𝟐𝟒𝟒, o valor do coeficiente angular é
aproximadamente igual a:
a) 0,244
b) 0,488
c) 0,366
d) 0,566
e) 0,433
Comentários:
Sabemos que:
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
𝑏 2 = 0,24
Comentários:
O coeficiente de determinação é o quadrado do coeficiente de correlação:
𝑅 2 = 0,92 = 0,81
Gabarito: D.
9. (INÉDITA/2022) Considere que o coeficiente de determinação tenha sido de 0,49, no ajuste de uma reta
de regressão linear simples de uma variável Y em uma variável X. Então, o módulo do coeficiente de
correlação amostral entre X e Y é igual a:
a) 0,25
b) 0,35
c) 0,50
d) 0,65
e) 0,70
Comentários:
Seja 𝑅 2 o coeficiente de determinação e 𝑟 o coeficiente de correlação.
𝑅 2 = 0,49
Logo,
𝑅 = ±√0,49
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
𝑅 = ±0,7
O módulo de 𝑅 vale 0,7.
Gabarito: E.
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
Correlação Linear
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
GABARITO – VUNESP
Correlação Linear
1. LETRA B
==13272f==
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
GABARITO – VUNESP
1. LETRA C 2. LETRA C
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
1. (VUNESP/EBSERH/2020) Numa regressão linear simples em que foi utilizada uma amostra
com 52 observações, a soma dos quadrados totais é de 50 e a soma dos quadrados dos resíduos
é de 20. O coeficiente de determinação e a estatística F dessa regressão são, respectivamente:
a) 0,6 e 75.
b) 0,6 e 12.
c) 0,8 e 1,5.
==13272f==
d) 0,8 e 12.
e) 0,8 e 75.
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
GABARITO – VUNESP
1. LETRA A
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
Correlação Linear
1. (INÉDITA/2022) Em um gráfico de dispersão, observa-se que a maioria dos pontos está situada no
primeiro e no terceiro quadrantes. Aqueles que não estão nessa posição, situam-se próximos da origem.
Então, a correlação linear entre as variáveis
a) poderá ser fracamente positiva.
b) será necessariamente fortemente positiva.
c) poderá ser fracamente negativa.
d) será necessariamente fortemente negativa.
e) será necessariamente nula.
2. (INÉDITA/2022) O coeficiente linear de Pearson indica a intensidade da correlação entre duas variáveis
e, ainda, o sentido dessa correlação. Assinale a alternativa que indica adequadamente a interpretação de
um determinado resultado obtido 𝒓 = −𝟎, 𝟗𝟏 para o coeficiente de correlação de Pearson:
a) Correlação linear negativa altamente significativa entre as variáveis.
b) Correlação linear positiva altamente significativa entre as variáveis.
c) Correlação linear positiva muito fraca entre as variáveis.
d) Correlação linear positiva relativamente fraca entre as variáveis.
e) Não há correlação linear positiva entre as variáveis.
3. (INÉDITA/2022) A tabela a seguir apresenta as penas de reclusão (P), em anos, cominadas a um grupo
de dez réus, e suas respectivas rendas familiares mensais per capitas (R), em número de salários-mínimos.
Réu 𝑷 𝑹 𝑷×𝑹 𝑷² 𝑹²
3 11 2 22 121 4
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
6 5 2 10 25 4
7 6 2,5 15 36 6,25
8 2 3 6 4 9
10 2 4 8 4 16
Dados:
𝟏𝟖𝟏𝟎, 𝟐𝟓 𝟏/𝟐 = 𝟒𝟐, 𝟓𝟒
𝟏𝟎𝟓, 𝟎𝟔𝟏/𝟐 = 𝟏𝟎, 𝟐𝟓
A partir das informações, o coeficiente de correlação linear entre as variáveis R e P é
a) – 0,31.
b) – 0,52.
c) – 0,66.
d) – 0,77.
e) – 0,82.
Mês 𝑿 𝒀 𝑿×𝒀 𝑿² 𝒀²
2 8 14 112 64 196
4 5 9 45 25 81
5 3 17 51 9 289
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
Dados:
𝟐𝟔𝟔 𝟏/𝟐 = 𝟏𝟔, 𝟑𝟏
𝟏𝟗𝟒𝟏/𝟐 = 𝟏𝟑, 𝟗𝟑
A partir das informações, o coeficiente de correlação linear entre as variáveis X e Y é
a) 0,23.
b) 0,31.
c) 0,39.
d) 0,44. ==13272f==
e) 0,49.
5. (INÉDITA/2022) A variável x tem desvio padrão igual a 1, enquanto a variável y tem desvio padrão igual
a 2. Se a covariância entre x e y é 0,5, então o coeficiente de correlação entre x e y é
a) 0,65.
b) 0,55.
c) 0,45.
d) 0,35.
e) 0,25.
6. (INÉDITA/2022) A variável x tem média 10 e desvio padrão 5, enquanto a variável y tem média 2 e desvio
padrão 1. Se a covariância entre x e y é 2, então o coeficiente de correlação entre x e y é
a) 0,4.
b) 0,5.
c) 0,8.
d) –0,4.
e) –0,6.
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
1 7 6
2 6 5
3 9 10
4 10 9
5 3 2
8. (INÉDITA/2022) A quantidade de metros de tecido vendidos por uma loja e o valor das vendas mensais
são apresentados na tabela a seguir, em que y representa os valores arrecadados com a venda de tecidos
no mês e x a quantidade de metros vendidos.
1 1 1
2 2 1
3 3 2
4 4 2
5 5 4
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
d) 0,83
e) 0,86
9. (INÉDITA/2022) Uma empresa está aplicando métodos motivacionais para melhorar os resultados de
seus funcionários com as vendas. Sejam y os valores relativos à quantidade vendida de um produto e x as
despesas relativas aos valores investidos em métodos motivacionais apresentados na tabela a seguir.
x 2 6 10 3 7 5
10. (INÉDITA/2022) Os autores de um artigo apresentaram uma análise de correlação para investigar a
relação entre o nível máximo de lactato x e a resistência muscular y. Os dados a seguir foram obtidos
O coeficiente de correlação linear entre o nível máximo de lactato (x) e a resistência (y) é:
a) 0,11.
b) 0,23.
c) -0,13.
d) -0,06.
e) 0,16.
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
GABARITO – INÉDITAS
Correlação Linear
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
1. (INÉDITA/2022) A nota final de uma disciplina é calculada com base no valor médio obtido pelo método
dos mínimos quadrados. Se um aluno obtiver as notas 3,5; 5,5; 7; 8; a sua nota final deverá ser:
a) 5.
b) 5,5.
c) 6.
d) 6,5.
e) 7.
2. (INÉDITA/2022) Um pesquisador, ao avaliar o efeito de uma variável X sobre outra Y por meio de uma
̂=𝜶
regressão linear da forma 𝒀 ̂+𝜷 ̂ 𝑿, usando o método dos mínimos quadrados, encontrou, a partir de
10 amostras, os seguintes somatórios:
∑𝑿 = 𝟏𝟓𝟎; ∑𝒀 = 𝟐𝟎𝟎; ∑𝑿𝟐 = 𝟐. 𝟕𝟓𝟎; 𝒆 ∑(𝑿𝒀) = 𝟒. 𝟓𝟎𝟎
A partir desses resultados, julgue o item a seguir.
a) para 𝑋 = 10, a estimativa de 𝑌 é 𝑌̂ = 2.
b) para 𝑋 = 8, a estimativa de 𝑌 é 𝑌̂ = 5.
c) para 𝑋 = 8, a estimativa de 𝑌 é 𝑌̂ = −1.
d) para 𝑋 = 9, a estimativa de 𝑌 é 𝑌̂ = 5.
e) para 𝑋 = 10, a estimativa de 𝑌 é 𝑌̂ = −1.
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
b) 3/7.
c) 1/3.
d) 3/4.
e) 2/5.
==13272f==
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
GABARITO – INÉDITAS
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
1. (INÉDITA/2022) Em uma regressão linear simples em que foi utilizada uma amostra com 42 observações,
a soma dos quadrados totais é de 40 e a soma dos quadrados dos resíduos é de 10. O coeficiente de
determinação e a estatística F dessa regressão são, respectivamente:
a) 0,6 e 225.
b) 0,6 e 120.
c) 0,75 e 120.
d) 0,75 e 225.
e) 0,8 e 75.
Modelo 1 275
Erro 89 125
Total 90 400
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
Erro 250 10 25
Total 750 11
A partir das informações e da tabela apresentadas, a correlação linear de Pearson entre a variável resposta
Y e a variável regressora X é igual:
a) 0,416
b) 0,516
c) 0,616
d) 0,716
e) 0,816
Erro 250 10 25
Total 750 11
A partir das informações e da tabela apresentadas, pode-se constatar que a variância amostral é
aproximadamente igual a:
a) 64,18
b) 66,18
c) 68,18
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
d) 70,18
e) 72,18
Erro 250 10 25
Total 750 11
6. (INÉDITA/2022) Após estimar um modelo de regressão simples, um estatístico trabalha nos resultados,
obtendo a tabela a seguir:
Resíduos 200 8 25
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
c) apesar de um poder de explicação de 75%, o modelo não passa no teste de significância da estatística F;
d) o modelo é capaz de explicar 75% da variação total;
e) a variância da variável explicativa do modelo é igual a 200;
7. (INÉDITA/2022) Um perito foi convocado para verificar se o valor de Y, número de pastilhas descoladas
de uma fachada, estava relacionado ao valor de X, tempo de exposição ao sol.
Modelo 1 4,80
Erro 5 1,20
Total 6 6,000
Considerando que ∑(𝒙𝒊 − 𝒙̅)𝟐 = 𝟐𝟎; 𝒆 𝟎, 𝟎𝟔𝟏/𝟐 = 𝟎, 𝟐𝟒𝟒, o valor do coeficiente angular é
aproximadamente igual a:
a) 0,244
b) 0,488
c) 0,366
d) 0,566
e) 0,433
9. (INÉDITA/2022) Considere que o coeficiente de determinação tenha sido de 0,49, no ajuste de uma reta
de regressão linear simples de uma variável Y em uma variável X. Então, o módulo do coeficiente de
correlação amostral entre X e Y é igual a:
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
a) 0,25
b) 0,35
c) 0,50
d) 0,65
e) 0,70
==13272f==
-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05
GABARITO – INÉDITAS
-Agradecemos a preferência