0% acharam este documento útil (0 voto)
14 visualizações116 páginas

Estatística Descritiva: Correlação e Regressão

Direitos autorais
© © All Rights Reserved
Levamos muito a sério os direitos de conteúdo. Se você suspeita que este conteúdo é seu, reivindique-o aqui.
Formatos disponíveis
Baixe no formato PDF, TXT ou leia on-line no Scribd
0% acharam este documento útil (0 voto)
14 visualizações116 páginas

Estatística Descritiva: Correlação e Regressão

Direitos autorais
© © All Rights Reserved
Levamos muito a sério os direitos de conteúdo. Se você suspeita que este conteúdo é seu, reivindique-o aqui.
Formatos disponíveis
Baixe no formato PDF, TXT ou leia on-line no Scribd

Aula 05

Prefeitura de São Paulo - APPGG


(Analista de Políticas Públicas e Gestão
Governamental) Estatística Descritiva -
2023 (Pós-Edital)

Autor:
Equipe Exatas Estratégia
Concursos

23 de Junho de 2023

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

Índice
1) Correlação Linear
..............................................................................................................................................................................................3

2) Regressão Linear Simples


..............................................................................................................................................................................................
27

3) Análise de Variância da Regressão


..............................................................................................................................................................................................
41

4) Questões Comentadas - Correlação Linear - Vunesp


..............................................................................................................................................................................................
61

5) Questões Comentadas - Regressão Linear Simples - Vunesp


..............................................................................................................................................................................................
62

6) Questões Comentadas - Análise de Variância da Regressão - Vunesp


..............................................................................................................................................................................................
65

7) Aviso importante - Orientação de estudo


..............................................................................................................................................................................................
67

8) Questões Comentadas - Correlação Linear - Inéditas


..............................................................................................................................................................................................
68

9) Questões Comentadas - Regressão Linear Simples - Inéditas


..............................................................................................................................................................................................
82

10) Questões Comentadas - Análise de Variância da Regressão - Inéditas


..............................................................................................................................................................................................
86

11) Lista de Questões - Correlação Linear - Vunesp


..............................................................................................................................................................................................
95

12) Lista de Questões - Regressão Linear Simples - Vunesp


..............................................................................................................................................................................................
97

13) Lista de Questões - Análise de Variância da Regressão - Vunesp


..............................................................................................................................................................................................
99

14) Lista de Questões - Correlação Linear - Inéditas


..............................................................................................................................................................................................
101

15) Lista de Questões - Regressão Linear Simples - Inéditas


..............................................................................................................................................................................................
107

16) Lista de Questões - Análise de Variância da Regressão - Inéditas


..............................................................................................................................................................................................
110

2 - 2023 (Pó
Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

CORRELAÇÃO LINEAR
Neste tópico estudaremos a correlação linear. A correlação é usada para indicar a força que mantém unidos
dois conjuntos de valores. Por meio da análise da correlação linear, buscamos identificar se existe alguma
relação entre duas ou mais variáveis, ou seja, se as alterações nas variáveis estão associadas umas com a
outras.

Para avaliar a existência de correlação podemos recorrer a uma forma de representação gráfica bem simples,
que chamamos de gráfico de dispersão. Basicamente, ela é uma representação de pares ordenados em um
plano cartesiano, composto por um eixo vertical (ordenada) e um eixo horizontal (abcissa).

50
45
40
35
30
Eixo Y

25
20
15
10
5
0
0 10 20 30 40 50 60 70 80 90 100
Eixo X

A título exemplificativo, as informações da tabela a seguir referem-se ao número de questões resolvidas por
um determinado aluno e a nota obtida por ele em uma avaliação. Observe que quanto maior o número de
questões resolvidas, maior é a nota obtida na avaliação.

Aluno Número de Questões (X) Nota Obtida (Y)

1 20 2
2 60 8
3 30 3
4 50 6
5 40 4
6 70 8
7 80 9
8 90 10
9 40 6

3 - 2023 (Pó
Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

10 30 4
11 10 1
12 60 6
13 50 5
14 70 6
15 90 9
16 100 10
17 20 3
18 40 5
19 60 7
20 50 4

A representação desses dados em formato de diagrama de dispersão sugere a existência de uma relação
linear positiva (variação no mesmo sentido) entre as duas variáveis:

11
10
9
8
Nota Obtida

7
6
5
4
3
2
1
0
0 10 20 30 40 50 60 70 80 90 100 110
Número de Questões

Neste exemplo, percebemos que a relação dos dados agrupados é quase linear. Por isso, se traçarmos uma
reta de tendência no gráfico, observaremos que os pontos se comportarão em torno da reta.

4 - 2023 (Pó
Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

Assim:

11
10
9
8
y = 0,0992x + 0,5441
Nota Obtida

7
6
5
4
3
2
1
0
0 10 20 30 40 50 60 70 80 90 100 110
Número de Questões

Há situações em que essa relação linear não é tão evidente. Um exemplo disso é quando os pontos estão
mais dispersos. Nesse caso, para identificarmos a relação existente entre as variáveis, usamos o coeficiente
de correlação linear de Pearson, definido por 𝑟.

Por fim, devemos ter em mente que a correlação linear pode ser:

a) direta ou positiva – quando temos dois fenômenos que variam no mesmo sentido. Se aumentarmos
ou diminuirmos um deles, o outro também aumentará ou diminuirá;

b) inversa ou negativa – quando temos dois fenômenos que variam em sentido contrário. Se
aumentarmos ou diminuirmos um deles, acontecerá o contrário com o outro, no caso, diminuirá ou
aumentará;

c) inexistente ou nula – quando não existe correlação ou dependência entre os dois fenômenos. Nessa
situação, o valor do coeficiente de correlação linear será zero (𝑟 = 0) ou um valor aproximadamente
igual a zero (𝑟 ≅ 0); e

d) perfeita – quando os fenômenos se ajustam perfeitamente a uma reta.

5 - 2023 (Pó
Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

As figuras a seguir ilustram essas quatro situações:

Correlação Positiva Correlação Negativa


14 14

12 12

10 10

8 8

6 6

4 4

2 2

0 0
0 5 10 15 0 5 10 15

Correlação Nula Correlação Perfeita


14 14

12 12

10 10

8 8

6 6

4 4

2 2

0 0
0 5 10 15 0 5 10 15

6 - 2023 (Pó
Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

Coeficiente de Correlação de Pearson

O coeficiente de correlação linear de Pearson é adotado para medir o quão forte é a relação linear entre
duas variáveis. Esse coeficiente é calculado pela seguinte expressão:

̅ ) × (𝒀𝒊 − 𝒀
∑𝒏𝒊=𝟏[(𝑿𝒊 − 𝑿 ̅ )]
𝒓=
̅ )² × ∑𝒏𝒊=𝟏(𝒀𝒊 − 𝒀
√∑𝒏𝒊=𝟏(𝑿𝒊 − 𝑿 ̅ )²

Os somatórios dessa fórmula podem ser simplificados, o que facilita a resolução de muitas questões. Por
isso, é muito importante que vocês aprendam a expressão a seguir:

𝒏 𝒏
∑ ̅ ) × (𝒀𝒊 − 𝒀
[(𝑿𝒊 − 𝑿 ̅ )] = ∑ ̅ ×𝒀
(𝑿𝒊 × 𝒀𝒊 ) − 𝒏 × 𝑿 ̅
𝒊=𝟏 𝒊=𝟏

Para facilitar a compreensão e internalização, vou apresentar um raciocínio que podemos adotar
para deduzir a fórmula alternativa mostrada anteriormente.

Primeiro, precisamos aplicar a propriedade distributiva:


𝑛 𝑛
∑ [(𝑋𝑖 − 𝑋̅) × (𝑌𝑖 − 𝑌̅)] = ∑ [𝑋𝑖 × 𝑌𝑖 − 𝑋𝑖 × 𝑌̅ − 𝑋̅ × 𝑌𝑖 + 𝑋̅ × 𝑌̅]
𝑖=1 𝑖=1

Agora, precisamos separar as quatro parcelas desse somatório principal. Reparem que as médias
são constantes, portanto, podem sair do somatório:
𝑛 𝑛 𝑛 𝑛 𝑛
∑ [(𝑋𝑖 − 𝑋̅) × (𝑌𝑖 − 𝑌̅)] = ∑ (𝑋𝑖 × 𝑌𝑖 ) − 𝑌̅ × (∑ 𝑋𝑖 ) − 𝑋̅ × (∑ 𝑌𝑖 ) + 𝑋̅ × 𝑌̅ × ∑ 1
𝑖=1 𝑖=1 𝑖=1 𝑖=1 𝑖=1

Nesse ponto, devemos lembrar que ∑𝑛𝑖=1 𝑋𝑖 = 𝑛 × 𝑋̅ e ∑𝑛𝑖=1 𝑌𝑖 = 𝑛 × 𝑌̅. Logo,


𝑛 𝑛
∑ [(𝑋𝑖 − 𝑋̅) × (𝑌𝑖 − 𝑌̅)] = ∑ (𝑋𝑖 × 𝑌𝑖 ) − (𝑌̅ × 𝑛 × 𝑋̅ ) − (𝑋̅ × 𝑛 × 𝑌̅) + (𝑋̅ × 𝑌̅ × 𝑛)
𝑖=1 𝑖=1

Observem que as duas últimas parcelas se anulam:

7 - 2023 (Pó
Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

𝑛 𝑛
∑ [(𝑋𝑖 − 𝑋̅) × (𝑌𝑖 − 𝑌̅)] = ∑ (𝑋𝑖 × 𝑌𝑖 ) − (𝑛 × 𝑋̅ × 𝑌̅) − (𝑛 × 𝑋̅ × 𝑌̅) + (𝑛 × 𝑋̅ × 𝑌̅)
𝑖=1 𝑖=1

Portanto,
𝑛 𝑛
∑ [(𝑋𝑖 − 𝑋̅) × (𝑌𝑖 − 𝑌̅)] = ∑ (𝑋𝑖 × 𝑌𝑖 ) − 𝑛 × 𝑋̅ × 𝑌̅
𝑖=1 𝑖=1

Utilizaremos essa fórmula alternativa para calcular o numerador do coeficiente de correlação. Reparem que
a expressão do lado esquerdo nos obriga a calcular todos os desvios (𝑋𝑖 − 𝑋̅) e (𝑌𝑖 − 𝑌̅), enquanto a
expressão do lado direito não. Nessa fórmula, 𝑛 indica o número de pontos no gráfico de dispersão, isto é, o
número de pares ordenados.

Na fórmula anterior, se substituirmos 𝑌 por 𝑋, teremos a seguinte expressão:


𝑛 𝑛
∑ [(𝑋𝑖 − 𝑋̅) × (𝑋𝑖 − 𝑋̅)] = ∑ (𝑋𝑖 × 𝑋𝑖 ) − 𝑛 × 𝑋̅ × 𝑋̅
𝑖=1 𝑖=1

𝒏 𝒏
∑ ̅ )𝟐 = ∑
(𝑿𝒊 − 𝑿 ̅ )𝟐
𝑿𝟐𝒊 − 𝒏 × (𝑿
𝒊=𝟏 𝒊=𝟏

Já, se substituirmos 𝑋 por 𝑌, iremos obter:


𝑛 𝑛
∑ [(𝑌𝑖 − 𝑌̅) × (𝑌𝑖 − 𝑌̅)] = ∑ (𝑌𝑖 × 𝑌𝑖 ) − 𝑛 × 𝑌̅ × 𝑌̅
𝑖=1 𝑖=1

𝒏 𝒏
∑ ̅ )𝟐 = ∑
(𝒀𝒊 − 𝒀 ̅ )𝟐
𝒀𝟐𝒊 − 𝒏 × (𝒀
𝒊=𝟏 𝒊=𝟏

As últimas duas fórmulas são formas alternativas que podem ser empregadas no cálculo do denominador do
coeficiente de correlação.

O coeficiente de correlação de Pearson pode assumir quaisquer valores entre 1 e -1, ou seja:

−𝟏 ≤ 𝒓 ≤ 𝟏

Assim, quanto mais próximo 𝑟 estiver de 0, menor será a relação linear entre as duas variáveis. Por sua vez,
quanto mais próximo 𝑟 estiver de (1 ou -1), maior será a relação linear entre as duas variáveis.

8 - 2023 (Pó
Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

O valor de 𝑟 é positivo quando a variável 𝑌 tende a aumentar ou a diminuir se 𝑋 também aumentar ou


diminuir, respectivamente. Nessa situação, dizemos que as variáveis são positivamente correlacionadas. No
exemplo a seguir, os dados estão praticamente em cima de uma reta, indicando a existência de uma
correlação positiva forte, isto é, 𝑟 muito próximo de 1. No caso, o coeficiente de correlação foi de 0,99267.

Correlação Positiva
18

16

14

12

10

0
-1 1 3 5 7 9 11 13 15

Se a correlação for positiva e todos os pontos estiverem sobre uma mesma reta, o valor de 𝑟 será exatamente
1. Nesse caso, dizemos que a correlação é positiva e perfeita.

Correlação Positiva e Perfeita


16

14

12

10

0
-1 1 3 5 7 9 11 13 15

O valor de 𝑟 é negativo quando a variável 𝑌 tende a diminuir ou aumentar quando 𝑋 aumentar ou diminuir,
respectivamente. Nessa situação, dizemos que as variáveis estão negativamente correlacionadas. No

9 - 2023 (Pó
Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

exemplo a seguir, os dados estão praticamente em cima de uma reta, indicando a existência de uma
correlação negativa forte, isto é, 𝑟 muito próximo de -1. No caso, o coeficiente de correlação foi de -0,9918.

Correlação Negativa
18
16
14
12
10
8
6
4
2
0
-1 1 3 5 7 9 11 13 15

Se a correlação for negativa e todos os pontos estiverem sobre uma mesma reta, o valor de r será exatamente
-1. Nesse caso, dizemos que a correlação é negativa e perfeita.

Correlação Negativa e Perfeita


16

14

12

10

0
-1 1 3 5 7 9 11 13 15

10- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

O valor de 𝑟 é zero (ou um valor muito próximo de zero) quando não existe uma relação linear entre as
variáveis. No exemplo a seguir, o coeficiente de correlação é 0,1132. Nesse caso, dizemos que a correlação
linear é nula ou inexistente.

Correlação Nula
10

0
0 0,5 1 1,5 2 2,5 3 3,5 4

Vejamos agora um exemplo numérico.

As questões normalmente informam os valores dos somatórios e exigem apenas a aplicação correta da
fórmula. Apesar disso, vamos considerar uma tabela com 5 pares ordenados, representando as notas de 5
alunos nas disciplinas X e Y, para calcular o coeficiente de correlação pelas duas fórmulas:

Aluno 𝑿𝒊 𝒀𝒊

1 6,50 7,00

2 7,50 8,00

3 8,00 8,00

4 8,50 9,00

5 9,50 10,00

11- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

Primeiro, teremos que calcular as médias de X e Y:

6,50 + 7,50 + 8,00 + 8,50 + 9,50 40


𝑋̅ = = = 8,00
5 5
7,00 + 8,00 + 8,00 + 9,00 + 10,00 42
𝑌̅ = = = 8,40
5 5

Agora, calcularemos os desvios de X e Y em relação às suas médias:

Aluno 𝑿𝒊 𝒀𝒊 ̅
𝑿𝒊 − 𝑿 ̅
𝒀𝒊 − 𝒀

1 6,50 7,00 6,50 - 8,00 = -1,50 7,00 - 8,40 = -1,40

2 7,50 8,00 7,50 - 8,00 = -0,50 8,00 - 8,40 = -0,40

3 8,00 8,00 8,00 - 8,00 = 0,00 8,00 - 8,40 = -0,40

4 8,50 9,00 8,50 - 8,00 = 0,50 9,00 - 8,40 = 0,60

5 9,50 10,0 9,50 - 8,00 = 1,50 10,00 - 8,40 = 1,60

Vou limpar a memória de cálculo para facilitar a visualização:

Aluno 𝑿𝒊 𝒀𝒊 ̅ 𝒀𝒊 − 𝒀
𝑿𝒊 − 𝑿 ̅

1 6,50 7,00 -1,50 -1,40

2 7,50 8,00 -0,50 -0,40

3 8,00 8,00 0,00 -0,40

4 8,50 9,00 0,50 0,60

5 9,50 10,0 1,50 1,60

12- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

Nesse ponto, teremos que calcular o numerador e o denominador do coeficiente de correlação. Para tanto,
precisaremos multiplicar os desvios de X pelos desvios de Y, bem como calcular os quadrados dos desvios:

Aluno 𝑿𝒊 𝒀𝒊 ̅ 𝒀𝒊 − 𝒀
𝑿𝒊 − 𝑿 ̅ ̅ ) × (𝒀𝒊 − 𝒀
(𝑿𝒊 − 𝑿 ̅) ̅ )²
(𝑿𝒊 − 𝑿 ̅ )²
(𝒀𝒊 − 𝒀

1 6,50 7,00 -1,50 -1,40 (-1,50) x (-1,40) = 2,10 (-1,50)² = 2,25 (-1,40)² = 1,96

2 7,50 8,00 -0,50 -0,40 (-0,50) x (-0,40) = 0,20 (-0,50)² = 0,25 (-0,40)² = 0,16

3 8,00 8,00 0,00 -0,40 (0,00) x (-0,40) = 0,00 (0,00)² = 0,00 (-0,40)² = 0,16

4 8,50 9,00 0,50 0,60 (0,50) x (0,60) = 0,30 (0,50)² = 0,25 (0,60)² = 0,36

5 9,50 10,0 1,50 1,60 (1,50) x (1,60) = 2,40 (1,50)² = 2,25 (1,60)² = 2,56

Limpando a memória de cálculo e deixando apenas os resultados. Vejamos:

Aluno 𝑿𝒊 𝒀𝒊 ̅ 𝒀𝒊 − 𝒀
𝑿𝒊 − 𝑿 ̅ (𝑿𝒊 − 𝑿
̅ ) × (𝒀𝒊 − 𝒀
̅ ) (𝑿𝒊 − 𝑿
̅ )² (𝒀𝒊 − 𝒀
̅ )²

1 6,50 7,00 -1,50 -1,40 2,10 2,25 1,96

2 7,50 8,00 -0,50 -0,40 0,20 0,25 0,16

3 8,00 8,00 0,00 -0,40 0,00 0,00 0,16

4 8,50 9,00 0,50 0,60 0,30 0,25 0,36

5 9,50 10,0 1,50 1,60 2,40 2,25 2,56

Conhecendo esses valores, podemos calcular os somatórios da fórmula de correlação.

5
∑ [(𝑋𝑖 − 𝑋̅) × (𝑌𝑖 − 𝑌̅)] = 2,10 + 0,20 + 0,00 + 0,30 + 2,40 = 5,00
𝑖=1

5
∑ (𝑋𝑖 − 𝑋̅)² = 2,25 + 0,25 + 0,00 + 0,25 + 2,25 = 5,00
𝑖=1

5
∑ (𝑌𝑖 − 𝑌̅)² = 1,96 + 0,16 + 0,16 + 0,36 + 2,56 = 5,20
𝑖=1

13- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

Aplicando esses valores na fórmula do coeficiente de correlação linear, temos:

∑𝑛𝑖=1[(𝑋𝑖 − 𝑋̅) × (𝑌𝑖 − 𝑌̅)]


𝑟=
√∑𝑛𝑖=1(𝑋𝑖 − 𝑋̅)² × ∑𝑛𝑖=1(𝑌𝑖 − 𝑌̅)²

5,00
𝑟=
√5,00 × 5,20

𝑟 ≅ 0,9805

O coeficiente de correlação linear ficou muito próximo de 1, o que implica dizer que existe uma relação linear
intensa entre as notas das duas disciplinas. Vejamos o gráfico de dispersão das duas variáveis

10,5

10

9,5
Nota na disciplina Y

8,5

7,5

6,5

6
6 6,5 7 7,5 8 8,5 9 9,5 10
Nota na disciplina X

Pronto, agora utilizaremos as fórmulas alternativas para calcular o mesmo coeficiente de correlação. Vamos
relembrar a fórmula:

∑𝑛𝑖=1[(𝑋𝑖 − 𝑋̅) × (𝑌𝑖 − 𝑌̅)]


𝑟=
√∑𝑛𝑖=1(𝑋𝑖 − 𝑋̅)2 × ∑𝑛𝑖=1(𝑌𝑖 − 𝑌̅)2

O numerador pode ser calculado mediante a aplicação da seguinte fórmula:


𝑛 𝑛
∑ [(𝑋𝑖 − 𝑋̅) × (𝑌𝑖 − 𝑌̅)] = ∑ (𝑋𝑖 × 𝑌𝑖 ) − 𝑛 × 𝑋̅ × 𝑌̅
𝑖=1 𝑖=1

14- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

Por sua vez, o denominador pode ser calculado por meio das seguintes fórmulas:
𝑛 𝑛
∑ (𝑋𝑖 − 𝑋̅)2 = ∑ 𝑋𝑖2 − 𝑛 × (𝑋̅)2
𝑖=1 𝑖=1

𝑛 𝑛
∑ (𝑌𝑖 − 𝑌̅)2 = ∑ 𝑌𝑖2 − 𝑛 × (𝑌̅)2
𝑖=1 𝑖=1

Retornemos à tabela inicial:

Aluno 𝑿𝒊 𝒀𝒊

1 6,50 7,00

2 7,50 8,00

3 8,00 8,00

4 8,50 9,00

5 9,50 10,00

Já calculamos as médias de X e Y:

6,50 + 7,50 + 8,00 + 8,50 + 9,50 40


𝑋̅ = = = 8,00
5 5

7,00 + 8,00 + 8,00 + 9,00 + 10,00 42


𝑌̅ = = = 8,40
5 5

Precisamos de três colunas adicionais: 𝑋 × 𝑌, 𝑋 2 e 𝑌 2

Aluno 𝑿𝒊 𝒀𝒊 𝑿𝒊 × 𝒀𝒊 𝑿𝟐𝒊 𝒀𝟐𝒊

1 6,50 7,00 6,50 x 7,00 = 45,50 (6,50)² = 42,25 (7,00)² = 49,00

2 7,50 8,00 7,50 x 8,00 = 60,00 (7,50)² = 56,25 (8,00)² = 64,00

3 8,00 8,00 8,00 x 8,00 = 64,00 (8,00)² = 64,00 (8,00)² = 64,00

4 8,50 9,00 8,50 x 9,00 = 76,50 (8,50)² = 72,25 (9,00)² = 81,00

5 9,50 10,0 9,50 x 10,00 = 95,00 (9,50)² = 90,25 (10,00)² = 100,00

15- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

Limpando a memória de cálculo, ficamos com os seguintes resultados:

Aluno 𝑿𝒊 𝒀𝒊 𝑿𝒊 ∙ 𝒀𝒊 𝑿𝟐𝒊 𝒀𝟐𝒊

1 6,50 7,00 45,50 42,25 49,00

2 7,50 8,00 60,00 56,25 64,00

3 8,00 8,00 64,00 64,00 64,00

4 8,50 9,00 76,50 72,25 81,00

5 9,50 10,0 95,00 90,25 100,00

Agora, podemos calcular os somatórios da fórmula:

5
∑ (𝑋𝑖 × 𝑌𝑖 ) = 45,50 + 60,00 + 64,00 + 76,50 + 95,00 = 341,00
𝑖=1

5
∑ 𝑋𝑖2 = 42,25 + 56,25 + 64,00 + 72,25 + 90,25 = 325,00
𝑖=1

5
∑ 𝑌𝑖2 = 49,00 + 64,00 + 64,00 + 81,00 + 100,00 = 358
𝑖=1

Já temos todas as informações necessárias para a aplicação das fórmulas alternativas.

O numerador do coeficiente de correlação é calculado por:

5
∑ (𝑋𝑖 × 𝑌𝑖 ) − 5 × 𝑋̅ × 𝑌̅ = 341,00 − 5 × 8,00 × 8,40 = 5,00
𝑖=1

Os termos do denominador são calculados pelas seguintes fórmulas:

5
∑ 𝑋𝑖2 − 5 × (𝑋̅)2 = 325 − 5 × 8,002 = 5,00
𝑖=1

5
∑ 𝑌𝑖2 − 5 × (𝑌̅)2 = 358 − 5 × 8,402 = 5,20
𝑖=1

16- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

Aplicando a fórmula do coeficiente de correlação, temos:

∑𝑛𝑖=1[(𝑋𝑖 − 𝑋̅) × (𝑌𝑖 − 𝑌̅)]


𝑟=
√∑𝑛𝑖=1(𝑋𝑖 − 𝑋̅)² × ∑𝑛𝑖=1(𝑌𝑖 − 𝑌̅)²

5,00
𝑟=
√5,00 × 5,20

𝑟 ≅ 0,9805

Portanto, o resultado produzido mediante a aplicação das fórmulas alternativas é exatamente o mesmo das
fórmulas tradicionais.

O coeficiente de correlação linear também pode ser definido por meio das seguintes expressões:

𝑆𝑋𝑌
𝑟=
√𝑆𝑋𝑋 × 𝑆𝑌𝑌

Em que 𝑆𝑋𝑌 = ∑𝑛𝑖=1[(𝑋𝑖 − 𝑋̅ ) × (𝑌𝑖 − 𝑌̅)]; 𝑆𝑋𝑋 = ∑𝑛𝑖=1(𝑋𝑖 − 𝑋̅ )2 e 𝑆𝑌𝑌 = ∑𝑛𝑖=1(𝑌𝑖 − 𝑌̅)2 .

Também pode aparecer na seguinte forma:

𝐶𝑜𝑣(𝑋, 𝑌)
𝑟=
𝜎𝑋 × 𝜎𝑌

Em que 𝐶𝑜𝑣(𝑋, 𝑌) representa a covariância das variáveis X e Y; 𝜎𝑋 e 𝜎𝑌 representam o desvio padrão,


respectivamente, das variáveis X e Y.

17- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

Propriedades do Coeficiente de Correlação

1ª Propriedade
• O coeficiente de correlação não sofre alteração quando uma constante é adicionada a
(ou subtraída de) uma variável.

Considere os dados da seguinte tabelar:

𝒊 𝑿𝒊 𝒀𝒊
1 1 6
2 2 7
3 3 8
4 4 9
5 5 10

Como vimos, primeiro temos que encontrar as médias das duas variáveis:

1+2+3+4+5
𝑋̅ = =3
5

6 + 7 + 8 + 9 + 10
𝑌̅ = =8
5

Agora, vamos montar a tabela auxiliar com os desvios (𝑋𝑖 − 𝑋̅) e (𝑌𝑖 − 𝑌̅), e os respectivos produtos (𝑋𝑖 −
𝑋̅) × (𝑌𝑖 − 𝑌̅), (𝑋𝑖 − 𝑋̅)² e (𝑌𝑖 − 𝑌̅)².

̅ 𝒀𝒊 − 𝒀
𝒊 𝑿𝒊 𝒀𝒊 𝑿𝒊 − 𝑿 ̅ (𝑿𝒊 − 𝑿
̅ ) × (𝒀𝒊 − 𝒀
̅ ) (𝑿𝒊 − 𝑿
̅ )² (𝒀𝒊 − 𝒀
̅ )²

1 1 6 -2 -2 4 4 4

2 2 7 -1 -1 1 1 1

3 3 8 0 0 0 0 0

4 4 9 1 1 1 1 1

5 5 10 2 2 4 4 4

Total 10 10 10

18- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

Aplicando esses valores na fórmula do coeficiente de correlação linear, temos:

∑𝑛𝑖=1[(𝑋𝑖 − 𝑋̅) × (𝑌𝑖 − 𝑌̅)]


𝑟=
√∑𝑛𝑖=1(𝑋𝑖 − 𝑋̅)² × ∑𝑛𝑖=1(𝑌𝑖 − 𝑌̅)²

10
𝑟=
√10 × 10

𝑟(𝑋, 𝑌) = 1

Logo, o coeficiente de correlação linear das variáveis 𝑋 e 𝑌 é 1.

Agora, vamos adicionar 3 unidades à variável X e 5 unidades à variável Y.

𝒊 𝑿𝒊 + 𝟑 𝒀𝒊 + 𝟓
1 4 11
2 5 12
3 6 13
4 7 14
5 8 15

Novamente, temos que encontrando as médias das duas variáveis:

4+5+6+7+8
𝑋̅ = =6
5

11 + 12 + 13 + 14 + 15
𝑌̅ = = 13
5

Construindo a tabela auxiliar:

̅ 𝒀𝒊 − 𝒀
𝒊 𝑿𝒊 𝒀𝒊 𝑿𝒊 − 𝑿 ̅ (𝑿𝒊 − 𝑿
̅ ) × (𝒀𝒊 − 𝒀
̅ ) (𝑿𝒊 − 𝑿
̅ )² (𝒀𝒊 − 𝒀
̅ )²

1 4 11 -2 -2 4 4 4

2 5 12 -1 -1 1 1 1

3 6 13 0 0 0 0 0

4 7 14 1 1 1 1 1

5 8 15 2 2 4 4 4

Total 10 10 10

19- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

Aplicando esses valores na fórmula do coeficiente de correlação linear, temos:

10
𝑟=
√10 × 10

𝑟(𝑋 + 3, 𝑌 + 5) = 1

Portanto, o coeficiente de correlação não sofreu alteração quando com a adição de 3 unidades à variável X
e 5 unidades à variável Y.

Essa propriedade simplifica a resolução de certas questões. Suponhamos que tivéssemos uma tabela
com os seguintes valores e precisássemos calcular a correlação entre as variáveis X e Y.

𝒊 𝑿𝒊 𝒀𝒊

1 201 301

2 202 302

3 204 308

4 205 309

Reparem que podemos subtrair 200 de todos os valores de X e 300 de todos os valores de Y.
Poderíamos, então, fazer uma transformação nessas variáveis, obtendo:

𝒊 𝑿𝒊 𝒀𝒊 (𝑿𝒊 − 𝟐𝟎𝟎) (𝒀𝒊 − 3𝟎𝟎)

1 201 301 1 1

2 202 302 2 2

3 204 308 4 8

4 205 309 5 9

A propriedade estudada nos garante que 𝑟(𝑋, 𝑌) = 𝑟(𝑋 − 200, 𝑌 − 300). Logo, poderíamos calcular
a correlação por meio dos valores transformados.

20- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

Encontrando as médias das variáveis transformadas:

1+2+4+5
𝑋̅ = =3
4

1+2+8+9
𝑌̅ = =5
4

Organizando a tabela auxiliar, teríamos:

𝒊 𝑿𝒊 𝒀𝒊 ̅ 𝒀𝒊 − 𝒀
(𝑿𝒊 − 𝟐𝟎𝟎) (𝒀𝒊 − 3𝟎𝟎) 𝑿𝒊 − 𝑿 ̅ (𝑿𝒊 − 𝑿
̅ ) × (𝒀𝒊 − 𝒀
̅ ) (𝑿𝒊 − 𝑿
̅ )² (𝒀𝒊 − 𝒀
̅ )²

1 201 301 1 1 -2 -4 8 4 16

2 202 302 2 2 -1 -3 3 1 9

3 204 308 4 8 1 3 3 1 9

4 205 309 5 9 2 4 8 4 16

Total 22 10 50

Aplicando esses valores na fórmula do coeficiente de correlação linear, teríamos:

22
𝑟(𝑋 − 200, 𝑌 − 300) = ≅ 0,984
√10 × 50

De fato, se jogássemos a tabela inicial em um software de estatística, veríamos que 𝑟(𝑋, 𝑌) = 0,984.

21- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

2ª Propriedade
• O o coeficiente de correlação pode não sofrer alteração ou pode ter seu sinal alterado
quando uma variável é multiplicada (ou dividida) por uma constante. Caso as
constantes tenham o mesmo sinal, o valor do coeficiente de correlação não será
alterado. Por outro lado, se as constantes tiverem sinais contrários, o coeficiente
mudará de sinal, mas o valor permanecerá inalterado.

Ainda com relação ao exemplo trabalhado na propriedade anterior, vamos multiplicar a variável X por 2 e a
variável Y por 2.

𝒊 𝑿𝒊 × 𝟐 𝒀𝒊 × 𝟐
1 2 12
2 4 14
3 6 16
4 8 18
5 10 20

Encontrando as médias das duas variáveis:

2 + 4 + 6 + 8 + 10
𝑋̅ = =6
5

12 + 14 + 16 + 18 + 20
𝑌̅ = = 16
5

Montando a tabela auxiliar:

̅ 𝒀𝒊 − 𝒀
𝒊 𝑿𝒊 𝒀𝒊 𝑿𝒊 − 𝑿 ̅ (𝑿𝒊 − 𝑿
̅ ) × (𝒀𝒊 − 𝒀
̅ ) (𝑿𝒊 − 𝑿
̅ )² (𝒀𝒊 − 𝒀
̅ )²

1 2 12 -4 -4 16 16 16

2 4 14 -2 -2 4 4 4

3 6 16 0 0 0 0 0

4 8 18 2 2 4 4 4

5 10 20 4 4 16 16 16

Total 40 40 40

22- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

Aplicando esses valores na fórmula do coeficiente de correlação linear, temos:

40
𝑟=
√40 × 40

𝑟(2𝑋, 2𝑌) = 1

Logo, a multiplicação por constantes de mesmo sinal não alterou o valor do coeficiente de correlação, nem
implicou na alteração de seu sinal.

Se tivéssemos multiplicado a variável X por -2 e a variável Y por -2:

𝒊 𝑿𝒊 × (−𝟐) 𝒀𝒊 × (−𝟐)

1 -2 -12

2 -4 -14

3 -6 -16

4 -8 -18

5 -10 -20

Nessa situação, as médias das duas variáveis são:

(−2) + (−4) + (−6) + (−8) + (−10)


𝑋̅ = = −6
5

(−12) + (−14) + (−16) + (−18) + (−20)


𝑌̅ = = −16
5

Construindo a tabela auxiliar, temos:

𝒊 𝑿𝒊 𝒀𝒊 ̅ 𝒀𝒊 − 𝒀
𝑿𝒊 − 𝑿 ̅ (𝑿𝒊 − 𝑿
̅ ) × (𝒀𝒊 − 𝒀
̅ ) (𝑿𝒊 − 𝑿
̅ )² (𝒀𝒊 − 𝒀
̅ )²

1 -2 -12 4 4 16 16 16

2 -4 -14 2 2 4 4 4

3 -6 -16 0 0 0 0 0

4 -8 -18 -2 -2 4 4 4

5 -10 -20 -4 -4 16 16 16

Total 40 40 40

23- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

Aplicando esses valores na fórmula do coeficiente de correlação linear, temos:

40
𝑟=
√40 × 40

Como as constantes possuíam sinais iguais, o sinal do coeficiente de correlação foi mantido.

𝑟(−2𝑋, −2𝑌) = 1

Novamente, a multiplicação por constantes de mesmo sinal não alterou o valor do coeficiente de correlação,
nem implicou na alteração de seu sinal.

Finalmente, vamos multiplicar a variável X por 2 e a variável Y por -2, constantes com sinais contrários.
==13272f==

𝒊 𝑿𝒊 × 2 𝒀𝒊 × (−2)
1 2 - 12
2 4 - 14
3 6 - 16
4 8 - 18
5 10 - 20

Encontrando as médias das duas variáveis:

2 + 4 + 6 + 8 + 10
𝑋̅ = =6
5

(−12) + (−14) + (−16) + (−18) + (−20)


𝑌̅ = = −16
5

Organizando a tabela auxiliar, temos:

𝒊 𝑿𝒊 𝒀𝒊 ̅ 𝒀𝒊 − 𝒀
𝑿𝒊 − 𝑿 ̅ (𝑿𝒊 − 𝑿
̅ ) × (𝒀𝒊 − 𝒀
̅ ) (𝑿𝒊 − 𝑿
̅ )² (𝒀𝒊 − 𝒀
̅ )²

1 2 -12 -4 4 -16 16 16

2 4 -14 -2 2 -4 4 4

3 6 -16 0 0 0 0 0

4 8 -18 2 -2 -4 4 4

5 10 -20 4 -4 -16 16 16

24- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

Total -40 40 40

Aplicando esses valores na fórmula do coeficiente de correlação linear, temos:

−40
𝑟=
√40 × 40

Portanto, como as constantes possuem sinais contrários, o sinal do coeficiente de correlação foi invertido.

𝑟(2𝑋, −2𝑌) = −1

Essa propriedade pode simplificar a resolução de determinadas questões. Suponhamos que


tivéssemos uma tabela com os seguintes valores e precisássemos calcular a correlação entre as
variáveis X e Y.

𝒊 𝑿𝒊 𝒀𝒊

1 200 300

2 350 350

3 400 450

4 450 500

Reparem que todos os valores podem ser divididos por 50. Poderíamos, então, fazer uma
transformação nessas variáveis, obtendo:

𝒊 𝑿𝒊 𝒀𝒊 𝑿𝒊 𝒀𝒊
𝟓𝟎 𝟓𝟎

1 200 300 4 6

2 350 350 7 7

3 400 450 8 9

4 450 500 9 10

25- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

𝑋 𝑌
A propriedade estudada nos garante que 𝑟(𝑋, 𝑌) = 𝑟 ,
50 50
. Logo, poderíamos calcular a correlação
por meio dos valores transformados.

Encontrando as médias das variáveis transformadas:

4+7+8+9
𝑋̅ = =7
4

6 + 7 + 9 + 10
𝑌̅ = =9
4

Organizando a tabela auxiliar, teríamos:

𝒊 𝑿𝒊 𝒀𝒊 𝑿𝒊 𝒀𝒊 ̅ 𝒀𝒊 − 𝒀
𝑿𝒊 − 𝑿 ̅ (𝑿𝒊 − 𝑿
̅ ) × (𝒀𝒊 − 𝒀
̅ ) (𝑿𝒊 − 𝑿
̅ )² (𝒀𝒊 − 𝒀
̅ )²
𝟓𝟎 𝟓𝟎

1 200 300 4 6 -3 -2 6 9 4

2 350 350 7 7 0 -1 0 0 1

3 400 450 8 9 1 1 1 1 1

4 450 500 9 10 2 2 4 4 4

Total 11 14 10

Aplicando esses valores na fórmula do coeficiente de correlação linear, teríamos:

𝑋 𝑌 11
𝑟( , )= ≅ 0,93
50 50 √14 × 10

De fato, se jogássemos a tabela inicial em um software de estatística, veríamos que 𝑟(𝑋, 𝑌) = 0,93.

26- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

REGRESSÃO LINEAR SIMPLES


A regressão simples é uma continuação do conceito de correlação/covariância. A regressão tenta explicar a
relação de uma variável chamada dependente, usando outra variável chamada independente.

Na regressão linear simples queremos calcular a expressão matemática que relaciona Y (variável
dependente) em função de X (variável independente). Como estamos falando de regressão linear simples,
trata-se da equação que representa uma reta. Essa equação pode ser escrita como:

𝑦 =𝑚∙𝑥+𝑏

O coeficiente 𝑚 é conhecido como taxa de variação ou coeficiente angular da reta. Esse coeficiente indica
que uma função é crescente se 𝒎 > 𝟎; decrescente se 𝒎 < 𝟎; ou constante se 𝒎 = 𝟎. Para uma reta que
passa pelos pontos (𝑥0 , 𝑦0 ) e (𝑥, 𝑦), o coeficiente angular é expresso por:

∆𝑦 𝑦 − 𝑦0
𝑚= =
∆𝑥 𝑥 − 𝑥0

O coeficiente b é conhecido como coeficiente linear da reta e determina o ponto em que a reta intercepta
o eixo 𝑦.

Vamos calcular a reta apresentada na figura abaixo, que passa pelos pontos (2, 7) e (4, 11).

14
13
12
11
10
(4, 11)
9
8
7
(2, 7)
6
5
4
3
2
1
0
0 1 2 3 4 5 6

O coeficiente angular da reta (𝒎) é o quociente entre a variação de 𝑦 e a variação de 𝑥. Podemos escolher
qualquer um dos pontos como referência para o cálculo da variação, desde que tenhamos atenção na hora
de aplicar os dados na fórmula. A ordem a ser considerada é sempre 𝑥 − 𝑥0 e 𝑦 − 𝑦0 , em que 𝑥0 e 𝑦0 são as

27- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

coordenadas do ponto tomado como referência. Assim, se adotarmos o ponto (2,7) como referência,
teremos:
∆𝑦 11 − 7
𝑚= = =2
∆𝑥 4−2

Dessa forma, a equação da reta fica:

𝑦 =𝑚∙𝑥+𝑏

𝑦 = 2∙𝑥+𝑏

Para calcular o valor de 𝑏, podemos usar qualquer ponto da reta, a exemplo de (2, 7).

7=2∙2+𝑏

7= 4+𝑏

𝑏=3

Logo, a expressão que representa nossa reta nesse exemplo é:

𝑦 =2∙𝑥+3

Como 𝑏 = 3, a reta intercepta o eixo 𝑦 no ponto (0, 3). Vejamos:

14
13 y = 2x + 3
12
11
10
(4, 11)
9
8
7
(2, 7)
6
5
4
3
(0, 3)
2
1
0
0 1 2 3 4 5 6

Nesse caso temos uma correlação perfeita positiva. O que aconteceria se os pontos do gráfico tivessem um
pouco mais dispersos, não evidenciando uma correlação linear perfeita? Será se conseguiríamos determinar
uma reta que se ajustasse a esse tipo de gráfico? A resposta é sim. Basta fazermos um pequeno ajuste na
expressão usada para determinar a reta de regressão.

28- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

Observe:

𝒀𝒊 = 𝜶 + 𝜷𝑿𝒊 + 𝜺𝒊

Em que 𝑖 = 1, 2, 3, ⋯ , 𝑛.

O termo 𝛼 + 𝛽𝑋𝑖 é o componente de 𝑌𝑖 que varia linearmente, de acordo com 𝑋𝑖 . Por sua vez, 𝜀𝑖 é o
componente aleatório de 𝑌𝑖 que descreve os erros (ou desvios) cometidos quando tentamos aproximar uma
série de observações 𝑋𝑖 por meio de uma reta 𝑌𝑖 .

Nesse modelo, 𝑌𝑖 é a variável cujo comportamento desejamos prever ou explicar, sendo chamada de variável
dependente ou resposta. Por outro lado, a variável 𝑋𝑖 é utilizada para explicar o comportamento de 𝑌𝑖 , sendo
conhecida como independente, regressora, explanatória ou explicativa.

O modelo de regressão linear requer que sejam atendidos alguns pressupostos básicos quanto à variável
aleatória 𝜀𝑖 (erro ou desvio):

i) 𝑬(𝜺𝒊 ) = 𝟎. A média dos erros é igual a zero. Ou seja, os desvios "para cima da reta" igualam o valor dos
desvios "para baixo da reta" na média.

ii) 𝑽𝒂𝒓(𝜺𝒊 ) = 𝝈². A variância dos erros é constante. Essa propriedade é denominada de homocedasticia.
Isso só é possível se a variável 𝜀𝑖 tiver variância constante. Ou seja, se ela tiver sempre a mesma variância,
independente de qual o valor de 𝑋𝑖 . Quando o modelo apresenta variâncias diferentes para o erro, temos
uma situação de heterocedasticia.

iii) 𝑪𝒐𝒗(𝜺𝒊 , 𝜺𝒋 ) = 𝟎 𝒑𝒂𝒓𝒂 𝒊 ≠ 𝒋. Os erros cometidos não são correlacionados, isto é, os desvios 𝜺𝒊 são
variáveis aleatórias independentes. Quando os erros não são independentes, temos uma situação
denominada de autocorrelação.

(CESPE 2019/TJ-AM) Um estudo considerou um modelo de regressão linear simples na forma 𝒚 = 𝟎, 𝟖𝒙 +


𝒃 + 𝝐, em que 𝒚 é a variável dependente, 𝒙 representa a variável explicativa do modelo, o coeficiente b
denomina-se intercepto e 𝝐 é um erro aleatório que possui média nula e desvio padrão 𝝈. Sabe-se que a
variável 𝒚 segue a distribuição normal padrão e que o modelo apresenta coeficiente de determinação 𝑹𝟐
igual a 85%.
Com base nessas informações, julgue o item que se segue.
O erro aleatório ϵ segue a distribuição normal padrão.

29- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

Comentários:
No modelo de regressão linear simples, as seguintes suposições sobre o erro devem ser observadas:
𝐸(𝜖) = 0, isto é, em média, o erro do modelo deve ser 0;
𝑉𝑎𝑟(𝜖) = 𝜎 2 , a variância deve ser constante, isto é, deve existir homocedasticia;
𝐶𝑜𝑣(𝜖𝑖, 𝜖𝑗) = 0, os erros devem ser independentes, ou seja, não há correlação entre os erros.
Nessa questão, o único ponto que precisamos mostrar é que o 𝑉𝑎𝑟(𝝐) = 1. O enunciado afirmou que Y segue
distribuição normal padrão. De fato, 𝑌 tem distribuição 𝑁(𝑏 + 0,8𝑥 + 𝜇; 𝜎 2 ) = 𝑁(0,1) em que 𝜎 2 é a
variância do erro. Como 𝑌 segue uma normal padrão, então 𝜎 2 = 1. Consequentemente, o erro também
seguirá uma distribuição normal, 𝜖~𝑁(0,1).

Gabarito: Certo.

Método dos Mínimos Quadrados

O método dos mínimos quadrados diz que a reta a ser adotada deverá ser aquela que torna mínima a soma
dos quadrados das distâncias da reta aos pontos experimentais, medidas no sentido da variação aleatória.
Em outras palavras, devemos encontrar uma reta que minimize o somatório dos quadrados das distâncias
(∑𝑛𝑖=1 𝑒𝑖2 ). O objetivo é minimizar a soma dos quadrados dos desvios.

Esse método é empregado na obtenção dos estimadores 𝛼 e 𝛽 de um modelo de regressão linear:

𝑌𝑖 = 𝛼 + 𝛽𝑋𝑖 + 𝜀𝑖 .

A expressão usada para determinar a reta de regressão é:

𝑌̂𝑖 = 𝑎 + 𝑏𝑋𝑖

em que 𝑎 e 𝑏 são as estimativas dos parâmetro 𝛼 e 𝛽, respectivamente.

Os erros (desvios) resultantes da aplicação do modelo de regressão linear correspondem às diferenças entre
os valores observados e os valores estimados:

𝑒𝑖 = 𝑌𝑖 − 𝑌̂𝑖

O objetivo do método dos mínimos quadrados é minimizar o somatório dos quadrados dos desvios (∑𝑛𝑖=1 𝑒𝑖2 ):
𝑛 𝑛
2
∑ 𝑒𝑖2 = ∑(𝑌𝑖 − 𝑌̂𝑖 )
𝑖=1 𝑖=1

30- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

Por esse método, o valor de 𝑏 é dado por:

∑𝒏𝒊=𝟏[(𝑿𝒊 − 𝑿̅ ) × (𝒀𝒊 − 𝒀̅ )]
𝒃=
∑𝒏𝒊=𝟏[(𝑿𝒊 − 𝑿̅ )𝟐 ]

Existem outras formas mais simples de calcular o valor de 𝑏.

Para o numerador da fórmula, temos:


𝑛 𝑛

∑[(𝑋𝑖 − 𝑋̅) × (𝑌𝑖 − 𝑌̅)] = ∑(𝑋𝑖 × 𝑌𝑖 ) − 𝑛 × 𝑋̅ × 𝑌̅


𝑖=1 𝑖=1

Para o denominador da fórmula, temos:


𝑛 𝑛

∑[(𝑋𝑖 − 𝑋 ] = ∑(𝑋𝑖2 ) − 𝑛 × 𝑋̅²


̅ )2
𝑖=1 𝑖=1

Logo,

̅ ×𝒀
∑𝒏𝒊=𝟏(𝑿𝒊 𝒀𝒊 ) − 𝒏 × 𝑿 ̅
𝒃=
̅²
∑𝒏𝒊=𝟏(𝑿𝟐𝒊 ) − 𝒏 × 𝑿

A reta de regressão passa pelos pontos médios (𝑋̅, 𝑌̅) das variáveis 𝑋 e 𝑌. Isso implica que o valor de 𝑎 pode
ser calculado substituindo o valor de 𝑏 em:

̅ − 𝒃𝑿
𝒂=𝒀 ̅

Vejamos um exemplo. A tabela a seguir apresenta as notas de 5 alunos nas disciplinas X e Y.

Aluno 𝑿 𝒀 ̅
𝑿−𝑿 ̅
𝒀−𝒀 ̅ ) × (𝒀 − 𝒀
(𝑿 − 𝑿 ̅ ) (𝑿 − 𝑿
̅ )² (𝒀 − 𝒀
̅ )²

1 5 9 -2 1 -2 4 1

2 5 8 -2 0 0 4 0

3 8 10 1 2 2 1 4

4 8 7 1 -1 -1 1 1

5 9 6 2 -2 -4 4 4

Média 7 8 Total -5 14 10

31- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

Calculando o valor de 𝑏:

∑(𝑋𝑖 − 𝑋̅)(𝑌𝑖 − 𝑌̅)


𝑏=
∑(𝑋𝑖 − 𝑋̅)2

−5
𝑏=
14

𝑏 ≅ −0,357

O valor de 𝑎 é calculado por:

𝑎 = 𝑌̅ − 𝑏𝑋̅

𝑎 = 8 − (−0,357) × 7

𝑎 = 8 + 2,499

𝑎 = 10,499

Assim, a reta de regressão estimada é:

𝑌̂ = 10,499 − 0,357 × 𝑋

Temos dessa reta estimada que a soma dos quadrados dos desvios é mínima. Podemos montar uma nova
tabela contendo os valores observados de (Y) e os valores estimados pela reta (𝑌̂):

Aluno 𝑿 𝒀 ̂
𝒀

1 5 9 8,714

2 5 8 8,714

3 8 10 7,643

4 8 7 7,643

5 9 6 7,286

32- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

Montando o gráfico com os valores estimados, temos:

12

10

8 y = -0,3571x + 10,5

==13272f==

0
3 4 5 6 7 8 9 10

Percebam que a reta tem uma correlação negativa. Os pontos azuis são os pares ordenados da amostra e a
reta vermelha é a reta de regressão que calculamos de tal forma que os desvios de estimativa cometidos se
comportem segundo a condição de mínimos quadrados.

O coeficiente 𝑏 pode ser calculado por meio da seguinte expressão:

𝑆𝑋𝑌
𝑏=
𝑆𝑋𝑋

Em que 𝑆𝑋𝑌 = ∑𝑛𝑖=1[(𝑋𝑖 − 𝑋̅ ) × (𝑌𝑖 − 𝑌̅)] e 𝑆𝑋𝑋 = ∑𝑛𝑖=1(𝑋𝑖 − 𝑋̅ )2 .

33- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

(VUNESP 2019/MPE-SP). Um aluno teve as seguintes notas: 3; 5; 5,5; 6,5. O professor quer atribuir a nota
final, escolhendo uma nota representativa desse conjunto com base no método dos mínimos quadrados.
Desse modo, essa nota final será
a) 4.
b) 4,5.
c) 5.
d) 5,5.
e) 6.

Comentários:
Vamos montar uma tabela com os dados fornecidos:
𝑿 𝒀 ̅)
(𝑿 − 𝑿 ̅)
(𝒀 − 𝒀 ̅ ) (𝒀 − 𝒀
(𝑿 − 𝑿 ̅) ̅ )𝟐
(𝑿 − 𝑿

1 3 -1,5 -2 3 2,25

2 5 -0,5 0 0 0,25

3 5,5 0,5 0,5 0,25 0,25

4 6,5 1,5 1,5 2,25 2,25

𝑋̅ = 2,5 𝑌̅ = 5 Total 5,5 5

Pelo método dos mínimos quadrados, temos:


𝑌̂ = 𝑎 + 𝑏𝑋𝑖
∑(𝑋𝑖 − 𝑋̅)(𝑌𝑖 − 𝑌̅)
𝑏=
∑(𝑋𝑖 − 𝑋̅)2
5,5
𝑏= = 1,1
5
𝑎 = 𝑌̅ − 𝑏𝑋̅
𝑎 = 5 − 1,1 × 2,5
𝑎 = 2,25
Nossa reta de regressão será:
𝑌̂ = 𝑎 + 𝑏𝑋𝑖

34- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

𝑌̂ = 2,25 + 1,1𝑋
̅ 𝑌̅), então:
Sabendo que a reta de regressão passa pelo ponto (𝑋,
𝑌̂ = 2,25 + 1,1 × 2,5
𝑌̂ = 5
Gabarito: C.

(CESPE 2018/ABIN) Ao avaliar o efeito das variações de uma grandeza X sobre outra grandeza Y por meio
de uma regressão linear da forma 𝒀̂=𝜶 ̂+𝜷 ̂ 𝑿, um analista, usando o método dos mínimos quadrados,
encontrou, a partir de 20 amostras, os seguintes somatórios (calculados sobre os vinte valores de cada
variável):
∑𝑿 = 𝟑𝟎𝟎; ∑𝒀 = 𝟒𝟎𝟎; ∑𝑿𝟐 = 𝟔. 𝟎𝟎𝟎; ∑𝒀𝟐 = 𝟏𝟐. 𝟖𝟎𝟎 𝒆 ∑(𝑿𝒀) = 𝟖. 𝟒𝟎𝟎
A partir desses resultados, julgue o item a seguir.
Para 𝑋 = 10, a estimativa de 𝑌 é 𝑌̂ = 12.

Comentários:
Inicialmente, vamos calcular os valores de 𝑌̅ e de 𝑋̅:
∑ 𝑦 400
𝑌̅ = = = 20
𝑛 20
∑ 𝑥 300
𝑋̅ = = = 15
𝑛 20

Agora, utilizaremos o método dos mínimos quadrados para determinar 𝛽̂ :


∑ 𝑋𝑖 𝑌𝑖 − 𝑛𝑋̅𝑌̅
𝛽̂ =
∑ 𝑋𝑖2 − 𝑛𝑋̅²
8400 − 20 × 15 × 20
𝛽̂ =
6000 − 20 × 15²
2400
𝛽̂ = = 1,6
1500

Conhecendo 𝛽̂ , podemos determinar o valor de 𝛼̂:


∑ 𝑌𝑖 − 𝛽̂ ∑ 𝑋𝑖
𝛼̂ =
𝑛
𝛼̂ = 20 − 1,6 × 15 = −4

Assim, o modelo de regressão é dado por:


𝑌̂ = −4 + 1,6𝑋

35- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

Para 𝑋 = 10, temos o seguinte valor de 𝑌̂:


𝑌̂ = −4 + 1,6 × 10
𝑌̂ = 12
Gabarito: Certo.

(FCC 2018/Pref. São Luís) Analisando um gráfico de dispersão referente a 10 pares de observações (𝒕, 𝒀𝒕 )
com 𝒕 = 𝟏, 𝟐, 𝟑, . . . , 𝟏𝟎, optou-se por utilizar o modelo linear 𝒀𝒕 = 𝜶 + 𝜷𝒕 + 𝜺𝒕 com o objetivo de se
prever a variável Y, que representa o faturamento anual de uma empresa em milhões de reais, no ano
(𝟐𝟎𝟎𝟕 + 𝒕). Os parâmetros α e 𝜷 são desconhecidos e 𝜺𝒕 é o erro aleatório com as respectivas hipóteses
do modelo de regressão linear simples. As estimativas de 𝜶 e 𝜷 (𝒂 e 𝒃, respectivamente) foram obtidas
por meio do método dos mínimos quadrados com base nos dados dos 10 pares de observações citados. Se
𝒂 = 𝟐 e a soma dos faturamentos dos 10 dados observados foi de 64 milhões de reais, então, pela
equação da reta obtida, a previsão do faturamento para 2020 é, em milhões de reais, de
a) 11,6
b) 15,0
c) 13,2
d) 12,4
e) 14,4

Comentários:
A reta calculada é expressa por:
𝑌̂ = 𝑎 + 𝑏 × 𝑡

Sabemos que a soma dos faturamentos dos 10 dados observados foi de 64 milhões de reais, então,
calculando a média temos:
64
𝑌̅ = 10 = 6,4.
Agora, vamos calcular a média de 𝑡:
1 + 2 + 3 + 4 + 5 + 6 + 7 + 8 + 9 + 10
𝑡̅ = = 5,5
10

Sabemos que 𝑎 = 2 e que a reta de regressão passa pelo ponto (𝑡̅, 𝑌̅). Portanto, vamos encontrar o valor de
𝑏:
𝑌̅ = 𝑎 + 𝑏𝑡̅
6,4 = 2 + 𝑏 × 5,5
4,4
𝑏=
5,5
𝑏 = 0,8

36- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

A reta fica assim:


𝑌̂ = 2 + 0,8𝑡

Em 2020, temos que 𝑡 = 13, pois 2020 = 2007 + 13. Logo:


𝑌̂ = 2 + 0,8 × 13
𝑌̂ = 12,4
Gabarito: D.

Reta Passando pela Origem

Em determinadas situações, a reta de regressão deve passar pela origem para que consiga se ajustar
adequadamente ao modelo teórico. Quando isso ocorre, temos uma situação em que o coeficiente linear
da reta de regressão é nulo (𝜶 = 𝟎).

Nesse caso, o modelo de regressão que passa obrigatoriamente pela origem é:

𝑌𝑖 = 𝛼 + 𝛽𝑋𝑖 + 𝜀𝑖

𝑌𝑖 = 0 + 𝛽𝑋𝑖 + 𝜀𝑖

𝒀𝒊 = 𝜷𝑿𝒊 + 𝜺𝒊 .

Em que 𝑋𝑖 é a variável independente ou explicativa; 𝑌𝑖 é a variável dependente ou resposta; 𝜀𝑖 representa os


erros aleatórios e 𝛽 é o parâmetro populacional a ser estimado.

Assim, a estimativa de 𝛽, pelo método dos mínimos quadrados, é:

∑ 𝑿𝒊 × 𝒀𝒊
𝒃=
∑ 𝑿𝒊 𝟐
A reta de regressão ajustada é:

𝒀̂𝒊 = 𝒃𝑿𝒊 .
Os desvios ou resíduos são dados por:

̂𝒊.
𝒆𝒊 = 𝒀𝒊 − 𝒀
Nesse caso, não há garantia de que o somatório dos resíduos seja igual a zero.

37- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

Calcular a reta que passa pela origem e comparar os desvios dessa abordagem com os desvios do
modelo linear tradicional para os dados abaixo:

i 𝑿 𝒀

1 1 4

2 2 5

3 3 6

4 4 6

5 5 9

Se utilizássemos o modelo de regressão linear tradicional, a reta que iríamos obter seria a seguinte:

10
9
8
y = 1,1x + 2,7
7
6
5
4
3
2
1
0
0 1 2 3 4 5 6 7

Agora, vamos calcular a reta de regressão que passa pela origem e comparar com o modelo
tradicional. Para isso, adicionaremos duas colunas à tabela original:

38- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

i 𝑿 𝒀 𝑿×𝒀 𝑿²

1 1 4 4 1

2 2 5 10 4

3 3 6 18 9

4 4 6 24 16

5 5 9 45 25

Total 101 55

De posse dos totais dessas duas colunas, podemos estimar o valor de 𝛽 pelo método dos mínimos
quadrados:

∑ 𝑋𝑖 × 𝑌𝑖 101
𝑏= 2 = ≅ 1,836
∑ 𝑋𝑖 55

Portanto, a reta de regressão ajustada é:

̂𝑖 = 𝑏𝑋𝑖
𝑌

̂𝑖 = 1,836 × 𝑋𝑖
𝑌

Vejamos como esse modelo se comporta em relação ao modelo tradicional:

12
y = 1,8364x
10

0
0 1 2 3 4 5 6 7

Vamos, agora, comparar os resíduos da abordagem tradicional com os desvios do modelo que passa
pela origem:

39- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

Modelo tradicional Modelo que passa pela origem

i
𝒀𝒊 ̂𝒊
𝒀 ̂𝒊
𝒆𝒊 = 𝒀𝒊 − 𝒀 𝒀𝒊 ̂𝒊
𝒀 ̂𝒊
𝒆𝒊 = 𝒀𝒊 − 𝒀

1 4 3,8 0,2 4 1,8364 2,1636

2 5 4,9 0,1 5 3,6727 1,3273

3 6 6 0 6 5,5091 0,4909

4 6 7,1 -1,1 6 7,3455 -1,3455

5 9 8,2 0,8 9 9,1818 -0,1818

Total 0 Total 2,4545

Reparem que, no modelo que passa pela origem, não há garantia de que o somatório dos desvios
seja zero.

40- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

ANÁLISE DE VARIÂNCIA DA REGRESSÃO


A estratégia que adotamos para verificar se compensa ou não utilizar um modelo de regressão linear,
= + + , é observar a redução no resíduo (desvio) quando comparado com um modelo
aproximadamente uniforme = + .

Se a redução é muito pequena, significa dizer que os dois modelos são praticamente equivalentes. Isso ocorre
quando a inclinação for zero ou um valor muito pequeno, não compensando usar um modelo mais
complexo. Assim, estamos interessados em testar a hipótese:

: =0
: ≠0

Se a hipótese nula é aceita, concluímos que não existe relação linear significativa entre as variáveis e .

O resultado da análise de variância da regressão é uma tabela que resume várias medidas usadas no teste
de hipóteses anterior. Para montar a tabela de análise de variância (ANOVA), precisamos conhecer: os graus
de liberdade, as somas dos quadrados e os quadrados médios do modelo, dos resíduos (erros ou desvios) e
total.

A seguir, veremos como construir a tabela de análise de variância da regressão.

Graus de Liberdade

O número total de graus de liberdade de uma amostra de tamanho é:

= −1

Como vimos anteriormente, a equação de regressão possui apenas dois parâmetros ( ). Portanto, o
número de graus de liberdade do modelo é:

= 2−1= 1

Agora, temos que descobrir o número de graus de liberdade dos resíduos. Para isso, utilizamos a seguinte
relação:

= + " #í % #

Daí, concluímos que:

−1= 1+ " #í % #

" #í % # = −2

41- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

O número de graus de liberdade do modelo de regressão é:

=2−1=1

O número de graus de liberdade dos resíduos é:

" #í % # = −2

O número de graus de liberdade total é:

= −1

Somas de Quadrados

Como vimos, a reta de regressão linear fornece uma estimativa & para uma variável . Os erros (desvios)
resultantes da aplicação do modelo de regressão linear correspondem às diferenças entre os valores
observados e os valores estimados:

= – )( ⇒ = + )(

Subtraindo + dos dois lados, temos:

−+= + )( − +

Agora, elevando os dois lados ao quadrado:

, − + -² = , + )( − + -²

, − + -/ = + 0 )( − + 1 + 2 2 2 , )( − + -
/ /

Somando tudo, temos:

3, − + -/ = 3 + 30 )( − + 1 + 2 2 3 2 , )( − + -
/ /

42- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

É possível demonstrar que :

223 2 , )( − + - = 0

Logo,

3, − + -/ = 3 + 30 )( − + 1 .
/ /

Portanto, temos que o desvio total do modelo de regressão, ( – + ), é o desvio de cada valor de
à média + .
em relação

567 = 3, − + -/
9

Assim, a soma dos quadrados totais, definida por ∑, − + -/ , é igual a soma dos quadrados dos
resíduos/desvios/erros, definida por ∑ / , mais a soma dos quadrados do modelo de regressão, definida na
expressão por ∑0 )( − + 1 :
/

567 = 56; + 56<

explicável". Essa parcela corresponde à a diferença entre cada valor previsto pelo modelo ( )( ) e o valor médio
A parcela do desvio total que o modelo de regressão é capaz de explicar é denominada de "desvio

( + ). Assim, a soma dos quadrados do modelo de regressão é:

56; = 30 )( − + 1
/

Podemos demonstrar que:

56; = = 2 3>, − + - 2 , − + -?
9

Em que = é a estimativa do coeficiente angular da reta de regressão.

43- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

A fórmula a seguir também pode ser utilizada para o cálculo de SQM:

56; = = 2 3,
/
− + -/
9

explicável". Essa parcela corresponde à diferença entre cada valor de e o valor previsto pelo modelo )( .
A parcela do desvio total que o modelo de regressão não é capaz de explicar é chamada de "desvio não

Assim, podemos definir a soma dos quadrados dos erros (resíduos).

56< = 30 – )( 1
/

Em algumas questões de concurso, a notação SQR é utilizada para representar a soma dos
quadrados do modelo de regressão, e não dos resíduos, como fizemos nesta aula. Na maioria das
questões, contudo, SQR representa a soma dos quadrados dos resíduos (erros).

A soma dos quadrados totais é calculada por meio das seguintes fórmulas:

567 = 56; + 56<


8

567 = 3, − + -/
9

44- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

A soma dos quadrados do modelo de regressão é calculada mediante as seguintes fórmulas:


8

56; = 30 )( − + 1
/

56; = = 2 3>, − + - 2 , − + -?
9

56; = =/ 2 3, − + -/
9

A soma dos quadrados dos resíduos é calculada pela fórmula:


8

56< = 30 – )( 1
/

Coeficiente de Determinação

O coeficiente de determinação mede a qualidade do ajuste proporcionado pela reta de regressão. Ele
determina a parcela da variação total de que é explicada pelo modelo de regressão, sendo calculado pela
fórmula:

56;
</ =
567

em que R é o coeficiente de correlação linear, calculado pela expressão:

56;
<=@
567

O coeficiente de determinação também pode ser escrito da seguinte forma:

56; 567 − 56< 56<


</ = = = 1−
567 567 567

A análise que queremos fazer segue o mesmo raciocínio do coeficiente de correlação, assim temos que:

0 ≤ </ ≤ 1

45- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

Portanto, quanto mais próximo de 1 estiver o coeficiente de determinação, mais forte será a correlação entre

seja, a reta de regressão é capaz de explicar as diferenças entre os valores observados ( ) e a média ( + ).
as variáveis. Implica dizer que grande parte da variação de é explicada pela modelo de regressão linear, ou

Por outro lado, quanto mais próximo de 0 estiver o coeficiente de determinação, mais fraca será a correlação
linear entre as variáveis. Significa dizer que grande parte da variação de não é explicada pelo modelo de

observados ( ) e a média ( + ).
regressão, ou seja, a reta de regressão é capaz de explicar muito pouco sobre as diferenças entre os valores

Coeficiente de Determinação Ajustado

O coeficiente de determinação ajustado é mais utilizado quando estamos tratando de regressão múltipla.
Contudo, esse assunto também tem sido abordado em algumas questões de regressão linear simples. Assim,
é importante conhecermos essa medida.

Basicamente, essa medida ajusta o coeficiente de determinação aos graus de liberdade. Ela é obtida pela
divisão de 56< e 567 pelos respectivos graus de liberdade:

56<
B, − 2-
++++
< =1−
/
567
B, − 1-

++++/ ) e o coeficiente de determinação tradicional (< / )


A relação entre o coeficiente de determinação ajustado (<
é dada por:

, − 1-
++++/ = 1 − ,1 − < / - 2
<
, − 2-

Quadrados Médios

Os quadrados médios são obtidos pela divisão entre as somas dos quadrados e os respectivos graus de
liberdade. Assim, temos:

a) quadrado médio do modelo (QMM):

56;
6;; =
1

b) quadrado médio dos resíduos (QMR):

56<
6;< =
−2

46- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

c) quadrado médio total (QMT):

567
6;7 =
−1

O quadrado médio dos resíduos (QMR) corresponde à estimativa da variância C / residual.

Estatística F (Razão F)

Para testar : = 0 contra : ≠ 0, usamos a seguinte estatística teste, denominada de estatística D (ou
razão F):

6;;
D∗ =
6;<

Se o valor de D ∗ for significativamente grande, teremos evidências para rejeitar .

Sob a hipótese , D ∗ tem distribuição D de Snedecor, com 1 e − 2 graus de liberdade, em que éo


número de observações.

Dessa forma, para avaliar o teste de hipóteses, basta compararmos o valor da estatística teste com o valor
crítico tabelado:

• Se D ∗ F DGHí G , podemos rejeitar a hipótese nula;


• Se D ∗ I DGHí G , não podemos rejeitar a hipótese nula.

O valor de DGHí G é consultado em uma tabela F de Snedecor com 1 grau de liberdade no numerador e −
2 graus de liberdade no denominador, para um determinado nível de significância.

47- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

Tabela de Análise de Variância da Regressão

Em geral, as questões de análise de variância da regressão fornecem uma tabela incompleta e pedem
alguma medida que está faltando. Para descobrir o valor da medida solicitada, você deve conhecer a
estrutura da tabela e as fórmulas apresentadas neste tópico. A estrutura da tabela de análise de variância
da regressão sempre terá o seguinte formato:

Graus de Soma dos Quadrados Estatística F


Fonte de Variação
Liberdade Quadrados Médios (Razão F)

56; 6;;
1 SQM 6;; = D∗ =
1 6;<
Modelo

56<
−2 SQR 6;< =
−2
Resíduos

TQS
N−O SQT QRS =
N−O
Total

UV = WX + WO YV + ZV , em que UV representa o número de leitos por habitante existente no município V; YV


(CESPE/EBSERH/2018) Determinado estudo considerou um modelo de regressão linear simples na forma

representa um indicador de qualidade de vida referente a esse mesmo município V, para V = O, ⋯ , N. A


componente ZV representa um erro aleatório com média X e variância ]^ . A tabela a seguir mostra a tabela
ANOVA resultante do ajuste desse modelo pelo método dos mínimos quadrados ordinários.
Fonte de Soma dos Graus de Média dos Razão
P-valor
Variação Quadrados Liberdade Quadrados F
Modelo 900 1 900 90 < 0,001
Erro 100 10 10
Total 1.000 11
A partir das informações e da tabela apresentadas, julgue os itens subsequentes.
O referido estudo contemplou um conjunto de dados obtidos de = 11 municípios.

48- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

Comentários:
Na análise de variância (ANOVA) da regressão, o total de graus de liberdade corresponde a − 1, em que
representa o número total de amostras. Logo, podemos estabelecer que:
− 1 = 11
= 12 _` abícade.
Gabarito: Errado.

UV = WX + WO YV + ZV , em que UV representa o número de leitos por habitante existente no município V; YV


(CESPE/EBSERH/2018) Determinado estudo considerou um modelo de regressão linear simples na forma

representa um indicador de qualidade de vida referente a esse mesmo município V, para V = O, ⋯ , N. A


componente ZV representa um erro aleatório com média X e variância ]^ . A tabela a seguir mostra a tabela
ANOVA resultante do ajuste desse modelo pelo método dos mínimos quadrados ordinários.
Fonte de Soma dos Graus de Média dos Razão
P-valor
Variação Quadrados Liberdade Quadrados F
Modelo 900 1 900 90 < 0,001
Erro 100 10 10
Total 1.000 11
A partir das informações e da tabela apresentadas, julgue os itens subsequentes.
A correlação linear entre o número de leitos hospitalares por habitante (y) e o indicador de qualidade de
vida (x) foi igual a 0,9.

Comentários:
O coeficiente de correlação linear entre as variáveis X e Y é calculado por meio da seguinte expressão:

56<
<=@ ,
567

em que 56< indica a soma dos quadrados da regressão (modelo) e 567 a soma dos quadrados totais.

Pela tabela, verificamos que 567 = 1000 e 56< = 900. Substituindo esses valores na equação anterior,
teremos:

900
<=@ = g0,9
1000

Portanto, o coeficiente de determinação < / possui valor igual a 0,9, mas o coeficiente de correlação não.
Gabarito: Errado.

49- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

UV = WX + WO YV + ZV , em que UV representa o número de leitos por habitante existente no município V; YV


(CESPE/EBSERH/2018) Determinado estudo considerou um modelo de regressão linear simples na forma

representa um indicador de qualidade de vida referente a esse mesmo município V, para V = O, ⋯ , N. A


componente ZV representa um erro aleatório com média X e variância ]^ . A tabela a seguir mostra a tabela
ANOVA resultante do ajuste desse modelo pelo método dos mínimos quadrados ordinários.
Fonte de Soma dos Graus de Média dos Razão
P-valor
Variação Quadrados Liberdade Quadrados F
Modelo 900 1 900 90 < 0,001
Erro 100 10 10
Total 1.000 11
A partir das informações e da tabela apresentadas, julgue os itens subsequentes.

A razão F da tabela ANOVA refere-se ao teste de significância estatística do intercepto , em que se testa a
hipótese nula : = 0 contra a hipótese alternativa h : ≠ 0.

Comentários:
i
A estatística D =
i "
está relacionada com o teste de hipótese para o coeficiente angular da reta de
regressão, isto é:
: =0
: ≠0
Se a hipótese não é rejeitada, significa dizer que não existe uma relação linear significativa entre a variável
explicativa (X) e a variável dependente (Y).
Gabarito: Errado.

UV = WX + WO YV + ZV , em que UV representa o número de leitos por habitante existente no município V; YV


(CESPE/EBSERH/2018) Determinado estudo considerou um modelo de regressão linear simples na forma

representa um indicador de qualidade de vida referente a esse mesmo município V, para V = O, ⋯ , N. A


componente ZV representa um erro aleatório com média X e variância ]^ . A tabela a seguir mostra a tabela
ANOVA resultante do ajuste desse modelo pelo método dos mínimos quadrados ordinários.
Fonte de Soma dos Graus de Média dos Razão
P-valor
Variação Quadrados Liberdade Quadrados F
Modelo 900 1 900 90 < 0,001
Erro 100 10 10
Total 1.000 11
A partir das informações e da tabela apresentadas, julgue os itens subsequentes.

50- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

O desvio padrão amostral do número de leitos por habitante foi superior a 10 leitos por habitante.

Comentários:
A soma dos quadrados totais (SQT) é dada por:
8

567 = 3, − + -/
9

A variância amostral é calculada por:


∑89 , − + -/
−1

Pela tabela, o grau de liberdade do total corresponde a 11, então:


− 1 = 11

Logo, a variância amostral é:


∑89 , − + -/ 567 1000
= = = 90,90
−1 11 11

Como a variância amostral é menor que 100, o desvio padrão amostral será:
g90,90 I √100
g90,90 I 10
Gabarito: Errado.

UV = WX + WO YV + ZV , em que UV representa o número de leitos por habitante existente no município V; YV


(CESPE/EBSERH/2018) Determinado estudo considerou um modelo de regressão linear simples na forma

representa um indicador de qualidade de vida referente a esse mesmo município V, para V = O, ⋯ , N. A


componente ZV representa um erro aleatório com média X e variância ]^ . A tabela a seguir mostra a tabela
ANOVA resultante do ajuste desse modelo pelo método dos mínimos quadrados ordinários.
Fonte de Soma dos Graus de Média dos Razão
P-valor
Variação Quadrados Liberdade Quadrados F
Modelo 900 1 900 90 < 0,001
Erro 100 10 10
Total 1.000 11
A partir das informações e da tabela apresentadas, julgue os itens subsequentes.

A estimativa de C / foi igual a 10.

51- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

Comentários:
A estimativa de C / equivale ao quadrado médio residual. Logo,
C / = 6;< = 10
Gabarito: Certo.

UV = WX + WO YV + ZV , em que UV representa o número de leitos por habitante existente no município V; YV


(CESPE/EBSERH/2018) Determinado estudo considerou um modelo de regressão linear simples na forma

representa um indicador de qualidade de vida referente a esse mesmo município V, para V = O, ⋯ , N. A


componente ZV representa um erro aleatório com média X e variância ]^ . A tabela a seguir mostra a tabela
ANOVA resultante do ajuste desse modelo pelo método dos mínimos quadrados ordinários.
Fonte de Soma dos Graus de Média dos Razão
P-valor
Variação Quadrados Liberdade Quadrados F
Modelo 900 1 900 90 < 0,001
Erro 100 10 10
Total 1.000 11
A partir das informações e da tabela apresentadas, julgue os itens subsequentes.

O < / ajustado (Adjusted R Square) foi inferior a 0,9.

Comentários:
O coeficiente de determinação permite avaliar a qualidade do ajuste do modelo, quantificando,
basicamente, a capacidade do modelo de explicar os dados coletados. Ele é calculado por meio da expressão:
56; 56<
</ = =1− ,
567 567
em que 56; = Soma dos quadrados da regressão (modelo), 56< = Soma dos quadrados dos resíduos (erros)
e SQT = Soma dos quadrados totais. Além disso, para evitar dificuldades na interpretação de < / , alguns
estatísticos preferem usar o < / ajustado, definido para uma equação com 2 coeficientes como

++++ −1
</ = 1 − k l 2 ,1 − < / -.
−2
Pela tabela temos que 567 = 1000 e 56< = 900. Substituindo os valores apresentados na tabela nas
equações acima teremos:
900
</ = = 0,9.
1000
Além disso, como temos − 1 = 11 graus de liberdade totais, então

++++ −1
</ = 1 − k l 2 ,1 − < / -.
−2

52- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

++++ 11
< / = 1 − k l 2 ,1 − 0,9-.
10
++++ = 1 − 1,1 2 0,1
< /

++++
< / = 1 − 0,11
++++
< / = 0,89.
Gabarito: Certo.

==13272f==

53- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

RESUMO DA AULA

CORRELAÇÃO LINEAR

A correlação é usada para indicar a força que mantém unidos dois conjuntos de valores. A
correlação linear pode ser:

Gráfico Definição

Correlação Positiva
Direta ou positiva – quando temos dois fenômenos que
15
variam no mesmo sentido. Se aumentarmos ou
10
diminuirmos um deles, o outro também aumentará ou
diminuirá;
5

0
0 5 10 15

Correlação Negativa
Inversa ou negativa – quando temos dois fenômenos que
15
variam em sentido contrário. Se aumentarmos ou
10
diminuirmos um deles, acontecerá o contrário com o
outro, no caso, diminuirá ou aumentará;
5
0
0 5 10 15

Correlação Nula
Inexistente ou nula – quando não existe correlação ou
14
dependência entre os dois fenômenos. Nessa situação, o
valor do coeficiente de correlação linear será zero (𝑟 = 0)
9
4
ou um valor aproximadamente igual a zero (𝑟 ≅ 0);
-1
0 5 10 15

Correlação Perfeita
15

10 Perfeita – quando os fenômenos se ajustam perfeitamente


a uma reta.
5

0
0 5 10 15

54- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

Coeficiente de Correlação de Pearson

σ𝒏 ഥ ഥ
𝒊=𝟏ሾሺ𝑿𝒊 −𝑿ሻ×ሺ𝒀𝒊 −𝒀ሻሿ
É adotado para medir o quão forte é a 𝒓=
RELAÇÃO linear entre duas VARIÁVEIS. ටσ𝒏 ഥ 𝒏 ഥ
𝒊=𝟏ሺ𝑿𝒊 −𝑿ሻ²×σ𝒊=𝟏ሺ𝒀𝒊 −𝒀ሻ²

𝒏 𝒏
∑ ሾሺ𝑿𝒊 − 𝑿 ഥ ሻሿ = ∑
ഥ ሻ × ሺ𝒀𝒊 − 𝒀 ഥ×𝒀
ሺ𝑿𝒊 × 𝒀𝒊 ሻ − 𝒏 × 𝑿 ഥ
𝒊=𝟏 𝒊=𝟏

𝒏 𝒏
∑ ഥ ሻ𝟐 ሿ = ∑
ሾሺ𝑿𝒊 − 𝑿 ഥ𝟐
(𝑿𝟐𝒊 ) − 𝒏 × 𝑿
𝒊=𝟏 𝒊=𝟏

𝒏 𝒏
∑ ഥ ሻ𝟐 ሿ = ∑
ሾሺ𝒀𝒊 − 𝒀 ഥ𝟐
(𝒀𝟐𝒊 ) − 𝒏 × 𝒀
𝒊=𝟏 𝒊=𝟏

Sobre a Coeficiente de Correlação de Pearson, podemos afirmar que:

• I – Pode assumir quaisquer valores entre 1 e -1, ou seja: −𝟏 ≤ 𝒓 ≤ 𝟏.


• II – Quanto mais próximo 𝒓 estiver de 0, menor será a relação linear entre as duas variáveis
• III – Quanto mais próximo 𝒓 estiver de (1 ou -1), maior será a relação linear entre as duas
variáveis.

Propriedades do Coeficiente de Correlação

1º Propriedade
• O coeficiente de correlação não sofre alteração quando uma constante é adicionada a
(ou subtraída de) uma variável.

2º Propriedade

• O coeficiente de correlação pode não sofrer alteração ou pode ter seu sinal alterado
quando uma variável é multiplicada (ou dividida) por uma constante. Caso as
constantes tenham o mesmo sinal, o valor do coeficiente de correlação não será
alterado. Por outro lado, se as constantes tiverem sinais contrários, o coeficiente
mudará de sinal, mas o valor permanecerá inalterado.

55- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

REGRESSÃO LINEAR SIMPLES

Trata-se da equação que representa uma


reta:
Calcula a expressão matemática que relaciona
Y (variável dependente) em função de X
𝒚=𝒎∙𝒙+𝒃
(variável independente).

- Propriedades

Sobre a Regressão Linear Simples, podemos afirmar que:

• I – O coeficiente 𝑚 é conhecido como taxa de variação ou coeficiente angular da reta.


∆𝒚 𝒚−𝒚
• II – O coeficiente angular é expresso por: 𝒎 = ∆𝒙 = 𝒙−𝒙𝟎
𝟎
• III – O coeficiente b é conhecido como coeficiente linear da reta e determina o ponto em
que a reta intercepta o eixo 𝑦.
• IV – Quando a correlação linear não é perfeita, utilizamos a expressão 𝒀𝒊 = 𝜶 + 𝜷𝑿𝒊 + 𝜺𝒊 ,
para determinar a reta de regressão.

Método dos Mínimos Quadrados

Esse método é empregado na obtenção dos


estimadores α e β de um modelo de
regressão linear:
A reta a ser adotada deverá ser aquela que
𝒀𝒊 = 𝜶 + 𝜷𝑿𝒊 + 𝜺𝒊 .
torna mínima a soma dos quadrados das
distâncias da reta aos pontos experimentais,
Expressão usada para determinar a reta de
medidas no sentido da variação aleatória.
regressão é:

𝒀𝒊 = 𝒂 + 𝒃𝑿𝒊

56- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

Reta Passando pela Origem

𝒀𝒊 = 𝜶 + 𝜷𝑿𝒊 + 𝜺𝒊

𝒀𝒊 = 𝟎 + 𝜷𝑿𝒊 + 𝜺𝒊

𝒀𝒊 = 𝜷𝑿𝒊 + 𝜺𝒊 .

ANÁLISE DE VARIÂNCIA DA REGRESSÃO

Observar a redução no
resíduo (desvio) quando
comparado com um O resultado da análise de
modelo aproximadamente variância da regressão é
Estratégia para verificar se
uniforme 𝒀𝒊 = 𝝁 + 𝜺𝒊 . uma tabela que resume
compensa ou não utilizar
várias medidas usadas no
um modelo de regressão Testar a hipótese: teste de hipóteses anterior.
linear,
𝒀𝒊 = 𝜶 + 𝜷𝑿𝒊 + 𝜺𝒊 𝑯𝟎 : 𝜷 = 𝟎

𝑯𝟏 : 𝜷 ≠ 𝟎

Graus de Liberdade

O número de graus de liberdade do modelo de regressão é:

𝐺𝐿𝑀𝑜𝑑𝑒𝑙𝑜 = 2 − 1 = 1

O número de graus de liberdade dos resíduos é:

𝐺𝐿𝑅𝑒𝑠í𝑑𝑢𝑜𝑠 = 𝑛 − 2

O número de graus de liberdade total é:

𝐺𝐿𝑇𝑜𝑡𝑎𝑙 = 𝑛 − 1

57- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

Somas de Quadrados

A soma dos quadrados totais é calculada por meio das seguintes fórmulas:

𝑆𝑄𝑇 = 𝑆𝑄𝑀 + 𝑆𝑄𝑅


𝑛

𝑆𝑄𝑇 = ∑ሺ𝑌𝑖 − 𝑌̅ሻ2


𝑖=1

A soma dos quadrados do modelo de regressão é calculada mediante as seguintes fórmulas:


𝑛
2
෡𝑖 − 𝑌̅)
𝑆𝑄𝑀 = ∑(𝑌
𝑖=1

𝑆𝑄𝑀 = 𝑏 × ∑ሾሺ𝑋𝑖 − 𝑋̅ሻ × ሺ𝑌𝑖 − 𝑌̅ሻሿ


𝑖=1

𝑆𝑄𝑀 = 𝑏 × ∑ሺ𝑋𝑖 − 𝑋̅ሻ2


2

𝑖=1

A soma dos quadrados dos resíduos é calculada pela fórmula:


𝑛
෡𝑖 )2
𝑆𝑄𝑅 = ∑(𝑌𝑖 – 𝑌
𝑖=1

Coeficiente de Determinação

O coeficiente de determinação é calculado pela fórmula:

𝑆𝑄𝑀
𝑅2 =
𝑆𝑄𝑇

Em que R é o coeficiente de correlação linear, calculado pela expressão:

𝑆𝑄𝑀
𝑅=√
𝑆𝑄𝑇

O coeficiente de determinação também pode ser escrito da seguinte forma:

58- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

𝑆𝑄𝑀 𝑆𝑄𝑇 − 𝑆𝑄𝑅 𝑆𝑄𝑅


𝑅2 = = = 1−
𝑆𝑄𝑇 𝑆𝑄𝑇 𝑆𝑄𝑇

Coeficiente de Determinação Ajustado

É obtida pela divisão de 𝑺𝑸𝑹 e 𝑺𝑸𝑻 pelos respectivos graus de liberdade:

𝑆𝑄𝑅
⁄ሺ𝑛 − 2ሻ
̅𝑅̅̅̅2 = 1 −
𝑆𝑄𝑇
⁄ሺ𝑛 − 1ሻ

̅̅̅̅𝟐 ) e o coeficiente de determinação


A relação entre o coeficiente de determinação ajustado (𝑹
tradicional (𝑹𝟐 ) é dada por:

ሺ𝑛 − 1ሻ
̅̅
𝑅̅̅2 = 1 − ሺ1 − 𝑅 2 ሻ ×
ሺ𝑛 − 2ሻ

Quadrados Médios
𝑆𝑄𝑀
Quadrado médio do modelo (QMM): 𝑄𝑀𝑀 =
1

𝑆𝑄𝑅
Quadrado médio dos resíduos (QMR): 𝑄𝑀𝑅 =
𝑛−2

𝑆𝑄𝑇
Quadrado médio total (QMT): 𝑄𝑀𝑇 =
𝑛−1

Estatística F (Razão F)
𝑄𝑀𝑀
Estatística 𝑭 (ou razão F): 𝐹 ∗ = 𝑄𝑀𝑅

Se 𝐹 ∗ > 𝐹𝑐𝑟í𝑡𝑖𝑐𝑜 , podemos rejeitar a hipótese nula;

Se 𝐹 ∗ < 𝐹𝑐𝑟í𝑡𝑖𝑐𝑜 , não podemos rejeitar a hipótese nula.

59- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

Tabela de Análise de Variância da Regressão

Fonte de Graus de Soma dos Quadrados Estatística F


Variação Liberdade Quadrados Médios (Razão F)

𝑆𝑄𝑀 𝑄𝑀𝑀
Modelo 1 SQM 𝑄𝑀𝑀 = 𝐹∗ =
1 𝑄𝑀𝑅

𝑆𝑄𝑅
Resíduos 𝑛−2 SQR 𝑄𝑀𝑅 =
𝑛−2

𝑺𝑸𝑻
Total 𝒏−𝟏 SQT 𝑸𝑴𝑻 =
𝒏−𝟏

60- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

QUESTÕES COMENTADAS – VUNESP

Correlação Linear

1. (VUNESP/EBSERH/2020) Dados para responder à questão.


A variável x tem média 4 e desvio padrão 2, enquanto a variável y tem média 3 e desvio padrão
1. A covariância entre x e y é –1.
O coeficiente de correlação entre x e y é
a) 0,5.
b) –0,5.
c) 1.
d) –1.
e) –0,25.

Comentários:
A fórmula do coeficiente de correlação é expressa por:
𝐶𝑜𝑣(𝑥, 𝑦)
𝜌=
𝜎𝑥 × 𝜎𝑦
Em que 𝐶𝑜𝑣(𝑥, 𝑦),representa a covariância entre x e y, e 𝜎 representa o desvio padrão da variável
aleatória.
Substituindo os valores dados no enunciado, temos:
−1
𝜌(𝑥, 𝑦) =
2×1
𝜌(𝑥, 𝑦) = −0,5
Gabarito: B.

61- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

QUESTÕES COMENTADAS – VUNESP

Regressão Linear Simples

1. (VUNESP/Pref. Mogi das Cruzes/2019) Sejam S o valor do salário, em R$ 1.000,00, e t o


respectivo tempo de serviço, em anos, de 20 empregados de uma empresa. Optou-se, com o
objetivo de previsão do salário de um determinado empregado em função do seu tempo de
serviço, por utilizar a relação linear 𝑺𝒊 = 𝜶 + 𝜷𝒕𝒊 + 𝜺𝒊 , com i representando a i-ésima observação,
α e β são parâmetros desconhecidos e εi é o erro aleatório com as respectivas hipóteses da
regressão linear simples. Utilizando o método dos mínimos quadrados, com base nas 20
observações correspondentes dos 20 empregados, obtiveram-se as estimativas de α e β (a e b,
respectivamente). O valor encontrado para b foi de 1,8 e as médias dos salários dos 20
empregados e dos correspondentes tempos de serviço apresentam os valores de R$ 2.800,00 e
2 anos, respectivamente.
A previsão de salário para um empregado que tenha 5 anos de serviço é de
a) R$ 6.800,00
b) R$ 7.500,00
c) R$ 8.200,00
d) R$ 8.400,00
e) R$ 9.000,00

Comentários:
Tomemos a equação 𝑆̂ = 𝑎 + 𝑏𝑡 para a reta estimada. Sendo b é igual a 1,8.
A média dos salários dos 20 empregados é 2800 e o tempo médio de serviço é 2 anos.
Logo,
2,8 = 𝑎 + 1,8 × 2
2,8 = 𝑎 + 3,6
𝑎 = −0,8
A previsão para 5 anos fica:
𝑆̂ = (−0,8) + 1,8 × 5
𝑆̂ = (−0,8) + 9
𝑆̂ = 8,2
Que corresponde a R$ 8.200,00.
Gabarito: C.

62- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

2. (VUNESP/MPE-SP/2019). Um aluno teve as seguintes notas: 3; 5; 5,5; 6,5. O professor quer


atribuir a nota final, escolhendo uma nota representativa desse conjunto com base no método
dos mínimos quadrados. Desse modo, essa nota final será
a) 4.
b) 4,5.
c) 5.
d) 5,5.
e) 6.

Comentários:
==13272f==

Vamos montar uma tabela com os dados fornecidos:

𝑿 𝒀 ̅)
(𝑿 − 𝑿 ̅)
(𝒀 − 𝒀 ̅ ) (𝒀 − 𝒀
(𝑿 − 𝑿 ̅) ̅ )𝟐
(𝑿 − 𝑿

1 3 -1,5 -2 3 2,25

2 5 -0,5 0 0 0,25

3 5,5 0,5 0,5 0,25 0,25

4 6,5 1,5 1,5 2,25 2,25

𝑋̅ = 2,5 𝑌̅ = 5 Total 5,5 5

Pelo método dos mínimos quadrados, temos:


𝑌̂ = 𝑎 + 𝑏𝑋𝑖
∑(𝑋𝑖 − 𝑋̅)(𝑌𝑖 − 𝑌̅)
𝑏=
∑(𝑋𝑖 − 𝑋̅)2
5,5
𝑏= = 1,1
5
𝑎 = 𝑌̅ − 𝑏𝑋̅
𝑎 = 5 − 1,1 × 2,5
𝑎 = 2,25
Nossa reta de regressão será:
𝑌̂ = 𝑎 + 𝑏𝑋𝑖
𝑌̂ = 2,25 + 1,1𝑋

63- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

̅ 𝑌̅), então:
Sabendo que a reta de regressão passa pelo ponto (𝑋,
𝑌̂ = 2,25 + 1,1 × 2,5
𝑌̂ = 5
Gabarito: C.

64- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

QUESTÕES COMENTADAS – VUNESP

Análise de Variância da Regressão

1. (VUNESP/EBSERH/2020) Numa regressão linear simples em que foi utilizada uma amostra
com 52 observações, a soma dos quadrados totais é de 50 e a soma dos quadrados dos resíduos
é de 20. O coeficiente de determinação e a estatística F dessa regressão são, respectivamente:
a) 0,6 e 75.
b) 0,6 e 12.
c) 0,8 e 1,5.
==13272f==

d) 0,8 e 12.
e) 0,8 e 75.

Comentários:
O coeficiente de determinação da regressão linear é expresso por:
𝑆𝑄𝑀 𝑆𝑄𝑅
𝑅2 = =1−
𝑆𝑄𝑇 𝑆𝑄𝑇
Quanto mais próximo de 1 estiver o coeficiente de determinação, mais forte será a correlação linear.
Implica dizer que as diferenças entre os valores observados (𝑌𝑖 ) e a média (𝑌̅) são quase totalmente
explicados pela reta de regressão. Por outro lado, quanto mais próximo de 0 estiver o coeficiente de
determinação, mais fraca será a correlação linear, isto é, a reta de regressão não é capaz de explicar as
diferenças entre os valores observados e a média.
Substituindo os valores, temos:
20
𝑅2 = 1 −
50
𝑅 2 = 1 − 0,4
𝑅 2 = 0,6
O coeficiente de determinação e a estatística 𝐹:
𝑆𝑄𝑀
𝑄𝑀𝑀 1 𝑆𝑄𝑀 × (𝑛 − 2)
𝐹= = =
𝑄𝑀𝑅 𝑆𝑄𝑅 𝑆𝑄𝑅
(𝑛 − 2)
Temos 52 observações, logo:
30 × (52 − 2)
𝐹=
20

65- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

𝐹 = 1,5 × 50
𝐹 = 75
Outra forma de fazer é:
𝑅 2 (𝑛 − 2)
𝐹=
1 − 𝑅2
030 × (52 − 2)
𝐹=
1 − 0,6
30
𝐹=
0,4
𝐹 = 75
Gabarito: A.

66- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

AVISO IMPORTANTE!

Olá, alunos (as)!

Informamos que não temos mais questões da banca, referente ao assunto tratado na aula de hoje, em
virtude de baixa cobrança deste tópico ao longo dos anos. No entanto, para complementar o estudo e deixar
sua preparação em alto nível, preparamos um caderno de questões inéditas que servirá como treino e
aprimoramento do conteúdo.

Em caso de dúvidas, não deixe de nos chamar no Fórum de dúvidas!

Bons estudos!

Estratégia Concursos

67- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

QUESTÕES COMENTADAS – INÉDITAS

Correlação Linear

1. (INÉDITA/2022) Em um gráfico de dispersão, observa-se que a maioria dos pontos está situada no
primeiro e no terceiro quadrantes. Aqueles que não estão nessa posição, situam-se próximos da origem.
Então, a correlação linear entre as variáveis
a) poderá ser fracamente positiva.
b) será necessariamente fortemente positiva.
c) poderá ser fracamente negativa.
d) será necessariamente fortemente negativa.
e) será necessariamente nula.

Comentários:
O enunciado afirma que a maioria dos pontos estão no primeiro e no terceiro quadrantes, logo a reta que
representa os dados é crescente (correlação linear positiva). Se os pontos não estiverem necessariamente
sobre uma reta, a correlação poderá ser fracamente positiva.

Assim, concluímos que o gabarito é a letra A.


Gabarito: A.

68- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

2. (INÉDITA/2022) O coeficiente linear de Pearson indica a intensidade da correlação entre duas variáveis
e, ainda, o sentido dessa correlação. Assinale a alternativa que indica adequadamente a interpretação de
um determinado resultado obtido 𝒓 = −𝟎, 𝟗𝟏 para o coeficiente de correlação de Pearson:
a) Correlação linear negativa altamente significativa entre as variáveis.
b) Correlação linear positiva altamente significativa entre as variáveis.
c) Correlação linear positiva muito fraca entre as variáveis.
d) Correlação linear positiva relativamente fraca entre as variáveis.
e) Não há correlação linear positiva entre as variáveis.

Comentários:
O coeficiente de correlação varia entre -1 e 1, sendo que quanto mais próximo de zero estiverem os pares
ordenados, mais fraca será a correlação; e quanto mais próximo de 1 ou -1 estiverem os pares ordenados,
mais forte será a correlação. Na presente questão, temos uma correlação negativa e muito próxima de −1,
portanto, altamente significativa.
Gabarito: A.

3. (INÉDITA/2022) A tabela a seguir apresenta as penas de reclusão (P), em anos, cominadas a um grupo
de dez réus, e suas respectivas rendas familiares mensais per capitas (R), em número de salários-mínimos.

Réu 𝑷 𝑹 𝑷×𝑹 𝑷² 𝑹²

1 15 0,5 7,5 225 0,25

2 12 1,5 18 144 2,25

3 11 2 22 121 4

4 7 1,5 10,5 49 2,25

5 6 1,25 7,5 36 1,5625

6 5 2 10 25 4

7 6 2,5 15 36 6,25

8 2 3 6 4 9

9 2,5 3,5 8,75 6,25 12,25

69- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

10 2 4 8 4 16

Totais 68,5 21,75 113,25 650,25 57,8125

Dados:
𝟏𝟖𝟏𝟎, 𝟐𝟓 𝟏/𝟐 = 𝟒𝟐, 𝟓𝟒
𝟏𝟎𝟓, 𝟎𝟔𝟏/𝟐 = 𝟏𝟎, 𝟐𝟓
A partir das informações, o coeficiente de correlação linear entre as variáveis R e P é
a) – 0,31.
b) – 0,52.
c) – 0,66.
d) – 0,77.
e) – 0,82.

Comentários:
A fórmula do coeficiente de correlação linear que vamos utilizar é:
𝑛(∑ 𝑥𝑖 𝑦𝑖 ) − (∑ 𝑥𝑖 )(∑ 𝑦𝑖 )
𝜌(𝑥, 𝑦) =
√𝑛(∑ 𝑥𝑖2 ) − (∑ 𝑥𝑖 )2 √𝑛(∑ 𝑦𝑖2 ) − (∑ 𝑦𝑖 )2

Portanto, basta aplicarmos os valores apresentados na tabela. Assim, considerando P como a variável X e R
como a variável Y, temos:
10 × 113,25 − 68,5 × 21,75
𝜌(𝑥, 𝑦) =
√10 × 650,25 − 68,52 √10 × 57,8125 − 21,752
1132,5 − 1489,88
𝜌(𝑥, 𝑦) =
√6502,5 − 4692,25 √578,125 − 473,0625
−471,5
𝜌(𝑥, 𝑦) =
√1810,25 √105,0625
O enunciado também trouxe alguns dados importantes:
1810,25 1/2 = 42,54
105,061/2 = 10,25
Sabendo disso, podemos utilizar esses valores na fórmula de correlação, ficando assim:
−357,375
𝜌(𝑥, 𝑦) =
42,547 × 10,25

70- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

−357,375
𝜌(𝑥, 𝑦) =
436,1071
𝜌(𝑥, 𝑦) = −0,819
Gabarito: E.

4. (INÉDITA/2022) A tabela a seguir apresenta as quantidades vendidas de pacotes de leite em pó (P), em


unidades, e de pacotes de café (Y), também em unidades.

Mês 𝑿 𝒀 𝑿×𝒀 𝑿² 𝒀²

1 10 15 150 100 225

2 8 14 112 64 196

3 12 16 192 144 256

4 5 9 45 25 81

5 3 17 51 9 289

Totais 38 71 550 342 1047

Dados:
𝟐𝟔𝟔 𝟏/𝟐 = 𝟏𝟔, 𝟑𝟏
𝟏𝟗𝟒𝟏/𝟐 = 𝟏𝟑, 𝟗𝟑
A partir das informações, o coeficiente de correlação linear entre as variáveis X e Y é
a) 0,23.
b) 0,31.
c) 0,39.
d) 0,44.
e) 0,49.

Comentários:
A fórmula do coeficiente de correlação linear que vamos utilizar é:
𝑛(∑ 𝑥𝑖 𝑦𝑖 ) − (∑ 𝑥𝑖 )(∑ 𝑦𝑖 )
𝜌(𝑥, 𝑦) =
√𝑛(∑ 𝑥𝑖2 ) − (∑ 𝑥𝑖 )2 √𝑛(∑ 𝑦𝑖2 ) − (∑ 𝑦𝑖 )2

71- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

Portanto, basta aplicarmos os valores apresentados na tabela. Assim, temos:


5 × 550 − 38 × 71
𝜌(𝑥, 𝑦) =
√5 × 342 − 382 √5 × 1047 − 712
2750 − 2698
𝜌(𝑥, 𝑦) =
√1710 − 1444 √5235 − 5041
52
𝜌(𝑥, 𝑦) =
√266 √194
O enunciado também trouxe alguns dados importantes:
266 1/2 = 16,31
1941/2 = 13,93
Sabendo disso, podemos utilizar esses valores na fórmula de correlação, ficando assim:
==13272f==

52
𝜌(𝑥, 𝑦) =
16,31 × 13,93
52
𝜌(𝑥, 𝑦) =
227,1651
𝜌(𝑥, 𝑦) = 0,23
Gabarito: A.

5. (INÉDITA/2022) A variável x tem desvio padrão igual a 1, enquanto a variável y tem desvio padrão igual
a 2. Se a covariância entre x e y é 0,5, então o coeficiente de correlação entre x e y é
a) 0,65.
b) 0,55.
c) 0,45.
d) 0,35.
e) 0,25.

Comentários:
A fórmula do coeficiente de correlação é expressa por:
𝐶𝑜𝑣(𝑥, 𝑦)
𝜌=
𝜎𝑥 × 𝜎𝑦
em que 𝐶𝑜𝑣(𝑥, 𝑦),representa a covariância entre x e y, e 𝜎 representa o desvio padrão da variável aleatória.
Substituindo os valores dados no enunciado, temos:

72- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

0,5
𝜌(𝑥, 𝑦) =
1×2
𝜌(𝑥, 𝑦) = 0,25
Gabarito: E.

6. (INÉDITA/2022) A variável x tem média 10 e desvio padrão 5, enquanto a variável y tem média 2 e desvio
padrão 1. Se a covariância entre x e y é 2, então o coeficiente de correlação entre x e y é
a) 0,4.
b) 0,5.
c) 0,8.
d) –0,4.
e) –0,6.

Comentários:
A fórmula do coeficiente de correlação é expressa por:
𝐶𝑜𝑣(𝑥, 𝑦)
𝜌=
𝜎𝑥 × 𝜎𝑦
em que 𝐶𝑜𝑣(𝑥, 𝑦),representa a covariância entre x e y, e 𝜎 representa o desvio padrão da variável aleatória.
Substituindo os valores dados no enunciado, temos:
2
𝜌(𝑥, 𝑦) =
5×1
𝜌(𝑥, 𝑦) = 0,4
Gabarito: A.

7. (INÉDITA/2022) O barista é o profissional especializado em preparar cafés de alta qualidade. Considere


que dois baristas foram convidados a avaliar cinco amostras de diferentes cafés.

Amostra Barista 1 Barista 2

1 7 6

2 6 5

3 9 10

73- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

4 10 9

5 3 2

O coeficiente de correlação entre as avaliações atribuídas pelos dois baristas é:


a) 0,57.
b) 0,96.
c) 0,77.
d) 0,89.
e) 0,91.

Comentários:

Primeiro, teremos que calcular as médias de X e Y:

7 + 6 + 9 + 10 + 3 35
𝑋̅ = = =7
5 5

6 + 5 + 10 + 9 + 2 32
𝑌̅ = = = 6,4
5 5

Agora, calcularemos os desvios de X e Y em relação às suas médias:

̅ 𝒀𝒊 − 𝒀
Amostra 𝑿𝒊 𝒀𝒊 𝑿𝒊 − 𝑿 ̅

1 7 6 0 -0,4

2 6 5 -1 -1,4

3 9 10 2 3,6

4 10 9 3 2,6

5 3 2 -4 -4,4

Nesse ponto, teremos que calcular o numerador e o denominador do coeficiente de correlação. Para tanto,
precisaremos multiplicar os desvios de X pelos desvios de Y, bem como calcular os quadrados dos desvios:

̅ 𝒀𝒊 − 𝒀
Amostra 𝑿𝒊 𝒀𝒊 𝑿𝒊 − 𝑿 ̅ (𝑿𝒊 − 𝑿
̅ ) × (𝒀𝒊 − 𝒀
̅ ) (𝑿𝒊 − 𝑿
̅ )² (𝒀𝒊 − 𝒀
̅ )²

74- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

1 7 6 0 -0,4 0 0 0,16

2 6 5 -1 -1,4 1,4 1 1,96

3 9 10 2 3,6 7,2 4 12,96

4 10 9 3 2,6 7,8 9 6,76

5 3 2 -4 -4,4 17,6 16 19,36

Total 34 30 41,2

Aplicando esses valores na fórmula do coeficiente de correlação linear, temos:

∑𝑛𝑖=1[(𝑋𝑖 − 𝑋̅) × (𝑌𝑖 − 𝑌̅)]


𝑟=
√∑𝑛𝑖=1(𝑋𝑖 − 𝑋̅)² × ∑𝑛𝑖=1(𝑌𝑖 − 𝑌̅)²

34
𝑟=
√30 × 41,2

𝑟 ≅ 0,967

Gabarito: B.

8. (INÉDITA/2022) A quantidade de metros de tecido vendidos por uma loja e o valor das vendas mensais
são apresentados na tabela a seguir, em que y representa os valores arrecadados com a venda de tecidos
no mês e x a quantidade de metros vendidos.

x: Venda de Tecidos y : Vendas Mensais


Mês
(a cada 100m) (em R$ 1.000,00)

1 1 1

2 2 1

3 3 2

4 4 2

5 5 4

75- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

O coeficiente de correlação linear de Pearson entre variáveis x e y é:


a) 0,78
b) 0,97
c) 0,90
d) 0,83
e) 0,86

Comentários:

Primeiro, teremos que calcular as médias de X e Y:

1 + 2 + 3 + 4 + 5 15
𝑋̅ = = =3
5 5
1 + 1 + 2 + 2 + 4 10
𝑌̅ = = =2
5 5

Agora, calcularemos os desvios de X e Y em relação às suas médias:

̅ 𝒀𝒊 − 𝒀
Mês 𝑿𝒊 𝒀𝒊 𝑿𝒊 − 𝑿 ̅

1 1 1 -2 -1

2 2 1 -1 -1

3 3 2 0 0

4 4 2 1 0

5 5 4 2 2

Nesse ponto, teremos que calcular o numerador e o denominador do coeficiente de correlação. Para tanto,
precisaremos multiplicar os desvios de X pelos desvios de Y, bem como calcular os quadrados dos desvios:

Mês ̅ 𝒀𝒊 − 𝒀
𝑿𝒊 𝒀𝒊 𝑿𝒊 − 𝑿 ̅ (𝑿𝒊 − 𝑿
̅ ) × (𝒀𝒊 − 𝒀
̅ ) (𝑿𝒊 − 𝑿
̅ )² (𝒀𝒊 − 𝒀
̅ )²

1 1 1 -2 -1 2 4 1

2 2 1 -1 -1 1 1 1

76- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

3 3 2 0 0 0 0 0

4 4 2 1 0 0 1 0

5 5 4 2 2 4 4 4

Total 7 10 6

Aplicando esses valores na fórmula do coeficiente de correlação linear, temos:

∑𝑛𝑖=1[(𝑋𝑖 − 𝑋̅) × (𝑌𝑖 − 𝑌̅)]


𝑟=
√∑𝑛𝑖=1(𝑋𝑖 − 𝑋̅)² × ∑𝑛𝑖=1(𝑌𝑖 − 𝑌̅)²

6
𝑟=
√7 × 10

𝑟 ≅ 0,904

Gabarito: C.

9. (INÉDITA/2022) Uma empresa está aplicando métodos motivacionais para melhorar os resultados de
seus funcionários com as vendas. Sejam y os valores relativos à quantidade vendida de um produto e x as
despesas relativas aos valores investidos em métodos motivacionais apresentados na tabela a seguir.

x 2 6 10 3 7 5

y 100 120 240 120 200 150

O coeficiente de correlação linear entre as quantidades vendidas e os valores empregados em métodos


motivacionais:
a) 0,91.
b) 0,87.
c) 0,83.
d) 0,79.
e) 0,75.

Comentários:

77- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

Primeiro, teremos que calcular as médias de X e Y:

2 + 6 + 10 + 8 + 3 + 7 + 5
𝑋̅ = = 5,5
6

100 + 120 + 240 + 120 + 200 + 150


𝑌̅ = = 155
6

Agora, calcularemos os desvios de X e Y em relação às suas médias:

𝑿𝒊 𝒀𝒊 ̅ 𝒀𝒊 − 𝒀
𝑿𝒊 − 𝑿 ̅

2 100 -3,5 -55

6 120 0,5 -35

10 240 4,5 85

3 120 -2,5 -35

7 200 1,5 45

5 150 -0,5 -5

Nesse ponto, temos que calcular o numerador e o denominador do coeficiente de correlação. Para tanto,
precisaremos multiplicar os desvios de X pelos desvios de Y, bem como calcular os quadrados dos desvios:

𝑿𝒊 𝒀𝒊 ̅ 𝒀𝒊 − 𝒀
𝑿𝒊 − 𝑿 ̅ (𝑿𝒊 − 𝑿
̅ ) × (𝒀𝒊 − 𝒀
̅ ) (𝑿𝒊 − 𝑿
̅ )² (𝒀𝒊 − 𝒀
̅ )²

2 100 -3,5 -55 192,5 12,25 3025

6 120 0,5 -35 -17,5 0,25 1225

10 240 4,5 85 382,5 20,25 7225

3 120 -2,5 -35 87,5 6,25 1225

7 200 1,5 45 67,5 2,25 2025

5 150 -0,5 -5 2,5 0,25 25

Total 715 41,5 14750

78- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

Aplicando esses valores na fórmula do coeficiente de correlação linear, temos:

∑𝑛𝑖=1[(𝑋𝑖 − 𝑋̅) × (𝑌𝑖 − 𝑌̅)]


𝑟=
√∑𝑛𝑖=1(𝑋𝑖 − 𝑋̅)² × ∑𝑛𝑖=1(𝑌𝑖 − 𝑌̅)²

715
𝑟=
√41,5 × 14750

𝑟 ≅ 0,914

Gabarito: A.

10. (INÉDITA/2022) Os autores de um artigo apresentaram uma análise de correlação para investigar a
relação entre o nível máximo de lactato x e a resistência muscular y. Os dados a seguir foram obtidos

x 400 750 700 800 850 1000

y 3,80 4,00 5,00 5,20 4,00 3,50

O coeficiente de correlação linear entre o nível máximo de lactato (x) e a resistência (y) é:
a) 0,11.
b) 0,23.
c) -0,13.
d) -0,06.
e) 0,16.

Comentários:

Primeiro, teremos que calcular as médias de X e Y:

400 + 750 + 700 + 800 + 850 + 1000 4500


𝑋̅ = = = 750
6 6

3,8 + 4,0 + 5,0 + 5,2 + 4,0 + 3,5 25,5


𝑌̅ = = = 4,25
6 6

Agora, calcularemos os desvios de X e Y em relação às suas médias:

𝑿𝒊 𝒀𝒊 ̅ 𝒀𝒊 − 𝒀
𝑿𝒊 − 𝑿 ̅

79- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

400 3,8 -350 -0,45

750 4 0 -0,25

700 5 -50 0,75

800 5,2 50 0,95

850 4 100 -0,25

1000 3,5 250 -0,75

Nesse ponto, temos que calcular o numerador e o denominador do coeficiente de correlação. Para tanto,
precisaremos multiplicar os desvios de X pelos desvios de Y, bem como calcular os quadrados dos desvios:

𝑿𝒊 𝒀𝒊 ̅ 𝒀𝒊 − 𝒀
𝑿𝒊 − 𝑿 ̅ (𝑿𝒊 − 𝑿
̅ ) × (𝒀𝒊 − 𝒀
̅ ) (𝑿𝒊 − 𝑿
̅ )² (𝒀𝒊 − 𝒀
̅ )²

400 3,8 -350 -0,45 157,5 122500 0,2025

750 4 0 -0,25 0 0 0,0625

700 5 -50 0,75 -37,5 2500 0,5625

800 5,2 50 0,95 47,5 2500 0,9025

850 4 100 -0,25 -25 10000 0,0625

1000 3,5 250 -0,75 -187,5 62500 0,5625

Total -45 200000 2,355

Aplicando esses valores na fórmula do coeficiente de correlação linear, temos:

∑𝑛𝑖=1[(𝑋𝑖 − 𝑋̅) × (𝑌𝑖 − 𝑌̅)]


𝑟=
√∑𝑛𝑖=1(𝑋𝑖 − 𝑋̅)² × ∑𝑛𝑖=1(𝑌𝑖 − 𝑌̅)²

−45
𝑟=
√200000 × 2,355

𝑟 ≅ −0,065

80- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

Gabarito: D.

81- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

QUESTÕES COMENTADAS – INÉDITAS

Regressão Linear Simples

1. (INÉDITA/2022) A nota final de uma disciplina é calculada com base no valor médio obtido pelo método
dos mínimos quadrados. Se um aluno obtiver as notas 3,5; 5,5; 7; 8; a sua nota final deverá ser:
a) 5.
b) 5,5.
c) 6.
d) 6,5.
e) 7.

Comentários:
Vamos montar uma tabela com os dados fornecidos:

𝑿 𝒀 ̅)
(𝑿 − 𝑿 ̅)
(𝒀 − 𝒀 ̅ ) (𝒀 − 𝒀
(𝑿 − 𝑿 ̅) ̅ )𝟐
(𝑿 − 𝑿

1 3,5 -1,5 -2,5 3,75 2,25

2 5,5 -0,5 -0,5 0,25 0,25

3 7 0,5 1,0 0,50 0,25

4 8 1,5 2,0 3,00 2,25

̅ = 𝟐, 𝟓
𝑿 ̅=𝟔
𝒀 Total 7,5 5

Pelo método dos mínimos quadrados, temos:


𝑌̂ = 𝑎 + 𝑏𝑋𝑖
∑(𝑋𝑖 − 𝑋̅)(𝑌𝑖 − 𝑌̅)
𝑏=
∑(𝑋𝑖 − 𝑋̅)2
7,5
𝑏= = 1,5
5
𝑎 = 𝑌̅ − 𝑏𝑋̅
𝑎 = 6 − 1,5 × 2,5
𝑎 = 2,25

82- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

Nossa reta de regressão será:


𝑌̂ = 𝑎 + 𝑏𝑋𝑖
𝑌̂ = 2,25 + 1,5𝑋
̅ 𝑌̅), então:
Sabendo que a reta de regressão passa pelo ponto (𝑋,
𝑌̂ = 2,25 + 1,5 × 2,5
𝑌̂ = 6
Gabarito: C.

2. (INÉDITA/2022) Um pesquisador, ao avaliar o efeito de uma variável X sobre outra Y por meio de uma
̂=𝜶
regressão linear da forma 𝒀 ̂+𝜷 ̂ 𝑿, usando o método dos mínimos quadrados, encontrou, a partir de
==13272f==

10 amostras, os seguintes somatórios:


∑𝑿 = 𝟏𝟓𝟎; ∑𝒀 = 𝟐𝟎𝟎; ∑𝑿𝟐 = 𝟐. 𝟕𝟓𝟎; 𝒆 ∑(𝑿𝒀) = 𝟒. 𝟓𝟎𝟎
A partir desses resultados, julgue o item a seguir.
a) para 𝑋 = 10, a estimativa de 𝑌 é 𝑌̂ = 2.
b) para 𝑋 = 8, a estimativa de 𝑌 é 𝑌̂ = 5.
c) para 𝑋 = 8, a estimativa de 𝑌 é 𝑌̂ = −1.
d) para 𝑋 = 9, a estimativa de 𝑌 é 𝑌̂ = 5.
e) para 𝑋 = 10, a estimativa de 𝑌 é 𝑌̂ = −1.

Comentários:
Inicialmente, vamos calcular os valores de 𝑌̅ e de 𝑋̅:
∑ 𝑦 200
𝑌̅ = = = 20
𝑛 10
∑ 𝑥 150
𝑋̅ = = = 15
𝑛 10
Agora, utilizaremos o método dos mínimos quadrados para determinar 𝛽̂ :
∑ 𝑋𝑖 𝑌𝑖 − 𝑛𝑋̅𝑌̅
𝛽̂ =
∑ 𝑋𝑖2 − 𝑛𝑋̅²
4500 − 10 × 15 × 20
𝛽̂ =
2750 − 10 × 15²
1500
𝛽̂ = =3
500
Conhecendo 𝛽̂ , podemos determinar o valor de 𝛼̂:

83- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

∑ 𝑌𝑖 − 𝛽̂ ∑ 𝑋𝑖
𝛼̂ =
𝑛
𝛼̂ = 20 − 3 × 15 = −25
Assim, o modelo de regressão é dado por:
𝑌̂ = −25 + 3 × 𝑋
Para 𝑋 = 10, temos o seguinte valor de 𝑌̂:
𝑌̂ = −25 + 3 × 10
𝑌̂ = 5
Para 𝑋 = 9, temos o seguinte valor de 𝑌̂:
𝑌̂ = −25 + 3 × 9
𝑌̂ = 2
Para 𝑋 = 8, temos o seguinte valor de 𝑌̂:
𝑌̂ = −25 + 3 × 8
𝑌̂ = −1
Gabarito: C.

3. (INÉDITA/2022) A respeito de duas variáveis, X e Y, sabe-se que:


∑𝑿 = 𝟐𝟎
∑𝒀 = 𝟏𝟐
∑𝑿𝒀 = 𝟒𝟖
∑𝑿𝟐 = 𝟓𝟐
(∑𝑿)𝟐 = 𝟏𝟔𝟗
Se o tamanho da amostra é igual a 4, então o valor de "b" na regressão simples 𝒀 = 𝒂 + 𝒃𝑿 é:
a) 1/4.
b) 3/7.
c) 1/3.
d) 3/4.
e) 2/5.

Comentários:
Primeiro calculamos as médias de X e de Y:

84- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

∑ 𝑋 20
𝑋̅ = = =5
𝑛 4
∑𝑌 12
𝑌̅ = = =3
𝑛 4
O valor de 𝑏 é calculado pela seguinte relação:
∑𝑋𝑌 − 𝑛 × 𝑋̅ × 𝑌̅
𝑏=
∑𝑋 2 − 𝑛 × (𝑋̅)2
48 − 4 × 5 × 3
𝑏=
52 − 4 × 52
48 − 60
𝑏=
52 − 100
−12
𝑏=
−48
1
𝑏=
4
Gabarito: A.

85- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

QUESTÕES COMENTADAS – INÉDITAS

Análise de Variância da Regressão

1. (INÉDITA/2022) Em uma regressão linear simples em que foi utilizada uma amostra com 42 observações,
a soma dos quadrados totais é de 40 e a soma dos quadrados dos resíduos é de 10. O coeficiente de
determinação e a estatística F dessa regressão são, respectivamente:
a) 0,6 e 225.
b) 0,6 e 120.
c) 0,75 e 120.
d) 0,75 e 225.
e) 0,8 e 75.

Comentários:
O coeficiente de determinação da regressão linear é expresso por:
𝑆𝑄𝑀 𝑆𝑄𝑅
𝑅2 = =1−
𝑆𝑄𝑇 𝑆𝑄𝑇
Substituindo os valores, temos:
10
𝑅2 = 1 −
40
𝑅 2 = 1 − 0,25
𝑅 2 = 0,75
O coeficiente de determinação e a estatística 𝐹:
𝑆𝑄𝑀
𝑄𝑀𝑀 1 𝑆𝑄𝑀 × (𝑛 − 2)
𝐹= = =
𝑄𝑀𝑅 𝑆𝑄𝑅 𝑆𝑄𝑅
(𝑛 − 2)
Temos 42 observações, logo:
30 × (42 − 2)
𝐹=
10
𝐹 = 3 × 40
𝐹 = 120
Gabarito: C.

86- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

2. (INÉDITA/2022) Um pesquisador aplicou um modelo de regressão linear simples na forma 𝒀 = 𝒃𝑿 +


𝒂 + 𝜺, em que 𝒃 representa o coeficiente angular, 𝒂 é o intercepto do modelo e 𝜺 denota o erro aleatório
com média zero e variância 𝝈². A tabela a seguir representa a análise de variância (ANOVA) proporcionada
por esse modelo.

Fonte de Graus de Soma de


variação Liberdade Quadrados

Modelo 1 275

Erro 89 125

Total 90 400

A correlação linear de Pearson entre a variável resposta Y e a variável regressora X é igual:


a) 0,83
b) 0,81
c) 0,79
d) 0,74
e) 0,70

Comentários:
O coeficiente de determinação da regressão linear é dado por:
𝑆𝑄𝑀
𝑅2 =
𝑆𝑄𝑇
𝑆𝑄𝑀 → 𝑆𝑜𝑚𝑎 𝑑𝑜𝑠 𝑞𝑢𝑎𝑑𝑟𝑎𝑑𝑜𝑠 𝑑𝑜 𝑚𝑜𝑑𝑒𝑙𝑜 𝑑𝑒 𝑟𝑒𝑔𝑟𝑒𝑠𝑠ã𝑜
𝑆𝑄𝑇 → 𝑆𝑜𝑚𝑎 𝑑𝑜𝑠 𝑞𝑢𝑎𝑑𝑟𝑎𝑑𝑜𝑠 𝑡𝑜𝑡𝑎𝑙 (𝑆𝑄𝑇 = 𝑆𝑄𝑀 + 𝑆𝑄𝑅)
Substituindo pelos valores da tabela, temos:
275
𝑅2 =
400
𝑅 2 = 0,6875

𝑅 = √0,6875
𝑅 = 0,83
Gabarito: A.

87- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

3. (INÉDITA/2022) Um pesquisador aplicou um modelo de regressão linear simples na forma 𝒀 = 𝒃𝑿 +


𝒂 + 𝜺, em que 𝒃 representa o coeficiente angular, 𝒂 é o intercepto do modelo e 𝜺 denota o erro aleatório
com média zero e variância 𝝈². A tabela a seguir representa a análise de variância (ANOVA) proporcionada
por esse modelo.

Fonte S. Quadrados G.L. Q. Médio

Modelo 500 1 500

Erro 250 10 25

Total 750 11

A partir das informações e da tabela apresentadas, a correlação linear de Pearson entre a variável resposta
Y e a variável regressora X é igual:
a) 0,416
b) 0,516
c) 0,616
d) 0,716
e) 0,816

Comentários:
O coeficiente de correlação linear entre as variáveis X e Y é calculado por meio da seguinte expressão:

𝑆𝑄𝑀
𝑅=√ ,
𝑆𝑄𝑇

em que 𝑆𝑄𝑀 indica a soma dos quadrados da regressão (modelo) e 𝑆𝑄𝑇 a soma dos quadrados totais.
Pela tabela, verificamos que 𝑆𝑄𝑇 = 750 e 𝑆𝑄𝑀 = 500. Substituindo esses valores na equação anterior,
teremos:

500
𝑅=√ = √0,666 = 0,816
750

Gabarito: E.

4. (INÉDITA/2022) Um pesquisador aplicou um modelo de regressão linear simples na forma 𝒀 = 𝒃𝑿 +


𝒂 + 𝜺, em que 𝒃 representa o coeficiente angular, 𝒂 é o intercepto do modelo e 𝜺 denota o erro aleatório

88- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

com média zero e variância 𝝈². A tabela a seguir representa a análise de variância (ANOVA) proporcionada
por esse modelo.

Fonte S. Quadrados G.L. Q. Médio

Modelo 500 1 500

Erro 250 10 25

Total 750 11

A partir das informações e da tabela apresentadas, pode-se constatar que a variância amostral é
aproximadamente igual a:
==13272f==

a) 64,18
b) 66,18
c) 68,18
d) 70,18
e) 72,18

Comentários:
A soma dos quadrados totais (SQT) é dada por:
𝑛

𝑆𝑄𝑇 = ∑(𝑌𝑖 − 𝑌̅)2


𝑖=1

A variância amostral é calculada por:


∑𝑛𝑖=1(𝑌𝑖 − 𝑌̅)2
𝑛−1
Pela tabela, o grau de liberdade do total corresponde a 11, então:
𝑛 − 1 = 11
Logo, a variância amostral é:
∑𝑛𝑖=1(𝑌𝑖 − 𝑌̅)2 750
= = 68,18
𝑛−1 11
Gabarito: C.

5. (INÉDITA/2022) Um pesquisador aplicou um modelo de regressão linear simples na forma 𝒀 = 𝒃𝑿 +


𝒂 + 𝜺, em que 𝒃 representa o coeficiente angular, 𝒂 é o intercepto do modelo e 𝜺 denota o erro aleatório

89- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

com média zero e variância 𝝈². A tabela a seguir representa a análise de variância (ANOVA) proporcionada
por esse modelo.

Fonte S. Quadrados G.L. Q. Médio

Modelo 500 1 500

Erro 250 10 25

Total 750 11

A partir das informações e da tabela apresentadas, pode-se constatar que o 𝑹𝟐 ajustado é


aproximadamente igual a:
a) 0, 733
b) 0,633
c) 0,583
d) 0,553
e) 0,513

Comentários:
O coeficiente de determinação é calculado por meio da expressão:
𝑆𝑄𝑀 𝑆𝑄𝑅
𝑅2 = =1− ,
𝑆𝑄𝑇 𝑆𝑄𝑇
em que 𝑆𝑄𝑀 = soma dos quadrados da regressão (modelo), 𝑆𝑄𝑅 = soma dos quadrados dos resíduos e SQT
= soma dos quadrados totais.
O R2 ajustado é definido para uma equação com 2 coeficientes como

̅𝑅̅̅2̅ = 1 − (𝑛 − 1) × (1 − 𝑅 2 ).
𝑛−2
Pela tabela temos que 𝑆𝑄𝑇 = 750 e 𝑆𝑄𝑀 = 500. Substituindo os valores apresentados na tabela nas
equações acima, teremos:
500
𝑅2 = = 0,666.
750
Além disso, como temos 𝑛 − 1 = 11 graus de liberdade totais, então

̅𝑅̅̅2̅ = 1 − (𝑛 − 1) × (1 − 𝑅 2 ).
𝑛−2

̅𝑅̅̅2̅ = 1 − (11) × (1 − 0,666).


10

90- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

̅̅
𝑅̅2̅ = 1 − 1,1 × 0,333
̅𝑅̅̅2̅ = 1 − 0,3666
̅𝑅̅̅2̅ = 0,6333.

Gabarito: B.

6. (INÉDITA/2022) Após estimar um modelo de regressão simples, um estatístico trabalha nos resultados,
obtendo a tabela a seguir:

Fonte S. Quadrados G.L. Q. Médio p-value

Equação 600 1 600 0,15%

Resíduos 200 8 25

Total 800 9 88,88

A partir desses números, é correto concluir que:


a) a estimativa do coeficiente angular da equação é igual a 5.
b) a variância estimada do erro aleatório é inferior a 20;
c) apesar de um poder de explicação de 75%, o modelo não passa no teste de significância da estatística F;
d) o modelo é capaz de explicar 75% da variação total;
e) a variância da variável explicativa do modelo é igual a 200;

Comentários:
Analisando-se cada alternativa, temos:
Letra A: Errado. Não é possível estimar o coeficiente angular, pois não há informações acerca de∑(𝑋𝑖 − 𝑋̅)2 .
Logo, não é possível afirmar que tal estimativa valha 5.
Letra B: Errado. Um estimador não viciado para a variância do erro 𝜎 2 é dado por
𝜎 2 = 𝑄𝑀𝑅𝑒𝑠 = 25
Letra C: Errado. O p-valor próximo de zero significa que o modelo proposto é adequado, pois fornece
evidências contra a hipótese nula. Contudo, com base nas informações dadas na questão, não podemos
afirmar que o modelo passa no teste de significância da estatística F.
Letra D: Correto. O coeficiente de determinação 𝑅 2 estima a proporção da variabilidade da variável
dependente que é explicada pelo conjunto das 𝑘 variáveis independentes do modelo de regressão. Devemos
lembrar que a definição do coeficiente é

91- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

𝑆𝑄𝑀
𝑅2 = .
𝑆𝑄𝑇
Com isso, teremos:
600
𝑅2 = = 0,75 = 75%.
800
Letra E: Errado. A variância da variável explicativa do modelo é dada pela soma dos quadrados do modelo.
Representa as distâncias quadráticas dos valores ajustados pelo modelo em relação à média aritmética.
Nessa questão, esse valor é igual a 600.
Gabarito: D.

7. (INÉDITA/2022) Um perito foi convocado para verificar se o valor de Y, número de pastilhas descoladas
de uma fachada, estava relacionado ao valor de X, tempo de exposição ao sol.

Fonte de Graus de Soma de


variação Liberdade Quadrados

Modelo 1 4,80

Erro 5 1,20

Total 6 6,000

Considerando que ∑(𝒙𝒊 − 𝒙̅)𝟐 = 𝟐𝟎; 𝒆 𝟎, 𝟎𝟔𝟏/𝟐 = 𝟎, 𝟐𝟒𝟒, o valor do coeficiente angular é
aproximadamente igual a:
a) 0,244
b) 0,488
c) 0,366
d) 0,566
e) 0,433

Comentários:
Sabemos que:

𝑆𝑄𝑀 = 𝑏 2 × ∑(𝑋𝑖 − 𝑋̅)2

em que 𝑏 2 é a estimativa do coeficiente angular da reta de regressão. Substituindo, temos:


4,80 = 𝑏 2 × 20

92- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

𝑏 2 = 0,24

𝑏 2 = √0,24 = 2 × √0,06 = 2 × 0,244 = 0,488


Gabarito: B.

8. (INÉDITA/2022) Em um modelo de regressão linear simples, obteve-se um coeficiente de correlação


igual a 0,9. O coeficiente de determinação é aproximadamente igual a
a) 0,36.
b) 0,68.
c) 0,70.
d) 0,81.
e) 0,89.

Comentários:
O coeficiente de determinação é o quadrado do coeficiente de correlação:
𝑅 2 = 0,92 = 0,81
Gabarito: D.

9. (INÉDITA/2022) Considere que o coeficiente de determinação tenha sido de 0,49, no ajuste de uma reta
de regressão linear simples de uma variável Y em uma variável X. Então, o módulo do coeficiente de
correlação amostral entre X e Y é igual a:
a) 0,25
b) 0,35
c) 0,50
d) 0,65
e) 0,70

Comentários:
Seja 𝑅 2 o coeficiente de determinação e 𝑟 o coeficiente de correlação.
𝑅 2 = 0,49
Logo,

𝑅 = ±√0,49

93- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

𝑅 = ±0,7
O módulo de 𝑅 vale 0,7.
Gabarito: E.

94- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

LISTA DE QUESTÕES – VUNESP

Correlação Linear

1. (VUNESP/EBSERH/2020) Dados para responder à questão.


A variável x tem média 4 e desvio padrão 2, enquanto a variável y tem média 3 e desvio padrão
1. A covariância entre x e y é –1.
O coeficiente de correlação entre x e y é
a) 0,5.
b) –0,5.
c) 1.
d) –1.
e) –0,25.

95- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

GABARITO – VUNESP

Correlação Linear

1. LETRA B

==13272f==

96- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

LISTA DE QUESTÕES – VUNESP

Regressão Linear Simples

1. (VUNESP/Pref. Mogi das Cruzes/2019) Sejam S o valor do salário, em R$ 1.000,00, e t o


respectivo tempo de serviço, em anos, de 20 empregados de uma empresa. Optou-se, com o
objetivo de previsão do salário de um determinado empregado em função do seu tempo de
serviço, por utilizar a relação linear 𝑺𝒊 = 𝜶 + 𝜷𝒕𝒊 + 𝜺𝒊 , com i representando a i-ésima observação,
α e β são parâmetros desconhecidos e εi é o erro aleatório com as respectivas hipóteses da
regressão linear simples. Utilizando o método dos mínimos quadrados, com base nas 20
observações correspondentes dos 20 empregados, obtiveram-se as estimativas de α e β (a e b,
respectivamente). O valor encontrado para b foi de 1,8 e as médias dos salários dos 20
==13272f==

empregados e dos correspondentes tempos de serviço apresentam os valores de R$ 2.800,00 e


2 anos, respectivamente.
A previsão de salário para um empregado que tenha 5 anos de serviço é de
a) R$ 6.800,00
b) R$ 7.500,00
c) R$ 8.200,00
d) R$ 8.400,00
e) R$ 9.000,00

2. (VUNESP/MPE-SP/2019). Um aluno teve as seguintes notas: 3; 5; 5,5; 6,5. O professor quer


atribuir a nota final, escolhendo uma nota representativa desse conjunto com base no método
dos mínimos quadrados. Desse modo, essa nota final será
a) 4.
b) 4,5.
c) 5.
d) 5,5.
e) 6.

97- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

GABARITO – VUNESP

Regressão Linear Simples

1. LETRA C 2. LETRA C

98- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

LISTA DE QUESTÕES – VUNESP

Análise de Variância da Regressão

1. (VUNESP/EBSERH/2020) Numa regressão linear simples em que foi utilizada uma amostra
com 52 observações, a soma dos quadrados totais é de 50 e a soma dos quadrados dos resíduos
é de 20. O coeficiente de determinação e a estatística F dessa regressão são, respectivamente:
a) 0,6 e 75.
b) 0,6 e 12.
c) 0,8 e 1,5.
==13272f==

d) 0,8 e 12.
e) 0,8 e 75.

99- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

GABARITO – VUNESP

Análise de Variância da Regressão

1. LETRA A

100- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

LISTA DE QUESTÕES – INÉDITAS

Correlação Linear

1. (INÉDITA/2022) Em um gráfico de dispersão, observa-se que a maioria dos pontos está situada no
primeiro e no terceiro quadrantes. Aqueles que não estão nessa posição, situam-se próximos da origem.
Então, a correlação linear entre as variáveis
a) poderá ser fracamente positiva.
b) será necessariamente fortemente positiva.
c) poderá ser fracamente negativa.
d) será necessariamente fortemente negativa.
e) será necessariamente nula.

2. (INÉDITA/2022) O coeficiente linear de Pearson indica a intensidade da correlação entre duas variáveis
e, ainda, o sentido dessa correlação. Assinale a alternativa que indica adequadamente a interpretação de
um determinado resultado obtido 𝒓 = −𝟎, 𝟗𝟏 para o coeficiente de correlação de Pearson:
a) Correlação linear negativa altamente significativa entre as variáveis.
b) Correlação linear positiva altamente significativa entre as variáveis.
c) Correlação linear positiva muito fraca entre as variáveis.
d) Correlação linear positiva relativamente fraca entre as variáveis.
e) Não há correlação linear positiva entre as variáveis.

3. (INÉDITA/2022) A tabela a seguir apresenta as penas de reclusão (P), em anos, cominadas a um grupo
de dez réus, e suas respectivas rendas familiares mensais per capitas (R), em número de salários-mínimos.

Réu 𝑷 𝑹 𝑷×𝑹 𝑷² 𝑹²

1 15 0,5 7,5 225 0,25

2 12 1,5 18 144 2,25

3 11 2 22 121 4

4 7 1,5 10,5 49 2,25

101- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

5 6 1,25 7,5 36 1,5625

6 5 2 10 25 4

7 6 2,5 15 36 6,25

8 2 3 6 4 9

9 2,5 3,5 8,75 6,25 12,25

10 2 4 8 4 16

Totais 68,5 21,75 113,25 650,25 57,8125

Dados:
𝟏𝟖𝟏𝟎, 𝟐𝟓 𝟏/𝟐 = 𝟒𝟐, 𝟓𝟒
𝟏𝟎𝟓, 𝟎𝟔𝟏/𝟐 = 𝟏𝟎, 𝟐𝟓
A partir das informações, o coeficiente de correlação linear entre as variáveis R e P é
a) – 0,31.
b) – 0,52.
c) – 0,66.
d) – 0,77.
e) – 0,82.

4. (INÉDITA/2022) A tabela a seguir apresenta as quantidades vendidas de pacotes de leite em pó (P), em


unidades, e de pacotes de café (Y), também em unidades.

Mês 𝑿 𝒀 𝑿×𝒀 𝑿² 𝒀²

1 10 15 150 100 225

2 8 14 112 64 196

3 12 16 192 144 256

4 5 9 45 25 81

5 3 17 51 9 289

102- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

Totais 38 71 550 342 1047

Dados:
𝟐𝟔𝟔 𝟏/𝟐 = 𝟏𝟔, 𝟑𝟏
𝟏𝟗𝟒𝟏/𝟐 = 𝟏𝟑, 𝟗𝟑
A partir das informações, o coeficiente de correlação linear entre as variáveis X e Y é
a) 0,23.
b) 0,31.
c) 0,39.
d) 0,44. ==13272f==

e) 0,49.

5. (INÉDITA/2022) A variável x tem desvio padrão igual a 1, enquanto a variável y tem desvio padrão igual
a 2. Se a covariância entre x e y é 0,5, então o coeficiente de correlação entre x e y é
a) 0,65.
b) 0,55.
c) 0,45.
d) 0,35.
e) 0,25.

6. (INÉDITA/2022) A variável x tem média 10 e desvio padrão 5, enquanto a variável y tem média 2 e desvio
padrão 1. Se a covariância entre x e y é 2, então o coeficiente de correlação entre x e y é
a) 0,4.
b) 0,5.
c) 0,8.
d) –0,4.
e) –0,6.

7. (INÉDITA/2022) O barista é o profissional especializado em preparar cafés de alta qualidade. Considere


que dois baristas foram convidados a avaliar cinco amostras de diferentes cafés.

Amostra Barista 1 Barista 2

103- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

1 7 6

2 6 5

3 9 10

4 10 9

5 3 2

O coeficiente de correlação entre as avaliações atribuídas pelos dois baristas é:


a) 0,57.
b) 0,96.
c) 0,77.
d) 0,89.
e) 0,91.

8. (INÉDITA/2022) A quantidade de metros de tecido vendidos por uma loja e o valor das vendas mensais
são apresentados na tabela a seguir, em que y representa os valores arrecadados com a venda de tecidos
no mês e x a quantidade de metros vendidos.

x: Venda de Tecidos y : Vendas Mensais


Mês
(a cada 100m) (em R$ 1.000,00)

1 1 1

2 2 1

3 3 2

4 4 2

5 5 4

O coeficiente de correlação linear de Pearson entre variáveis x e y é:


a) 0,78
b) 0,97
c) 0,90

104- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

d) 0,83
e) 0,86

9. (INÉDITA/2022) Uma empresa está aplicando métodos motivacionais para melhorar os resultados de
seus funcionários com as vendas. Sejam y os valores relativos à quantidade vendida de um produto e x as
despesas relativas aos valores investidos em métodos motivacionais apresentados na tabela a seguir.

x 2 6 10 3 7 5

y 100 120 240 120 200 150

O coeficiente de correlação linear entre as quantidades vendidas e os valores empregados em métodos


motivacionais:
a) 0,91.
b) 0,87.
c) 0,83.
d) 0,79.
e) 0,75.

10. (INÉDITA/2022) Os autores de um artigo apresentaram uma análise de correlação para investigar a
relação entre o nível máximo de lactato x e a resistência muscular y. Os dados a seguir foram obtidos

x 400 750 700 800 850 1000

y 3,80 4,00 5,00 5,20 4,00 3,50

O coeficiente de correlação linear entre o nível máximo de lactato (x) e a resistência (y) é:
a) 0,11.
b) 0,23.
c) -0,13.
d) -0,06.
e) 0,16.

105- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

GABARITO – INÉDITAS

Correlação Linear

1. LETRA A 5. LETRA E 9. LETRA A


2. LETRA A 6. LETRA A 10. LETRA D
3. LETRA E 7. LETRA B
4. LETRA A 8. LETRA C

106- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

LISTA DE QUESTÕES – INÉDITAS

Regressão Linear Simples

1. (INÉDITA/2022) A nota final de uma disciplina é calculada com base no valor médio obtido pelo método
dos mínimos quadrados. Se um aluno obtiver as notas 3,5; 5,5; 7; 8; a sua nota final deverá ser:
a) 5.
b) 5,5.
c) 6.
d) 6,5.
e) 7.

2. (INÉDITA/2022) Um pesquisador, ao avaliar o efeito de uma variável X sobre outra Y por meio de uma
̂=𝜶
regressão linear da forma 𝒀 ̂+𝜷 ̂ 𝑿, usando o método dos mínimos quadrados, encontrou, a partir de
10 amostras, os seguintes somatórios:
∑𝑿 = 𝟏𝟓𝟎; ∑𝒀 = 𝟐𝟎𝟎; ∑𝑿𝟐 = 𝟐. 𝟕𝟓𝟎; 𝒆 ∑(𝑿𝒀) = 𝟒. 𝟓𝟎𝟎
A partir desses resultados, julgue o item a seguir.
a) para 𝑋 = 10, a estimativa de 𝑌 é 𝑌̂ = 2.
b) para 𝑋 = 8, a estimativa de 𝑌 é 𝑌̂ = 5.
c) para 𝑋 = 8, a estimativa de 𝑌 é 𝑌̂ = −1.
d) para 𝑋 = 9, a estimativa de 𝑌 é 𝑌̂ = 5.
e) para 𝑋 = 10, a estimativa de 𝑌 é 𝑌̂ = −1.

3. (INÉDITA/2022) A respeito de duas variáveis, X e Y, sabe-se que:


∑𝑿 = 𝟐𝟎
∑𝒀 = 𝟏𝟐
∑𝑿𝒀 = 𝟒𝟖
∑𝑿𝟐 = 𝟓𝟐
(∑𝑿)𝟐 = 𝟏𝟔𝟗
Se o tamanho da amostra é igual a 4, então o valor de "b" na regressão simples 𝒀 = 𝒂 + 𝒃𝑿 é:
a) 1/4.

107- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

b) 3/7.
c) 1/3.
d) 3/4.
e) 2/5.

==13272f==

108- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

GABARITO – INÉDITAS

Regressão Linear Simples

1. LETRA C 2. LETRA C 3. LETRA A

109- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

LISTA DE QUESTÕES – INÉDITAS

Análise de Variância da Regressão

1. (INÉDITA/2022) Em uma regressão linear simples em que foi utilizada uma amostra com 42 observações,
a soma dos quadrados totais é de 40 e a soma dos quadrados dos resíduos é de 10. O coeficiente de
determinação e a estatística F dessa regressão são, respectivamente:
a) 0,6 e 225.
b) 0,6 e 120.
c) 0,75 e 120.
d) 0,75 e 225.
e) 0,8 e 75.

2. (INÉDITA/2022) Um pesquisador aplicou um modelo de regressão linear simples na forma 𝒀 = 𝒃𝑿 +


𝒂 + 𝜺, em que 𝒃 representa o coeficiente angular, 𝒂 é o intercepto do modelo e 𝜺 denota o erro aleatório
com média zero e variância 𝝈². A tabela a seguir representa a análise de variância (ANOVA) proporcionada
por esse modelo.

Fonte de Graus de Soma de


variação Liberdade Quadrados

Modelo 1 275

Erro 89 125

Total 90 400

A correlação linear de Pearson entre a variável resposta Y e a variável regressora X é igual:


a) 0,83
b) 0,81
c) 0,79
d) 0,74
e) 0,70

110- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

3. (INÉDITA/2022) Um pesquisador aplicou um modelo de regressão linear simples na forma 𝒀 = 𝒃𝑿 +


𝒂 + 𝜺, em que 𝒃 representa o coeficiente angular, 𝒂 é o intercepto do modelo e 𝜺 denota o erro aleatório
com média zero e variância 𝝈². A tabela a seguir representa a análise de variância (ANOVA) proporcionada
por esse modelo.

Fonte S. Quadrados G.L. Q. Médio

Modelo 500 1 500

Erro 250 10 25

Total 750 11

A partir das informações e da tabela apresentadas, a correlação linear de Pearson entre a variável resposta
Y e a variável regressora X é igual:
a) 0,416
b) 0,516
c) 0,616
d) 0,716
e) 0,816

4. (INÉDITA/2022) Um pesquisador aplicou um modelo de regressão linear simples na forma 𝒀 = 𝒃𝑿 +


𝒂 + 𝜺, em que 𝒃 representa o coeficiente angular, 𝒂 é o intercepto do modelo e 𝜺 denota o erro aleatório
com média zero e variância 𝝈². A tabela a seguir representa a análise de variância (ANOVA) proporcionada
por esse modelo.

Fonte S. Quadrados G.L. Q. Médio

Modelo 500 1 500

Erro 250 10 25

Total 750 11

A partir das informações e da tabela apresentadas, pode-se constatar que a variância amostral é
aproximadamente igual a:
a) 64,18
b) 66,18
c) 68,18

111- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

d) 70,18
e) 72,18

5. (INÉDITA/2022) Um pesquisador aplicou um modelo de regressão linear simples na forma 𝒀 = 𝒃𝑿 +


𝒂 + 𝜺, em que 𝒃 representa o coeficiente angular, 𝒂 é o intercepto do modelo e 𝜺 denota o erro aleatório
com média zero e variância 𝝈². A tabela a seguir representa a análise de variância (ANOVA) proporcionada
por esse modelo.

Fonte S. Quadrados G.L. Q. Médio

Modelo 500 1 500

Erro 250 10 25

Total 750 11

A partir das informações e da tabela apresentadas, pode-se constatar que o 𝑹𝟐 ajustado é


aproximadamente igual a:
a) 0, 733
b) 0,633
c) 0,583
d) 0,553
e) 0,513

6. (INÉDITA/2022) Após estimar um modelo de regressão simples, um estatístico trabalha nos resultados,
obtendo a tabela a seguir:

Fonte S. Quadrados G.L. Q. Médio p-value

Equação 600 1 600 0,15%

Resíduos 200 8 25

Total 800 9 88,88

A partir desses números, é correto concluir que:


a) a estimativa do coeficiente angular da equação é igual a 5.
b) a variância estimada do erro aleatório é inferior a 20;

112- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

c) apesar de um poder de explicação de 75%, o modelo não passa no teste de significância da estatística F;
d) o modelo é capaz de explicar 75% da variação total;
e) a variância da variável explicativa do modelo é igual a 200;

7. (INÉDITA/2022) Um perito foi convocado para verificar se o valor de Y, número de pastilhas descoladas
de uma fachada, estava relacionado ao valor de X, tempo de exposição ao sol.

Fonte de Graus de Soma de


variação Liberdade Quadrados

Modelo 1 4,80

Erro 5 1,20

Total 6 6,000

Considerando que ∑(𝒙𝒊 − 𝒙̅)𝟐 = 𝟐𝟎; 𝒆 𝟎, 𝟎𝟔𝟏/𝟐 = 𝟎, 𝟐𝟒𝟒, o valor do coeficiente angular é
aproximadamente igual a:
a) 0,244
b) 0,488
c) 0,366
d) 0,566
e) 0,433

8. (INÉDITA/2022) Em um modelo de regressão linear simples, obteve-se um coeficiente de correlação


igual a 0,9. O coeficiente de determinação é aproximadamente igual a
a) 0,36.
b) 0,68.
c) 0,70.
d) 0,81.
e) 0,89.

9. (INÉDITA/2022) Considere que o coeficiente de determinação tenha sido de 0,49, no ajuste de uma reta
de regressão linear simples de uma variável Y em uma variável X. Então, o módulo do coeficiente de
correlação amostral entre X e Y é igual a:

113- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

a) 0,25
b) 0,35
c) 0,50
d) 0,65
e) 0,70

==13272f==

114- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência
Equipe Exatas Estratégia Concursos
Aula 05

GABARITO – INÉDITAS

Análise de Variância da Regressão

1. LETRA C 4. LETRA C 7. LETRA B


2. LETRA A 5. LETRA B 8. LETRA D
3. LETRA E 6. LETRA D 9. LETRA E

115- 2023 (Pó


Prefeitura de São Paulo - APPGG (Analista de Políticas Públicas e Gestão Governamental) Estatística Descritiva
www.estrategiaconcursos.com.br 116

-Agradecemos a preferência

Você também pode gostar