0% acharam este documento útil (0 voto)
70 visualizações12 páginas

Introdução

Este documento explora os conceitos fundamentais da correlação e regressão linear simples. Aborda os conceitos básicos, o modelo de regressão linear e a interpretação dos parâmetros, bem como o cálculo do coeficiente de correlação. O documento também discute as aplicações da regressão linear simples em diversos campos.
Direitos autorais
© © All Rights Reserved
Levamos muito a sério os direitos de conteúdo. Se você suspeita que este conteúdo é seu, reivindique-o aqui.
Formatos disponíveis
Baixe no formato DOCX, PDF, TXT ou leia on-line no Scribd
0% acharam este documento útil (0 voto)
70 visualizações12 páginas

Introdução

Este documento explora os conceitos fundamentais da correlação e regressão linear simples. Aborda os conceitos básicos, o modelo de regressão linear e a interpretação dos parâmetros, bem como o cálculo do coeficiente de correlação. O documento também discute as aplicações da regressão linear simples em diversos campos.
Direitos autorais
© © All Rights Reserved
Levamos muito a sério os direitos de conteúdo. Se você suspeita que este conteúdo é seu, reivindique-o aqui.
Formatos disponíveis
Baixe no formato DOCX, PDF, TXT ou leia on-line no Scribd

Fornet Andre Tripano

Justin Júlio
Maria Lourenço A. Ziza
Mário Carimo Batista
Rui Gimo
Rute Severino Jefure
Rosa Fernando João

Estatística e gestão de informações

Estatística descritiva

Tema: Correlação e regressão linear simples

Docente:
__________________________
(Msc. Cristina F. Chumussora da Costa)

UNIVERSIDADE LICUNGO - EXTENSÃO DODO


BEIRA
ÍNDICE
Introdução....................................................................................................................................3

Regressão Linear Simples............................................................................................................4

Conceitos Fundamentais..............................................................................................................4

Interpretação dos Coeficientes:....................................................................................................6

Avaliação do Ajuste do Modelo...................................................................................................6

Aplicações da Regressão Linear Simples....................................................................................6

Análise De Correlação Linear......................................................................................................6

Tipos de correlação......................................................................................................................7

Exemplo:......................................................................................................................................8

Conclusão...................................................................................................................................11

Referência bibliográfica.............................................................................................................12
Introdução
O presente trabalho tem como objetivo explorar os conceitos fundamentais da correlação e
regressão simples. Ambas as técnicas são essenciais na análise estatística, permitindo-nos
compreender a relação entre variáveis e realizar previsões com base em dados observados. Neste
trabalho, vamos abordar os conceitos básicos, o modelo de regressão linear e a interpretação dos
parâmetros, bem como o cálculo do coeficiente de correlação.

Na ciência dos dados e na análise estatística, entender a relação entre variáveis é crucial para
compreender fenômenos complexos e tomar decisões informadas. A correlação e a regressão são
ferramentas poderosas para investigar e quantificar essas relações. A correlação simples mede a
força e a direção da associação entre duas variáveis, enquanto a regressão linear busca modelar
essa relação por meio de uma equação matemática que descreve a linha de melhor ajuste entre os
dados. A regressão linear, especificamente, é uma técnica estatística amplamente utilizada para
entender como uma variável independente influencia uma variável dependente. No decorrer
deste trabalho, será demonstrado como calcular os parâmetros e interpretar seus significados em
um contexto prático. Além disso, exploraremos a correlação entre variáveis e sua importância na
análise estatística. Ao final deste trabalho, esperamos deixar uma compreensão mais sólida
desses conceitos.
Regressão Linear Simples
Na análise estatística, a regressão linear simples é uma ferramenta poderosa para compreender e
modelar a relação entre duas variáveis. Ela é particularmente útil quando queremos entender
como uma variável dependente é afetada por uma única variável independente. A Seguir
trazemos os fundamentos da regressão linear simples, seus princípios básicos e sua aplicação em
diversos contextos.

Conceitos Fundamentais
A regressão linear simples parte do princípio de que existe uma relação linear entre a variável
independente (x) e a variável dependente (y). Essa relação é representada por uma linha reta que
melhor se ajusta aos dados disponíveis. O objetivo é encontrar essa linha de melhor ajuste, que
minimize a diferença entre os valores observados e os valores previstos pela linha de regressão.

A regressão linear é utilizada para analisar, qualitativamente e quantitativamente, relações entre


variáveis. Chama-se de variável dependente ou variável endógena, (y), aquela cujo
comportamento será explicado pela variável (x), chamada de variável explicativa, regressor ou
variável independente. A ideia aqui é bastante simples; é, praticamente, estimar a equação de
uma reta,

Tal equação é descrita como y = β0+β1⋅x.

O ponto central é, portanto, encontrar valores para β0 e β1. Em outras palavras, queremos estimar
a inclinação da reta utilizando uma amostra aleatória de dados de x e y. A inclinação nos fornece
o efeito em y da mudança de uma unidade em x.

Equação da Regressão Linear Simples: A equação geral da regressão linear simples é expressa
como: y =β0 + β1⋅x + ε

Onde:

 y é a variável dependente que desejamos prever,


 x é a variável independente que está sendo utilizada para prever y,
β0
 é o intercepto da linha de regressão, representando o valor esperado de y
quando x é igual a zero,

 β1 é o coeficiente de inclinação da linha de regressão, indicando a mudança


esperada em y para uma unidade de mudança em x,

 ε representa o erro aleatório, que são as diferenças entre os valores observados e


os valores previstos pela linha de regressão.

A reta de regressão depende de cinco estatísticas básicas:

Média De X

Desvio Padrao X

Media De Y

Desvio Padrão De Y

Correlação De X E Y

β1 n ∑ xy −( ∑ x ) .( ∑ y)
β 1= 2
n ∑ x −( ∑ x)
2

β 0 o intercepto
β 0=
∑ y −β 1 ∑ x
n n

Estimativa dos Coeficientes: O processo de ajuste da linha de regressão envolve estimar os


valores dos coeficientes β0 e β1 com base nos dados disponíveis. Isso é geralmente feito
utilizando técnicas como o método dos mínimos quadrados, que minimiza a soma dos quadrados
das diferenças entre os valores observados e os valores previstos.

Interpretação dos Coeficientes:


 O intercepto β0 representa o valor esperado de y quando x é igual a zero. Ele
indica onde a linha de regressão intercepta o eixo vertical.

 O coeficiente de inclinação β1 indica a mudança esperada em y para uma unidade


de mudança em x. Ele descreve a inclinação da linha de regressão.

Avaliação do Ajuste do Modelo


Uma vez ajustada a linha de regressão, é importante avaliar o quão bem o modelo se ajusta aos
dados. Isso pode ser feito através de diversas métricas, como o coeficiente de determinação (R2),
que indica a proporção da variabilidade na variável dependente que é explicada pelo modelo de
regressão.

Aplicações da Regressão Linear Simples


A regressão linear simples é amplamente utilizada em diversos campos, incluindo ciências
sociais, economia, biologia, medicina, engenharia e muito mais. Ela pode ser aplicada para fazer
previsões, identificar tendências, entender relações de causa e efeito e fazer inferências sobre o
comportamento de sistemas complexos.

Ao compreender os princípios básicos da regressão linear simples e suas aplicações, os analistas


de dados podem extrair conhecimentos valiosos a partir de conjuntos de dados unidimensionais e
tomar decisões embasadas em evidências.

Análise De Correlação Linear


A análise de correlação linear é uma medida de associação (ou dependência) entre variáveis.
Quando se tem apenas duas variáveis, trata-se de uma correlação linear simples (coeficiente de
correlação linear de Pearson, r); e quando se tem mais de duas variáveis, trata-se de uma
correlação múltipla (análise da matriz de correlação entre as variáveis: coeficiente de
correlação múltiplo (R múltiplo)).
Na análise de correlação pretende-se medir o grão de associação linear entre duas variáveis
aleatórias, enquanto na análise de regressão linear o interesse é estimar ou prever o valor medio
de uma variável aleatória com base nos valores fixos da outra variável.

Fórmula de correlação:

n ∑ xy −( ∑ x ) .( ∑ y )
r=
√ n ∑ x −¿ ¿ ¿ ¿
2

Tipos de correlação
O Coeficiente de correlação de Pearson (r) é uma medida adimensional que pode assumir valores
no intervalo entre -1 e +1.

 Se r = -1, Enato diz-se que há uma relação linear negativa perfeita entre as duas variáveis
X e Y ( Relação inversa).
 Se r = 1, Diz-se que há uma relação linear positiva perfeita entre as variáveis X e Y
(Relação direta).
 Se r = 0, Diz-se que não existe uma relação linear entre as variáveis X e Y.
 Se −1<r ←0 , 7 , Diz-se que há uma relação negativa forte entre as variáveis X e Y.
 Se −0 , 7 ≤ r ≤−0 , 5, Diz-se que há uma relação linear moderada negativa
 Se −0 , 5 ≤r ≤−0 ,1 Diz-se que há relação linear negativa fraca.
 Se 0 , 1≤ r ≤ 0 ,5 , Diz-se que há relação linear positiva fraca.
 Se 0 , 7 ≤ r ≤ 1, Diz-se que há relação linear positiva forte.
 Se 0 , 5 ≤r ≤ 0 , 7, Diz-se que há relação linear positiva moderada.
Exemplo:
A tabela a seguir fornece dados sobre a taxa de demissão por 100 empregados e taxa de
desemprego na industria dos EUA no período de 1960 a 1970.

Ano 1960 11961 1962 1963 1964 1965 1966 1967 1968 1969 1970
Taxa de demissão 1,3 1,2 1,4 1,4 1,5 1,9 2,6 2,3 2,5 2,7 2,1
Taxa d desemprego 6,2 7,8 5,8 4,0 5,0 4,0 3,2 3,7 3,3 3,3 5,6

a. Suponha que a taxa de desemprego Y se relaciona com a taxa de demissão x, como


y =β0 + β1⋅x + ε, estime os parâmetros β0 e β1 e interprete os resultados obtidos.
b. Calcule o coeficiente de correlação e interprete o resultado
c. Determine o coeficiente de determinação e interprete o resultado

Para resolver o problema devemos primeiro contruir uma tabela que vai nos facilitar a achar os
somatórios.

Taxa de Taxa de desemprego


demissão (X) (Y)) XY X² Y2
1.3 6.2 8.06 1.69 38.44
1.2 7.8 9.36 1.44 60.84
1.4 5.8 8.12 1.96 33.64
1.4 5.7 7.98 1.96 32.49
1.5 5 7.5 2.25 25
1.9 4 7.6 3.61 16
2.6 3.2 8.32 6.76 10.24
2.3 3.6 8.28 5.29 12.96
2.5 3.3 8.25 6.25 10.89
2.7 3.3 8.91 7.29 10.89
2.1 5.6 11.76 4.41 31.36

∑❑ 20.9 53.5 94.14 42.91 282.75


a. Tendo a tabela, podemos calcular os parâmetros de β0 e β1 estimados.
O tamanho da amostra e de 11 ( n = 11).
n ∑ xy −( ∑ x ) .( ∑ y)
Começamos a calcular o β1 usando a formula β 1= 2
n ∑ x −( ∑ x)
2

Dados: n=11; ∑ xy =94.14 ; ( ∑ x )=20.9 ; ( ∑ y )=53 . 5 ; ∑ x =42 , 91


2

n ∑ xy −( ∑ x ) .( ∑ y) Interpretação: de β 1 estimado β 1 ≈−2 ,35 É o valor


β 1= 2
n ∑ x −( ∑ x)
2
que diminui na taxa de desemprego quando a taxa de
11. 94 ,14−20 , 9 . 53 ,5 demissão aumenta em una unidade
β 1= 2
11. 42.91−20 , 9
1035 , 54−1118 ,15
β 1=
472 , 01−436 ,81
−82, 61
β 1=
35 , 2
β 1=−2,3485 ≈−2, 35
Tendo o B1 podemos calcular o β 0estimado Aplicando a seguinte formula

β 0=
∑ y −β 1 ∑ x
n n

Dados: n=11, ∑ y=53 , 5 β 1=¿ -2,346875 ( ∑ x ) =20.9 ;

β 0=
∑ y −β 1 ∑ x Interpretação do β 0 estimado
n n
É o valor estimado da taxa de desemprego quando a
53 ,5 20 , 9
β 0= −(−2,346875) taxa de demissão é igual a zero, ou seja quando a
11 11
taxa de demissão é zero espera-se que a taxa de
β 0=4,86363636+4,4590625
desemprego seja ou aproximadamente a igual a 9 , 32
β 0=9,32269 ≈ 9 , 32

Logo o modelo estimado de regressão linear que explica a relação das duas variáveis e:

y=9 ,32−2 ,35 X

b. Calcule o coeficiente de correlação e interprete o resultado.


Dados: n=11; ∑ xy=94 ,14 ( ∑ x ) =20.9 ; ( ∑ y ) =¿ ¿ 53 . 5; ∑ y 2=282 ,75
n ∑ xy −( ∑ x ) .( ∑ y ) 11. 94 ,14−20 , 9 . 53 , 5
r= =
√ n ∑ x −¿ ¿ ¿ ¿
2
√11. 42 , 91−20 , 92 . √ 11. 282 ,75−¿ ¿ ¿

r = -0,884169338

Interpretação:

Com r =−0,884169338. Este valor pertence ao intervalo −1<r ←0 , 7 , Então podemos afirmar
que existe uma relação linear negativa forte entre a taxa de demissão e a taxa de desemprego, o
que significa que quanto maior for a taxa de desemprego menor é a taxa de demissão ou vice-
versa.
Conclusão
Em conclusão, a correlação simples e a regressão linear simples são ferramentas fundamentais na
análise estatística de dados, permitindo aos pesquisadores e analistas entenderem as relações
entre variáveis quantitativas. Através da interpretação dos coeficientes de correlação e regressão,
podemos extrair conhecimentos significativos sobre a natureza e a força das relações entre as
variáveis em estudo. No exemplo apresentado, exploramos a relação entre a taxa de desemprego
e a taxa de demissão nas indústrias dos Estados Unidos, demonstrando como calcular e
interpretar os parâmetros da regressão linear e o coeficiente de correlação. Essa análise nos
permitiu entender melhor como as taxas de desemprego e demissão estão relacionadas e como
uma pode influenciar a outra.
Referência bibliográfica
 CHEIN, Flávia. Introdução aos Modelos de Regressão linear: um passo inicial para
compreensão da econometria como uma ferramenta de avaliação de políticas públicas.
Brasília: ENAP, 2019
 SOUSA ANDRADE, João, Apontamentos de Econometria Aplicada, Dezembro de 2001
- (Maio 2004)

Você também pode gostar