0% acharam este documento útil (0 voto)
178 visualizações188 páginas

Econometria Slides Traduzidos

Gestão Escola Este documento introduz os conceitos fundamentais da econometria. Em 3 frases: Apresenta o que é econometria e os passos da análise econômica empírica, discute a estrutura dos dados econômicos como transversais e de séries temporais, e introduz a noção de causalidade e ceteris paribus.

Enviado por

Pedro França
Direitos autorais
© © All Rights Reserved
Levamos muito a sério os direitos de conteúdo. Se você suspeita que este conteúdo é seu, reivindique-o aqui.
Formatos disponíveis
Baixe no formato PDF, TXT ou leia on-line no Scribd
0% acharam este documento útil (0 voto)
178 visualizações188 páginas

Econometria Slides Traduzidos

Gestão Escola Este documento introduz os conceitos fundamentais da econometria. Em 3 frases: Apresenta o que é econometria e os passos da análise econômica empírica, discute a estrutura dos dados econômicos como transversais e de séries temporais, e introduz a noção de causalidade e ceteris paribus.

Enviado por

Pedro França
Direitos autorais
© © All Rights Reserved
Levamos muito a sério os direitos de conteúdo. Se você suspeita que este conteúdo é seu, reivindique-o aqui.
Formatos disponíveis
Baixe no formato PDF, TXT ou leia on-line no Scribd

NOVA

Machine Translated by Google

IMS
Em formação
Gestão
Escola

NOVA
IMS
Em formação
Gestão
Econometria I
Escola

Parte I

Bruno Dam´asio (bdamasio@[Link])


2022

Nova Escola de Gestão da Informação


Universidade NOVA de Lisboa

Instituto Superior de Estatística e Gestão da Informação


Universidae Nova de Lisboa
Machine Translated by Google
NOVA
IMS
Em formação
Índice I
Gestão
Escola

1. Introdução e a Natureza da Econometria

O que é Econometria?

Passos na Análise Econômica Empírica

A estrutura dos dados econômicos

Causalidade e Ceteris Paribus

2. O Modelo de Regressão Linear Simples

Introdução

Derivando o OLS

Propriedades algébricas das estatísticas OLS

Unidades de Medida e Forma Funcional

Valores Esperados e Variações dos Estimadores OLS

1
Machine Translated by Google
NOVA
IMS
Em formação
Índice ii
Gestão
Escola

3. O Modelo de Regressão Linear Múltipla

Introdução

Mecânica e Interpretação do OLS

Suposições de Amostra Finita

Propriedades Finitas da Amostra

O valor esperado dos estimadores OLS

A variação dos estimadores OLS

Inferência

O teste t

O teste F

2
Machine Translated by Google
NOVA
IMS
Em formação
Gestão
Escola

Introdução e a Natureza da
Econometria
Machine Translated by Google
NOVA
IMS
Em formação
O que é Econometria?
Gestão
Escola

A econometria é uma disciplina que “pretende dar conteúdo empírico às relações


econômicas”. Tem sido definido geralmente como “a aplicação de métodos matemáticos
e estatísticos a dados econômicos”. Aplicação de
econometria:

• Para prever (por exemplo, taxas de juros, taxas de inflação e taxas internas brutas
produtos).

• Estudar as relações econômicas;


• Testar teorias econômicas.

• Avaliar e implementar políticas governamentais e empresariais.

3
Machine Translated by Google
NOVA
IMS
Em formação
Passos na Análise Econômica Empírica
Gestão
Escola

1. Formule a questão de interesse. A pergunta pode tratar


testar um determinado aspecto de uma teoria econômica, ou pode pertencer a
testar os efeitos de uma política governamental.
2. Construir o modelo econômico. Um modelo econômico consiste em
equações matemáticas que descrevem várias relações. A modelagem
econômica formal às vezes é o ponto de partida para a análise empírica,
mas é mais comum usar a teoria econômica de forma menos formal, ou
mesmo confiar inteiramente na intuição.

3. Especifique o modelo econométrico.


4. Colete os dados.

5. Estimar e testar o modelo econométrico. Este modelo é satisfatório?

• SIM: Responda à pergunta na etapa 1. •


NÃO: retorne à etapa 2 ou 3.

4
Machine Translated by Google
NOVA
IMS
Em formação
Um modelo econômico
Gestão
Escola

Exemplo: Modelo de treinamento profissional e produtividade do trabalhador

• Qual é o efeito do treinamento adicional na produtividade do trabalhador?

• A teoria econômica formal não é realmente necessária para derivar a equação:

salário = f (educação, experiência, treinamento)

5
Machine Translated by Google
NOVA
IMS
Em formação
Um modelo econométrico
Gestão
Escola

• A forma funcional deve ser especificada:

salário = ÿ0 + ÿ1educação + ÿ2exper + ÿ3treinamento + u

• A maior parte da econometria trata da especificação do erro u • Modelos


econométricos podem ser usados para teste de hipóteses:
• Por exemplo, o parâmetro ÿ3 representa o efeito do treinamento sobre o salário •
Qual é o tamanho desse efeito? É diferente de zero?

6
Machine Translated by Google
NOVA
IMS
Em formação
Dados transversais
Gestão
Escola

• Amostra de indivíduos, famílias, empresas, cidades, estados, países,


etc. tomadas em um determinado momento.

• Uma característica importante dos dados transversais: eles são obtidos por
amostragem aleatória da população subjacente.

• Por exemplo, suponha que yi seja a i-ésima observação da variável dependente e xi


seja a i-ésima observação da variável explicativa

• Amostragem aleatória significa que {(yi , xi)} é uma sequência independente. • Isso

implica que para i 6= j

Cov (yi , yj) = Cov (xi , xj) = Cov (yi , xj) = 0

7
Machine Translated by Google
NOVA
IMS
Em formação
Dados transversais
Gestão
Escola

Figura 1: Dados transversais sobre taxas de crescimento e características dos países

8
Machine Translated by Google
NOVA
IMS
Em formação
Dados transversais
Gestão
Escola

Figura 2: Poupança vs Renda

9
Machine Translated by Google
NOVA
IMS
Em formação
Dados de série temporal
Gestão
Escola

• Um conjunto de dados de série temporal consiste em observações sobre uma variável ou

várias variáveis ao longo do tempo.

• Por exemplo: preços das ações, oferta de moeda, índice de preços ao consumidor, valor bruto

produto doméstico, taxas anuais de homicídios e números de vendas de automóveis, etc.

• Os dados de séries temporais não podem ser considerados independentes ao longo do tempo.

Por exemplo, saber algo sobre o produto interno bruto do último trimestre nos diz bastante sobre a

provável variação do PIB durante este trimestre.

10
Machine Translated by Google
NOVA
IMS
Em formação
Dados de série temporal
Gestão
Escola

• A análise de dados de séries temporais é mais difícil do que a


de dados transversais. Razões:
• precisamos levar em conta a natureza dependente das séries temporais econômicas;
• os dados de séries temporais exibem características únicas, como tendências ao
longo do tempo e sazonalidade; • modelos baseados em dados de séries temporais
raramente satisfazem as premissas cobertas pelo capítulo “Propriedades de Amostra
Finita de OLS”. As hipóteses mais adequadas são cobertas pelo capítulo “Teoria da
Grande Amostra”, que é teoricamente mais avançado.

11
Machine Translated by Google
NOVA
IMS
Em formação
Dados de série temporal
Gestão
Escola

Figura 3: Dados de séries temporais sobre salários mínimos e variáveis relacionadas

12
Machine Translated by Google
NOVA
IMS
Em formação
Dados de série temporal
Gestão
Escola

Figura 4: Cronograma para produção por hora

13
Machine Translated by Google
NOVA
IMS
Em formação
Seções Transversais Agrupadas
Gestão
Escola

• Duas ou mais seções transversais são combinadas em um conjunto de dados

• As seções transversais são desenhadas independentemente umas das outras

• Seções transversais agrupadas frequentemente usadas para avaliar mudanças de

políticas. • Exemplo:

• Avaliar o efeito da mudança nos impostos sobre a propriedade sobre os


preços das casas • Amostra aleatória dos preços das casas para o ano de
1993 • Uma nova amostra aleatória dos preços das casas para o ano de 1995
• Comparar antes/depois (1993: antes da reforma, 1995: depois da reforma)

14
Machine Translated by Google
NOVA
IMS
Em formação
Seções Transversais Agrupadas
Gestão
Escola

Figura 5: Seções transversais agrupadas sobre os preços da habitação

15
Machine Translated by Google
NOVA
IMS Dados em painel ou longitudinais
Em formação
Gestão
Escola

• As mesmas unidades de seção transversal são seguidas ao longo do tempo

• Os dados do painel têm uma dimensão transversal e de série temporal

• Os dados do painel podem ser usados para contabilizar não observáveis invariáveis no tempo

• Os dados do painel podem ser usados para modelar respostas

defasadas • Exemplo: • Estatísticas de crimes na cidade; cada


cidade é observada em dois anos.

16
Machine Translated by Google
NOVA
IMS Dados em painel ou longitudinais
Em formação
Gestão
Escola

Figura 6: Dados de painel de dois anos sobre crime

17
Machine Translated by Google
NOVA
IMS
Em formação
Ramos da Econometria
Gestão
Escola

• Microeconometria

• Macroeconometria

• Econometria Financeira

• Econometria de Séries Temporais

• Econometria Espacial

• Econometria Bayesiana
Também:

• Econometria Teórica vs. Econometria Aplicada

18
Machine Translated by Google
NOVA
IMS
Em formação
Causalidade e Ceteris Paribus
Gestão
Escola

Definição de efeito causal de x em y:

“Como a variável y muda se a variável x é alterada, mas todos os outros


fatores relevantes são mantidos constantes?”

• A maioria das questões econômicas são questões ceteris paribus

• É importante definir em qual efeito causal se está interessado

• É útil descrever como um experimento teria que ser projetado


para inferir o efeito causal em questão

19
Machine Translated by Google
NOVA
IMS
Em formação
Causalidade e Ceteris Paribus
Gestão
Escola

Efeito causal do fertilizante no rendimento das culturas

• Em quanto aumentará a produção de soja se aumentarmos a quantidade de fertilizante

aplicada ao solo?

• Suposição implícita: todos os outros fatores que influenciam o rendimento das culturas, como qualidade

da terra, chuva, presença de parasitas, etc. são mantidos fixos

Experimentar:

• Escolha vários terrenos de um hectare; atribuir aleatoriamente diferentes quantidades de

fertilizantes às diferentes parcelas; comparar rendimentos.

• O experimento funciona porque a quantidade de fertilizante aplicada não está relacionada

a outros fatores que influenciam o rendimento das culturas.

20
Machine Translated by Google
NOVA
IMS
Em formação
Causalidade e Ceteris Paribus
Gestão
Escola

Medindo o retorno à educação

• Se uma pessoa é escolhida da população e recebe mais um ano de


educação, em quanto seu salário aumentará?

• Suposição implícita: todos os outros fatores que influenciam os salários, como


experiência, antecedentes familiares, inteligência etc., são mantidos fixos

Experimentar:

• Escolha um grupo de pessoas; atribuir aleatoriamente diferentes quantidades


de educação a eles (inviável!); comparar resultados salariais

• Problema sem atribuição aleatória: a quantidade de educação está


relacionada a outros fatores que influenciam os salários (por exemplo, inteligência)

21
Machine Translated by Google
NOVA
IMS
Em formação
Causalidade e Ceteris Paribus
Gestão
Escola

Efeito da aplicação da lei no nível de criminalidade da cidade

• Se uma cidade for escolhida aleatoriamente e receber dez policiais adicionais,

em quanto sua taxa de criminalidade cairia?

• Alternativamente: Se duas cidades são iguais em todos os aspectos, exceto que a cidade A

tem mais dez policiais, em quanto as taxas de criminalidade das duas cidades diferem?

Experimentar:

• Atribuir aleatoriamente o número de policiais a um grande número de cidades • Na realidade, o

número de policiais será determinado pela taxa de criminalidade (determinação simultânea de

crime e número de policiais)

22
Machine Translated by Google
NOVA
IMS
Em formação
Gestão
Escola

A regressão linear simples


Modelo
Machine Translated by Google
NOVA
IMS
Em formação
O SLRM
Gestão
Escola

Suponha que temos duas variáveis (observáveis) y e x. E que nos interessa:

• explicando y em termos de x •
estudando como y varia com as mudanças em x

Ao escrever um modelo que “explicará y em termos de x”, devemos enfrentar


três questões.

1. como permitimos que outros fatores o afetem? 2.


qual é a relação funcional entre y e x? 3. como podemos ter
certeza de que estamos capturando uma relação ceteris paribus entre y e x?

y = ÿ0 + ÿ1x + u (1)

A equação (1), que é assumida como válida na população de interesse, define


o modelo de regressão linear simples
23
Machine Translated by Google
NOVA
IMS
Em formação
O SLRM
Gestão
Escola

Tabela 1: Terminologia para regressão simples

y x

Variável dependente Variável independente


Variável explicada Variável explicativa
Resposta variável Variável de controle
Variável prevista Variável preditora

Regressar e Regressor

24
Machine Translated by Google
NOVA
IMS
Em formação
O termo de erro
Gestão
Escola

• A variável u é chamada de termo de erro, distúrbio aleatório (“perturba


uma relação de outra forma estável”).

• Representa outros fatores não observados além de x que afetam y.

• Uma regressão simples trata todos os fatores que afetam y exceto x como
não observados (Por quê?).

• A perturbação surge por vários motivos (Discutir).

25
Machine Translated by Google
NOVA
IMS
Em formação
O SLRM
Gestão
Escola

• A Equação (1) também aborda a questão do relacionamento funcional


entre y e x.
• Se os outros fatores em u forem mantidos fixos, e assumindo ÿu = 0, então x
tem um efeito linear em y:

ÿy = ÿ1ÿx

• Isso significa que ÿ1 é o parâmetro de inclinação na relação


entre y e x, mantendo os demais fatores em u fixos; é de interesse primordial
na economia aplicada. • O parâmetro de interceptação ÿ0, às vezes chamado
de termo constante, também tem seus usos, embora raramente seja central
para uma análise. • A linearidade de (1) implica que uma mudança de uma
unidade em x tem o mesmo efeito em y, independentemente do valor inicial de
x (Isto não é realista para muitas aplicações econômicas).

(Discutir)
26
Machine Translated by Google
NOVA
IMS
Em formação
O SLRM
Gestão
Escola

• Exemplo: produtividade de soja e fertilizantes

rendimento = ÿ0 + ÿ1fertilizante + u

• Exemplo: Uma função de salário simples

salário = ÿ0 + ÿ1educ + u

(Discutir)

27
Machine Translated by Google
NOVA
IMS
Em formação
Suposição média condicional
Gestão
Escola

• Quando há uma interpretação causal?

• Suposição de independência média condicional

E [u | x] = 0

Os fatores não observados não contêm informações sobre as variáveis


explicativas.

• É improvável que a suposição de independência média condicional na função


salário seja válida porque indivíduos com mais educação também serão mais
inteligentes em média.

28
Machine Translated by Google
NOVA
IMS
Em formação
Função de regressão populacional (PFR)
Gestão
Escola

• A suposição de independência média condicional implica que

E [s | x] = ÿ0 + ÿ1x
• Isso significa que o valor médio da variável dependente pode ser
expresso como uma função linear da variável explicativa

29
Machine Translated by Google
NOVA
IMS Condições de ortogonalidade
Em formação
Gestão
Escola

• Agora que discutimos os ingredientes básicos do modelo de


regressão simples, abordaremos a importante questão de
como estimar ÿ0 e ÿ1
• Nós temos

E [u | x] = 0 ÿ ( E[u] = 0= 0 ÿ ( EE[x[y(yÿ ÿÿ0ÿ0ÿ ÿ1x]


E [xu] = 0= 0
ÿ ÿ1x)]

30
Machine Translated by Google
NOVA
IMS Método de abordagem de momentos
Em formação
Gestão
Escola

• Como existem dois parâmetros desconhecidos para estimar,

• Podemos esperar que as equações de pré-visualização possam ser usadas para obter boas
estimadores para os parâmetros ÿ0 e ÿ1
• Assumindo uma amostra aleatória de n indivíduos e usando o método de
os momentos que temos:

n ÿ1Xxi yˆ ÿ ÿˆ 0 ÿ ÿˆ 1xi = 0 (2)

e
n ÿ1X yˆ ÿ ÿˆ 0 ÿ ÿˆ 1xi = 0 (3)

31
Machine Translated by Google
NOVA
IMS
Em formação
O estimador OLS no SLRM
Gestão
Escola

Usando as propriedades básicas do operador de soma, temos:

ÿˆ 0 = ¯y ÿ ÿˆ 1x¯ (4)

-1n
_ Pni=1 (xi ÿ x¯) (yi ÿ y¯)
ÿ1 = 2 (5)
nÿ1 Pni=1 (xi ÿ x¯)

ou, a covariância amostral entre x e y dividida pela variância amostral


de x.

(mostrar este resultado)

32
Machine Translated by Google
NOVA
IMS
Em formação
O estimador OLS no SLRM
Gestão
Escola

• As estimativas fornecidas em 4 e 5 são chamadas de estimativas dos mínimos


quadrados ordinários (OLS) de ÿ0 e ÿ1. • Para justificar este nome, para qualquer
ÿˆ 0 e ÿˆ 1, defina um valor ajustado para y quando x = xi : ˆyi = ÿˆ 0 + ÿˆ 1xˆi

• O resíduo para observação i pode ser definido como

uˆi = yi ÿ yˆi = yi ÿ ÿˆ 0 ÿ ÿˆ 1xi •


Ajuste tão bem quanto possível uma linha de regressão através dos pontos de dados:

33
Machine Translated by Google
NOVA
IMS
Em formação
Minimizando o SSR
Gestão
Escola

Colocando de outra forma, escolhemos ÿˆ 0 e ÿˆ 1 para fazer a soma dos resíduos


quadrados,

2
(yi ÿ ÿˆ 0 ÿ ÿˆ 1xi) 2 (6)
SSR(ÿˆ 0, ÿˆ 1) Xn uˆ
eu
= Xn
i=1 i=1

O foco para o mínimo é encontrado definindo as derivadas parciais de


(6) iguais a zero:

ÿ
SSR(ÿˆ 0, ÿˆ 1) = ÿ2 Xn (yi ÿ ÿˆ 0 ÿ ÿˆ 1xi)
ÿÿˆ 0
i=1
ÿ
SSR(ÿˆ 0, ÿˆ 1) = ÿ2 Xn (yi ÿ ÿˆ 0 ÿ ÿˆ 1xi)xi
ÿÿˆ 1
i=1

34
Machine Translated by Google
NOVA
IMS
Em formação
Equações normais
Gestão
Escola

E estes produzem as chamadas equações normais:

nÿˆ 0 + ÿˆ 1 Xn xi = Xn yi
(7)
i=1 i=1

ÿˆ 0 Xn xi + ÿˆ 1 Xn
x eu
yi xi
= Xn (8)
i=1 i=1 i=1

(mostre que as condições necessárias para ÿˆ 0 e ÿˆ 1 minimizar (6) são


dadas exatamente pelas equações (2) e (3).
35
Machine Translated by Google
NOVA
IMS
Em formação
Soluções
Gestão
Escola

Novamente, temos:

ÿˆ 0 = ¯y ÿ ÿˆ 1x¯ (9)

-1n
_ Pn i=1 (xi ÿ x¯) (yi ÿ y¯)
ÿ1 = 2 (10)
nÿ1 Pn i=1 (xi ÿ x¯)

36
Machine Translated by Google
NOVA
IMS
Em formação
Gestão
Escola

Por que OLS?

36
Machine Translated by Google
NOVA
IMS Por que OLS?
Em formação
Gestão
Escola

37
Machine Translated by Google
NOVA
IMS
Em formação
Exemplo em R
Gestão
Escola

data(ceosal1, pacote='wooldridge')

# Regressão OLS
lm( salário ~ roe, data=ceosal1)

##
## Chamar:

## lm(formula = salario ~ roe, data = ceosal1)


##
## Coeficientes:

## (Interceptar) ovas
## 963,2 18,5

38
Machine Translated by Google
NOVA
IMS
Em formação
PRF vs Função Ajustada
Gestão
Escola

39
Machine Translated by Google
NOVA
IMS
Em formação
Exemplo em R
Gestão
Escola

data(ceosal1, pacote='wooldridge')
attach(ceosal1)

cov(roe,salário)
var(roe)
média(salário)
mean(roe) ( b1hat
<- cov(roe,salary)/var(roe) ) ( b0hat <-
média(salário) - b1hat*mean(roe) ) separar(ceosal1)

40
Machine Translated by Google
NOVA
IMS
Em formação
Exemplo em R
Gestão
Escola

data(wage1, pacote='wooldridge')

# Regressão OLS:
lm(salário ~ educ, dados=salário1)

##
## Chamar:

## lm(formula = salário ~ educ, dados = salário1)


##
## Coeficientes:

## (Interceptar) educar

## -0,9049 0,5414

41
Machine Translated by Google
NOVA
IMS
Em formação
Exemplo em R
Gestão
Escola

data(voto1, pacote='wooldridge')

# Regressão OLS (parênteses para saída imediata):


( VOTEres <- lm(voteA ~ shareA, data=vote1) )

##
## Chamar:
## lm(formula = voteA ~ shareA, data = vote1)
##
## Coeficientes:

## (Interceptar) compartilhar A

## 26.8122 0,4638

# gráfico de dispersão com linha de regressão:


with(vote1, plot(shareA, voteA)) abline(VOTEres)
42
Machine Translated by Google
NOVA
IMS
Em formação
Exemplo em R
Gestão
Escola

80

70

60

50
voteA

40

30

20

0 20 40 60 80 100

compartilhar A

43
Machine Translated by Google
NOVA
IMS Propriedades algébricas de OLS
Em formação
Gestão
Escola

Xn u = 0 (11)
i=1

Xn xiuˆi = 0 (12)
i=1

y¯ = ÿˆ 0 + ÿˆ 1x¯ (13)

44
Machine Translated by Google
NOVA
IMS
Em formação
Valores e Resíduos Ajustados
Gestão
Escola

data(wage1, pacote='wooldridge')
WAGEregres <- lm(salário ~ educ, data=wage1) # obtém
coeficientes, valores previstos e resíduos [Link] <- coef(WAGEregres)
salá[Link] <- ajustado(WAGEregres) [Link] <- resid(WAGEregres)

# Confirma a propriedade (1):


mean([Link])

## [1] -1.19498e-16

45
Machine Translated by Google
NOVA
IMS
Em formação
Valores e Resíduos Ajustados
Gestão
Escola

# Confirme a propriedade (2):


cor(wage1$educ , [Link])

## [1] 4.349557e-16

# Confirma a propriedade (3):


mean(wage1$wage)

## [1] 5.896103

[Link][1] + [Link][2] * mean(wage1$educ)

## (Interceptar)
## 5.896103

46
Machine Translated by Google
NOVA
IMS
Em formação
Uma decomposição útil
Gestão
Escola

Nós temos:

yi = ˆyi + ˆui (14)


E deixar:

SST = Xn (yi ÿ y¯)2 (15)


i=1

SSE = Xn (ˆyi ÿ y¯)2 (16)


i=1

SSR = Xn uˆ
2
(17)
eu

i=1
Portanto, é simples mostrar que:

SST = SSE + SSR (mostre isto) (18)

47
Machine Translated by Google
NOVA
IMS
Em formação
Bondade de ajuste: o quadrado R
Gestão
Escola

• Muitas vezes é útil calcular um número que resuma quão bem a linha de regressão
OLS se ajusta aos dados.

• O quadrado R (coeficiente de determinação):

SSE SSR
R2 = =1ÿ
SST SST

• a razão da variação explicada em relação à variação total; • É interpretado como a

fração da variação da amostra em y que é explicada por x.

2 • Um valor de R que é quase igual a zero indica um ajuste ruim da linha OLS:
muito pouco da variação no yi é capturado pela variação no ˆyi .

• Pode-se mostrar que R 2


é igual ao quadrado da amostra
coeficiente de correlação entre yi e ˆyi .

48
Machine Translated by Google
NOVA
IMS
Em formação
Bondade de ajuste: o quadrado R
Gestão
Escola

data(ceosal1, pacote='wooldridge')
CEOregres <- lm( salário ~ roe, data=ceosal1)
# Calcular valores e resíduos previstos: [Link] <-
ajustado(CEOregres) [Link] <- resid(CEOregres)

49
Machine Translated by Google
NOVA
IMS
Em formação
Bondade de ajuste: o quadrado R
Gestão
Escola

# Calcular R^2 de três maneiras diferentes: sal <-


ceosal1$salary var([Link]) / var(sal)

## [1] 0,01318862

1 - var([Link]) / var(sal)

## [1] 0,01318862

cor(sal, [Link])^2

## [1] 0,01318862

50
Machine Translated by Google
NOVA
IMS
Em formação
Unidades de Medida e Forma Funcional
Gestão
Escola

• Até agora, nos concentramos em relações lineares entre as variáveis


dependentes e independentes

• as relações lineares não são suficientemente gerais para todas as economias


formulários.

• Felizmente, é bastante fácil incorporar muitas não linearidades na análise de


regressão simples definindo apropriadamente as variáveis dependentes e
independentes

• A transformação logarítmica é uma das mais aplicadas


transformação para variáveis econômicas.

51
Machine Translated by Google
NOVA
IMS
Em formação
Unidades de Medida e Forma Funcional
Gestão
Escola

• Suponhamos que E [ui | xi ] = 0. Qual é o impacto no


valor esperado condicional y, E [yi | xi ] quando xi1 (digamos) é aumentado em
uma certa quantidade? Deixar

ÿE [yi | xi ] ÿ E [yi | xi + ÿxi ] ÿ E [yi | xi ]

• Se xi é uma variável contínua e ÿxi é considerado uma pequena quantidade:

dE [yi | xi ]
ÿE [yi | xi ] ÿ ÿxi dxi

• Se xi for uma variável discreta, por exemplo, uma variável binária. Use a definição:

ÿE [yi | xi ] ÿ E [yi | xi + ÿxi ] ÿ E [yi | xi ]

Observação: A aproximação ainda pode ser usada em certos casos mesmo quando xi
é uma variável discreta.

52
Machine Translated by Google
NOVA
IMS
Em formação
Unidades de Medida e Forma Funcional
Gestão
Escola

Tabela 2: Resumo das Formas Funcionais Envolvendo Logaritmos

Modelo Departamento Regressor Variável Interpretação de ÿ1

Nível de nível y x ÿE [y | xi ] = ÿ1ÿx


Nível de registro log(y) x %ÿE [y | xi ] ÿ 100ÿ1ÿx
Log-log log(y) log(x) %ÿE [y | xi ] ÿ ÿ1%ÿx
Registro de nível y log(x) ÿE [y | xi ] ÿ (ÿ1/100)%ÿx

(Borda)
Observação: Se os parâmetros são estimados (o que é sempre o caso), nós
precisa adicionar o termo "estimado". Por exemplo, "A mudança estimada
em E [yi | xi ]...”.

53
Machine Translated by Google
NOVA
IMS
Em formação
O SLRM: Suposições
Gestão
Escola

SLR1: Linear em Parâmetros


O modelo na população pode ser escrito como

y = ÿ0 + ÿ1x + u (19)

SLR2: Amostragem Aleatória


Temos uma amostra aleatória de tamanho n, {(xi , yi) : i = 1, 2, · · · ,
n}, seguindo o modelo populacional (19)

SLR3: Variação da amostra em


x Os resultados da amostra em x, {(xi , yi) : i = 1, 2, · · · , n}, não são todos
do mesmo valor.

54
Machine Translated by Google
NOVA
IMS
Em formação
O SLRM: Suposições
Gestão
Escola

SLR4: Média Condicional Zero


O erro u tem um valor esperado de zero dado qualquer valor da
variável explicativa. Em outras palavras,

E[u | x] = 0 (20)

SLR5: Homocedasticidade
O erro u tem a mesma variância dado qualquer valor da variável
explicativa. Em outras palavras,

2
Var(u | x) = ÿ (21)

Observação: x denota o vetor n-dimensional (x1, x2, · · · , xn).

55
Machine Translated by Google
NOVA
IMS
Em formação
Exemplo de Homocedasticidade
Gestão
Escola

56
Machine Translated by Google
NOVA
IMS
Em formação
Exemplo de heterocedasticidade
Gestão
Escola

57
Machine Translated by Google
NOVA
IMS
Em formação
Imparcialidade do OLS
Gestão
Escola

Teorema 1
Imparcialidade do OLS

Nas suposições SLR1 a SLR4 temos:

E h ÿˆ 0 | x i = ÿ0 (22)

E h ÿˆ 1 | x i = ÿ1 (23)

(Prova disso)

58
Machine Translated by Google
NOVA
IMS Variações de Amostragem dos Estimadores OLS
Em formação
Gestão
Escola

Teorema 2

Variações de Amostragem dos Estimadores OLS


Nas suposições SLR1 a SLR5 temos:
2
ÿ 2n ÿ1 Pn = 1 e 2x i
Var ÿˆ 0 | x = n (24)
P i=1 (xi ÿ x¯)
e
2ÿ

Var ÿˆ 1 | x = 2 (25)
Pn i=1 (xi ÿ x¯)

(Prova disso)

59
Machine Translated by Google
NOVA
IMS
Em formação
Estimando a variância do erro
Gestão
Escola

2 • Problema: ÿ É desconhecido!

2
2 • Precisamos de um estimador para ÿ como Var ÿˆ 1 | x depende de ÿ
2
• Um estimador imparcial da variância do erro, Var (u | x) = ÿ é:

2 SSR Pn uˆ i=12n
ÿˆ = = eu

(26)
n-2 ÿ2

e
ÿˆ = ÿ ÿˆ 2 (27)

denota o erro padrão de regressão

60
Machine Translated by Google
NOVA
IMS
Em formação
Erros padrão de ÿˆ 0 e ÿˆ 1
Gestão
Escola

A quantidade ˆÿ é relevante porque permite estimar os erros padrão


(SE's) dos estimadores OLS. Do seguinte modo:

2x
i=1i
n 2
(28)
se ÿˆ 0 | X = s P
ÿˆ i=1 (xi ÿ x¯)
2nÿ1
e

2
(29)
Pn se ÿˆ 1 | X =Pn si=1ÿˆ(xi2 ÿ x¯)
O erro padrão de qualquer estimativa nos dá uma ideia de quão preciso é o
estimador. Os erros padrão desempenham um papel central na Econometria;
vamos usá-los para construir estatísticas de teste e intervalos de confiança para
cada procedimento econométrico.

61
Machine Translated by Google
NOVA
IMS Regressão pela Origem e Regressão em um
Em formação
Gestão
Escola
Constante

• Em casos raros, desejamos impor a restrição de que, quando x = 0, o valor


esperado de y é zero. • Existem certas relações para as quais isso é razoável.
Para
Por exemplo, se a renda (x) for zero, então a receita do imposto de renda (y) também
deve ser zero.

• Formalmente, agora escolhemos um estimador de inclinação, que chamamos de ÿ˜, e um


linha do formulário:

y˜ = ÿ˜x

• Esta expressão é chamada de regressão pela origem porque a linha passa pelo
ponto (x = 0, y˜ = 0)
• Pode ser mostrado que
Pn = 1 nxi2 yi
xi
ÿ˜ =
P i=1
• Por outro lado, se definirmos a inclinação para zero (o que significa que nem
precisamos ter um x), a interceptação é simples ¯y.

62
Machine Translated by Google
NOVA
IMS Regressão pela Origem e Regressão em um
Em formação
Gestão
Escola
Constante

data(ceosal1, pacote='wooldridge')
# Regressão OLS usual:
(reg1 <- lm( salário ~ roe, data=ceosal1))

##
## Chamar:

## lm(formula = salário ~ ovas, dados = ceosal1)


##
## Coeficientes:

## (Interceptar) ovas
## 963,2 18,5

63
Machine Translated by Google
NOVA Regressão pela Origem e Regressão em um
IMS
Em formação
Gestão
Constante
Escola

# Regressão sem interceptação (através da origem): (reg2 <- lm( salário ~


0 + roe, data=ceosal1))

##
## Chamar:

## lm(formula = salario ~ 0 + roe, data = ceosal1)


##
## Coeficientes:
## ovas
## 63,54

# Regressão sem inclinação (em uma constante): (reg3 <-


lm( salário ~ 1 , dados=ceosal1))

##
## Chamar:

## lm(formula = salário ~ 1, dados = ceosal1)


##
## Coeficientes:

## (Interceptar)
## 1281

# média y:
média(ceosal1$salário)

## [1] 1281,12

64
Machine Translated by Google
NOVA Regressão pela Origem e Regressão em um
IMS
Em formação
Gestão
Constante
Escola

# Gráfico de dispersão com todas as 3 linhas de


regressão plot(ceosal1$roe, ceosal1$salary, ylim=c(0,4000))
abline(reg1, lwd=2, lty=1) abline(reg2, lwd=2, lty=2 ) abline(reg3,
lwd=2, lty=3) legend("topleft",c("full","através da origem","const
only"),lwd=2,lty=1:3)

65
Machine Translated by Google
NOVA
IMS Regressão pela Origem e Regressão em um
Em formação
Gestão
Escola
Constante

4000
cheio

através da origem
const apenas

3000

2000

ceosal1$salário

1000

0 10 20 30 40 50

ceosal1$roe

66
Machine Translated by Google
NOVA
IMS
Em formação
Gestão
Escola

A regressão linear múltipla


Modelo
Machine Translated by Google
NOVA
IMS
Em formação
Introdução
Gestão
Escola

• A principal desvantagem no uso da regressão simples é que é muito difícil tirar


conclusões ceteris paribus sobre como x afeta y • a suposição chave, E[u | x] —

que todos os outros fatores que afetam y são


não correlacionado com x é muitas vezes irreal

• A análise de regressão múltipla é mais acessível à análise ceteris paribus


porque nos permite controlar explicitamente muitos outros fatores que afetam
simultaneamente a variável dependente.

67
Machine Translated by Google
NOVA
IMS
Em formação
Ceteris Paribus ou Holding Outros Fatores Fixos
Gestão
Escola

• O objetivo da maioria dos estudos empíricos em economia e outras ciências sociais é


determinar se uma mudança em uma variável, digamos x, causa uma mudança em
outra variável, digamos y.

• Por exemplo:

• Ter mais um ano de educação causa um aumento na mensalidade


salário?
• A redução do tamanho da turma causa uma melhora no aluno
atuação? A redução da alíquota do imposto predial empresarial causa um
aumento na atividade econômica da cidade?

• Porque as variáveis econômicas são adequadamente interpretadas como aleatórias


variáveis, devemos usar idéias de probabilidade para formalizar o sentido em que uma
mudança em x causa uma mudança em y.

68
Machine Translated by Google
NOVA
IMS
Em formação
Ceteris Paribus ou Holding Outros Fatores Fixos
Gestão
Escola

• A noção de ceteris paribus - isto é, manter todos os outros fatores (relevantes) fixos,
está no cerne do estabelecimento de uma relação causal.

• Simplesmente descobrir que duas variáveis estão correlacionadas raramente é


suficiente para concluir que uma mudança em uma variável causa uma mudança em outra.

• Afinal, raramente podemos realizar um experimento controlado que permita uma


simples análise de correlação para descobrir a causalidade.

• Em vez disso, podemos usar métodos econométricos para manter efetivamente outros
fatores fixos.

69
Machine Translated by Google
NOVA
IMS
Em formação
Ceteris Paribus ou Holding Outros Fatores Fixos
Gestão
Escola

• Se focarmos na resposta média ou esperada, a ceteris paribus


análise envolve estimar

E [s | x, c],

o valor esperado de y condicional em x e c.


• O vetor c denota um conjunto de variáveis de controle que gostaríamos de

explicitamente mantenha fixo ao estudar o efeito de x sobre o valor esperado de


y.
• A razão pela qual controlamos essas variáveis é que achamos que x é

correlacionada com outros fatores que também influenciam y.

• Se x é contínuo, os juros centram-se em ÿE [y | x, c] /ÿx, que normalmente é


chamado de efeito parcial de x sobre E [y | x, c]. • Se x é discreto, estamos

interessados em E [y | x, c] avaliados em diferentes valores de x, com os elementos


de c fixados nos mesmos valores especificados.

70
Machine Translated by Google
NOVA
IMS
Em formação
Ceteris Paribus ou Holding Outros Fatores Fixos
Gestão
Escola

Ceteris Paribus: “outros fatores (relevantes) sendo iguais”, desempenha


um papel importante na análise causal.

71
Machine Translated by Google
NOVA
IMS
Em formação
Ceteris Paribus ou Holding Outros Fatores Fixos
Gestão
Escola

• Suponha que os salários dependam da educação e da experiência da força de trabalho.


Seu objetivo é medir o “retorno à educação”.

• Se sua análise envolve apenas salários e educação, você não pode


descobrir o efeito ceteris paribus da educação sobre os salários.

• Considere os seguintes dados:

salários mensais (Euros) anos de experiência anos de educação


1500 6 9
1500 0 15
1600 1 15
2000 8 12
2500 10 12

72
Machine Translated by Google
NOVA
IMS
Em formação
Ceteris Paribus ou Holding Outros Fatores Fixos
Gestão
Escola

• O exemplo anterior mostra que o foco

dE [salários | educação]
dedução

está incorreto.

• Em vez disso, precisamos analisar

ÿE [salários | educação, experiência]


ÿeducação

73
Machine Translated by Google
NOVA
IMS
Em formação
Ceteris Paribus ou Holding Outros Fatores Fixos
Gestão
Escola

• Ceteris Paribus é relativamente fácil de analisar em Dados Experimentais. •

Considerou os efeitos de novos fertilizantes na produtividade das culturas.

• Suponha que a cultura em consideração seja a soja. • Como

a quantidade de fertilizante é apenas um fator que afeta os rendimentos - alguns


outros incluem chuva, qualidade da terra e presença de parasitas – esta questão
deve ser colocada como uma questão ceteris paribus. Uma maneira de determinar
o efeito causal da quantidade de fertilizante na produtividade da soja é realizar um
experimento, que pode incluir as seguintes etapas.
1. Escolha vários lotes de terra de um hectare,
2. Aplique diferentes quantidades de fertilizante em cada
lote, 3. Meça posteriormente os rendimentos.

74
Machine Translated by Google
NOVA
IMS
Em formação
Ceteris Paribus ou Holding Outros Fatores Fixos
Gestão
Escola

• Em economia e outras ciências sociais você tem dados não experimentais,


então, em princípio, é difícil estimar os efeitos ceteris paribus.

• No entanto, veremos que os métodos econométricos podem simular um


experimento ceteris paribus.
• Seremos capazes de fazer em ambientes não experimentais o que os cientistas
naturais são capazes de fazer em um ambiente controlado de laboratório: manter
outros fatores fixos.

• Veremos que o procedimento é bem simples: se o foco está na relação entre xi2 e
yi e xi2, xi4 são as variáveis controladas, basta adicioná-las em um modelo de
regressão:

yi = ÿ0 + ÿ1x1 + ÿ2xi2 + ÿ3xi3 + ui

(simples assim!) Na prática, o problema é encontrar as variáveis


controladas apropriadas.

75
Machine Translated by Google
NOVA
IMS
Em formação
Introdução
Gestão
Escola

• A regressão linear geral com k variáveis explicativas é apenas uma extensão da


regressão simples como segue:

yi = ÿ0 + ÿ1xi1 + · · · + ÿk xik + ui (30)

• Ainda precisamos fazer uma suposição de média condicional zero, então agora
suponha que E [y | X] = 0

• No mínimo, todos os fatores no termo de erro não observado não estão


correlacionados com as variáveis explicativas

• ÿ0 ainda é a interceptação, ÿ0, · · · , ÿk denotam parâmetros de inclinação.

76
Machine Translated by Google
NOVA
IMS
Em formação
Introdução
Gestão
Escola

• Porque
ÿ
E [s | X] ÿ ÿj ÿxj
• ÿj representa o

efeito marginal de xj • indica a quantidade que se espera

que y mude à medida que xj muda uma unidade e outras variáveis são mantidas
constantes (ceteris paribus).

77
Machine Translated by Google
NOVA
IMS
Em formação
Introdução
Gestão
Escola

O modelo estimado:

colGPA \i = 1,29 + 0,454hsGPAi + 0,0094ACTi

data(gpa1, pacote='wooldridge')
lm(colGPA ~ hsGPA+ACT, dados=gpa1)

##
## Chamar:

## lm(formula = colGPA ~ hsGPA + ACT, dados = gpa1)


##
## Coeficientes:

## (Interceptar) hsGPA ATO


## 1.286328 0,453456 0,009426

78
Machine Translated by Google
NOVA
IMS
Em formação
O modelo
Gestão
Escola

Podemos escrever o modelo econométrico como:

yi = ÿ0 + ÿ1xi1 + · · · + +ÿk xik + ui (31)

ÿ ÿ0 ÿ
ÿ1
= 1 xi1 xi2 · · · xik .
. (32)
.

ÿÿÿÿÿ k ÿÿÿÿÿ + ui
0=x iÿ + ui (33)

79
Machine Translated by Google
NOVA
IMS
Em formação
Uma Convenção Notacional
Gestão
Escola

ano 1 1 x 11 x 12 · · · x1k 1 x21 u1


ÿ ÿ ÿ ÿ ÿ ÿ
ano 2 x22 · · · x2k u2
y= . , X= . . . .. . , vc = . .
. . . . . . .
. . . . . .

ÿÿÿÿÿ
yn ÿÿÿÿÿ ÿÿÿÿÿ
1 xn1 xn2 · · · xnk ÿÿÿÿÿ ÿÿÿÿÿ
un ÿÿÿÿÿ

• y: vetor coluna formado pelas n observações da variável y;


• X: matriz n × (k + 1) das variáveis explicativas
• u: vetor coluna contendo os n distúrbios
• Usaremos um x em negrito para denotar uma coluna ou uma linha de X

• O subscrito i (e eventualmente t) geralmente será usado para denotar


linhas (observações) de X

80
Machine Translated by Google
NOVA
IMS
Em formação
Uma Convenção Notacional
Gestão
Escola

• Matriz X também pode ser representada como

X = 1n x•1 x•2 · · · x•k


Onde

• x•k : vetor coluna formado pelas n observações da variável xk • 1n: vetor coluna de

1's

81
Machine Translated by Google
NOVA
IMS
Em formação
O modelo
Gestão
Escola

O modelo aplicado a todas as n observações:

y = ÿ01n + ÿ1x•1 + ÿ2x•2 + · · · + ÿk x•k + u (34)

ÿ ÿ0 ÿ
ÿ1
= 1n x•1 x•2 · · · x•k .
. (35)
.

ÿÿÿÿÿ
k ÿÿÿÿÿ + u

= Xÿ + u (36)

ou

ÿ ano 1
ÿ ÿ 1x11 · · · x1k 1x21 ÿÿ ÿ0 ÿ ÿ u1 ÿ
ano 2 · · · x2k ÿ1 u2
.
.
.
.
.
.
.
.
.
.
.
. (37)
. . . ···
. . .

ÿÿÿÿÿ
yn ÿÿÿÿÿ = ÿÿÿÿÿ
1 xn1 · · · xnk ÿÿÿÿÿ ÿÿÿÿÿ
k ÿÿÿÿÿ + ÿÿÿÿÿ un ÿÿÿÿÿ

82
Machine Translated by Google
NOVA
IMS
Em formação
O modelo
Gestão
Escola

Para concluir:

yi = ÿ0 + ÿ1xi1 + · · · + +ÿk xik + ui (38)


0
=x iÿ + ui (39)

ou (o modelo aplicado a todas as n observações)

y = ÿ01n + ÿ1x•1 + ÿ2x•2 + · · · + ÿk x•k + u (40)


= Xÿ + u (41)

83
Machine Translated by Google
NOVA
IMS
Em formação
O modelo
Gestão
Escola

• No modelo

salário = ÿ0 + ÿ1educação + ÿ2exper + ui

um exemplo é

1500 1 17 4
ÿ 2000
ÿ ÿ 1 12 11 ÿ
yi =
1350 , X= 1 15 2
. . . .
. . . .
. . . .

ÿÿÿÿÿÿÿ
2400 ÿÿÿÿÿÿÿ ÿÿÿÿÿÿÿ
1 15 7 ÿÿÿÿÿÿÿ

84
Machine Translated by Google
NOVA
IMS Exogeneidade estrita como uma suposição chave
Em formação
Gestão
Escola

• A equação OLS estimada é escrita em uma forma semelhante à


caso de regressão simples:

yˆ = ÿˆ 0 + ÿˆ 1x1 + · · · + ÿˆ k xk (42)

• O método de OLS escolhe as estimativas para minimizar a soma de


resíduos quadrados.

• Ou seja, dadas n observações em y e (x1, ..., xk ), as estimativas (ÿˆ 0, ..., ÿˆ k )


são escolhidas simultaneamente para fazer

Xn yi ÿ ÿˆ 0 ÿ ÿˆ 1xi1 ÿ · · · ÿ ÿˆ k xik (43)


i=1

o menor possível.

85
Machine Translated by Google
NOVA
IMS Exogeneidade estrita como uma suposição chave
Em formação
Gestão
Escola

Isso leva a k + 1 equações lineares em k + 1, o frequentemente chamado OLS FOC:

Xn yi ÿ ÿˆ 0 ÿ ÿˆ 1xi1 ÿ · · · ÿ ÿˆ k xik = 0
i=1

Xn xi1 yi ÿ ÿˆ 0 ÿ ÿˆ 1xi1 ÿ · · · ÿ ÿˆ k xik = 0


i=1

Xn xi2 yi ÿ ÿˆ 0 ÿ ÿˆ 1xi1 ÿ · · · ÿ ÿˆ k xik = 0


i=1
.
.
.

Xn xik yi ÿ ÿˆ 0 ÿ ÿˆ 1xi1 ÿ · · · ÿ ÿˆ k xik = 0 (44)


i=1

Observação: Assim como o SLRM no OLS, o FOC também pode ser obtido pelo método
dos momentos. 86
Machine Translated by Google
NOVA
IMS
Em formação
Método da abordagem dos momentos
Gestão
Escola

Condições de ortogonalidade:

E [u] = 0 7ÿÿ n ÿ1Xn u=0 (45)


i=1

E [xju] = 0 7ÿÿ n ÿ1Xn xijuˆi = 0 (46)


i=1

para j = 1, · · · , k

87
Machine Translated by Google
NOVA
IMS
Em formação
Vetor Coeficiente de Mínimos Quadrados
Gestão
Escola

Mesmo para n e k de tamanho moderado, resolver essas equações manualmente


é tedioso. Felizmente existe uma maneira matricial: Seja S(b) a soma dos
quadrados dos resíduos quando b é escolhido como um estimador de ÿ:

0 2 0

Xn (yi ÿ x ib) 0 = e e = (y ÿ Xb) (y ÿ Xb) (47)


i=1

Vamos resolver o problema


min S (b) (48)
b

88
Machine Translated by Google
NOVA
IMS
Em formação
Vetor Coeficiente de Mínimos Quadrados
Gestão
Escola

Nós temos
ÿS (b)
= · · · = ÿ2X ÿb 0 y + 2X 0Xb

Seja ÿˆ a solução de ÿS(b) = 0. Este valor satisfaz as equações normais de


ÿb
mínimos quadrados:
0
X 0Xÿˆ = X y (49)

Se o inverso de X0X existir, então

ÿ1
ÿˆ = (X 0X) X 0 sim (50)

0
···
onde ÿˆ = ÿˆ 0 ÿˆ 1 ÿk _

89
Machine Translated by Google
NOVA
IMS
Em formação
Vetor Coeficiente de Mínimos Quadrados
Gestão
Escola

data(gpa1, pacote='wooldridge')
y <- gpa1$colGPA
X <- cbind(1, gpa1$hsGPA, gpa1$ACT)
cabeça(X)

## [,1] [,2] [,3]


## [1,] ## 1 3,0 21

[2,] ## [3,] 1 3,2 24


1 3,6 26

## [4,] ## 1 3,5 27

[5,] ## [6,] 1 3,9 28


1 3,4 25

90
Machine Translated by Google
NOVA
IMS
Em formação
Vetor Coeficiente de Mínimos Quadrados
Gestão
Escola

( bhat <- solve( t(X)%*%X ) %*% t(X)%*%y )

## [,1]
## [1,] 1,286327767 ##
[2,] 0,453455885 ## [3,]
0,009426012

91
Machine Translated by Google
NOVA
IMS Equações normais para o caso de duas variáveis
Em formação
Gestão
Escola

Problema analítico 1
Derivar as equações normais para o caso de duas variáveis (SLRM)

92
Machine Translated by Google
NOVA
IMS
Em formação
Interpretando a Equação de Regressão OLS
Gestão
Escola

• No modelo montado:

yˆi = ÿˆ 0 + ÿˆ 1xi1 + · · · + ÿˆ k xik

• As estimativas ÿˆ ter efeito parcial, ou ceteris paribus, j


interpretações
• temos:
ÿˆyi = ÿˆ 1ÿxi1 + · · · + ÿˆ kÿxik

• para que possamos obter a mudança prevista em y dadas as mudanças em


xj . • Em particular, quando x2, · ·, ·xkj =são
2, mantidos
··· fixos, de modo que ÿxj = 0, para
, k, temos:
ÿˆyi = ÿˆ 1ÿxi1

93
Machine Translated by Google
NOVA
IMS
Em formação
Introdução
Gestão
Escola

data(gpa1, pacote='wooldridge')
GPAres <- lm(colGPA ~ hsGPA+ACT, data=gpa1)
resumo(GPAres)

94
Machine Translated by Google
NOVA
IMS
Em formação
Introdução
Gestão
Escola

##
## Chamar:

## lm(formula = colGPA ~ hsGPA + ACT, dados = gpa1)


##
## Resíduos:
## Mín. 1T Mediana 3T Máx.
## -0,85442 -0,24666 -0,02614 0,28127 0,85357
##
## Coeficientes:
## Estimativa padrão Erro t valor Pr(>|t|)

## (Interceptar) 1,286328 0,340822 3,774 0,000238 ***


##hsGPA 0,453456 0,095813 4,733 5,42e-06 ***
## ATO 0,009426 0,010777 0,875 0,383297
## ---
' ' 1
## Signif. códigos: 0 '***' 0,001 '**' 0,01 '*' 0,05 '.' 0,1 ##

## Erro padrão residual: 0,3403 em 138 graus de liberdade


## Múltiplo R ao quadrado: 0,1764, R ao quadrado ajustado: 0,1645
## Estatística F: 14,78 em 2 e 138 DF, valor p: 1,526e-06

95
Machine Translated by Google
NOVA
IMS
Em formação
Introdução
Gestão
Escola

data(wage1, pacote='wooldridge')
# Regressão OLS:
resumo( lm(log(salário) ~ educ+exper+tenure, data=wage1) )

96
Machine Translated by Google
NOVA
IMS
Em formação
Introdução
Gestão
Escola

##
## Chamar:

## lm(formula = log(salário) ~ educ + exper + posse, data = salário1)


##
## Resíduos:
## Mín. 1T Mediana 3T Máx.
## -2,05802 -0,29645 -0,03265 0,28788 1,42809
##
## Coeficientes:
## Estimativa padrão Erro t valor Pr(>|t|)

## (Interceptar) 0,284360 0,104190 2,729 0,00656 **


## educação 0,092029 0,007330 12,555 < 2e-16 ***

## especialista 0,004121 0,001723 2,391 0,01714 *


## posse 0,022067 0,003094 7,133 3,29e-12 ***
## ---
' ' 1
## Signif. códigos: 0 '***' 0,001 '**' 0,01 '*' 0,05 '.' 0,1 ##

## Erro padrão residual: 0,4409 em 522 graus de liberdade


## Múltiplo R-quadrado: 0,316, R-quadrado ajustado: 0,3121
## Estatística F: 80,39 em 3 e 522 DF, valor p: < 2,2e-16
97
Machine Translated by Google
NOVA
IMS
Em formação
Valores e Resíduos Ajustados OLS
Gestão
Escola

O modelo ajustado é:

yˆ = ÿˆ 0 + ÿˆ 1x1 + · · · + ÿˆ k xk + u (51)

Os resíduos para a observação i são:

uˆi = yi ÿ yˆi (52)

Novamente, as seguintes propriedades são válidas:

¯ˆ
1. y¯ = y
2. y¯ = ÿˆ 0 + ÿˆ 1x¯1 + · · · + ÿˆ k

x¯k 3. A covariância da amostra entre cada xj , para j = 1, · · · , k e ˆui é


zero. Assim, a covariância amostral entre ˆyi e ˆui .

98
Machine Translated by Google
NOVA
IMS
Em formação
Valores e Resíduos Ajustados OLS
Gestão
Escola

Para concluir:
ÿ1
• Estimador OLS: ÿˆ = (X0X) 0 X0y

• Valores ajustados: ˆyi = iÿˆ


x ou yˆ = Xÿˆ
• Resíduos: ˆui = yi ÿ yˆi ou uˆ = y ÿ yˆ,
Onde

yˆ1 uˆ1
ÿ ÿ ÿ ÿ
yˆ2 uˆ2
y= .
. , u= .
.
.
. .

ÿÿÿÿÿ
sn ÿÿÿÿÿ ÿÿÿÿÿ
un ÿÿÿÿÿ

99
Machine Translated by Google
NOVA
IMS Bondade de ajuste: o R 2
Em formação
Gestão
Escola

• Novamente como no caso da regressão simples:

SSE SSR
R2 = =1ÿ
SST SST

Onde

eu
2
SSR = uˆ 0uˆ = Xn _

i=1

2 • R nunca diminui quando uma variável explicativa é adicionada ao


modelo!

100
Machine Translated by Google
NOVA
IMS
Em formação
Bondade de ajuste: o R ajustado2
Gestão
Escola

• O coeficiente de determinação ajustado é

n-1 2
R¯2 = 1 ÿ n ÿ 1-R
kÿ1

1ÿ SSR/ (n ÿ k ÿ 1) =
SST/ (n ÿ 1)
2 ÿˆ
=1ÿ
SST/ (n - 1)
2
• Ao contrário de , R¯2 pode diminuir quando uma variável é adicionada ao conjunto
R de variáveis independentes.

101
Machine Translated by Google
NOVA
IMS Qualidade de ajuste: comentários adicionais sobre R 2
Em formação
Gestão
Escola

O famoso econometrista Arthur Goldberger (1930-2009) disse uma vez que não é
2
A coisa mais importante sobre R importante. Por quê?

2
• Sempre podemos aumentar R adicionando mais variáveis explicativas. No
o limite, se k = n + 1 então R 2=1

• Estamos preocupados com parâmetros em uma população, não com


qualidade de ajuste na amostra;
2 • Na seção transversal R tão alto quanto 0,2 às vezes são dignos de nota
2
• Em dados de séries temporais, R altas (maiores que 0,9) são frequentes.

• O ponto desta discussão é que se uma linha de regressão fornece


um bom ajuste a um corpo de dados depende da configuração.

• Não podemos comparar um modelo linear versus loglinear com base em


R2 .

• R 2 é apenas uma medida de associação linear entre x e y.

102
Machine Translated by Google
NOVA
IMS
Em formação
R-quadrado e o termo constante no modelo
Gestão
Escola

E se o modelo não tiver uma interceptação?

103
Machine Translated by Google
NOVA
IMS
Em formação
O MLRM: Suposições
Gestão
Escola

MLR1: Linear em Parâmetros


O modelo na população pode ser escrito como

yi = ÿ0 + ÿ1xi1 + · · · + ÿk xik + ui
0
=x iÿ + ui (53)

MLR2: Amostragem Aleatória


Temos uma amostra aleatória de n observações,

{(xi1, xi2, · · · , xik , yi)i = 1, · · · , n}

seguindo o modelo populacional na hipótese MLR1.

104
Machine Translated by Google
NOVA
IMS
Em formação
O MLRM: Suposições
Gestão
Escola

MLR3: Sem Colinearidade Perfeita


Na amostra não existem relações lineares exatas entre as variáveis
independentes.
Em outras palavras, a matriz X tem posto k + 1.

MLR4: Média Condicional Zero


Condicional em toda a matriz X, cada erro ui tem média zero:
E [ui | X] = 0

105
Machine Translated by Google
NOVA
IMS
Em formação
O MLRM: Suposições
Gestão
Escola

MLR5: Homocedasticidade
O erro u tem a mesma variância dado qualquer valor das variáveis explicativas: Var
2.
[u | X] = ÿ
Em forma de matriz:
2
Var (u | X) = ÿ Dentro

onde In denota a matriz identidade n-dimensional.

MLR6: Normalidade
Nós temos:

ui | X ÿ N 0, ÿ2

106
Machine Translated by Google
NOVA
IMS Propriedades Finitas da Amostra
Em formação
Gestão
Escola

Teorema 3

Imparcialidade do OLS

Sob as premissas MLR1-4, os estimadores OLS são estimadores imparciais


dos parâmetros populacionais. Nós temos:

E h ÿˆ | Xi = ÿ

(Prova)

107
Machine Translated by Google
NOVA
IMS
Em formação
Incluindo informações irrelevantes
Gestão
Escola

• Suponha que o modelo correto seja

y = ÿ0 + ÿ1x1 + u

• Mas estimamos o modelo

y = ÿ0 + ÿ1x1 + ÿ2x2 + u

• Em outras palavras, ÿ2 = 0 na população. • O


rendimento dos resultados da estimativa OLS

yˆ = ÿˆ 0 + ÿˆ 1x1 + ÿˆ 2x2

• Pelo Teorema (3) temos

E h ÿˆ | X i = ÿ ou E h ÿˆ j | Xi = ÿj

implicando que a inclusão de variáveis extras para uma regressão não enviesar os
resultados. No entanto, como será visto mais tarde, eles diminuem a precisão da
estimativa aumentando a variância das estimativas OLS
108
Machine Translated by Google
NOVA
IMS
Em formação
Excluindo informações relevantes
Gestão
Escola

Suponha que o modelo correto seja

yi = ÿ0 + ÿ1xi1 + ÿ2xi2 + ui (54)

mas especificamos incorretamente o modelo como

yi = ÿ0 + ÿ1xi1 + vi , vi = ÿ2xi2 + ui e o (55)

estimador OLS para ÿ1 no modelo (54), ÿe1 será

Pn i=1 (xi1 ÿ x¯1) yi


ÿe1 = = ÿ1 + Xn ai vi
2
Pn i=1 (xi1 ÿ x¯1) i=1
Pn i=1(xi1ÿx¯1)
onde ai = 2.
Pn i=1(xi1ÿx¯1)
portanto

Pn i=1 (xi1 ÿ x¯1) xi2


E h ÿe1 | X i = ÿ1 + ÿ2 2
Pn i=1 (xi1 ÿ x¯1)
implicando que ÿe1 é tendencioso para ÿ1 a menos que corr(x1, x2) = 0 ou ÿ2 = 0. Isso é
chamado de viés de variável omitida.
109
Machine Translated by Google
NOVA
IMS Propriedades Finitas da Amostra
Em formação
Gestão
Escola

Exemplo (variáveis omitidas).


Suponha que o salário seja determinado por

salárioi = ÿ0 + ÿ1educ + ÿ2habilidade + ui .

Suponha que E [vi | X] = 0. Como a habilidade não é observada, estimamos o modelo

salário = ÿ0 + ÿ1educ + ÿi

ÿi = ÿ2habilidade + vi

Se cov (educação , habilidadei) 6= 0 então cov (educação , ÿi) 6= 0 ÿ E [ÿi | X] 6 = 0.

110
Machine Translated by Google
NOVA
IMS
Em formação
Resumo do viés em ÿe1 quando x2 é omitido
Gestão
Escola

A direção do viés da variável omitida é a seguinte:

corr (x1, x2) > 0 corr (x1, x2) < 0


ÿ2 > 0 Viés positivo Viés negativo

ÿ2 < 0 Viés negativo Viés positivo

111
Machine Translated by Google
NOVA
IMS
Em formação
Viés de variável omitida: exemplo
Gestão
Escola

data(gpa1, pacote='wooldridge') lm(colGPA ~


ACT, data=gpa1)

##
## Chamar:

## lm(formula = colGPA ~ ACT, data = gpa1)


##
## Coeficientes:

## (Interceptar) ATO
## 2,40298 0,02706

112
Machine Translated by Google
NOVA
IMS
Em formação
Viés de variável omitida: exemplo
Gestão
Escola

lm(colGPA ~ hsGPA+ACT, dados=gpa1)

##
## Chamar:

## lm(formula = colGPA ~ hsGPA + ACT, dados = gpa1)


##
## Coeficientes:

## (Interceptar) hsGPA ATO


## 1.286328 0,453456 0,009426

cor(gpa1$hsGPA,gpa1$ACT)

## [1] 0,3458056

113
Machine Translated by Google
NOVA Interpretação "participação" da regressão múltipla e o
IMS
Em formação
Gestão
teorema FWL
Escola

• Pode-se mostrar que o coeficiente estimado de uma variável


explicativa em uma regressão múltipla pode ser obtido em duas etapas:
1. Regresse a variável explicativa em todas as outras variáveis
explicativas 2. Regresse y nos resíduos desta regressão
• Por que esse procedimento funciona?
1. Os resíduos da primeira regressão são a parte da variável explicativa
que não está correlacionada com as demais variáveis explicativas.
2. O coeficiente de inclinação da segunda regressão representa,
portanto, o efeito isolado da variável explicativa no dep. variável

114
Machine Translated by Google
NOVA Interpretação "parcial" da regressão múltipla
IMS
Em formação
Gestão
e o teorema FWL
Escola

long<-lm(salário~educ+exper+tenure, data=wage1)
grandes

##
## Chamar:

## lm(formula = salário ~ educ + exper + posse, dados = salário1)


##
## Coeficientes:

## (Interceptar) educar posse


## -2,87273 0,59897 especialista 0,02234 0,16927

115
Machine Translated by Google
NOVA Interpretação "participação" da regressão múltipla e o
IMS
Em formação
Gestão
teorema FWL
Escola

educreg<-lm(exper~educ+tenure, data=wage1) short<-


lm(wage~resid(educreg)-1, data=wage1) short

##
## Chamar:

## lm(formula = salário ~ resid(educreg) - 1, data = salário1)


##
## Coeficientes:

## resid(edureg) ##
0,02234

116
Machine Translated by Google
NOVA
IMS
Em formação
Variações de estimadores OLS
Gestão
Escola

Teorema 4

Variações de estimadores OLS

Sob as premissas MLR1-MLR5, a matriz de variância-covariância do


Os estimadores OLS são:

2 ÿ1
Var ÿˆ | X = ÿ (X 0X)

(Prova)

117
Machine Translated by Google
NOVA
IMS Variações de Amostragem dos Estimadores de Inclinação OLS
Em formação
Gestão
Escola

As variâncias de ÿˆ j j = 1, · · · , k são os elementos da diagonal principal de


ÿ1 ÿ1
2ÿ (X0X) , 2ÿ (X0X) (j+1,j+1) ,
e podem ser mostrados na forma

2ÿ
Var ÿˆj | X =
1ÿR
2j SSTj

Onde:

2•Rj denota o R-quadrado de regredir xj em todas as outras


variáveis independentes (xij ÿ x¯j)
2
• SSTj = Pn = nS2 é a variação total da amostra em xj ,
i=1 xj

118
Machine Translated by Google
NOVA
IMS Variações de Amostragem dos Estimadores de Inclinação OLS
Em formação
Gestão
Escola

Podemos concluir que a precisão de ÿˆ pequena)


j é alto (ou seja, Var ÿˆ j | X é
quando:

2•ÿ é baixo;

•S 2
xj
é alto. Por exemplo, na regressão:

salário = ÿ0 + ÿ1educ + · · · + ui

se a maioria das pessoas (na amostra) relatar aproximadamente a


2
mesma educação, Sserá baixo e ÿ2 será estimado muito
educar

imprecisamente. Pouco pode ser aprendido sobre a relação entre salários e


educação se a maioria das pessoas entrevistadas relatar o mesmo nível de
educação.

• n é alto (amostra grande é preferível a amostra pequena);


2
• R educ 2
é baixo (a multicolinearidade aumenta R ).
j

119
Machine Translated by Google
NOVA
IMS
Em formação
Multicolinearidade
Gestão
Escola

• Se rank(X) < k + 1 então ÿˆ não está definido. •


Isso é chamado de multicolinearidade estrita. •

Quando isso acontecer, o software estatístico não poderá


ÿ1
construir (X0X)
• Como o erro é descoberto rapidamente, isso raramente é um problema
para a prática econométrica aplicada.

• A situação mais relevante está perto da multicolinearidade, que muitas vezes é


chamado de multicolinearidade por
ÿ1
brevidade. • Esta é a situação quando o (X0X) é quase singular, quando as
colunas de X são quase linearmente dependentes.
2 que infla
• A multicolinearidade é traduzida em altos valores de R j

Var ÿˆj | X

Consequência: as estimativas dos coeficientes individuais serão imprecisas.

120
Machine Translated by Google
NOVA
IMS
Em formação
Multicolinearidade
Gestão
Escola

Sintomas de multicolinearidade:

• Altas correlações entre variáveis explicativas; • R2 é

relativamente alto, mas as estimativas dos coeficientes tendem a ser


insignificantes (próxima seção) - erros padrão muito altos;

• Coeficientes podem ter sinal “errado” ou magnitudes implausíveis; • Pequenas

mudanças nos dados produzem grandes oscilações no parâmetro


estimativas.

121
Machine Translated by Google
NOVA
IMS
Em formação
Multicolinearidade
Gestão
Escola

E:

• Mais dados são uma solução para a multicolinearidade. Por quê?

• Alto grau de correlação entre certas variáveis independentes pode ser


irrelevante para o quão bem podemos estimar outros parâmetros no
modelo. Por exemplo, em um modelo com k = 4, suponha que xi2 e xi3
estejam fortemente correlacionados entre si. No entanto, nenhum deles
está correlacionado com xi4. Então, a estimação de ÿ4 não sofre
nenhum problema com a correlação entre xi2 e xi3. Se xi2 e xi3 são
apenas variáveis controladas, o “problema de multicolinearidade” não é
sequer um problema. O problema aqui seria se as variáveis controladas
fossem removidas.

• Se uma combinação linear das variáveis mais colineares for significativa,


substitua as variáveis colineares pela combinação linear.

122
Machine Translated by Google
NOVA
IMS
Em formação
Fator de inflação de variação
Gestão
Escola

• Na expressão

2ÿ
Var ÿˆj | X =
1 ÿ R 2j SSTj

• O termo
1
1 ÿ R 2j

é freqüentemente chamado de fator de inflação de variância (VIF),

• Assim, podemos escrever

2ÿ
Var ÿˆj | X = × VIF
SSTj

• Como regra geral (arbitrária), o VIF não deve ser maior que 10

Observação: veja pacote de carro

123
Machine Translated by Google
NOVA
IMS
Em formação
Variações de modelos especificados incorretamente
Gestão
Escola

• Considere novamente o modelo

y = ÿ0 + ÿ1x1 + ÿ2x2 + u

• Suponha que os seguintes modelos sejam estimados por OLS

yˆ = ÿˆ 0 + ÿˆ 1x1 + ÿˆ 2x2 y˜

= ÿ˜ 0 + ÿ˜ 1x1

• As variações são as seguintes:

2ÿ
Var ÿˆ 1 | X =
(1 ÿ R 21 ) SST1
2ÿ
Var ÿ˜ 1 | X = =
SST1

124
Machine Translated by Google
NOVA
IMS
Em formação
Variações de modelos especificados incorretamente
Gestão
Escola

• A conclusão de que ÿˆ 1 é sempre preferível a ÿ˜ 1 não se mantém


quando trazemos variância para a imagem! • Sempre temos Var ÿ˜ 1 |
X ÿ Var ÿˆ 1 | X • Se corr (x1, x2) 6= 0 temos: 1. Se ÿ2 6= 0 ÿ ÿ˜1 é
tendencioso mas ÿˆ1 é imparcial e Var ÿ˜1 | X < Var ÿˆ1 | X ; 2. Se ÿ2 = 0
ÿ ÿ˜1 e ÿˆ1 são ambos imparciais e Var ÿ˜1 | X < Var ÿˆ1 | X

• Se corr (x1, x2) = 0 ÿ ÿ˜ 1 = ÿˆ 1 e Var ÿ˜ 1 | X = Var ÿˆ 1 | X. _

125
Machine Translated by Google
NOVA
IMS
Em formação
Variações de modelos especificados incorretamente
Gestão
Escola

##
## Chamar:

## lm(formula = colGPA ~ hsGPA, dados = gpa1)


##
## Resíduos:
## Mín. 1Q Mediana ## 3T Máx.
-0,85220 -0,26274 -0,04868 0,28902 0,88551
##
## Coeficientes:
## Estimativa padrão Erro t valor Pr(>|t|)

## (Interceptar) 1.41543 0,30694 4,611 8,98e-06 ***


##hsGPA 0,48243 0,08983 5,371 3,21e-07 ***
## ---
' ' 1
## Signif. códigos: 0 '***' 0,001 '**' 0,01 '*' 0,05 '.' 0,1
##

## Erro padrão residual: 0,34 em 139 graus de liberdade


## Múltiplo R-quadrado: 0,1719, R-quadrado ajustado: 0,1659
## Estatística F: 28,85 em 1 e 139 DF, valor p: 3,211e-07

126
Machine Translated by Google
NOVA
IMS
Em formação
Variações de modelos especificados incorretamente
Gestão
Escola

##
## Chamar:

## lm(formula = colGPA ~ hsGPA + ACT, dados = gpa1)


##
## Resíduos:
## Mín. 1T Mediana 3T Máx.
## -0,85442 -0,24666 -0,02614 0,28127 0,85357
##
## Coeficientes:
## Estimativa padrão Erro t valor Pr(>|t|)

## (Interceptar) 1,286328 0,340822 3,774 0,000238 ***


##hsGPA 0,453456 0,095813 4,733 5,42e-06 ***
## ATO 0,009426 0,010777 0,875 0,383297
## ---
' ' 1
## Signif. códigos: 0 '***' 0,001 '**' 0,01 '*' 0,05 '.' 0,1 ##

## Erro padrão residual: 0,3403 em 138 graus de liberdade


## Múltiplo R ao quadrado: 0,1764, R ao quadrado ajustado: 0,1645
## Estatística F: 14,78 em 2 e 138 DF, valor p: 1,526e-06

127
Machine Translated by Google
NOVA
IMS
Em formação
Estimando as variâncias do estimador OLS
Gestão
Escola

• Se quisermos testar hipóteses sobre ÿˆ ou formar confiança


intervalos, então vamos exigir uma estimativa amostral da matriz de
covariância
2 ÿ1
Var ÿˆ | X = ÿ (X 0X)
ÿ1 2
A parte (X0X) é conhecido, mas ÿ não.
• Como
2 2
E você | X = ÿ
2
• Um estimador possível, mas inviável para ÿ é

1
n Xu 2
eu .

É inviável porque ui não é observável.

128
Machine Translated by Google
NOVA
IMS
Em formação
Estimando as variâncias do estimador OLS
Gestão
Escola

• Deixar
1
2 ÿˆ
=
nÿkÿ1 Xu 2 eu .

• Pode-se provar que


2 2
E ÿˆ |X=ÿ
• Portanto
c
2 ÿ1
Var ÿˆ | X = ˆÿ (X 0X) .

129
Machine Translated by Google
NOVA
IMS
Em formação
Estimando as variâncias do estimador OLS
Gestão
Escola

ÿ1
• A raiz quadrada do k + 1º elemento diagonal da matriz (X0X)

1/2
2
(X 0X)
h ÿˆ -1 e (k+1,k+1)

é o erro padrão do estimador ÿˆ k ”o erro padrão que muitas vezes é indicado como

de ÿˆ k ou se ÿˆ k | X (se ÿˆ k ou simplesmente ˆÿÿˆ k ).

130
Machine Translated by Google
NOVA
IMS
Em formação
Estimando as variâncias do estimador OLS
Gestão
Escola

Por exemplo
c

c Var ÿˆ 0 | X covÿˆc 0, ÿˆ 1 | X 2,1 -0,5


Var ÿˆ | X = ÿ c
ÿ =
cov
ÿ c ÿˆ 1, ÿˆ 0 | X Var ÿˆ 1 | X ÿ ÿ0,5 3,2 !

então

se ÿˆ 0 | X = ÿ 2,1 e se ÿˆ 1 | X = ÿ 3,2

131
Machine Translated by Google
NOVA
IMS
Em formação
Estimando as variâncias do estimador OLS
Gestão
Escola

data(gpa1, pacote='wooldridge')

# Determinar o tamanho da amostra e não. de regressores:


n <- nrow(gpa1); k<-2

#extrai y
y <- gpa1$colGPA

# extrai X e adiciona uma coluna de uns


X <- cbind(1, gpa1$hsGPA, gpa1$ACT)

# Exibe as primeiras linhas de X:


cabeça(X)

## [,1] [,2] [,3]


## [1,] ## 1 3,0 21

[2,] ## [3,] 1 3,2 24

## [4,] ## 1 3,6 26

[5,] ## [6,] 1 3,5 27


1 3,9 28
1 3,4 25

132
Machine Translated by Google
NOVA
IMS
Em formação
Estimando as variâncias do estimador OLS
Gestão
Escola

# Estimativas de parâmetros:

( bhat <- solve( t(X)%*%X ) %*% t(X)%*%y )

## [,1]
## [1,] 1,286327767 ##
[2,] 0,453455885 ## [3,]
0,009426012

# Resíduos, variância estimada de u e SER: uhat <- y - X %*%


bhat sigsqhat <- [Link]( t(uhat) %*% uhat / (nk-1) )

( SER <- sqrt(sigsqhat) )

## [1] 0,3403158

# Variação estimada dos estimadores de parâmetros e SE:


Vbetahat <- sigsqhat * solve( t(X)%*%X ) ( se <-
sqrt( diag(Vbetahat) ) )

## [1] 0,34082212 0,09581292 0,01077719

133
Machine Translated by Google
NOVA
IMS
Em formação
Teorema de Gauss-Markov
Gestão
Escola

Teorema 5

Teorema de Gauss-Markov
Sob as premissas MLR1 - MLR5, os estimadores OLS são os melhores
estimadores lineares imparciais (AZUL) dos coeficientes de regressão, ou seja,

Var ÿˆj | X ÿ Var ÿej | X

onde ÿej é qualquer estimador não tendencioso linear em y.

No sentido matricial

Var ÿˆ | X ÿ Var ÿe | X

significa que Var ÿe | X ÿ Var ÿˆ | X é uma matriz psd.

134
Machine Translated by Google
NOVA
IMS
Em formação
Inferência Estatística sob Normalidade
Gestão
Escola

Inferência estatística no modelo de regressão:

• Testes de hipóteses sobre parâmetros populacionais


• Construção de intervalos de confiança

Distribuições de amostragem dos estimadores OLS:

• Os estimadores OLS são variáveis aleatórias

• Já conhecemos seus valores esperados e suas variâncias • No entanto,

para testes de hipóteses, precisamos conhecer sua distribuição • Para derivar sua

distribuição, precisamos de suposições adicionais

• Suposição sobre distribuição de erros: distribuição normal

135
Machine Translated by Google
NOVA
IMS
Em formação
Inferência Estatística sob Normalidade
Gestão
Escola

Suposição MLR6: Normalidade


Nós temos:

ui | X ÿ N(0, ÿ2 )

Equivalentemente,

você | X ÿ N(0, ÿ2 I)

136
Machine Translated by Google
NOVA
IMS
Em formação
Discussão da suposição de normalidade
Gestão
Escola

• O termo de erro é a soma de “muitos” fatores não observados diferentes •


Somas de fatores independentes são normalmente distribuídos (CLT) •
Problemas:
• Quantos fatores diferentes? Número grande o suficiente?
• Possivelmente distribuições muito heterogêneas de fatores individuais
• Quão independentes são os diferentes fatores?
• A normalidade do termo de erro é uma questão empírica
• Pelo menos a distribuição de erros deve estar "próxima" do normal

• Em muitos casos, a normalidade é questionável ou impossível por definição •


Em alguns casos, a normalidade pode ser alcançada através de transformações de
a variável dependente
• Sob normalidade, OLS é BUE (consulte MLE
posteriormente) • Para fins de inferência estatística, a suposição de normalidade
pode ser substituído por um grande tamanho de amostra

137
Machine Translated by Google
NOVA
IMS
Em formação
Inferência Estatística sob Normalidade
Gestão
Escola

Uma maneira sucinta de resumir as suposições populacionais do CLM é

0
e|XÿNx iÿ, ÿ2 (56)

138
Machine Translated by Google
NOVA
IMS
Em formação
Terminologia
Gestão
Escola

Observação

• Suposições MLR1-5 =ÿ Suposições de Gauss-Markov


• Suposições MLR1-6 =ÿ Suposições Clássicas ou Linear Clássica
Suposições do Modelo (Suposições CLM)

139
Machine Translated by Google
NOVA
IMS
Em formação
Inferência Estatística sob Normalidade
Gestão
Escola

Teorema 6

Distribuição de amostragem normal do OLS


Sob as suposições MLR1-6 temos:

ÿˆj |Var
X ).ÿˆ j | X ÿ N ÿj ,

Portanto,
z= ÿj ÿ ÿj _
ÿ N (0, 1)
Var ÿˆj | X
r

Onde 2

Var ÿˆj | X = hÿ (X 0X) -1 e (j+1,j+1)

140
Machine Translated by Google
NOVA
IMS
Em formação
Inferência Estatística sob Normalidade
Gestão
Escola

Teorema 7
distribuição t para estimadores padronizados

Sob as suposições MLR1-6 temos:

t= ÿj ÿ ÿj _
c
ÿ t(nÿkÿ1))
Var ÿj | _ X
r

Onde
c
2
Var ÿˆ (X 0X) -1 e (j+1,j+1)
j | X = h ÿˆ
e
2 ÿˆ SSR
=
nÿkÿ1

141
Machine Translated by Google
NOVA
IMS
Em formação
O teste t : configuração geral
Gestão
Escola

• Suponha que tenhamos uma hipótese sobre o ÿj

H0 : ÿj = a

onde a é um valor específico, digamos a = 0, e que esta hipótese é


testada contra a hipótese alternativa

H1 : ÿj6 = a.

• Duas possibilidades:
• Se |tobs | > tÿ/2 =ÿ rejeitar H0 no nível ÿ × 100%
• Se |tobs | ÿ tÿ/2 =ÿ não rejeite H0 onde

ÿˆ j ÿ
tobs =
a se ÿˆ
j

e tÿ/2 : P t > tÿ/2 = ÿ/2


142
Machine Translated by Google
NOVA
IMS
Em formação
O teste t : configuração geral
Gestão
Escola

• Sob a hipótese nula temos

t= ÿˆ j ÿ a
ÿ t(nÿkÿ1)
se ÿˆ j

• Se observarmos |tobs | > tÿ/2 e o H0 é verdadeiro, então uma baixa probabilidade


ocorreu o evento.

• Tomamos |tobs | > tÿ/2 como prova contra o nulo e o


decisão deve ser rejeitar H0.

Outros casos:

• H1 : ÿj > a: se tobs > tÿ =ÿ rejeitar o nulo no nível ÿ × 100%;


caso contrário, não rejeite.

• H1 : ÿj < a: se tobs < ÿtÿ =ÿ rejeitar o nulo no nível ÿ × 100%;


caso contrário, não rejeite.

143
Machine Translated by Google
NOVA
IMS
Em formação
O teste t : configuração geral
Gestão
Escola

Figura 7: Regra de rejeição de 5% para a alternativa H1 : ÿj > 0 com 28 df

144
Machine Translated by Google
NOVA
IMS
Em formação
O teste t : configuração geral
Gestão
Escola

Figura 8: Regra de rejeição de 5% para a alternativa H1 : ÿj < 0 com 18 df

145
Machine Translated by Google
NOVA
IMS
Em formação
O teste t : configuração geral
Gestão
Escola

Figura 9: Regra de rejeição de 5% para a alternativa H1 : ÿj 6= 0 com 25 df

146
Machine Translated by Google
NOVA
IMS
Em formação
O teste t : o valor-p
Gestão
Escola

• valor p é a probabilidade de obter uma estatística de teste pelo menos como


extremo como o que foi realmente observado, assumindo que a
hipótese nula é verdadeira. • Calcule o valor p para H0 : ÿj = a: • H1 :
ÿj 6= a =ÿ valor p = 2P (t > |tobs | | H0 é verdadeiro). • H1 : ÿj > a =ÿ valor
p = P (t > tobs | H0 é verdadeiro). • H1 : ÿj < a =ÿ valor p = P (t <
tobs | H0 é verdadeiro). • Por exemplo, um valor de p = 0,02 mostra
pouca evidência apoiando H : 0 • No nível de 5% você deve rejeitar
o nulo. • Regra de rejeição:

valor p ÿ ÿ ÿ não rejeitar H0 no nível ÿ × 100% valor p < ÿ ÿ rejeitar

H0 no nível ÿ × 100%

147
Machine Translated by Google
NOVA
IMS
Em formação
O teste t : o valor-p
Gestão
Escola

Figura 10: valor-p contra uma alternativa bilateral, quando tobs = 1,85 e
df = 40.
148
Machine Translated by Google
NOVA
IMS
Em formação
O teste t : caso padrão
Gestão
Escola

• Muitas vezes queremos testar se existe alguma relação entre xj (ou x•j) e o
valor esperado de y sem impor um sinal sobre o efeito parcial a priori

• Assim, na maioria das aplicações, nosso principal interesse está em testar


a hipótese nula
H0 : ÿj = 0
• ÿj mede o efeito parcial de xj no valor esperado de y, após controlar todas as
outras variáveis independentes

• ÿj = 0 significa que, uma vez consideradas as outras variáveis, xj não tem


efeito sobre o valor esperado de y.

149
Machine Translated by Google
NOVA
IMS
Em formação
O teste t : caso padrão
Gestão
Escola

• Por exemplo, no modelo

log (salário) = ÿ0 + ÿ1educ + ÿ2exper + ÿ3tenure + u

• O H0 nulo : ÿ2 = 0 significa que, uma vez contabilizados a educação e a posse, o


número de anos na força de trabalho (exper) não tem efeito sobre o salário por
hora. Se for verdade, isso implica que o histórico de trabalho de uma pessoa antes do
emprego atual não afeta o salário.

• Se ÿ2 > 0, então a experiência de trabalho anterior contribui para a produtividade e,


portanto, para o salário.

150
Machine Translated by Google
NOVA
IMS
Em formação
O teste t : caso padrão
Gestão
Escola

data(wage1, pacote='wooldridge')
# Regressão OLS:
resumo( lm(log(salário) ~ educ+exper+tenure, data=wage1) )

##
## Chamar:

## lm(formula = log(salário) ~ educ + exper + posse, data = salário1)


##
## Resíduos:
## Mín. 1T Mediana 3T Máx.
## -2,05802 -0,29645 -0,03265 0,28788 1,42809
##
## Coeficientes:
## Estimativa padrão Erro t valor Pr(>|t|)

## (Interceptar) 0,284360 0,104190 2,729 0,00656 **


## educação 0,092029 0,007330 12,555 < 2e-16 ***

## especialista 0,004121 0,001723 2,391 0,01714 *


## posse 0,022067 0,003094 7,133 3,29e-12 ***
## ---
' ' 1
## Signif. códigos: 0 '***' 0,001 '**' 0,01 '*' 0,05 '.' 0,1
##

## Erro padrão residual: 0,4409 em 522 graus de liberdade


## Múltiplo R-quadrado: 0,316, R-quadrado ajustado: 0,3121
## Estatística F: 80,39 em 3 e 522 DF, valor p: < 2,2e-16

151
Machine Translated by Google
NOVA
IMS
Em formação
O teste t : caso padrão
Gestão
Escola

# CV para alfa=5% e 1% usando a distribuição t #com 522 df: alfa


<- c(0,05, 0,01) qt(1-alfa, 522)

## [1] 1,647778 2,333513

# Valores críticos para alfa=5% e 1% usando a aproximação


#normal: qnorm(1-alpha)

## [1] 1.644854 2.326348

152
Machine Translated by Google
NOVA
IMS
Em formação
O teste t : comentários adicionais
Gestão
Escola

Redação correta ao relatar o resultado de um teste envolvendo H0 : ÿj = a vs


H1 : ÿj 6= a

• Quando o nulo é rejeitado, dizemos que ÿˆ j (não ÿj) é significativamente


diferente de a no nível ÿ × 100%.
• Quando o nulo não é rejeitado, dizemos que dizemos que ÿˆ j (não ÿj)
não é significativamente diferente de a no nível ÿ × 100%.

Redação correta ao relatar o resultado de um teste envolvendo H0 : ÿj = 0 vs


H1 : ÿj 6= 0

• Quando o nulo é rejeitado dizemos que ÿˆ j (não ÿj) é significativamente


diferente de zero ao nível ÿ × 100%, ou o regressor (em ÿj) é relevante
para explicar E [y | X]. • Quando o nulo não é rejeitado dizemos que
ÿˆ j (não ÿj) não é significativamente diferente deouzero ao nível ÿ(em
o regressor × 100%,
ÿj)
não é relevante para explicar E [y | X].

153
Machine Translated by Google
NOVA
IMS
Em formação
O teste t : comentários adicionais
Gestão
Escola

Mais Observações:

• A rejeição do nulo não é prova de que o nulo é falso. Por quê?


• A aceitação do nulo não é prova de que o nulo é verdadeiro. Por quê?
Preferimos usar a linguagem que falhamos para rejeitar H0 no nível
ÿ100% em vez de H0 ser aceito no nível ÿ100%. • Em um teste do tipo

H0 : ÿj = 0, se se(ÿˆ j) for grande (ÿˆ j é um estimador


impreciso) é mais difícil rejeitar o nulo. A amostra contém pouca
informação sobre o verdadeiro valor de ÿj . • Em um teste do tipo H0 : ÿj
= 0 vs H1 : ÿj < 0 (ou H1 : ÿj > 0), valores de p
deve ser dividido por dois.

154
Machine Translated by Google
NOVA
IMS
Em formação
Significado Estatístico Versus Econômico
Gestão
Escola

• A significância estatística de uma variável é determinada pelo tamanho dos tobs =


ÿˆ j/SE(ÿˆ j)

• a significância econômica de uma variável está relacionada ao tamanho e sinal


de ÿˆj .

• Suponha que em uma atividade empresarial tenhamos:

log(\salário) = 0,1 + 0,01 feminino + · · · n = 600


(0,001)

H0 : ÿ1 = 0 vs H1 : ÿ1 6= 0. Temos

tobs = 10,

valor p ÿ 0

Discutir significância estatística versus significância econômica.

155
Machine Translated by Google
NOVA
IMS
Em formação
Intervalos de confiança
Gestão
Escola

• Sob as premissas do CLM, podemos facilmente construir uma confiança


intervalo (CI) para o parâmetro populacional ÿj
• Os intervalos de confiança também são chamados de estimativas de intervalo
porque fornecem uma faixa de valores prováveis para o parâmetro populacional,
e não apenas uma estimativa pontual. • A manipulação simples do resultado no

Teorema 7 implica que

P ÿˆ j ÿ tÿ/2se ÿˆ j ÿ ÿj ÿ ÿˆ j + tÿ/2seÿˆ j = 1 ÿ ÿ.

Por isso,

ÿj ÿ h ÿˆj ± tÿ/2 × se ÿˆj i

com (1 ÿ ÿ) 100% de confiança


156
Machine Translated by Google
NOVA
IMS
Em formação
Intervalos de confiança
Gestão
Escola

• Interpretação do intervalo de confiança •


Os limites do intervalo são aleatórios (ou uma realização de rv) •
Em amostras repetidas, o intervalo que é construído acima
forma cobrirá o coeficiente de regressão populacional em (1 ÿ ÿ)
100% dos casos.

Relação entre intervalos de confiança e testes de hipóteses:

a ÿ/ IC ÿ Rejeitar H0 : ÿj = a em favor de H1 : ÿj 6= a

157
Machine Translated by Google
NOVA
IMS
Em formação
Intervalos de confiança
Gestão
Escola

158
Machine Translated by Google
NOVA
IMS
Em formação
Testando uma combinação linear de parâmetros
Gestão
Escola

• Suponha que queremos testar uma única hipótese envolvendo mais de um


do ÿj
• Para ilustrar a abordagem geral, consideraremos um modelo simples
comparar os retornos da educação em faculdades juniores e faculdades de quatro
anos; por simplicidade, nos referimos a estas últimas como “universidades”
• Considere o modelo

log (salário) = ÿ0 + ÿ1jc + ÿ2univ + ÿ3exper + u

Onde:
• jc = número de anos frequentando uma faculdade de dois
anos; • univ = número de anos em uma faculdade de quatro
anos; • exper = meses na força de trabalho.

159
Machine Translated by Google
NOVA
IMS
Em formação
Testando uma combinação linear de parâmetros
Gestão
Escola

• A hipótese de interesse é se um ano de faculdade vale um ano de


universidade. • Sob H0, mais um ano em uma faculdade e mais um ano
em uma universidade levam ao mesmo aumento percentual ceteris paribus
no salário. Do seguinte modo:

H0 : ÿ1 = ÿ2 vs. H1 : ÿ1 < ÿ2

• Não podemos simplesmente usar as estatísticas t individuais para ÿˆ 1 e ÿˆ 2 para testar


H0.
• No entanto, para construir uma estatística para fazer o teste, reescrevemos
o nulo e alternativo

H0 : ÿ1 ÿ ÿ2 = 0 vs. H1 : ÿ1 ÿ ÿ2 < 0
sob o nulo temos

ÿˆ 1 ÿ ÿˆ
t=
2 se ÿˆ 1 ÿ ÿˆ 2
160
Machine Translated by Google
NOVA
IMS
Em formação
Testando uma combinação linear de parâmetros
Gestão
Escola

data(twoyear, package='wooldridge') reg


<- lm(lwage~jc+univ+exper, data=twoyear)
summary(reg)

161
Machine Translated by Google
NOVA
IMS
Em formação
Testando uma combinação linear de parâmetros
Gestão
Escola

##
## Chamar:

## lm(formula = salário ~ jc + univ + exper, data = twoyear)


##
## Resíduos:
## Mín. 1T Mediana 3T Máx.
## -2,10362 -0,28132 0,00551 0,28518 1,78167
##
## Coeficientes:
## Estimativa padrão Erro t valor Pr(>|t|)

## (Interceptar) 1.4723256 0.0210602 69.910 <2e-16 ***


## j 0,0666967 0,0068288 9,767 <2e-16 ***
## univ 0,0768762 0,0023087 33,298 <2e-16 ***

## especialista 0,0049442 0,0001575 31,397 <2e-16 ***


## ---

## Signif. códigos: 0 '***' 0,001 '**' 0,01 '*' 0,05 '.' 0,1' '1
##
162
## Erro padrão residual: 0,4301 em 6759 graus de liberdade
Machine Translated by Google
NOVA
IMS
Em formação
Testando uma combinação linear de parâmetros
Gestão
Escola

Problema:

c c

se ÿˆ 1 ÿ ÿˆ 2 ÿˆ 1 + Var ÿˆ 2 ÿ 2 × covÿˆc 1, ÿˆ 2
= r Var
6= se ÿˆ 1 ÿ se ÿˆ 2 !

Três possibilidades:

1. Calcular cov
c ÿˆ 1, ÿˆ 2
2. Reparametrize o modelo
3. Use matrizes

163
Machine Translated by Google
NOVA
IMS
Em formação
Testando uma combinação linear de parâmetros
Gestão
Escola

Abordagem 1: Calcular ccov


ÿˆ 1, ÿˆ 2

• A matriz de variância-covariância das estimativas é:


c

Var ÿ0 cov
c ÿˆ 0, ÿˆ 1 · · · covc ÿˆ 0, ÿˆ k
ÿ c
ÿ
Var ÿˆ 1 cov
c ÿˆ 1, ÿˆ k
.. .
. .
.
c

Var ÿk _
ÿÿÿÿÿÿÿ ÿÿÿÿÿÿÿ

• Só precisa pegar o elemento (2, 3)


Observação: em R:vcov()

164
Machine Translated by Google
NOVA
IMS
Em formação
Testando uma combinação linear de parâmetros
Gestão
Escola

vcov(reg)

## (Interceptar) jc univ especialista

## (Interceptar) 4.435337e-04 -1.741432e-05 -1.573472e-05 -3.104756e-06


## j -1.741432e-05 4.663243e-05 1.927929e-06 -1.718296e-08
## univ -1.573472e-05 1.927929e-06 5.330230e-06 3.933491e-08
## especialista -3.104756e-06 -1.718296e-08 3.933491e-08 2.479792e-08

sqrt(vcov(reg)[2,2]+vcov(reg)[3,3]-2*vcov(reg)[3,2])

## [1] 0,006935907

165
Machine Translated by Google
NOVA
IMS
Em formação
Testando uma combinação linear de parâmetros
Gestão
Escola

• Calcular tobs como

0,0667 - 0,0769
tobs =
ÿ 0,00682 + 0,00232 ÿ 2 × 1,927929 × 10ÿ6
ÿ0,01018
=
0,006936
= -1,468

• A região de rejeição é:

W = {t : tobs < -1,645}

• O valor-p é cerca de 0,070, não rejeitamos o valor nulo ao nível de 5%.


Não há evidência contra ÿ1 = ÿ2 no nível de 5%

166
Machine Translated by Google
NOVA
IMS
Em formação
Testando uma combinação linear de parâmetros
Gestão
Escola

Abordagem 2: Reparametrize o modelo

• Defina um novo parâmetro como a diferença entre ÿ1 e ÿ2: ÿ = ÿ1 ÿ


ÿ2.
• Então, queremos testar

H0 : ÿ = 0 vs. H1 : ÿ < 0 (57)

• Observando que ÿ1 = ÿ + ÿ2 temos

log (salário) = ÿ0 + ÿjc + ÿ2 (jc + univ) + ÿ3exper + u (58)

• Estime o modelo (58) e teste diretamente (57) usando


ˆ
ÿ
t= ˆ ÿ t(nÿkÿ1)
se ÿ

167
Machine Translated by Google
NOVA
IMS
Em formação
Testando uma combinação linear de parâmetros
Gestão
Escola

data(twoyear, package='wooldridge')
regreparam <- lm(lwage~jc+I(jc+univ)+exper, data=twoyear)
summary(regreparam)

168
Machine Translated by Google
NOVA
IMS
Em formação
Testando uma combinação linear de parâmetros
Gestão
Escola

##
## Chamar:

## lm(formula = salário ~ jc + I(jc + univ) + exper, data = twoyear)


##
## Resíduos:
## Mín. 1T Mediana 3T Máx.
## -2,10362 -0,28132 0,00551 0,28518 1,78167
##
## Coeficientes:
## Estimativa padrão Erro t valor Pr(>|t|)

## (Interceptar) 1.4723256 0.0210602 69.910 <2e-16 ***


## jc -0,0101795 0,0069359 -1,468 0,142

## I(jc + univ) 0,0768762 0,0023087 33,298 <2e-16 ***


## especialista 0,0049442 0,0001575 31,397 <2e-16 ***
## ---

## Signif. códigos: 0 '***' 0,001 '**' 0,01 '*' 0,05 '.' 0,1' '1
##
169
## Erro padrão residual: 0,4301 em 6759 graus de liberdade
Machine Translated by Google
NOVA
IMS
Em formação
Testando uma combinação linear de parâmetros
Gestão
Escola

Abordagem 3: Use matrizes Temos

Rÿˆ ÿ Rÿ
t= ÿ t(nÿkÿ1)
ÿ1
ÿˆ q R (X0X) R0

onde R é ak + vetor linha 1 dimensional

Nesse caso
R = 0 1 ÿ1 0

170
Machine Translated by Google
NOVA
IMS
Em formação
Testando uma combinação linear de parâmetros
Gestão
Escola

Nós temos

2,40 × 10ÿ3 ÿ9,41 × 10ÿ5 ÿ8,50 × 10ÿ5 ÿ1,68 × 10ÿ5 ÿ9,29 × 10ÿ8
ÿ1 ÿ 2,52 × 10ÿ4 1,04 × 10ÿ5 ÿ8,50 × 10ÿ2,13
5 1,04
× 10ÿ7
× 10ÿ5
ÿ1,68
2,88
ÿ9,41
××10ÿ5
10ÿ5
× 10ÿ5 ÿ
X0X =
ÿ9,29 × 10ÿ8 2,13 × 10ÿ7 1,34 × 10ÿ7
ÿÿÿ ÿÿÿ

além disso

ÿ1
ÿˆ q R (X0X) R0 = 0,430138 × 0,016124827 = 0,006936

Rÿ = Rÿ = ÿ1 ÿ ÿ2 = 0 (sob o nulo)

Rÿˆ = ÿ0,01018

Portanto, novamente,
ÿ0,01018 =
tobs = 0,006936 ÿ1,468

171
Machine Translated by Google
NOVA
IMS
Em formação
Testando uma combinação linear de parâmetros
Gestão
Escola

data(twoyear, package='wooldridge') reg <-


lm(lwage~jc+univ+exper, data=twoyear)
X=[Link](cbind(rep(1,nrow(twoyear)),twoyear$jc, twoyear$univ,
twoyear$exper)) xtxmenos1=solve(t(X)%*%X)

xtxmenos1
sigma=(resumo(reg))$sigma
sigma
R=t(c(0,1,-1,0))
R
betahat=c(reg$coeficientes) betahat

Rb=R%*%betahat
Rb
denominador=sigma*sqrt(R%*%xtxmenos1%*%t(R))
denominador
t=Rb/denominador
t

172
Machine Translated by Google
NOVA
IMS
Em formação
Testando uma combinação linear de parâmetros
Gestão
Escola

## [,1] [,2] [,3] [,4]


## [1,] 2.397233e-03 -9.412177e-05 -8.504379e-05 -1.678074e-05
## [2,] -9.412177e-05 2.520413e-04 1.042017e-05 -9.287133e-08
## [3,] -8.504379e-05 1.042017e-05 2.880909e-05 2.125993e-07
## [4,] -1.678074e-05 -9.287133e-08 2.125993e-07 1.340290e-07
## [1] 0,4301384
## [,1] [,2] [,3] [,4]
## [1,] 0 1 -1 0
## (Interceptar) jc especialista univ
## 1.472325579 0.066696719 0.076876249 0.004944224
## [,1]
## [1,] -0,01017953
## [,1]
## [1,] 0,006935907
## [,1]
## [1,] -1.467657

173
Machine Translated by Google
NOVA
IMS
Em formação
Testando várias restrições lineares: o teste F
Gestão
Escola

• Consideremos o modelo (modelo irrestrito):

y = ÿ0 + ÿ1x1 + · · · + ÿk xk + u

• Até agora, cobrimos apenas hipóteses envolvendo um único


restrição.

• Frequentemente, desejamos testar várias hipóteses sobre o


parâmetros de inclinação ÿ1, · ·
· , ÿk • Começamos com o caso principal de testar se um conjunto de
variáveis independentes não tem efeito parcial sobre uma variável
dependente. • Por simplicidade de notação, suponha que seja a última q variáveis
na lista de variáveis independentes • Temos uma hipótese nula conjunta sobre
ÿ

H0 : ÿkÿq+1 = ÿkÿq+2 = · · · = ÿk = 0 (59)

• O que coloca restrições de exclusão q no modelo.


174
Machine Translated by Google
NOVA
IMS
Em formação
Testando várias restrições lineares: o teste F
Gestão
Escola

• Quando impomos as restrições sob H0, ficamos com a


modelo restrito:

y = ÿ0 + ÿ1x1 + · · · + ÿkÿqxkÿq + u

• Assim, o modelo restrito (R) é um caso especial do irrestrito


um (UR).
• Depois de estimar os dois modelos (UR e R), o que precisamos decidir )
2
é se o aumento no SSR (ou no modelo R irrestrito ao passar do
para o modelo restrito é grande o suficiente para justificar a rejeição
do nulo (59).
• Como em todos os testes, a resposta depende do nível de significância de
o teste

175
Machine Translated by Google
NOVA
IMS
Em formação
Testando várias restrições lineares: o teste F
Gestão
Escola

• Formalmente temos

F= ( SSRR ÿ SSRUR) /q
SSRUR/ (n ÿ k ÿ 1)
R2 ÿ R 2 /q
= UR R
ÿ F(q,nÿkÿ1)
(1 ÿ R 2UR) / (n ÿ k ÿ 1)

Onde:

• q = dfH0 ÿ dfH1 = dfR ÿ dfUR (número de restrições sob o nulo) • n ÿ k ÿ 1


= dfUR (df do modelo irrestrito)

176
Machine Translated by Google
NOVA
IMS
Em formação
Testando várias restrições lineares: o teste F
Gestão
Escola

• Seja Fobs as estatísticas de teste observadas.


• Nós temos:

• rejeitar H0 se Fobs > Fÿ (ou p-valor <


ÿ) • não rejeitar H0 se Fobs ÿ Fÿ (ou p-valor ÿ ÿ)
• O raciocínio é o seguinte. Sob a hipótese nula temos

F ÿ F(k,nÿkÿ1)

• Se observarmos F > Fÿ e H0 for verdadeiro, então ocorreu um evento de baixa


probabilidade.

Observação: o valor p pode ser calculado como

P (F > Fobs | H0 é verdadeiro)

177
Machine Translated by Google
NOVA
IMS
Em formação
Testando várias restrições lineares: o teste F
Gestão
Escola

Figura 11: valor crítico de 5% e região de rejeição em uma distribuição F3,60 .

178
Machine Translated by Google
NOVA
IMS
Em formação
Testando várias restrições lineares: o teste F
Gestão
Escola

data(mlb1, pacote='wooldridge')
# Regressão OLS irrestrita: [Link] <-
lm(log(salary) ~ years+gamesyr+bavg+hrunsyr+rbisyr, data=mlb1)
# Regressão OLS restrita: res.r <-
lm(log(salary) ~ years+gamesyr, data=mlb1)
# R2:
([Link] <- sumário([Link])$[Link] )

## [1] 0,6278028

( r2.r <- resumo(res.r)$[Link] )

## [1] 0,5970716

# Estatística F:
(F <- ([Link]-r2.r) / ([Link]) * 347/3 )

## [1] 9.550254

# valor p = 1-cdf da distribuição F apropriada: 1-pf(F, 3.347)

## [1] 4.473708e-06

179
Machine Translated by Google
NOVA
IMS
Em formação
Testando várias restrições lineares: o teste F
Gestão
Escola

data(mlb1, pacote='wooldridge')

# Regressão OLS irrestrita:


[Link] <-
lm(log(salário) ~ anos+gamesyr+bavg+hrunsyr+rbisyr, data=mlb1)
# Carrega o pacote "car" (que deve ser instalado no computador) library(car)

## Carregando o pacote necessário: carData

180
Machine Translated by Google
NOVA
IMS
Em formação
Testando várias restrições lineares: o teste F
Gestão
Escola

#teste F

myH0 <- c("bavg","hrunsyr","rbisyr")


linearHypothesis([Link], myH0)

## Teste de hipótese linear


##

## Hipótese:
## bavg = 0
## hrunsyr = 0
## rbisyr = 0
##
## Modelo 1: modelo restrito

## Modelo 2: log(salário) ~ anos + gamesyr + bavg + hrunsyr + rbisyr


##
## [Link] RSS Df Soma de Sq 350 F Pr(>F)
## 1 198,31
## 2 347 183,19 3 15.125 9.5503 4.474e-06 ***
## ---
' ' 1
## Signif. códigos: 0 '***' 0,001 '**' 0,01 '*' 0,05 '.' 0,1

181
Machine Translated by Google
NOVA
IMS
Em formação
Testando várias restrições lineares: o teste F
Gestão
Escola

• Quando o nulo é
H0 : ÿ1 = ÿ2 = · · · = ÿk = 0

• Estamos testando a significância geral de uma regressão


• O modelo restrito é
y = ÿ0 + u

• A estatística F torna-se

SSE/k
F=
SSR/ (n ÿ k ÿ 1)

= R 2/k
ÿ F(k,nÿkÿ1)
(1 ÿ R2) / (n ÿ k ÿ 1)

182
Machine Translated by Google
NOVA
IMS
Em formação
O teste t versus o teste F
Gestão
Escola

• Os testes t sucessivos sequenciais e os testes F são equivalentes?

• O que acontece se o teste t e o teste F sugerirem conclusões diferentes?

183

Você também pode gostar