ISEG, Universidade de Lisboa Econometria
Formulário de Econometria — 2a edição
Artur Silva Lopes, 24/11/20171
Revisão — Estatística
Var(X) = E(X − µ)2 = E(X 2 ) − µ2 ; Cov(X, Y ) = E[(X − µX )(Y − µY )] = E(X Y ) − E(X)E(Y );
ρX,Y = corr(X, Y ) = Cov(X,Y )
σX σY .
E(Y ) = E[E(Y | X)]; E[g(X)| x] = g(x); se X e Y são independentes, então E(Y | X) = E(Y );
se E(Y | X) = E(Y ), então Cov(Y, X) = 0 (e ρX,Y = 0).
Modelo de regressão linear para amostras aleatórias de dados seccionais
yi = β 0 + β 1 xi1 + . . . + β k xik + ui ⇔ yi = xi β + ui , i = 1, 2, . . . , n ⇔ y = Xβ + u.
= (X′ X)−1 X′ y, u 2
OLS: β 2 = u
i = yi − yi , σ i /(n − k − 1), R2 = SSE SSR
SST = 1 − SST .
2
Var( β̂| X) = σ̂2 (X′ X)−1 , Var( β̂ j | X) = SSTjσ̂(1−R2 ) , j = 1, 2, . . . , k, com SSTj = (xij − x̄j )2 e
j
Rj2 o R2 da regressão de xj sobre os restantes regressores.
j − β 0 )/se(β a
j ) ∼ t(n−k−1) ou ∼
H0 : β j = β 0j , t = (β j N (0, 1) sob H0 .
2
R n−k−1
H0 : β 1 = β 2 = . . . = β k = 0, F = 1−R2 × k ∼ F(k,n−k−1) sob H0 .
R2 −R2
Quaisquer q restrições (com y inalterado): F = SSRSSR
R −SSRUR
UR
× n−k−1
q = 1−R
UR
2
R
× n−k−1
q ∼
UR
F(q,n−k−1) sob H0 , com SSRU R a soma dos quadrados dos resíduos do modelo sem restrições e SSRR
a soma dos quadrados dos resíduos do modelo com as restrições.
Inferência robusta à heteroscedasticidade:
a) matriz de White: Var∗ (β| X) = (X′ X)−1 û2 x′ xi (X′ X)−1 ;
i i
j − β 0 )/se∗ (β a
j ) ∼ j ) =
b) estatísticas−t robustas: H0 : β j = β 0j , t = (β j N (0, 1) sob H0 ; se∗ (β
Var∗
(β̂ | X). EViews: . . . estimate ... OPTIONS: coefficient covariance matrix -> White.
j
a
Estatísticas de teste (LM) de heteroscedasticidade: LM = n Rû2 2 ∼ χ2(p) sob H0 ; p = número de
regressores (excluindo o termo independente) da regressão auxiliar de teste.
Variáveis dummy
Afectando apenas o termo independente. Exemplo: wage = β 0 + δ 0 f emale + β 1 educ + erro,
para não cair na armadilha das variáveis artificiais, violando a hipótese de não colinearidade perfeita.
δ 0 = E(wage| female = 1, educ) − E(wage| female = 0, educ).
Se a característica qualitativa faz uma partição em g grupos distintos, introduzem-se no modelo
apenas g − 1 variáveis dummy, mantendo o termo independente.
Modelo com log(y): % ∆ exacta = 100[exp(β 1 ) − 1], com β
1 o coeficiente da dummy.
Afectando também o coeficiente de declive. Exemplo: wage = β 0 + δ 0 female + β 1 educ +
δ 1 female × educ + erro.
Teste de igualdade de equações de regressão. A) Com D a representar a variável dummy, H0 :
δ0 = δ1 = . . . = δk = 0 em y = β 0 + δ 0 D + β 1 x1 + δ 1 D x1 + . . . + β k xk + δ k D xk + erro.
B) H0 : α0 = β 0 , α1 = β 1 , . . . , αk = β k em y = α0 + α1 x1 + . . . + αk xk + u para grupo 1 e
1 Elaborado com base em Wooldridge, J. M. (2009, 2016), Introductory Econometrics, 4th and 6th eds., South-Western,
Cengage Learning, e com os comentários e sugestões de Luizete Reis e Ana Pereira, que não têm, no entanto, qualquer
responsabilidade nos erros e omissões que possam subsistir
1
ISEG, Universidade de Lisboa Econometria
[SSR −(SSR +SSR )]/(k+1)
y = β 0 + β 1 x1 + . . . + β k xk + u para grupo 2. FCHOW = (SSR
p 1 2
1 +SSR2 )/[n−2(k+1)]
∼ F(k+1,n−2(k+1))
sob H0 , com SSRp a SSR obtida do modelo estimado com o conjunto de todas as observações. Se não
interessar testar a igualdade dos termos independentes, a SSRp é calculada com base num modelo que
inclui uma dummy com efeito sobre esse coeficiente.
Modelos para variáveis dependentes binárias
y = 0 ou 1. y| x ∼ B(1, p(x)). Revisão: se X ∼ B(1, θ), então E(X) = θ e Var(X) = θ(1 − θ).
f (x| θ) = θx (1 − θ)1−x , x = 0, 1.
Modelo linear de probabilidades: E(y| x) = p(x) = P (y = 1| x) = β 0 + β 1 x1 + . . . + β k xk . Logo,
β j = ∆P (y = 1|x)/∆xj . Deficiências: i) eventuais yi < 0 ou yi > 1; ii) linearidade (efeitos parciais
constantes); iii) heteroscedasticidade.
Previsão dos yi ’s: ỹi = 1, se yi ≥ 0.5, e ỹi = 0, se yi < 0.5.
Modelos Logit e Probit: P (y = 1| x) = G(β 0 + β 1 x1 + . . . + β k xk ) = G(x β), com 0 <
exp(z) z
G(z) < 1. Logit: G(z) = Λ(z) = 1+exp(z) ; EViews: @clogistic(.). Probit: G(z) = Φ(z) = ∞ φ(v)dv,
2
φ(z) = √12π exp − z2 ; EViews: @cnorm(.).
Efeitos parciais das variáveis. A. Para pequenas variações: A.1 Se xj é uma variável aproxi-
madamente contínua, pode fazer-se ∂p(x) ∂xj = g(x β) β j = g(β 0 + β 1 x1 + . . . + β k xk ) β j , onde g(z) =
d G(z)
d z ; g(z) > 0, ∀z. EViews: @dlogistic(.) e @dnorm(.), respectivamente; A.2 Se xk é uma variável
discreta, quando passa de ck para ck + 1: G[(β 0 + β 1 x1 + . . . + β k (ck + 1)] − G(β 0 + β 1 x1 + . . . + β k ck ).
B. Outros casos: ∆P (y = 1| x) = G(novo ponto) − G(ponto inicial).
Estimação dos efeitos parciais médios. i) Para variáveis aproximadamente contínuas: [ n1 ni=1 g(β 0 +
1 xi1 + . . . + β
k xik )] β
j = [ 1 n
β n i=1 g(xi β)] β j . Exemplo EViews: series facesc = @dnorm(c(1) +
c(2)*x2) series efeipar = facesc*c(2) scalar epm=@mean(efeipar).
ii) Para variáveis discretas. xk passa de ck para ck + 1:
1
n
G β0 + β xi1 + . . . + β
(ck + 1) − G(β +β xi1 + . . . + β
ck ) .
1 k 0 1 k
n i=1
Exemplo de EViews, com x2 =D(ummy): series a= @cnorm(c(1)+c(2)*x1+c(3)) series b=@cnorm
(c(1)+c(2)*x1) scalar epmd=@mean(a-b).
Estimação de MV: β = arg max L(β). L(β) = li (β) = yi log[G(xi β)] + (1 − yi ) log[1 −
G(xi β)] < 0, ∀β. EViews: quick —> estimate equation . . . —> METHOD: binary —> logit ou probit.
= β; b) β ∼ a é assintoticamente eficiente; d) se(β
j ), j =
Propriedades: a) plim(β) N (., .); c) β
0, 1, . . . , k, são válidos assintoticamente.
/se(β
) ∼ a
Inferência. H0 : β j = 0, β j j N (0, 1) sob H0 . Quaisquer q restrições de exclusão:
a
LR = 2 (LUR − LR ) ∼ χ(q) sob H0 . EViews: view —> coefficient tests —> redundant variables —
2
Likelihood ratio —> ... (nomes das variáveis).
Bondade do ajustamento. % previsões correctas = npc n × 100, npc =número de previsões correctas.
EViews: view —> prediction-expectation evaluation —> valor de limiar = 0.5.
×1.6 ×0.625
Para comparações grosseiras: coef. probit −→coef. logit; coef. logit −→ coef. probit; coef. probit
×0.4 ×0.25
−→coef. MLP; coef. logit −→ coef. MLP.
Regressão básica com séries temporais
Série temporal, xt , é uma realização de um processo estocástico, {xt }, sucessão de variáveis
aleatórias indexadas pelo tempo.
2
ISEG, Universidade de Lisboa Econometria
Exemplo de modelo estático: yt = β 0 + β 1 zt + ut , t = 1, 2, . . . , n. Exemplo de modelo dinâmico,
FDL(2): yt = α0 + δ 0 zt + δ 1 zt−1 + δ 2 zt−2 + ut ; MCP = δ 0 ; MLP= δ 0 + δ 1 + δ 2 . Variação transitória
unitária em t (e ut ≡ 0, ∀t): δ 0 = yt − yt−1 ; δ 1 = yt+1 − yt−1 ; δ 2 = yt+2 − yt−1 . Variação permanente
unitária em t (e ut ≡ 0, ∀t): yt − yt−1 = δ 0 ; yt+1 − yt−1 = δ 0 + δ 1 ; yt+2 − yt−1 = δ 0 + δ 1 + δ 2 , . . . .
Modelo clássico. TS.1 Linearidade nos parâmetros: {(xt1 , xt2 , . . . , xtk , yt )} : yt = β 0 + β 1 xt1 +
. . .+β k xtk +ut , t = 1, 2, . . . , n; xt = (xt1 , xt2 , . . . , xtk ), X é n×(k+1); notação matricial: y = Xβ + u.
TS.2 Exogeneidade estrita: E(ut | X) = 0, ∀t ⇒ Cov(ut , xsj ) = 0, ∀t, s, j. Mais forte que exogeneidade
contemporânea: E(ut | xt ) = E(ut | xt1 , xt2 , . . . , xtk ) = 0, ∀t ⇒ Cov(ut , xtj ) = 0, ∀t, j. Violações mais
importantes: variáveis omitidas correlacionadas com as incluídas e variações dos erros que provocam
variações futuras dos regressores (feedback). TS.3 Não colinearidade perfeita: r(X) = k + 1. Teor.:
TS.1 + TS.2 + TS.3 ⇒ E(β) = E(β| X) = β.
TS.4 Homoscedasticidade: Var(ut | X) = σ2 , t = 1, 2, . . . , n. TS.5 Ausência de autocorrelação:
corr(ut , us ) = 0, ∀t, s, t = s. Teor.: TS.1 a TS.5 (hipóteses de Gauss-Markov) ⇒ Var(β̂ j | X) =
σ2
SSTj (1−Rj2 )
, j = 1, 2, . . . , k. Teor.: TS.1 a TS.5 ⇒ com σ̂ 2 = SSR/(n−k−1) = SSR/DF , E(σ̂ 2 ) = σ2 .
Teor. (Gauss-Markov): TS.1 a TS.5 ⇒ condicional em X, o estimador OLS, β, é o BLUE para β.
TS.6 Normalidade: ut ’s independentes de X e ut ∼ iidN (0, σ2 ). Teor.: TS.1 a TS.6 (hipóteses CLM)
∼ N (β, σ2 (X′ X)−1 ); b) sob as respectivas H0 , t’s ∼ t(.) e F ’s ∼ F(.,.) ; c) a construção usual
⇒ a) β|X
de ICs é válida.
Exemplos de EViews: a) dummy: pill=year>1962; b) variáveis desfasadas: z(-1), z(-2), . . . .
Modelo simples de tendência linear (determinística): yt = α0 + α1 t + et , com et ∼ iid(0, σ 2 ),
processo ruído branco, e t = 1, 2, . . . , n; ∆ yt ≈ α1 ; EViews: (generate series) t = @trend + 1. Modelo
de tendência exponencial: log(yt ) = β 0 + β 1 t + et ; ∆ log(yt ) ≈ yty−y t−1
t−1
≈ β 1 . Modelo de tendência
quadrática: yt = α0 + α1 t + α2 t + et .
2
Variáveis com tendência na regressão. Modelo adequado: yt = β 0 + β 1 xt1 + β 2 xt2 + β 3 t + vt ; os
estimadores β 1 e β2 do modelo yt = β 0 + β 1 xt1 + β 2 xt2 + ut são enviesados se xt1 e/ou xt2 “tiverem
tendência”; alguns dos resultados obtidos poderão ser espúrios.
Teor. FWL I. As estimativas OLS β 2 de yt = β 0 + β 1 xt1 + β 2 xt2 + β 3 t + ut podem obter-se
1 e β
de: i) remoção da tendência de yt , xt1 e xt2 ; por exemplo, ÿt = yt − yt = yt − ( α0 + α 1 t); ii) regressão
de ÿt sobre ẍt1 e ẍt2 . Interpretação dos coeficientes: em termos de variações em torno da tendência.
Nota: pode ser útil incluir t numa regressão em que yt “não tem tendência” mas um regressor tem.
Sazonalidade regular é modelada com dummies sazonais. EViews: @seas(.). Teor. FWL
II: as estimativas OLS β 1 e β de yt = α0 + δ 1 Qt1 + δ 2 Qt2 + δ 3 Qt3 + β xt1 + β xt2 + ut (da-
2 1 2
dos trimestrais) podem obter-se de: i) remoção da sazonalidade de yt , xt1 e xt2 ; por exemplo,
ÿt = yt − yt = yt − ( γ0 +
γ 1 Qt1 + γ 2 Qt2 + γ3 Qt3 ); ii) regressão de ÿt sobre ẍt1 e ẍt2 . Interpre-
tação dos coeficientes: em termos de variações após remoção da sazonalidade (dessazonalização).
Tópicos adicionais sobre a utilização do OLS
O processo estocástico {xt }, com E(x2t ) < ∞ é estacionário (em covariância) se: i) E(xt ) é
constante em t; ii) Var(xt ) é constante em t; iii) ∀t, h ≥ 1, Cov(xt , xt+h ) só depende de h e não de t. Em
termos grosseiros, um processo estacionário {xt } é fracamente dependente se limh→∞ corr(xt , xt+h ) = 0
(assintoticamente não autocorrelacionado).
Processo MA(1): xt = et +α et−1 , et ∼ iid(0, σ 2e ). E(xt ) = 0, ∀t; Var(xt ) = σ2e (1+α2 ); Cov(xt , xt+1 ) =
3
ISEG, Universidade de Lisboa Econometria
α
α σ2e e corr(x, xt+1 ) = 1+α 2 ; Cov(xt , xt+h ) =corr(xt , xt+h ) = 0, ∀h ≥ 2. Os processos MA são sempre
estacionários e fracamente dependentes.
Processo AR(1): yt = ρ yt−1 + et . É estacionário (e fracamente dependente) se |ρ| < 1. Nesse caso,
σ2
∀t, E(yt ) = 0, V ar(yt ) = σ2y = 1−ρe 2 , Cov(yt , yt+1 ) = ρ σ2y , corr(yt , yt+1 ) = ρ, corr(yt , yt+h ) = ρh , ∀h ≥
0.
Exemplo de processo estacionário em tendência: yt = α0 +α1 t+et . Mas também yt = α0 +α1 t+ut ,
com ut = et + γet−1 , ou ut = ρ ut−1 + et , com |ρ| < 1, etc. . Embora não estacionários, estes processos
não levantam problemas na análise de regressão.
Propriedades assintóticas do OLS. TS.1’ Linearidade e dependência fraca: {(xt1 , xt2 , . . . , xtk ,
yt )} : yt = β 0 + β 1 xt1 + . . . + β k xtk + ut , t = 1, 2, . . . , n, e é estacionário e fracamente dependente.
TS.2’ Exogeneidade contemporânea: E(ut | xt1 , . . . , xtk ) = E(ut | xt ) = 0, ∀t. Exemplos: yt−1 não
é estritamente exógeno mas é, em princípio, contemporaneamente exógeno; pode existir efeito de
feedback, desde que não seja contemporâneo. TS.3’ = TS.3 Não colinearidade perfeita: r(X) = k + 1.
Teor.: TS.1’ + TS.2’ + TS.3’ ⇒ plim(β ) = β , j = 0, 1, . . . , k.
j j
TS.4’ Homoscedasticidade: Var(ut | xt ) = σ2 , ∀t. TS.5’ Ausência de autocorrelação: Cov(ut , us ) =
j ∼ a
0, ∀t = s. Teor.: TS.1’ a TS.5’ ⇒ β N (., .); os usuais erros-padrão (se’s), estatísticas-t, −F e LM
são válidos assintoticamente. Exemplo: segundo a HEM, com yt um rendimento (percentual) de um
activo financeiro, E(yt | yt−1 , yt−2 , . . .) = E(yt ), ∀t.
Séries temporais altamente persistentes. Passeio aleatório sem deriva: yt = yt−1 + et (AR(1)
com ρ = 1, processo de raiz unitária); yt =y0 + ti=1 ei = y0 + tend. estocástica; Var(yt ) = t σ2e , ∀t;
t
E(yt+h | It ) = yt , ∀h ≥ 1; corr(yt , yt+h ) = t+h . Se yt = ρyt−1 + et , com |ρ| < 1, E(yt+h | It ) =
h
ρ yt , ∀h ≥ 1.
Passeio aleatório com deriva: yt = α0 + yt−1 + et (também AR(1) com ρ = 1); yt = y0 + α0 t +
t
i=1 ei = y0 + tend. determinística + tend. estocástica; não é estacionário em tendência.
Processo fracamente dependente = I(0), não é necessário diferenciar nenhuma vez para poder usar
na regressão. Processo fortemente dependente = altamente persistente = de raiz unitária = I(1):
necessário diferenciar uma vez para ficar (estacionário e) fracamente dependente (I(0)). Exemplos:
passeios aleatórios; mais geralmente: yt = (α0 +) yt−1 + ut , com ut ∼ I(0) qualquer. Nota: diferenciar
uma série também reduz numa unidade o grau do polinómio em t que ela possa ter; Ex.: yt =
α0 + α1 t + vt ⇒ ∆ yt = α1 + ∆ vt . As séries I(0) têm um comportamento de reversão ou regressão
para a média que as séries I(1) não têm.
Decisão sobre I(1) ou I(0): i) estimar ρ1 (ou ρ) em yt = α + ρ1 yt−1 + ut ; ii) se
ρ1 > 0.9 ou 0.8 ⇒
considerar que yt ∼ I(1). Atenção: se yt “tem tendência”, esta necessita ser removida. Suspeita de
regressão espúria “em níveis” ⇒ regressão em primeiras diferenças.
Se a igualdade E(ut | xt , yt−1 , xt−1 , . . .) = 0, for satisfeita, o modelo yt = β 0 +β 1 xt1 +. . .+β k xtk +ut
diz-se dinamicamente completo. A condição anterior é equivalente à condição E(yt |xt , yt−1 , xt−1 ,
yt−2 , . . .) = E(yt | xt ). Se um modelo é dinamicamente completo, então satisfaz TS.5’.
Autocorrelação e heteroscedasticidade
Se ∃t, s, t = s : Cov(ut , us ) = 0, quais as implicações negativas? No modelo yt = β 0 + β 1 xt + ut ,
4
ISEG, Universidade de Lisboa Econometria
com x̄ = 0, ut = ρ ut−1 + et , |ρ| < 1, et ∼ iid(0, σ2 ), tem-se
n−1 n−t
| X) = σ2 σ2 j
Var(β 1 +2 ρ xt xt+j ,
SSTx SSTx2 t=1 j=1
ou seja, em geral, a precisão do estimador OLS é sobre-avaliada. Daqui resulta que os métodos usuais
de inferência passem a ser inválidos, mesmo assintoticamente. Nalguns modelos dinâmicos passa a
= β.
ter-se plim(β)
Teste-t para autocorrelação AR(1) com regressores estritamente exógenos. H0 : ρ = 0
ρ̂ a
em ut = ρ ut−1 + et . Na regressão de u t sobre u
t−1 , sem constante, tρ = se( ρ) ∼ N (0, 1) sob H0 .
Teste h − alt de Durbin para autocorrelação AR(1) sem exogeneidade estrita dos re-
ρ̂ a
gressores. Na regressão auxiliar de u t sobre xt1 , xt2 , . . . , xtk , u
t−1 , tρ = se( ρ) ∼ N (0, 1) sob H0 .
Testes de Breusch-Godfrey para autocorrelações de ordens mais elevadas, sem exo-
geneidade estrita dos regressores. H0 : ρ1 = ρ2 = . . . = ρq = 0 em ut = ρ1 ut−1 + ρ2 ut−2 + . . . +
ρq ut−q +et . Da regressão auxiliar de u
t sobre xt1 , xt2 , . . . , xtk , u
t−1 , u t−q , BG(q) = LM(q) =
t−2 , . . . , u
a
(n − q) Ru2 ∼ χ2(q) sob H0 . Versão alternativa: estatística-F para testar a significância conjunta de
t−1 , u
u t−q .
t−2 , . . . , u
A diferenciação do modelo pode ser útil para eliminar os sintomas de autocorrelação.
As consequências da heteroscedasticidade são semelhantes às da autocorrelação dos erros. Testes de
heteroscedasticidade: de White e de Breusch-Pagan, com u 2t como variável dependente das regressões
auxiliares de teste.
Introdução aos métodos para dados de painel
Os dados seccionais agregados e independentes resultam de amostras aleatórias obtidas em pontos
distintos do tempo. Já nos dados de painel, os (mesmos) elementos da amostra são seguidos ao longo
do tempo.
Agregação de dados seccionais independentes e de diferentes períodos de tempo
Hipótese implícita: a relação entre a variável dependente e as explicativas é estável no tempo.
Para permitir a possibilidade de diferentes distribuições nos vários períodos de tempo, os termos
independentes podem ser diferentes; isto consegue-se com a introdução de dummies.
Teste de Chow apenas para mudança nos coeficientes de declive ao longo do tempo:
[SSRp −(SSR1 +SSR2 +...+SSRT )] n−T (k+1)
FCHOW = SSR1 +SSR2 +...+SSRT . (T −1)k ∼ F[(T −1)k, n−T (k+1)] sob H0 , com SSRp a SSR
obtida do modelo estimado com o conjunto de todas as observações e com dummies para permitir
termos independentes diferentes, e SSR1 a SSRT as SSRs para cada um dos (T ) períodos de tempo.
k é o número de variáveis explicativas, não incluindo o termo independente nem as dummies.
Uma experiência natural (ou quasi-experiência) ocorre sempre que um acontecimento exógeno
– frequentemente uma mudança de política – muda o ambiente em que os elementos da população
operam.
Estimador de diferença-das-diferenças. Representando com C e T os grupos de controlo e de
tratamento, respectivamente, e com d T a dummy com o valor 1 se o elemento pertence ao grupo T e
d2 a dummy para o segundo período (após a mudança), tem-se:
y = β 0 + δ 0 d2 + β 1 d T + δ 1 d2 .d T + erro,
5
ISEG, Universidade de Lisboa Econometria
δ 1 é o efeito de tratamento médio e
δ 1 = (ȳ2,T − ȳ2,C ) − (ȳ1,T − ȳ1,C ) = (ȳ2,T − ȳ1,T ) − (ȳ2,C − ȳ1,C ).
onde o primeiro índice representa o ano (o período), e o segundo representa o grupo. Nota: se
a equação tiver variáveis explicativas adicionais, a expressão da estimativa de δ 1 muda mas o seu
significado mantém-se.
Análise de dados de painel de dois períodos
Principal utilidade destes dados: permitem que os efeitos fixos ou não observados estejam correla-
cionados com os regressores. Exemplo básico de modelo de efeitos fixos ou não observados, com
apenas uma variável explicativa:
yit = β 0 + δ 0 d2t + β 1 xit + ai + uit , t = 1, 2,
onde d2t é uma dummy igual a 1 quando t = 2 (e igual a zero se t = 1), ai é o efeito não observado ou
efeito fixo ou heterogeneidade não observada e uit é o erro idiossincrático. Em geral, o estimador OLS
(da equação sem ai ) é enviesado e inconsistente (tem o “enviesamento de heterogeneidade”). Solução:
estimar com o OLS a equação de primeira diferença:
∆ yi = δ 0 + β 1 ∆ xi + ∆ ui .
Hipótese mais importante: a de exogeneidade, Cov(∆ui , ∆ xi ) = 0, ∀i, que é satisfeita se a hipótese
de exogeneidade estrita for satisfeita no modelo inicial; outra condição: ∆xi deve ter alguma variação
ao longo de i. Pode acontecer que todas as hipóteses do modelo clássico sejam satisfeitas.
Modelo geral:
yit = β 0 + δ 0 , d2t + β 1 xit1 + β 2 xit2 + . . . + β k xitk + ai + uit , t = 1, 2.
Em xitj i é o índice de observação seccional, t o do período de tempo e j o de variável.
Análise de política com dados de painel de dois períodos
Modelo de efeitos não observados mais simples:
yit = β 0 + δ 0 d2t + β 1 progit + ai + uit ,
onde yit é uma “variável de resultado” e progit é uma dummy de participação no programa (d2t é a
dummy com valor 1 para o segundo período). Se a participação no programa só ocorreu no segundo
período, o estimador (OLS) de β 1 da equação diferenciada é
= ∆ytreat − ∆ycontrol ,
β 1
que é a versão de dados de painel do estimador de diferença das diferenças.
EViews: convém que os dados estejam “empilhados” de acordo com as unidades seccionais e para
cada uma delas. Convém estruturar o ficheiro de trabalho, para: a) identificar a unidade seccional
associada com cada observação e b) identificar as datas ou períodos de tempo das observações. Fazendo:
PROC (ou clicando 2 vezes no “range”) -> workfile structure: balanced panel. Nas respectivas
caixas, indicar as variáveis de data (“date series”) e de identificação das unidades seccionais (“cross-
section id series”). Vantagem da “reestruturação”: os desfasamentos e os avanços nunca envolverão os
dados de 2 unidades seccionais diferentes.
A estimação da matriz de covariâncias do estimador OLS robusta à heteroscedasticidade, à la
White, usual, obtém-se com a opção (de painel): coef covariance method: White (diagonal).