0 notas 0% acharam este documento útil (0 voto) 50 visualizações 41 páginas Modelo Básico de Regressão Linear
O documento introduz a econometria e o método dos mínimos quadrados ordinários, destacando sua aplicação na análise de relações causais entre variáveis socioeconômicas. Ele aborda a importância de distinguir entre correlação e causalidade, além de apresentar diferentes abordagens empíricas, como a estrutural e a de forma reduzida. O texto também discute a construção de modelos econométricos e a análise de dados para estimar relações de interesse.
Descrição aprimorada por IA
Direitos autorais
© © All Rights Reserved
Levamos muito a sério os direitos de conteúdo. Se você suspeita que este conteúdo é seu,
reivindique-o aqui .
Formatos disponíveis
Baixe no formato PDF ou leia on-line no Scribd
Ir para itens anteriores Ir para os próximos itens
Salvar Modelo Básico de Regressão Linear para ler mais tarde
Meaty) Cleo
REGRESSAO LINEAR
DESCRIGAO
Introdugao a area de Econometria e suas abordagens, introdugao ao método dos minimos quadrados ordinarios, e
defini¢do e propriedades do estimador de minimos quadrados ordinarios,
PROPOSITO
‘Compreender do que trata a érea de Econometria e como aplicé-la para estudar questes empiricas, bem como entender
conceitos introdutérios do modelo de
inimos quadrados ordinarios.
PREPARAGAO
‘Antes de iniciar 0 contetido deste tema, certifique-se de ter papel e lapis por perto para acompanhar os exemplos e as
demonstragées.
OBJETIVOS
MODULO 1
Descrever a drea de econometria e a abordagem empirica para problemas socioecondmicosMODULO 2
Definir conceitos basicos dos estimadores de minimos quadrados ordinarios
MODULO 1
© Descrever a area de econometria e a abordagem empirica para problemas socioeconémicos;
INTRODUGAO
Toda teoria deve gerar previsées, que devem, por sua vez, ser avaliadas empiricamente. Para isso, utllzamos
econometria
Econometria consiste no uso intenso de ferramentas da matematica e da estatistica para entender melhor questées
sociais @ econémicas que nos rodeiam.
Neste tema, introduziremos duas abordagens utlizadas para esse instrumental. Além disso, também introduziremos 0
método de estimacao dos minimos quadrados ordinérios — ferramenta basica para a anélise ompirica, itil om
todas as areas do conhecimento,
Usaremos conceitos de célculo multivariado @ estatistica ao longo do tema. Vale revisar alguns resultados basicos, como
definigdes de esperanga estatistica, variéncia, covariancia, correlagao, funcionamento do operador de somatério, lei dos
grandes nimeros, teorema central do limite e lei das expectativas iteradas,
ESTUDO DE ECONOMETRIA
Neste médulo, discutiremos um pouco da intuigo do estudo de econometria e como estruturar uma andlise econométrica.
RELAGAO ENTRE VARIAVEIS SOCIOECONOMICAS
© objetivo principal da econometria enquanto area de pesquisa 6 encontrar uma relagao causal entre variavels
econdmicas ou sociais de interesse, ou seja, 0 impacto de uma variavel sobre outra. Um objetivo secundario, mais fraco, 6
© de verificar associagdes (causais ou ndo) entre variaveis,
(© que é uma relagao causal?
Ha varios exemplos simples no nosso dia a dia, vejamos:& EXEMPLO
Se chove, entéo molha,
‘Se dou uma topada com o pé em uma pedra, meu pé comega a doer.
Observe com cuidado a estrutura dessas frases: podemos identificar relagées de causa e efeito, Observo dois eventos —
topada com o pé e dor no pé — e consigo dizer que um foi causado pelo outro: ndo é mera coincidéncia,
42048
DIFICULDADES NA BUSCA DE RELAGAO CAUSAL
Nem sempre ¢ facil identificar relagdes causais. Nao basta que dois eventos parecam relacionados, é necessério
descartar outras causas possiveis,
‘Se uma pessoa doente toma um remédio e fica boa, sera que foi o remédio que a curou ou ela se recuperaria em qualquer
hipétese? Sera que o remédio pode até ter atrasado essa recuperagao? Ha varios outros fatores que afetam a satide de
lum individuo e precisamos isolar o impacto do remédio.
Se 0 governo implementa uma politica puiblica e o desemprego cai, sera que a politica foi a responsavel pela queda do
desemprego?
Vejamos, a seguir, alguns exemplos de perguntas que podem ser respondidas com econometria:
Um programa que oferece treinamento para funcionérios de uma fabrica aumenta a produtividade desses
funcionérios?
(© uso de drogas licitas, como alcool ou cigarro, durante a gestacao aumenta a probabilidade de que bebés nascam
com problemas de satide?
Leis que punem criminosos de maneira mais severa reduzem a taxa de homicidios?
Uma transferéncia do governo federal para um municipio gera aumento de gastos em educagao nesse municipio?
DESAFIOS DO PESQUISADORNeste médulo, vamos apresentar quais so as preocupagdes que um pesquisador que utiliza dados — na academia ou no
mercado — deve ter ao iniciar o estudo de relagées de interesse.
Vale reforgar que 6 fundamental distinguir a correlagdo entre as variéveis da causalidade entre elas. O nosso desafio
enquanto pesquisadores que procuram investigar fenémenos sociais com dados sera sempre o de encontrar uma relaglio
de causa e ofeito entre as varidveis de nosso interesse, usando uma amostra da populagao.
Neste médulo, cobriremos trés tipos distintos de abordagem empirica em econometria:
Na abordagem estrutural, partimos de um modelo e, a partir dele, explicitamos as relagées econémicas/sociais que
queremas investigar empiricamente. J a abordagem de forma reduzida com dados experimentais conta com diversas
vantagens que faciitam a obtengdo de causalidade entre as variévels, pois o econometrista gera exatamente os dados de
que precisa em um experimento especifico, Jé na abordagem de forma reduzida com dados observacionais (ou
simplesmente ‘observados'), os dados nao coletados diretamente pelo economettista para o fim especifico, 0 que impoe
alguns desatios adicionais para o pesquisador em comparagao a abordagem com dados experimentais.
Vamos estudar essas abordagens,
ABORDAGEM ESTRUTURAL
Em sua apresentagdo tradicional, a Econometria consiste na aplicagdo do instrumental de Matematica e Estatistica em
dados do mundo real, com o objetivo de responder perguntas econémicas.
Tal definigdo &, nos dias de hoje, uma referéncia histérica, pois a Economettia usa métodos frequentes em Ciéncias
Exatas e os aplica a questées em quaisquer ciéncias — da Biologia Sociologia, da Psicologia a Engenharia, da
Pedagogia a Ciéncia Politica
Parte das aplicagdes da Econometria se déio em Ciéncias Sociais pela caracteristica dos dados disponiveis nessa area.
Teremos, no entanto, uma interpretagao ampla: Ciéncias Sociais incluem, por exemplo, a analise de pregos de agées na
bolsa de valores — objeto também estudado pela Engenharia,
MODELO ECONOMETRICO
Usaremos, a partir daqui, a apresentagdo tradicional da Econometria,Tenha sempre em mente, no entanto, que a economettia se trata de uma ferramenta presente em todas as éreas do
saber,
Partimos, nesse caso, de perguntas de natureza socioeconémica. Em seguida, analisamos modelos matemdticos que
ilustram a relagdo entre as variéveis relevantes para essas perguntas. Por fim, usamos dados do mundo real @
ferramentas estatisticas para estimar as relagées de interesse e encontrar respostas.
A partir desse processo, teremos 0 nosso modelo econométrico. Para estimar 0 modelo econométrico, partimos de uma
amostra de dados,
AMOSTRA DE DADOS
Uma amostra de dados nada mais ¢ do que uma sequéncia de varidveis aleatorias.
Este fato deixa claro por que precisamos da estatistica: o instrumental estatistico permite realizar testes de hipétese sobre
0s dados a partir dos quais tiraremos conclusées.
TEORIA DO CONSUMIDOR
\Veremos, agora, a abordagem estrutural com mais de detalhes.
Iniciaremos nossa exposigao utlizando um tépico familiar aos economistas: a teoria do consumidor.
Na abordagem utiizada por economistas para entender 0 comportamento de consumidores, por exemplo, os individuos
fazem escolhas 6timas de consumo diante dos precos e dada a sua renda
As escolhas dtimas de consumo sao simplesmente as quantidades demandadas (nossa variével dependente), vistas como
fungdes dos precos de mercado e da renda do consumidor (as variaveis explicativas),
Chamamos essas relagdes de fungées de demanda.
FUNGOES DE DEMANDA
Se voce jé estudou a teoria do consumidor, essa é a funcao de demanda marshalliana, que depende de precos ©
renda (em oposigao a demanda hicksiana, que depende de pregos e utilidade).
Em suma, partimos de um modelo teérico sobre 0 comportamento do consumidor e derivamos as equagées de demanda.
‘Temos, entdo, formulas matematicas que representam a demanda do consumidor e mostram como essa demanda
depende de fatores como pregos e renda.
‘Vamos ilustrar isso com um exemplo a seguir:EQUAGOES DE DEMANDA - EXEMPLO
‘Suponha que nosso interesse seja analisar o consumo de arroz no Brasil. A quantidade de arroz demandada pelos
consumidores, de acordo com a teoria do consumidor, vai depender:
Do prego do arroz;
Do prego dos produtos substitutos e complementares do arroz;
Da renda daqueles consumidores;
De outras caracteristicas desses mesmos consumidores.
Por exemplo, podemos imaginar que o consumo de arroz depende do praco do feljao (que 6 complementar ao arroz) e do
macarrao (que é substituto).
‘Ademanda é dada por:
\
:
arroz (Preijaor Pmacarios «Ry =)
© Aten
*
Em que Garros & a quantidade demandada de arroz, que & fungao"
1 Para visualizagao completa da equago utilize a rolagem horizontal
Dos pregos de todos os bens consumidos por esse individuo;
Da renda R do individuo:
De suas preferéncias >, que representam as caracteristicas individuais dos consumidores (que podem gostar muito
de arroz ou, talvez, prefiram massas).
Nosso modelo econémico parte de uma relagao entre a quantidade demandada de arroz pelos consumidores © as
varidveis que mencionamos: prego do arroz, prego do macarrao, renda individual e as caracteristicas do consumidor.
‘Vamos olhar uma versao particularmente simples. O modelo econométrice linear para a quantidade demandada por arroz,
se assumissemos que sua demanda depende somente do seu proprio prego e da renda, seria, por exemplo:
Qarron = Bo + B1Parron + B2R +
© Atongaot Para vsualizagao completa da equagao utlize a rolagem horizontal
O feito do prego do arroz sobre a quantidade demandada é dado por fy. Jé o efeito da sua renda é dado por By.Aqui, estamos supondo que o modelo teérico da demanda é verdadeiro. Esperamos, em nossas estimagées,
encontrar:
Um valor de B negativo (maior prego, menor quantidade demandada);
Um valor de renda positivo (maior renda, maior quantidade demandada).
1 ATENGAO
Nao se preocupe se a expresso apresentada anteriormente ainda ndo esta inteiramente clara, Explicaremos sua
estrutura e cada variével ao longo do médulo.
ABORDAGEM ESTRUTURAL
Vamos, agora, organizar os passos de uma abordagem estrutural
PASSO 01
PASSO 02
PASSO 03
PASSO 04
PASSO 01
O primeiro passo nesse proceso & a formulagao da questo de interesse para o pesquisador, isto 6, qual é a variével X
que impacta a variével Y,
No exemplo apresentado para a teoria do consumidor, um dos interesses do pesquisador pode ser estimar algum
parametro com importancia dentro dessa teoria. Um exemplo de parémetro seria a elasticidade-prego da demanda, ou
seja, qudo responsiva a demanda por arroz & a mudangas no prego desse produto.
ELASTICIDADE-PREGO
A clasticidade-prego nos informa qual ¢ a variagao percentual da quantidade consumida quando o prego aumenta,
1%.PASSO 02
© segundo passo, apés a formulago da pergunta de interesse, é desenvolver o nosso modelo teérico. Na abordagem
estrutural, esse modelo vem da teoria do consumidor.
‘Ateoria do consumidor, entretanto, diz que existem outras variveis que influenciam a quantidade demandada além do
prego. Por conta disso, precisamos formular a equacao de interesse de maneira completa, incluindo todos os fatores que
podem afetar 0 prego.
PASSO 03
O terceiro passo é, a partir desse modelo teérico, construir o modelo econométrico que o representa. No exemplo,
podemos ver que Y ser a varidvel dependente — no exemplo do arroz, a quantidade demandada; e X sera a variavel
cexplicativa (ou independente), a varidvel cuja relagao com Y queremos medi
Ou seja, queremos entender como X causa Y. Essa equacao pode ser representada da seguinte maneira:
Y= Bot ByX + BpZ tu
No exemplo da demanda de arroz, X serla o prego do arroz. Podemos ter outras variavels que so expressas pela varlavel
[Link] no nosso modelo — por exemplo, a renda dos consumidores ou 0 prego do macarrao.
Note que, na relago econométrica, temos um termo a mais, 0 termo U. Tal termo sera o termo de erro ou todos os
outros fatores que explicam Y e que nao estao incluidos em X e Z.
J4 08 coeficientes B; € Bz S80 0s pardmetros da regressdo. Se estivermos particularmente interessados na relagdo entre
prego e demanda, B; sera o parametro de interesse
PASSO 04
© quarto passo seria obtermos uma amostra da populagao que seja ttl para estimar nosso modelo, isto 6, para mensurar
a relagao entre Y e X. Isso é necessério para podermos estimar nossos pardimetros discutidos no passo anterior.
Uma vez estimados parametros com os dados, podemos partir para o dltimo passo: fazer testes de hipétese sobre oles
(mas isso 6 assunto para outros temas).
Discutiremos, no segundo médulo, como obter os parametros de interesse. De todo modo, é crucial ter em mente o tipo de
abordagem a escolher, para proceder com a analise em seguida,
ABORDAGEM DE FORMA REDUZIDA
Na abordagem de forma reduzida, o interesse do pesquisador é responder uma pergunta especfica sobre como duas
varidveis se relacionam.& EXEMPLO
Por exemplo, suponha que estejamos interessados em avaliar o efeito de treinamento técnico sobre a produtividade de
funcionarios de uma fabrica. Essa é uma pergunta que interessa aos gerentes © CEOs de empresas na industria, que
querem entender se a melhoria de treinamento compensa os custos de sua implementacao,
Na abordagem de forma reduzida, portanto, no temos, necessariamente, um modelo teérico por tras dessa decisao dos
gerentes.
Idealmente, o efeito desse treinamento seria calculado pela diferenca entre a produtividade do funcionério que teve 0
treinamento e outro funcionério, semelhante em todos os aspectos, que nao foi treinado.
Gostariamos, na verdade, de observar um mesmo trabalhador que, ao mesmo tempo e nas mesmas condigées, recebeu ©
no recebeu treinamento: qualquer dlferenga em sua produtividade seria causada somente pelo treinamento. Isso, porér,
6 uma impossibilidade fisica. Esse & 0 problema fundamental da inferéncia causal, pois sempre observaremos a mesma
nidade em apenas uma situagao: em um dado momento, essa pessoa fol treinada ou nao fol
A seguir, veremos isso de um modo um pouco mais formal
EXEMPLO — PRODUTIVIDADE DO TRABALHADOR
0
Sejam ¥} € Yj) a produtividade do trabalhador i com ou sem treinamento, espectivamente. Esses so conhecidos
como os resultados potenciais da intervengdo, também chamada de tratamento.
Assim, Y @ a produtividade de isobtratamento e J" € a produtvidade sem tratamento, Chamaremos o estado da
natureza onde nao ha tratamento de estado de controle,
ESTADO DA NATUREZA
Trata-se de uma terminologia comum em Economia e Finangas. E simplesmente uma possibilidade entre varias
mutuamente excludentes, Por exemplo, se jogamos uma moeda para o alto, ha dois estados da natureza possiveis:
cara ou coroa,
Cada unidade i tem dois resultades potenciais, mas apenas um resultado observado, isto 6, qual foi de fato a
realizagdo. O resultado observado é dado por:
Diy} +(1 — Diy?
Ji
5
© Atengao! Para visualizagao completa da equagao utiize a rolagem horizontalEm que D; assume valor 1, se a unidade i recebeu a intervengdoltratamento, e 0 caso contrario, O efelto que gostariamos
de obter é o seguinte:
Efeito do treinamento = y;
.
© Atengao! Para visualizacdo completa da equagée utlize a rolagem horizontal
Como nao podemos observar o mesmo trabalhador em duas situagées diferentes (ele recebeu treinamento ou nao
recebeu), precisamos comparar trabalhadores que receberam e que nao receberam treinamento.
COMPARAGAO ENTRE TRABALHADORES
‘Ao fazer a comparagao entre trabalhadores, temos de levar em conta outros fatores que afetam a produtividade desses
funcionarios. Por exemplo:
Roman Fenton/shutterstock
A temperatura no local onde eles trabalham.violetkaipa/shutterstock
A qualidade dos equipamentos disponiveis
Pakhnyushchy/shutterstock
O nivel de educagao formal deles.
Tais fatores podem ser diferentes entre trabalhadores que receberam treinamento e outros que nao receberam. No jargao
economeétrico, dizemos que temos de controlar por essas variaveis, ou seja, filtrar 0 efeito delas e isolar 0 efeito da
nossa intervengo.
O intuito 6 comparar trabalhadores que sejam similares e que difiram apenas na exposigo 20 treinamento. Isso & © que
chamamos de uma analise ceteris paribus.
Mantendo todos os demais fatores constantes, qual é 0 efeito do treinamento?
® RESPOSTANo exemplo apresentado, no momento de aplicar a intervengao, teriamos de escolher trabalhadores que receberiam
treinamento @ outros que nao receberiam treinamento, para ter os dois tipos em nossa amostra.
Idealmente, a escolha desses trabalhadores se faria por algum método que se aproximasse de um sorteio. Isso
conhecido como aleatorizagao ou randomizacao dos individuos que recebem ou ndo a intervengao.
Quando 0 pesquisador pode fazer essa aleatorizacao, dizemos que ele realiza um experiment, pois consegue
determinar (aleatoriamente!) quem serd tratado @ quem nao sera. Os dados resultantes so chamados de experimentais.
ALEATORIZAGAO
‘Ao aleatorizar quem receberd ou ndo a intervengdo, é possivel comparar 0 resultado médio desses grupos e concluir
algo sobre o efeito da intervencao. Em estatistica, 0 resultado médio é obtido com o uso do operador esperanga
matematica
GRUPOS
(Os que recebem e os que ndo recebem treinamento
A légica disso & que o sorteio, se feito de forma correta, garante que, na média, as varidvels observadas pelas quais
controlamos estejam “balanceadas’, isto é, so iguais (na médial) entre aqueles que receberam ou nao a intervengao.
Podemos, entéo, escrever:
Efeito médio do treinamento apés aleatorizagao = E[y}]
© Aten
Como temos aleatoriedade — um sorteio na escolha do tratamento —, ele sera independente de Y;. Veremos, mais
1 Para visualizagao completa da equago utlze a rolagem horizontal
adiante, que essa independéncia entre as variéveis sera fundamental para conseguirmos ter 0 nosso efeito causal.
5 le yo
Na presenca de aleatorizagao, as variévels Y; © Yj’ serdo independentes entre si. Podemos escrever a esperanca
condicional em ser tratado ou nao como a esperanga nao condicional.
Dizemos entdo que ha independéncia na média condicional
VAMOS FORMALIZAR ESSA IDEIA MAIS A FRENTE.
‘A-consequéncia disso que 0 efeito médio serd obtido pela comparagao de médias entre os dois grupos de trabalhadores
—08 treinados © 0s ndo treinados. Esse método permite estimar o impacto do treinamento sobre a produtividade dosfuncionérios, independentemente dos outros fatores e insumos que, como vimos, também eram importantes para explicar
a produtividade do trabalhador,
ANALISE DE DADOS OBSERVADOS
Nem sempre € possivel “sortear” a intervengdo entre as unidades. Pode haver entraves élicos, de custo ou simplesmente
queremos avaliar uma intervengdo ou relago que j4 ocorreu no passado e, portanto, esté fora do nosso controle desenhar
como ela deve ser feita
Devido as dificuldades de obter dados de natureza experimental, ou seja, obtidos a partir de uma aleatorizagao,
normalmente recorremos a uma andlise de dados observados.
(Os dados observadas podem ser:
Dados coletados sem o desenho de experimento por tras;
«
Dados secundérios, coletados por institutos de pesquisa;
«
Dados administrativos de autarquias ou de algumas empresas piiblicas ou privadas,
No caso de dados observados, a especificagao correta do modelo econométrico 6 essencial para a obtengao de um efeito
que tenha interpretagao causal.
‘Vamos rearranjar a expresso da equagao basica de resultados potenciais da seguinte forma
Yi = Ely?]+ Y? + 6D; — E[Y?]Yi =at+6Dj+ uj
© Atengio! Para vsualizagao completa da equagao utlize a rolagem horizontal
VAMOS EXPLICAR PASSO A PASSO:
PASSO 01
PASSO 02
PASSO 03
PASSO 04
PASSO 01
Da primeira para a segunda igualdade, apenas rearranjamos os elementos da equacao.
PASSO 02
0
ba sennda para atercora ssewvenos 5 = y! — y?
PASSO 03
Da tereeia para a quart, apenas “somamos zero" ao asicionar EX Y!] —E[Y?] a expresso
PASSO 04
dl Ely?
Na ultima expresso, apenas renomeamos {| Por a, isto 6, 0 termo constante de intercepto da nossa equagéo
linear, Y? — E[Y?] como. termo de desvio u em relagéo ao valor esperado de Y (esse valor esperado ¢,
simplesmente, E)[Y?] —ou seja, estamos usando o operador esperanca)
MODELO ECONOMETRICO SIMPLES‘Vamos, agora, analisar o modelo econométrico simples da ultima equago, que estabelece uma relagéo linear entre a
varidvel de interesse, ou variavel dependente (nossa varidvel Y}), ¢ a varidvel explicativa (que é a nossa varivel D)).
‘D RELEMBRANDO
‘Temos, aqui, a equagao em que relacionamos linear mente Ye a intervengdo D;. Lembre-se da férmula de uma equagao
linear: y = ax +b.
Nesse caso, estamos fazendo um raciocinio andlogo, assumindo que as varidveis se relacionam linearmente &
adicionando um termo aleatério u,, que representa tudo aquilo para o qual ndo temos dados e que pode afetar a relagdo
entre Dye Yj
Esse foi um exemplo “limpo", em que apenas ilustramos como podemos sair de uma pergunta para uma especificago na
qual cada elemento possui uma interpretagdo clara
Vamos ver, a seguir, um exemplo um pouco mais elaborado:
FATORES NAO OBSERVADOS
‘Agora, queremos responder a seguinte pergunta:
Mais anos de estudo geram salérios maiores no futuro?
Poderlamos usar dados, por exemplo, da Pesquisa Nacional por Amostra de Domicilios, feita pelo Instituto Brasileiro de
Geografia e Estatistica (IBGE) anualmente, para fazer esse exercicio, Nossa equagao linear a ser estimada — que
chamaremos de regressiio linear — seré
Salarios; = fy + 6; Escolaridade; + u;
(Equagao 1)
S
Atengao! Para visualizacdo completa da equagdo utilize a rolagem horizontal
Is30 significa que, se a escolaridade aumenta em uma unidade (por exemplo, um ano a mais), 0 sari aumenta, em
médla, 8; unidades (por exemplo, quantia adicional recebida por més no contracheque)
Para que 0 By Sejao feito causal do uma vatiagdo de educagao usando anos de escoaridade, como estamos fazendo,
sobre os salvos dos individuos, teriamos de supor que os demas fatores nao observados contidos emu, que
explicam os salérios, se mantém constantes mesmo apés uma variagéo da educagéo.
Em outas palawas, que Aa; =u! — uy = 0, -emaue 2) 0 termo de ero da nossa estmaplo quando
aumentamos a escolaridade em um ano.
E importante entender isso.Imagine que um aumento de escolaridade seja acompanhado por uma melhora nas condigées de salide — por exemplo,
pessoas mais escolarizadas podem aprender sobre habitos saudaveis © adoté-los.
‘Amelhora nas condigées de satide, por sua vez, pode aumentar a produtividade e, portanto, a renda: pessoas mais,
saudaveis produzem melhor. Também podemos pensar que algum componente no erro afeta, simultaneamente,
escolaridade e a renda —veremos um exemplo mais adiante.
Na nossa regressao linear, temos apenas a varidvel escolaridade, mas nao observamos condigées de satide que esto
incluldas no termo uy
No fim das contas, um aumento da nossa variavel escolaridade acaba gerando um aumento em uj, Ao medir By, nao
estamos capturando apenas 0 efeito de escolaridade sobre salarios, mas 0 efeito agregado de escolaridade e condigoes
de satide sobre rendat
®t ATENGAO
Esse ponto é central da andlise econométrica: quando nao prestamos atengéo a ele, nossa andlise empitica fica
seriamente comprometida,
Vamos fazer mais uma ilustrago, a seguir, com um exemplo sobre vacinas.
EXEMPLO — VARIAVEL NAO OBSERVADA
Imagine que os médicos deem vacinas para as pessoas ¢ apenas megam o impacto, aps algum tempo, sobre as
condigées de satide (por exemplo, a resposta imune do organismo). Se as pessoas sabem que foram vacinadas, elas
podem pensar: “Estou protegido pela vacina e posso mudar meu comportamento, tornando-me menos cuidadoso”. Esse
pensamento afeta a probabilidade de que a pessoa fique doente.
Nesse caso, a vacina tem efeito direto sobre as condigdes de satide do paciente — pelo mecanismo biolégico que provoca
no organismo —e efeito indireto — pela mudanga de comportamento que induz.
Por isso, os experimentos médicos so cuidadosos para no informar ao paciente se ele recebeu o medicamento em teste
‘ou um placebo. Nesse exemplo, a varidvel u,, no observada, é a mudanga de comportamento,
‘A seguir, vamos ver como isso funciona matematicamente!
VARIAVEL U;
‘Vamos supor que aumentemos a educagao em um ano: chamaremos esse novo nivel de educagao de
. , geet
Escolaridade; . teriamos uma nova estimativa de salérios futuros, denotada por Sala rios,, dada por:
Saldrios, = Bo + Ai Escolaridade; + u;(Equacéo 2)
Ss
‘Atengdol Para visualizagdo completa da equagéo utllze a rolagem horizontal
Podemos subtrair a equacao 1 da equagdo 2 para obter a associagao entre esse aumento e os salérios
Salarios, — Salérios, = A; (Bscolaridade; = Escolaridade;) uj —u;
6, AEscolaridade; + Au;
ASalérios, Au,
Ai AEscolaridade; ~ AEscolaridade;
.
© Atengaot Para visualizagao completa da equagao utiize a rolagem horizontal
®t ATENGAO
A é anotagao tradicional para variagdo. Para uma variavel X qualquer, AX=X-X. Por exemplo,
ASalirios; = Saldrios, — Salérios, .Em outras palavras, é a diferenca entre Saldrios; (0 que se obtém
quando o nivel de educagdo é Escolaridade, ) e Saldrios, (o que se obtém quando o nivel de educagao 6
Escolaridade; ).
Desse modo, para que Bi; represente o efeito causal entre anos de escolaridade e salarios, devemos ter At
Com isso, todos os demais fatores ndo observados (isto &, que ndo conseguimos controlar pela falta de dados) contidos
em u; que explicam Salérios, (a variével dependente) so considerados constantes apés uma mudanca em
Escolaridade; (a variavel explicativa),
Isso significa que ndo hé correlagao estatstica entre Escolaridade;¢ o termo u A mudanca observada nos salérios
futurs, desse modo, deve-se somente a variagdo nos anos de escolardade do individu i
E possivel imaginar algumas variaveis importantes que esto presentes em u, © podem ser correlacionadas com a
educagao, como algumas habilidades cognitivas e socioemocionais, Nesse sentido, individuos que séo mais habeis obtém
salarios maiores — efeito direto de u sobre a varivel explicativa Y — e acabam estudando mais — efeito indireto de u
sobre a varidvel explicativa,
Nao conseguimos controlar esses fatores a partir dessa regressao. Por conta disso, se estimassemos esse modelo sem
garantir que Au, = 0, estariamos identificando uma correlagao entre educagdo e salérios, e nao uma causalidade.
Note que, se os dados foram gerados a partir de um experiment aleatorizado bem-feito, entéo, Au; = 0 por construgao.
Para dados observacionais, no entanto, nem sempre o caso. Portanto, precisamos ser cuidadosos.ETAPAS DA ANALISE EMPiRICA
Assista, a seguir, a um video sobre as etapas da Andlise Empirica:
Para assistir a um video
sobre 0 assunto, acesse a
0 online deste conteuido.
VERIFICANDO O APRENDIZADO
1.0 ULTIMO PASSO PARA UM DESENHO DE PESQUISA UTILIZANDO A ABORDAGEM
ESTRUTURAL E:
A) Coleta de dados.
B) Estimacdo dos parametros.
) Formulagao do modelo econométrico.
D) Testes de hipétese.
E) Desenvolvimento de um modelo matematico,2. ASSINALE A ALTERNATIVA CORRETA SOBRE A ABORDAGEM DE FORMA REDUZIDA:
'A) Requer que seja imposto aos dados um modelo matematico sobre o comportamento econémico dos agentes.
B) E muito utlizado quando queremos obter coeficientes com significado econémica bem fundamentado em teoria,
C) Preocupa-se, exclusivamente, com previsao de resultados.
D) E 2 abordagem mais utllzada quando queremos obter respostas de natureza causal
E) Supée que os fatores ndo observavels sejam correlacionados com a variavel explicativa, e obtém estimativas corretas
dessa forma
GABARITO
1.0 ltimo passo para um desenho de pesquisa utilizando a abordagem estrutural é:
Aalternativa "D" esté correta
O teste de hipéteses é a titima etapa: apés obtermos nossas estimativas, precisamos testé-las para saber o grau de
confianga que podemos depositar nelas.
2. Assinale a alternativa correta sobre a abordagem de forma reduzida:
Aalternativa "D " esta correta,
‘A forma reduzida tenta identificar 0 impacto causal de uma variével explicativa X sobre uma variavel dependente Y. A
principal hipétese que precisamos fazer para obtermos esse efeito 6 que os fatores nao observados que afetam Y sejam
1ndo correlacionados com a variavel explicativa.
MODULO 2
© Det
imos quadrados ordinarios,
MODELO POPULACIONAL DE REGRESSAO LINEAR
Vamos supor que temos uma amostra aleatéria qualquer de natureza de corte transversal. Essa é uma palavra
complicada para dizer que temos observagées de varios individuos (ou firmas, ou plantas, ou planetas etc.) no mesmo
momento do tempo.CORTE TRANSVERSAL
‘Vocé encontraré com frequéncia o termo original, em inglés: cross-section.
Wwe EXEMPLO
Podemos observar a inflagao em varios paises para o mesmo ano, ou a temperatura de varios pacientes em um hospital
em determinado momento. Se quiser, vocé pode pensar em unidades individuais em vez de individuos, mas ambos os
termos so usados.
‘Assuma que temos duas variaveis, x e y, ¢ gostariamos de verificar como y varia quando mudamos x. Note que, aqui,
estamos sendo generalistas @ no estamos assumindo nenhuma relagao causal entre x e y. Nesse caso, apenas
queremos verificar como essas duas variaveis se movimentam juntas.
Existem trés perguntas que surgem imediatamente:
E se y é afetado por outros fatores que nao x?
Qual é a forma funcional que relaciona essas duas varidveis?
Se estamos interessados no efeito causal de x em y, como podemos distingui-o de uma mera correlacao?
MODELO LINEAR BIVARIADO
Vamos comegar com um modelo simples:
y=Pot+fix+u
5
© Atengiot Para visualizagdo completa da equagéo utiize a rolagem horizontal
Assumimos que esse modelo vale para a populagio de interesse. Esse é um modelo linear bivariado: temos duas
varidveis, y e x, relacionadas por uma forma funcional linear como y= ax + b.
Essa equacao permite que outros fatores afetem y. Tais fatores so representados pelo termo de erro u, que
representa tudo aquilo que afeta y, mas nao observamos.
Chamamos 0 coeficiente Bg de parametro de intercepto e chamamos fy de pardmetro de inclinagio. Esses dois
parametros descrevem uma relagao entre y e x para a populago, e queremos estimé-los utlizando dados amostrais.®t ATENGAO
importante frisar isto: nunca observamos fp © fy verdadeiros, apenas os estimamos a partir de uma amostra,
Como estimamos By © By?
Utlizando dados e hipéteses. Precisamos ter hipéteses criveis para estimar esses pardmetros de maneira precisa. Em
nossa equacdo, todas as variavels ndo observadas estdo contidas no termo u, que chamamos de erro idiossincratico
CY aNv)
S
HIPOTESES E DADOS
Primeiro, faremos a seguinte hipétese simplificadora sem perda de generalidade:
E[U]=0
© Atengdot Para visuaizagdo completa da equagdo ullize a rolagem horizontal
Normalizar a esperanca do erro para zero na populagio é uma hipétese inofensiva, Por qué? Porque a presenca de By
‘sempre nos permite isso. Caso a média de u seja diferente de zero (e.g. um valor ag), apenas adicionamos o valor do
intercepto,
Esse aluste nao tem efeito algum sobre o coeffciente By
y = (By + a0) + Bix + (u— ao)
.
© Atengaot Para visualizagéo completa da equagéo utiize a rolagem horizontal
Em que dg=E(u). O novo termo de erro & (ust) € 0 novo intercepto & (Bg + ag)
A inclinagao By, porém, nao foi alterada,
Qual é a interpretagao do intercepto vertical?simples: se x-0, 0 valor de y 6, em média, igual a Bp
Cutra hipétese que fazemos envolve a média do erro para cada “fatia” da populagdo determinada pelos valores de x:
E[
= Ell
.
© Atengiot Para visuaizacdo completa da equagao ulllze a rolagem horizontal
Se essa hipétese vale, dizemos que u é independente na média de x. Essa é a independéncia na média condicional
de que falamos no primeiro médulo. Isso significa que, quando a nossa variavel explicativa (x) muda, 0 nosso
termo de erro (u) nao é afetado,
INDEPENDENTE NA MEDIA
\Vocé pode encontrar algumas vezes 0 termo em inglés: mean independent
‘D RELEMBRANDO
Como vimos no médulo anterior, essa hipétese é fundamental: se nossos dados nao a respeitarem, nossa interpretagao
de causalidade fica comprometida, e precisaremos desenvolver outros métodos, além do escopo deste tema,
‘Vamos retomar nosso exemplo para faciliar o entendimento do que representa essa hipétese.
EXEMPLO — EFEITO DE ESCOLARIDADE EM SALARIO
‘Suponha que estamos estimando 0 efeito de escolaridade em salério, e u é a habilidade inata de cada individuo, que nao
observamos. Independéncia na média implica que:
E [habilidade|
8] = E [habilidade|x = 12] = E [habilidade
= 16]
.
© Atengao! Para visualizagao completa da equagée utiize a rolagem horizontal
(Ou seja, a habilidade esperada é a mesma para diferentes grupos da populagao — com 8, 12 au 16 anos de educagao.
Como as pessoas escolhem seu investimento em educagao baseado, em parte, em sua habilidade, que ¢ nao observada,
essa hipétese é provavelmente violada no exemplo de educago e salario, Precisaremos, portanto, de outros modelos
para estimar essa relagdo (isso também é assunto para outros temas).‘Ao combinarmos essa nova hipétese E[u| x}=E[u], que, como vimos, néo é facilmente satisfeita nos dados, com E[uJ=0,
que 6 simplesmente uma normalizagao dos dados, chegamos a nova hipétese:
E[U| X]=
, PARA TODO X
© Atengiot Para vsualizagao completa da equagéo utlize a rolagem horizontal
Essa hipétese € conhecida como hipétese de esperanga condicional zero, sendo uma hipétese-chave para
identificarmos efeitos em modelos de regressdo linear.
De fato, podemos partir dessa hipdtese, como faremos agora. Observe inicialmente que ela implica E(u)=0:
E(u) = E,[E(u|x)] = E,[0] = 0
.
© Atengaot Para visualizagdo completa da equagéo utiize a rolagem horizontal
A primeira igualdade & uma aplicagao da lei das expectativasteradas.
‘Além disso, a independéncia da média condicional implica que a covariancia entre u e x é igual a zero: Cov(u,
}= E(ux) - E(u) x E(x), Portanto:
. Mas.
lembre-se de que a definigdo de covariancia 6 Cov,
E(u) x E(x)
0 x E(
y
© Atengao! Para visuatizagdo completa da equagéo utiize a rolagem horizontal
Usaremos adiante esses dois resultados: E(u) =O © E(ux) = 0
Como a esperanca condicional é um operador Iinear, Efu] x}=0 também nos permite escrever:
y=Bo+Aix+u
Ely|
E[Bo+ fix+u
E[y|
= E[6o|x] + E[61x|x] +EE[y|x] = Bo + #1E [x|x] +E
Ely|x] = Bo + Aix +0
E [y|x] = Bo + Aix
© Atengio! Para visualizagéo completa da equagéo utlize a rolagem horizontal
SEGUNDA LINHA
TERCEIRA LINHA
QUARTA LINHA
QUINTA LINHA
SEXTA LINHA
SEGUNDA LINHA
Simplesmente aplicamos a esperanga (condicional) em ambos os lados da equagao.
TERCEIRA LINHA
Usamos 0 fato de que a esperanca é um operador linear e, portanto, a esperanga da soma ¢ a soma das esperangas.
QUARTA LINHA
Atengdo! Usamos 0 fato de que os parametros (Bp,8;) no dependem da variavel explicativa, Afinal, esses parametros
s€0 constantes — desconhecidos, mas constantes — e nao dependem do valor da varidvel explicativa x. A esperanca
(condicional ou incondicional) de uma constante é igual 4 prépria constante (E[Bo|xI=By). € usamos novamente o fato de
que a esperanca é um operador linear para escrever EIB; x| xJ=8+E(x| x)
QUINTA LINHAApenas observamos que E[x| x]=x e usamos nossa hipétese central E[u| x)=0.
SEXTA LINHA
‘Temos que a fungo de regressao populacional é uma fung&o linear de x ou uma fungo de esperanga condicional. Essa
relagdo 6 crucial para que possamos interpretar By, Sob certas condigées, como um parémetro causal
MiINIMOS QUADRADOS ORDINARIOS
VAMOS AVANCAR, AGORA, PARA O ASSUNTO PRINCIPAL DESTE
MODULO: O MODELO DE MiINIMOS QUADRADOS ORDINARIOS (MQO).
‘Supondo que temos dados sobre x e y, como pademos estimar os parametros populacionais Bg @ By? Seja
{(xjy):1=1,2,...n} uma amostra aleatéria de tamanho n (0 nimero de observagées) de uma populagéo.
Vamos escrever nossa equagao populacional para determinado individu i:
.
© tengo! Para visualizagao completa da equagdo utllze a rolagem horizontal
Em que |indica uma observagao em particular (ou seja, um individuo na nossa amostra),
Conseguimos observar nos dados ye x, mas néo conseguimos observar u,. Apenas sabemos que ele existe e afeta, de
alguma maneira, nossos resultados. Usamos, entéo, as duas restrigdes populacionais que discutimos anteriormente para
obter as equagdes para Bp © By: E[ul=0 e Efux)=0.
Podemos, agora, reescrever as restrigbes apresentadas usando U=y-Ay-By x:
U=Y-Bp-By X
Isso 6 apenas uma forma de reescrever 0 nosso modelo original:
Y =Bot By X+UE[Y-Bo-B, X]=0
E(X[Y-Bo-B, X])=0
.
© Atengaot Para visualizagao completa da equagéo utiize a rolagem horizontal
ESSAS SAO AS DUAS CONDIGOES NA POPULAGAO QUE
EFETIVAMENTE DETERMINAM Bo E By.
Novamente, observe que a notacao aqui é populacional. No entanto, no mundo real de andlise estatistica, no temos
acesso a populago, somente a uma amostra dela. As contrapartidas amostrais das duas equagées apresentadas
anteriormente sao:
35 («[n-%-Aix])=0
.
© Atengao! Para visualizagéo completa da equagéo utiize a rolagem horizontal
em que Bg © By s80 as osmativas dos pardmetos populaconas ie Br, rspectvamento,
O leitor mais atento notaré que estamos dividindo por n, @ ndo n-1. Nao ha ajuste sendo feito para graus de liberdade
quando calculamos médias amostrais, mas existe quando calculamos momentos de ordem maior como a variancia
amostral,
Essas sao duas equagdes lineares com duas incégnitas, Vamos, agora, obter algumas propriedades amostrais dessas
equagées.DESENVOLVIMENTO DO ESTIMADOR DE MINIMOS
QUADRADOS ORDINARIOS
Para comegar, vamos desenvolver o lado esquerdo da primeira equagao:
23: (w-B- fies) = 230 - 2D HAF
1
i=l isl a isl
=1Y yi -— Bo - ai( + a)
i=l i=l
=y ~Bo- Biz
s
© Atengdot Para visuaizacdo completa da equagao utllze a rolagem horizontal
a
a 1
emaque y= 2 Jy; 6amédia amostra para as nobserasées dey a notago 6 andloge para © ) Logo
i=l
155 (RK — Fiai)=Omsiaren. y — By -~ Biz =0any = 8 + he
isl
Usamos esse resultado para explicitar 0 intercepto em termos da inclinagao:
Bo=y — fiz
Inserimos esse resultado na segunda equagao:
E(alu-%-Ae)=0
Desse modo, obtemos seguinte resultado:
Me
*(x[u- (7-2) -Fias]) =0
iMs
([u-7 +z Fra) ) =0
3
[2 (u _ y) fee, - fiat] =0
oa (% - v)= Ade (x: _ z)
© Atengio! Para visualizagdo completa da equagao utilize a rolagem horizontal
n _\2 n _ _2
Y(n-2) =v (a? - ame +2
i=l i=1
ll
Me
an 2
x? — 2x Ox tnx
i
i]
iM:
AL
I
‘
8
”
:
Bp
”
Hl
Me
A
I
6B
*
ll
Mes
#
e
41
tt
islE também que:
> (x - 2) (u - v)= y (= — ayy — zy + zy)
i=l
LY — ney - ney + ney
I
Me
of
Yi — axy
1
he (% - v)
ns ¥)
ll
Me
n an —
Desse modo, podemos reescrever >) X; (x: -y ) =AyX (x = x) como:
ial ist~
© Atengao! Para visualizagdo completa da equagéo utiize a rolagem horizontal
n _\2
se >> (x - z) F 0 , podemos escrever:, podemos escrever:
isl
A=
x (=)
.
© Atengaot Para visualizagao completa da equagao utiize a rolagem horizontal
Podemos fazer, ainda, uma pequena modificagao nessa expressao, Para isso, vamos dividir 0 numerador © 0
denominador por (n-1):
.
© Atengao! Para visualizagéo completa da equagéo utlize a rolagem horizontal
Essa divisdo nao alterou a expresso, mas nos permite interpretar 0 nosso estimador.
© que encontramos agora?
(O numerador a covariancia amostral entre x e y, @ 0 denominador 6 a variancia amostral de x, Ou soja’
Bi Covariancia amostral (2;,y; )
1 Variancia amostral (zi)
.
© Atongéot Para visuazagdo completa da equasso ule arolagem horton
‘A témula eproserada antromerte para By 6 muito mpotante porque nos mosta come usar os dads quo tomes em
rns para computa estimate da nina da eta do ogess8o nar
@ VOCE SABIA
ase estimador Bi 6 comumente chamada de estimador do mi
imos quadrados ordinarios (MQO) para a inclinagao.possivel computar esse estimador sempre que a variancia de x; 6 diferente de zero, isto &, quando temos variago
suficiente nas variéveis que queremos usar para explicar y). Em outras palavras, se xj néo é constante para todos os
valores de i, & possivel gerar um estimador de MAO 3 para By
A intuigdo 6 que a variagao em x 6 0 que permite identificar o seu impacto em y. Isso também significa, no entanto, que
no podemos determinar essa inclinagao em uma relagdo na qual observamos uma amostra em que, por exemplo, todos
05 individuos tém o mesmo ndmero de anos de escolaridade ou qualquer outra variavel explicativa que estamos
Interessados em estimar,
Iso 6 intultve. Quoromos saber 0 impacto de uma vive expat sobre una vrével dependent ea varive
expat no mua, qualquer rmidanga na valivel dependent deve a ura causal
Vamos olar para @expesséo de J com cided. Para acta oreclocii, pense or um insane, que avarncia
amostal de X 6 igual aun, Nosso caso, a covariria amwstal ent X oY 6 oxalamente ainclnago da rata de minimos
auadiaos que relaiona Ye X. Em ous palaes, se Xaumera em ume vided, avararo de Y 6 om ma igual a
essa covarinci
No caso geral, precisamos corrigit a covarincia amostral, dividindo-a pela variancia amostral de X. Se essa variancia for
baixa, a inclinagao 31 sera mais alta, para uma dada covariancia entre X e Y. E intuitivo: se todos os valores de X so
préximos uns dos outros, a reta de regresséo sera bastante inclinada,
Uma vez que calculamos 31 podemos computer o valor do intercepto Bg como By = y — 812 Essaéa
estimativa de MQO do intercepto. Ela é uma estimativa pois é calculada a partir de médias amostrals. Esse resultado para
ointercepto & ci de ober pois Bg 6 near em
Para qusisquerestimatvas Bp € By. que satstacam os resultados obs anterormente,defrimos os valores
Preditos:
.
© Atengao! Para visualizagdo completa da equagéo utiize a rolagem horizontal
Lembre-se de que
.n}e, portanto, temos n equagdes dessas, Esse é 0 valor que prevemos para yi dado que x=x,
Note, porém, que hé um erro nessa predigao, pols y#y,. Chamamos esse erro de residuo, e ultlizamos a notacéo tj para
ele, O residuo & dado por:
Ui =H - Fi
=i — Bo — fie
~
© Atengao! Para visualizagéo completa da equagéo utiize a rolagem horizontal‘Suponha que medimos o tamanho desse residuo, para cada i, elevando-o ao quadrado. Essa operago eliminara todos os
valores negativos desse erro de predigao,
Esse tipo de transformagao ¢ itt quando queremos somar os valores desses residuos para ter uma dimensao da
qualidade do nosso modelo econométrico @ nao queremos que valores positivos © negatives se cancelem. Nesse caso,
devemos fazer:
=¥(u-B- Bia)
© Atengao! Para visuaizagdo completa da equagéo utllze a rolagem horizontal
Essa expressio é conhecida como soma dos quadrados dos residuos (SQR),
O residuo 6 baseado em estimativas da incinagéo da rela e do seu intercepto.
E possivel imaginar varios valores para essas estimativas, gerando varias retas diferentes. Como escolher um? Um
procedimento natural, se queremos um modelo bom, é que ele “acerte” nas predigdes. Para isso, gostariamos que ele
minimizasse a SQR.
Queremos, portanto, escolher (3g @ (31 que minimize SQR, Utilizando ferramentas de otimizagao das aulas de
céleulo, 6 possivel mostar quo as estimatvas de By) € By que minimizam esse valor s8o justamente as que obtomes
nesta segao. Uma vez que obtemos esses coeficientes, obtemos a reta de regressao linear via MQO:
Bo + Bix
y
Ss a 4 a
© atengao! Para visualizagao completa da equagao utilize a rolagem horizontal
REPRESENTAGAO GRAFICA
Para concluir, vamos fazer uma representagao grafica dos objetos que estamos discutindo, Temos diversas observagies
para as variavels x e y: cada ponto azul na imagem abaixo é um par ordenado (x,y) que observamos.
‘Areta vermetha relaciona esas duas varidveis, mas notamos que ela ndo passa exatamente por cada um dos pontos
azuis. Por qué?
E simples: x nao 6 0 Unico fator que afeta o valor de y — temos também o termo u. A distancia vertical entre o um ponto
azul ea reta vermelha é exatamente o valor de u para uma observagao especifica,Nao conhecemos a verdadeira equacao da reta que relaciona X e Y para toda populagao, mas vimos como estimé-la a
Partir de uma base de dados.
PROPRIEDADES ALGEBRICAS DE ESTIMADORES DE
MQO
\Veremos, agora, algumas propriedades algébricas dos estimadores de MQO obtidos.
‘Quando temos o intercepto em nossa regress&o, podemos escrever:
Me
(n-R-Fin)- Sm -0© Atengaot Para visuatizagao completa da equagao utiize a rolagem horizontal
‘Asoma dos residuos da regressdo linear obtida via MQO sempre soma zero, por construgéo, Como Yi = Fi + fh
por definigéo, podemos tirar a média amostral dos dois lados:
id it ioe
ahi =a 433 by
isl i
© Atengiot Para vsualizagdo completa da equagéo utlize a rolagem horizontal
‘A média dos valores previstos, no entanto, é igual a zero:
n
aq=0
1
ele
i
© Atengiot Para vsualizagao completa da equagéo utlize a rolagem horizontal
A equacao anterior se torna:
1 v 1 v
FLV = TLV
isl isl
© tengo! Para visualizacao completa da equacao utilize a rolagem horizontal
Ou soja, a média das observagies (y) 6 igual A média dos valores previstos ( fj) . De maneia similar, utlizando a
equagao que usamos para obter as estimativas dos parémetros, temos que:
£(aln-R-Ae)=0
=1
5
© Atengaot Para visualizagdo completa da equagéo utiize a rolagem horizontal
© que implica que a covariancia amostral entre as varidveis explicativas x; @ os residuos 6 sempre zero
5
© Atengao! Para visualizagao completa da equagao utiize a rolagem horizontalPor fim, como {; € fungao linear de x, (basta ver a reta de regresséo linear via MAO), os valores previstos também nao
Possuem correlagao com os residuos:
n
LaG =0
i=l
.
© Atengao! Para visualizacdo completa da equagéo utlize a rolagem horizontal
‘As duas igualdades apresentadas, que determinam que nao ha correlagao entre os residuos e as variéveis explicativas
06 valores prvito, so gerades por constugdo,
ouseja, Bo € i sto escotidos deta mancira que essas igualdadessejam verdadoiras
Uma terceira propriedade surge se incluirmos a média amostral de x como varidvel explicativa em nossa regressao,
y=Bot fie
5
© Atengaot Para visualizagao completa da equacao utlize a rolagem horizontal
MEDINDO A QUALIDADE DA REGRESSAO LINEAR
Para cada observagao, escrevemos:
YWrHMTyy
© Atengaot Para
sualizagao completa da equacao utilize a rolagem horizontal
Isso 6 intuitivo: 0 valor real de y, é 0 valor que prevemos para ele mais uma medida de erro (nosso residue)
Vamos, agora, definir medidas para a qualidade de nossa previséo de y),
Defina a soma quadratica total (SQT), a soma quadratica explicada (SQE) e a soma quadratica dos residuos (SQR)
de tal modo que:
sar =S(w-¥),
n n
_ 2 2
SQR= Vv 4) = OG
i i
© Atengio! Para visualizagao completa da equagéo utiize a rlagem horizontal
SQr
Essas metricas de qualidade nada mais sd0 do que variancias amostrais quando divdimos por n-4. Desse modo, —— =>
QE
=. SQR
6 avariancia amostral de Ys, 7 6a variancia amostral do Yi €
1
uma breve manipulagao algébrica, podemos reescrever ST da seguinte maneira:
6a variancia amostral de @j . Com
sar =3(w-v):ll
iMs
>
&
|
i
£)
—~
=)
I
al
Nae
+
=
=
|
Bit; = 0. obtemos:
ist i
oe
sqr= Nae (G-y
ys
SQT = SQR+SQE
© Atengaot Para visualizagdo completa da equagéo utlize a olagem horizontal
‘Se assumirmos que SQT > 0, podemos definir a fragao da variagao total em y, que & explicada por x (ou pela nossa
regressao) como© Atengio! Para visualizagao completa da equagéo utiize a rlagem horizontal
R2
‘A medida chamada de “R-quadrado” ou R? nos diz a proporgao da variancia de y; que pode ser explicada pelas varidveis
explcavas que tems em mos possvel mostrar que ela 6 igual a quacrado da conelagéo enteyie Yi € Give.
portanto, est no interval [0,1].
Um R? igual a zero significa que nao ha relagdo linear entre y, e x, e um R? igual a 1 significa que ha uma relagdo linear
perfeita entre essas variaveis (por exemplo, yi=x+2). A medida que o R? aumenta, os valores de yj esto mais proximos
da reta de regressao obtida via MQO,
Assista, a seguir, a um video sobre a Medida R®
Para assistir a um video PD,
sobre 0 assunto, acesse a 1}
verso online deste contetido. 0
VERIFICANDO O APRENDIZADO1. ASSINALE A ALTERNATIVA CORRETA SOBRE A HIPOTESE DE INDEPENDENCIA NA MEDIA:
{A)Independéncia na média entre duas variéveis implica que elas so independents.
B) Independéncia na média implica que duas variaveis nao so correlacionadas
C) Corretagéo igual a zero implica independéncia na média
D) Correlagéo igual a zero implica independéncia
E) Covariancia igual a zero implica independéncia na média,
2. ASSINALE A ALTERNATIVA CORRETA SOBRE O COEFICIENTE DE INCLINAGAO DA RETA
DE REGRESSAO LINEAR:
Covariancia amostrat (4)
Variincia amortral (w
A) =
8) Bi =
ela popactonal (sun)
Varin populacionall =)
D) By = Lemariancia amostrat (tugs)
5) A = Lorian amatra
Variincia epulacional(,)
GABARITO
1. Assinale a alternativa correta sobre a hipétese de independéncia na média:
Aalternativa "B " esté correta
Independéncia na média entre duas varidveis Y e X significa dizer que E[YIXI-E[Y].
Podemos tirar a esperanga em X dos dois lados dessa expressao e obter: E[E[YIXI=EI]
(isso é a lel das expectativas iteradas), Desse modo, temos que:
cov(X,¥Y) = El(X - B(X))(¥ - E(Y))]
= E{E[(X — B(X))(¥ — B(Y))|X]}
= BX — B(X))(BY1X) — B(Y))}
= E{(X— B(X))(E(Y) — E(Y))} =
Fonte: Autor/YDUQS
Em que, na segunda linha, utilizamos a lei das expectativas iteradas
2. Assinale a alternativa correta sobre o coe!
jonte de in
inago da reta de regressao linear:
Aalternativa
esté corretaEssa é a definigao do coeficiente de inclinacao da reta de regressao linear obtida via MQO. Podemos dizer que a
inclinagao da reta de regressdo 6 a covaridncia amostral entre Xe Y corrigida pela variancia de X.
CONCLUSAO
CONSIDERAGOES FINAIS
Neste tema, vimos alguns conceitos-chave para a introdugdo de econometria, Comegamos com uma explicagao do que &
‘© método de trabalho em econometria, apresentando as abordagens estrutural e reduzida. Depois, construimos 0
estimador basico da econometria, pelo método de minimos quadrados ordinarios.
Estudamos, portanto, a base para toda pesquisa economeétrica ou de analise de dados. Vocé encontrara isso a todo
momento, Empresas, governos e a academia querem saber qual é 0 impacto de uma politica piiblica sobre 0
desenvolvimento econdmico, que fatores incentivam a pesquisa cientifica, quais so os determinantes dos pregos das
agbes, ¢ assim por diante
\Vocé deu 0 primeiro passo para se tomar um cientista de dados!
Para ouvir um podeast sobre
© assunto, acesse a versao
online deste conteuido.
REFERENCIAS
CUNNINGHAM, . Causal inference: the mixtape. [sl]: Yale University Press, 2018.
WOOLDRIDGE, Jeffrey. Introdugao 4 Econometria: uma abordagem modema. 4. ed. [s.1]: Cengage CTP, 2017.
EXPLORE+
Para se aprofundar nos assuntos tratados neste tema, veja os dois primeiros capitulos do livro Causal inference: the
mixtape de Scott Cunningham.\Veja, também, o material sobre minimos quadrados ordinrios em Introdugao 4 Econometria: uma abordagem moderna,
de Jeffrey Wooldridge, uma referéncia importante em econometria, Se gostar de calculo, veja, no livro de Wooldridge,
como obter o estimador de minimos quadrados ordinarios a partir de um problema de otimizagao.
CONTEUDISTA
Raphael Guinancio Bruce
@& CURRICULO LATTES