0% encontró este documento útil (0 votos)
25 vistas9 páginas

Monitoria No.3

Cargado por

Juan Serrato
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
25 vistas9 páginas

Monitoria No.3

Cargado por

Juan Serrato
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

Monitoria No.

3
Juan José Almeida y Maximiliano Millan

2024-03-01

Modelo de regresión lineal simple (MCO)


La teoría microeconómica suele establecer, a través de modelos, relaciones funcionales
entre dos o más variables para explicar cómo toman decisiones los agentes. En este caso se
desea analizar las propiedades estadísticas o de muestras finitas y de muestras grandes de
una familia de estimadores, entre ellos el de mínimos cuadrados ordinarios (MCO).
library(readxl)
GEIH_Valle2020 <- read_excel("C:/Users/Juan/OneDrive/Escritorio/JUAN
JOSÉ/univalle/Semestre 2024-I/Monitorias Eco
2024/GEIH_Valle2020_TrimIV.xlsx")
View(GEIH_Valle2020)

GEIH <- GEIH_Valle2020[, c("ingrlab", "esc")]


View(GEIH)
summary(GEIH)

## ingrlab esc
## Min. : 0 Min. : 0.000
## 1st Qu.: 600000 1st Qu.: 7.000
## Median : 890000 Median :11.000
## Mean : 1203435 Mean : 9.859
## 3rd Qu.: 1300000 3rd Qu.:11.000
## Max. :36000000 Max. :26.000
## NA's :3189 NA's :2

Omitir NA
GEIH_V <- [Link](GEIH)

Nombramos las variables


Ingreso <- GEIH_V$ingrlab
Escolaridad <- GEIH_V$esc

Gráfico de dispersión
plot(Ingreso ~ Escolaridad, data = GEIH_V)
Gráfico de escolaridad
library(ggplot2)
ggplot(data=GEIH_V, mapping= aes(Escolaridad)) +
xlim(0,50)+
geom_histogram(aes(y= ..density..), color = "green", fill = "darkred")+
stat_function(fun = dnorm, args = list(mean = mean(Escolaridad), sd =
sd(Escolaridad)), col = "darkblue")+
geom_density(fill = "black", alpha = 0.2)+
theme_bw()

## Warning: The dot-dot notation (`..density..`) was deprecated in ggplot2


3.4.0.
## ℹ Please use `after_stat(density)` instead.
## This warning is displayed once every 8 hours.
## Call `lifecycle::last_lifecycle_warnings()` to see where this warning was
## generated.

## `stat_bin()` using `bins = 30`. Pick better value with `binwidth`.

## Warning: Removed 2 rows containing missing values (`geom_bar()`).


Modelo de regresión líneal
Modelo1 <- lm(Ingreso ~ Escolaridad, data = GEIH_V)
Modelo1

##
## Call:
## lm(formula = Ingreso ~ Escolaridad, data = GEIH_V)
##
## Coefficients:
## (Intercept) Escolaridad
## -470691 153179

summary(Modelo1)

##
## Call:
## lm(formula = Ingreso ~ Escolaridad, data = GEIH_V)
##
## Residuals:
## Min 1Q Median 3Q Max
## -2905606 -614279 -216865 304796 34019826
##
## Coefficients:
## Estimate Std. Error t value Pr(>|t|)
## (Intercept) -470691 74313 -6.334 2.76e-10 ***
## Escolaridad 153179 6387 23.982 < 2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Residual standard error: 1375000 on 2908 degrees of freedom
## Multiple R-squared: 0.1651, Adjusted R-squared: 0.1648
## F-statistic: 575.1 on 1 and 2908 DF, p-value: < 2.2e-16

El R cuadrado es una métrica estadística que se utiliza para evaluar la bondad de ajuste de
un modelo de regresión.
En este caso, un R cuadrado de 0.1648 significa que aproximadamente el 16.48% de la
variabilidad en los ingresos laborales se explica mediante la variable independiente (años
de educación).

Linealidad
plot(Modelo1, 1, caption = "Modelo1")

Supuestos y Análisis de los Residuales


Residuales <- residuals(Modelo1)
hist(Residuales)
Media cero
mean(Residuales)

## [1] 4.470075e-10

Exogeneidad
Es el supuesto que se encarga de analizar la correlación existente entre las variables
regresoras y los residuales. Lo ideal para exogeneidad es que esta sea 0 ya que si esto no
pasa y las x´s están correlacionadas con los errores no se podrá evaluar correctamente los
distintos efectos de las independientes sobre la regresada. En el caso en el que haya una
sola variable regresora cuantitativa, la correlacion se calcula con los valores estimados.
Para esto analizamos los residuales y su correlación con una Y estimada.
y_estimada <- [Link](Modelo1)
cor(Residuales, y_estimada)

## [1] -2.700573e-16

Normalidad
plot(Modelo1, which = 2)
Varianza constante
(ggplot(Modelo1, aes([Link](Modelo1),Residuales))
+ geom_point(col=I("red"))
+ stat_smooth(method = "loess")
+ stat_binhex(bins = 50)
+ scale_fill_gradient(low = "light blue",high = "black")
+ geom_hline(yintercept = 0,col ="black", linetype = "dashed")
+ xlab("Fitted Values")
+ ylab("Residuals"))

## `geom_smooth()` using formula = 'y ~ x'


No autocorrelación
residualesrezagados <- dplyr::lag(Residuales)
plot(Residuales, residualesrezagados)
Correlograma
Es una representación gráfica de las autocorrelaciones de una muestra consigo misma.
• Los valores de -1 o 1 indican autocorrelación fuerte
• Los valores cerca de cero indican autocorrelación débil
• Los valores negativos indican una relación inversa y los positivos una relación
directa.
acf(Residuales, ci = 0.95, xlab = "Residuales", ylab = "Autocorrelación",
main = "Correlograma", plot = TRUE)

También podría gustarte