100% encontró este documento útil (1 voto)
359 vistas29 páginas

Economtria Fase 3 Unad

Este documento presenta información sobre la fase 3 de econometría, la cual aborda los temas de multicolinealidad, heterocedasticidad y autocorrelación. Inicialmente, provee definiciones de conceptos básicos como errores de un modelo econométrico. Luego, explica los conceptos de multicolinealidad, heterocedasticidad y autocorrelación de los errores de forma detallada. Finalmente, solicita responder preguntas sobre estos temas.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
100% encontró este documento útil (1 voto)
359 vistas29 páginas

Economtria Fase 3 Unad

Este documento presenta información sobre la fase 3 de econometría, la cual aborda los temas de multicolinealidad, heterocedasticidad y autocorrelación. Inicialmente, provee definiciones de conceptos básicos como errores de un modelo econométrico. Luego, explica los conceptos de multicolinealidad, heterocedasticidad y autocorrelación de los errores de forma detallada. Finalmente, solicita responder preguntas sobre estos temas.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

lOMoARcPSD|12952371

economtria fase 3 unad

Fundamentos de Economía (Universidad Nacional Abierta y a Distancia)

StuDocu is not sponsored or endorsed by any college or university


Downloaded by cuarto semestre ([email protected])
lOMoARcPSD|12952371

ECONOMETRÍA

UNIDAD 2: FASE 3 - MULTICOLINEALIDAD, HETEROCEDASTICIDAD Y


AUTOCORRELACIÓN

MARLY YISELA SALAZAR

ALEJANDRA CRISTANCHO

MAYID ERASMO CARVAJAL

CARLOS ANDRÉS GÓMEZ PEÑALOZA

GRUPO: 105010_5

DIRECTOR: JUAN DAVID PULIDO

PROGRAMA: ECONOMÍA

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD

Downloaded by cuarto semestre ([email protected])


lOMoARcPSD|12952371

I. Responder las siguientes preguntas:

a) ¿Qué son errores o residuos de un modelo econométrico?


El término error viene a ser la diferencia entre el valor observado de la variable
dependiente (de la data poblacional) y el valor estimado poblacional que se
obtiene de la recta de regresión poblacional.
U= Y - (Y^ ¿

b) ¿Por qué los errores se miden como Y (real) – Y (estimado)?, ¿qué


son cada una de estas variables Y (la real y la estimada)?

El valor estimado muestral de la variable dependiente equivale al estimado


muestral del intercepto más el estimado muestral de la pendiente que multiplica al
valor muestral de la variable independiente, esto es:

Y^ = ^β + ^β 1 X1

La variable dependiente Y es la variable que se desea explicar.

c) ¿Qué son errores ruido blanco?


Según Villavicencio (s.f) “Un ruido blanco es un caso simple de procesos
estocásticos, donde los valores son independientes e idénticamente distribuidos a
lo largo del tiempo con media cero e igual varianza.”(p.3)
Característica de una variación que es puramente aleatoria y que no contiene
elementos sistemáticos. La propiedad ideal de un término de error estocástico es
una ecuación de regresión es ruido blanco, un ruido blanco es una serie tal que
su media es cero, la varianza es constante y no están serial mente
correlacionada.

d) ¿Qué significa “normalidad de los errores”?

Según Ecured (s.f) “Para cada valor de la variable independiente (o combinación


de valores de las variables independientes), los residuos se distribuyen
normalmente con media cero.

Esto se refiere a que todos nuestros datos, tanto nuestras variables


independientes así como nuestra variable dependiente, tienen que tener puntajes

Downloaded by cuarto semestre ([email protected])


lOMoARcPSD|12952371

que están distribuidos normalmente. Más específicamente los residuos (error) de


estos puntajes deben tener una distribución normal. ¿Por qué es importante esto?
La regresión es un análisis lineal y por ello, trabaja con relaciones lineales.
Cuando los errores de las variables tienen distribución no normal, pueden afectar
las relaciones y la significancia
La normalidad de los errores permite la estimación por intervalos de confianza no
sólo para los coeficientes de regresión, sino también para la predicción. Permite el
planteamiento de pruebas de hipótesis sobre los parámetros del modelo. Cuando
los errores no son normales, los intervalos y las pruebas de hipótesis no son
exactas y pueden llegar a ser inválidas.”

e) ¿Por qué algunos modelos no utilizan las variables en sus


unidades originales y las transforman con diferentes estrategias
como logaritmo, delta Δ (cambio, tasa), variación porcentual, al
cuadrado, al cubo, multiplicadas por pares, u otro?

Según Gurajati (2009) “En el análisis empírico con frecuencia se manipulan los
datos simples. Por ejemplo, en las regresiones de series de tiempo con datos
trimestrales, por lo general estos datos provienen de datos mensuales a los que
se agregan simplemente las observaciones de tres meses y se divide la suma
entre 3. Este procedimiento de promediar las cifras suaviza en cierto grado los
datos al eliminar las fluctuaciones en los datos mensuales.”(p.417)

Teniendo en cuenta de que estos estos modelos de regresión lineal se


fundamentan o se configuran mediante la relación con grupos relacionados entre
sí que pueden construir modelos complejos, las relaciones entre fenómenos y su
aparente causalidad son difíciles de medir o de evaluar, en este sentido los
señores (Bernoulli, Gauss, Laplace) estudiaron estos fenómenos e inventaron lo
que hoy se conoce como la probabilidad y la estadística , sumado a lo anterior
existen magnitudes con el comportamiento relativamente constante es decir que
cada vez que se mide el resultado es el mismo es decir de que el tamaño de un
lapicero, el peso de un vehículo, la distancia a un punto del planeta o a la luna o
cuyo movimiento es fijo o constante o acelerado con los objetos al caer o el
movimiento de la tierra, pero cuando queremos comparar dos o más posibilidades
que no sean magnitudes determinadas es cuando se hace necesario no utilizar
las variables en sus unidades originales y las transformamos con diferentes
estrategias como los logaritmos.

Downloaded by cuarto semestre ([email protected])


lOMoARcPSD|12952371

II. Explicar con sus palabras los conceptos esenciales de


la fase:
a) Multicolinealidad de las X
b) Heterocedasticidad de los errores
c) Autocorrelación de los errores.

MULTICOLINEALIDAD

Este concepto hace referencia a la relación perfecta o casi perfecta entre algunas
variables explicativas. Por ejemplo, el modelo econométrico
Y= Bo+B1X1+B2x2+B3x3 + e
Diremos que presenta multicolinealidad si X1 y X3 denotan alguna correlación, es
decir, están relacionadas. Ahora bien, ¿por qué es un problema? Porque es difícil
aislar los efectos individuales B1 y B3 sobre la variable Y
Uno de los supuestos del modelo clásico de regresión lineal es que no exista
ningún tipo de multicolinealidad.
Según Gujarati (2009) “se dice que existe una relación lineal exacta si se satisface
la siguiente condición λ1X1 + λ2X2 + ·· ·+λk Xk _=0; donde λ1, λ2…., λk .Son
constantes tales que no todas son simultáneamente iguales a cero” (p.321).
Ahora, de la forma casi perfecta, también incluida en la multicolinealidad se
expresa: λ1X1 + λ2X2 + ·· ·+λ2Xk + vi _=0 donde vi es un término de error estocástico.
Cabe agregar, la siguiente cuestión “¿Por qué supone el modelo clásico de
regresión lineal que no hay multicolinealidad entre las X? : Si la multicolinealidad
es perfecta(…), los coeficientes de regresión de las variables X son
indeterminados, y sus errores estándar, infinitos. Si la multicolinealidad es menos
que perfecta, (…), los coeficientes de regresión, aunque sean determinados,
poseen grandes errores estándar (En relación con los coeficientes mismos), lo
cual significa que los coeficientes no pueden ser estimados con gran precisión o
exactitud.”(Gujarati, 2009, p.323)
Causas
Las causas de la multicolinealidad son diversas, dicho problema podría deberse a:
 Métodos erróneos de recolección de información
 Restricciones en el modelo o en la población muestral

Downloaded by cuarto semestre ([email protected])


lOMoARcPSD|12952371

 Mala especificación del modelo.


 Modelo sobre determinado

Consecuencias
En el caso de multicolinealidad casi perfecta, los coeficientes pueden ser
estimados por MCO, presentándose las siguientes características en dicha
regresión:
 Los estimadores obtenidos son MELI
 Las covarianzas y varianzas estimadas son grandes lo que genera
una estimación no precisa. Los estimadores de los coeficientes y de
las varianzas son muy sensibles a cambios pequeños en los datos.
 Los intervalos de confianza se vuelven más amplios
 La razón t de uno o más coeficientes tiende a ser estadísticamente
no significativos.
 El R^2 presenta valores altos.

En el caso que se quiera detectar la existencia de multicolinealidad se debe estar


atento a un conjunto de características ( para este caso mencionaré solo dos):
R^2 con valor alto
Correlación alta ente regresoras (por lo general una correlación mayor a 0.8 es un
indicador de problema)
Corrección
De haberse detectado la presencia de multicolinealidad casi perfecta, se puede
corregir mediante:
 Eliminación de la(s) variable causante de multicolinealidad
 La transformación de datos.
 Combinación de información de corte transversal y de serie de tiempo
 Adición de datos nuevos.

LA HETEROCEDASTICIDAD

La heterocedasticidad se refiere a que la varianza del término error del modelo


econométrico varía a lo largo de diferentes observaciones, es decir, es una
varianza fluctuante. En otras palabras, la heterocedasticidad implica que la
varianza del error es diferente para cada valor de “x”, la varianza no es constante.

Downloaded by cuarto semestre ([email protected])


lOMoARcPSD|12952371

Además, la heteroscedasticidad del error es una violación al supuesto del modelo


clásico de regresión lineal de homocedasticidad.

Según Pedrosa (2020) “La heterocedasticidad es, en estadística, cuando los


errores no son constantes a lo largo de toda la muestra. El término es contrario
a homocedasticidad. En otras palabras, en los modelos de regresión lineales se
dice que hay heterocedasticidad cuando la varianza de los errores no es igual en
todas las observaciones realizadas. Así, no se cumple uno de los requisitos
básicos de las hipótesis de los modelos lineales.”

Causas de la heteroscedasticidad

Entre algunas causas se pueden señalar:

 Los datos de corte transversal sobre el comportamiento de agentes


económicos son muy heterogéneos cuando la muestra seleccionada no ha
sido previamente filtrada.
 La presencia de factores atípicos (variables regresoras cuyo dato puede
tener un valor muy alto o muy bajo en comparación a los otros datos).
 Incorrecta transformación de datos.
 Forma funcional incorrecta del modelo econométrico.
 Debido a que el término de error de un modelo econométrico representa a
aquellas variables no consideradas, por lo tanto, una causa de este
problema es la omisión de variables relevantes y la intensidad de la
heteroscedasticidad depende del comportamiento de las variables
omitidas.

Existen diferentes pruebas de diagnóstico de este problema, se pueden nombrar


a: test de Park; Glejser; Spearman; Goldfeld – Quandt; Breusch-Pagan.Godfrey,
prube general de heteroscedasticidad de White; koenker – Basset.

Downloaded by cuarto semestre ([email protected])


lOMoARcPSD|12952371

LA AUTOCORRELACIÓN

La autocorrelación implica que los errores del modelo no son independientes


entre sí. Es decir, la esperanza matemática de un error en el periodo (i) con
respecto al periodo (j) es diferente de cero. Los errores a lo largo del tiempo están
relacionados.

E( μi, μj ¿ ≠ 0

La autocorrelación aparece generalmente en series temporales pero también


puede darse en modelos de corte transversal ( se denomina correlación espacial)

Para comprender a detalle es menester postular el siguiente ejemplo planteado


en la página web de YouTube - Economía con Manzanitas - sobre la
autocorrelación:

Imaginemos que nuestro estado de ánimo es igual a una constante, la constante


de estar bien.

ESTADO DE ÁNIMO: yt =C

Al graficar tenemos

yt

yt=C

Tiempo

Downloaded by cuarto semestre ([email protected])


lOMoARcPSD|12952371

Nuestros estados de ánimo fluctúan alrededor de la constante. Ahora bien, la


pregunta es si nuestro estado de ánimo tiene o no autocorrelación? Para hallar la
respuesta tenemos que estimar el error, es decir, la diferencia entre las curvas.

Así el error se define como nuestro estado de ánimo actual menos nuestro estado
de ánimo estimado

Error: μi= yt − ^y t

El estado de ánimo es como nos sentimos ahora, felices, tristes, etc, por otro
lado, nuestro estado de ánimo estimado viene dado por el modelo que es igual a
la constante de estar bien.

Todos los estados de ánimo diferentes a estar bien se consideran un error. Así, el
error es un cambio imprevisto en tu estado de ánimo.

De lo anterior, la autocorrelación son los cambios imprevistos en los


estados de ánimo y dichos cambios se encuentran relacionados.

Por ejemplo, si un individuo tiene diferentes estados de ánimo a lo largo de la


semana (3 días felices y 3 días tristes). Los estados de ánimo presentan
autocorrelación porque se observa un patrón curioso, es que se denota que tres
días se encuentra feliz y tres días triste.

¿Qué significa que los errores se encuentren correlacionados? Pues si hubo un


cambio imprevisto, un error en un periodo atrás en el tiempo, ese mismo afecta al
error que va a ocurrir hoy en día.

Otro ejemplo sería lo acontecido por un terremoto que afecta la producción, ese
terremoto que ocurrió un año atrás no solamente afectó la producción de ese
tiempo sino que afecta a la producción de hoy en día y posiblemente a la
producción del siguiente año.

Por otro lado, ¿cómo determinar si el modelo econométrico tiene problemas de


autocorrelación? Someramente y sin la capacidad de explicarlos diestramente se
deben realizar la aplicación de ciertas pruebas:

 La prueba d de Durbin-Watson
 La prueba de Breusch - Godfrey
 Resolver los ejercicios de Gujarati (2009): 10.29 y 10.33,
del modelo general de ambos ejercicios (para el 10.29 el

Downloaded by cuarto semestre ([email protected])


lOMoARcPSD|12952371

loglineal eliminando la multicolinealidad y para el 10.33 el


modelo lineal con todas las variables), obtener los errores
de estimación y realizar los análisis de heterocedasticidad
y de autocorrelación.

EJERCICIOS 10.29 Y 10.33

Downloaded by cuarto semestre ([email protected])


lOMoARcPSD|12952371

Para dar respuesta a los interrogantes, lo primero realizado fue utilizar


el comando summarize:

Downloaded by cuarto semestre ([email protected])


lOMoARcPSD|12952371

Acto seguido se creó la matriz de correlación, al utilizar el comando


Correl:

Es menester que al examinar los coeficientes de relación entre las


variables independientes, se detallan altos niveles de correlación entre
X4 (ingreso personal disponible, IPD) y X2 (automóviles nuevos, IPC)
Con una correlación de 0.9914.

Otra correlación alta se establece en X4 (ingreso personal disponible,


IPD) y X6 (fuerza laboral civil empleada…) Con una correlación de
0.9726

Al revisar la correlación entre X2 (automóviles nuevos, IPC) y X3 (“IPC,


todos los renglones, todos los consumidores urbanos”) se obtiene que:
Una correlación de 0.9969.

Asimismo, al revisar las variables X5 y X6 su correlación es:0.5362 La


cual es menor a todas las anteriores. Correlación fuerte entre X3 (“IPC,

Downloaded by cuarto semestre ([email protected])


lOMoARcPSD|12952371

todos los renglones, todos los consumidores urbanos”) y X4 (IPD,


ingreso disponible)(0.9913)
Para generar un modelo log-lineal en Stata, lo primero que se debe
hacer es crearlo mediante el siguiente comando:

Generate lx2= ln(x2)


Generate lx3= ln(x3)
Generate lx4= ln(x4)
Generate lx5 = ln (x5)
Generate lx6= ln (x6)
Generate ly = ln(y)

Si se incluyen todas las regresoras, se obtiene lo siguiente:

Log(y)= 3.2634+1.79(Lx2)+ -4.109(Lx3) + 2.127(Lx4)+ -


0.030(Lx5)+0.276(Lx6) + u

Si se espera encontrar el problema de la multicolinealidad, ya que como


se observa la R^2 tiene un valor muy alto (0.8548). Es decir, existe
una correlación elevada entre las regresoras (por lo general una
correlación mayor a 0.8 es un indicador de este problema)

Para resolver lo anterior, se puede corregir mediante la eliminación de


una o más variables causantes de dicha multicolinealidad.

Downloaded by cuarto semestre ([email protected])


lOMoARcPSD|12952371

Por ende se puede retirar las variables(X3 y X4) y se obtiene el


siguiente resultado

Ahora el valor de la R^2 es 0.6848 lo cual es recomendable.

Prueba de heteroscedasticidad

Al aplicar esta prueba a la anterior regresión se busca comprobar la


existencia o no de la heteroscedasticidad, para esto, hay que tener en
cuenta lo siguiente:

Prueba de White en Stata

Esta prueba se puede estimar vía imtest, White en Stata (comando)

Ho= existe homoscedasticidad


H1= No hay homoscedasticidad (existe heteroscedasticidad)

Valor > 0.05 No rechazar Ho (existe homocedasticidad)


Valor <0.05 Rechazar Ho (existe heteroscedasticidad)

Se busca que exista homoscedasticidad ya que es uno de los supuestos


de los estimadores de regresión lineal

Downloaded by cuarto semestre ([email protected])


lOMoARcPSD|12952371

El valor encontrado es 0.1042, el cual es mayor a 0.05, por ende existe


homocedasticidad

Test de Autocorrelación

No rechace autocorrelación positiva.

Downloaded by cuarto semestre ([email protected])


lOMoARcPSD|12952371

10.33. Datos Longley actualizados. Ampliamos los datos de la seccion 10.10 para incluir ob-
servaciones de 1959-2005. Los nuevos datos aparecen en la tabla 10.17. Los datos se
relacionan con Y numero de personas empleadas, en millares;I = deflactor de pre-
cios implicito del PNB; +z = PNB, millones de dolares; +3 = numero de personas des-
empleadas, en millares; +4 = numero de personas en las fuerzas armadas, en millares;
X; poblacidn no lnstitucionalizada mayor de 16 anos, yI = año, igual a 1 en 1959,
2 en 1960 y 47 en 2005.
a) Trace diagramas de dispersion, como se indica en el capitulo, para evaluar las
relacio- nes entre las variables independientes. ¿Hay relaciones fuertes? ¿Parecen
lineales?
b) Elabore una matriz de correlacion. ¿Qué variables parecen relacionarse mas ente st,
sin incluir la dependiente?
c) Ejecute una regresiñn estândar de MCO para pronosticar e1 numero de personas
em- pleadas en millares. ¿Los coeficientes de las variables independientes se
comportan como esperaria?
d) Con base en los resultados anteriores, ¿cree que estos datos sufren de
multicolineali- dad?

tsset observation, year


time variable: obs•zrvation, 1959 to 2005
delta: 1 year

Downloaded by cuarto semestre ([email protected])


lOMoARcPSD|12952371

TABLA1O.I7

dv, t95P-2IXI5 1959 6463D 82.P08 5O93IXI 37'4D 2S52 J2D287' 1


1960 65Z78 84.074 S296IXI 3&52 2SJ4 J21836 2
196J 65Z'4G BE.0\5 5482IXI 47J4 2S73 J23404 3
1 963 67762 87.J03 62Z2IXI 4DZ0 2 73Z J27274 S
sssas aa.‹3a asa‹ro bros 2z›g zs427’ 6
1965 71088 90.OSS 7244IXI 336G 2722 J31S4J 7
1966 72896 92.624 7929IXI 2876 3J23 J3365D 8
1967 74372 95.49\ 838OtX) 2976 3446 J3'i90S 9
1968 7'i92D 99.Sd 9J61IXI 28J7 3S3S J38J7J ID
1 969 77902 J04.S04 99OZtAI 2BM 3SD6 J4D4GJ 11
1970 78678 J o. s J 0449IXI 4093 › ag 43OZ0 1z
197 J 79367 JJS.S49 J J34Zt@ 60J6 28J6 J46826 13
1972 82 JS3 JZ0.SS6 J 2468IXI 4882 2449 J48S92 14
1973 85064 JZ7.307 J 3953IXI 43-d5 2 32?’ JS1476 16
197S 8SB4G JSJ.&S7 J6SJ 3IXI 7929 2JBO \S7344 17
1976 887’S2 J60.68 J8421IXI 740G 2J44 J603J9 18
1977’ 92OJZ J7’0.884 205J2IXI 6P9J 2J33 J633ZZ 19
1978 P6048 JB2.863 23J63IXI 6202 2JJZ J6G422 2D
98824 JP8.077 Z59S 3IXI 6137 2088 J6944D 21
1P8J \00S97 23d.385 S JgJ 4IXI 8273 2J42 J74929 23
1982 99526 2S0.7'S8 329J5IXI JD678 2JZP \77 JZ6 24
1P83 J00B34 260.68 35738IXI JD7J7 2J99 J79234 25
1P84 J05IXt5 27'0.4P6 39dP6IXI 8539 22J9 J81 J92 26
lms JOZJSD 278.759 42468IXI 83J2 2234 J83J74 27
1 986 J09S97 2B4.B9*i 448OétAI 8Z37 2244 J8S2B4 28
J\244D 292.69J 473F 4IXI 7425 2257' \874\9 29
J\4968 302.68 SJ27’4IXI 67IIJ 2224 J89233 3D
1P89 J\Z342 3J4.179 S5J0élXI 6528 220B J90862 31
1 P90 J\87'93 326.357 S837'9IXI 7047 2J6Z J92644 32
1P9J J\ZZ'J8 337.747 60263IXI 8628 2JJ8 J94936 33
1 993 J2DZS9 3S3.SJg 66893IXI 8P4D J 7€0 J9962Z 35
1P94 J230d0 bsl.02s rosg«ro z azz zo gzo u
lms J24P00 368.444 Z4334IXI 7404 J SZP Z0442D 37
1996 J26708 37S.42B ?’B5J 9IXI 723d J SDZ Z0ZO8?’ 38
1P9 7 J29SS8 38J.663 83373IXI 6739 J 457 Z09846 3S
1 P9B J31463 3BS.BBC B7€B 3IXI gZJD 423 ZI263B 4D
1P99 J33488 39J.4S2 93D22IXI 3B80 J 3BO Z\3404 41
2IXI0 ugs ass.see sssssro 5692 J 4DS 2\8OGJ 42
J36933 409.S82 JOJ7J ét@ 680J J 4J2 Z2D800 43
J364B5 4J6.7g4 JO5O02IXI 8378 J 42S Z23S32 44
J3Z?’36 4ZS.S53 JJ 0J76IX) 8774 J 423 Z26223 46
2lXl4 J39Z52 437.Z9*i JJ 76Z1IXI 8149 4JJ Z2889Z 4G
2oos J41 7'3D 4SJ.P4G JZ5D24IXI 7S9J J 3ZB Z31SSZ 47

Downloaded by cuarto semestre ([email protected])


lOMoARcPSD|12952371

“Y = número de personas empleadas, en millares


X1= deflactor de precios implícito del PNB
X2= PNB, millones de dólares
X3= número de personas desempleadas
X4= número de personas en las fuerzas armadas, en millares
X5= población no institucionalizada mayor de 16 años
X6= año, igual 1 en 1959, 2 en 1960 y47 en 2005”

Para realizar los diagramas de dispersión se utiliza el comando


Graph matrix y x1 x2 x3 x4 x5 x6 en Stata

Con lo anterior se obtiene lo siguiente:

Downloaded by cuarto semestre ([email protected])


lOMoARcPSD|12952371

0 500000 0 5 10 100000150000200000250000
150

Y 100

50
500000

X1

0
1.5e+07

1.0e+07
X2
5.0e+06

10 0

5 X3

0
4000

3000
X4
2000

1000
250000

200000
X5
150000

100000 50

X6

0
50 100 150 0 5.0e+061.0e+071.5e+07 1000 2000 3000 4000 0 50

Hay relaciones fuertes pero no perfectas entre X1X2, X1X5, X1X6,X2X5, X2X6,X5X6

Downloaded by cuarto semestre ([email protected])


lOMoARcPSD|12952371

Gráfica X1X2

0 5.0e+061.0e+071.5e+07
500000

X1

0
1.5e+07

1.0e+07

X2
5.0e+06

0
0 500000

Gráfica X1X5

100000150000200000250000
500000

X1

0
250000

200000

X5
150000

100000
0 500000

Downloaded by cuarto semestre ([email protected])


lOMoARcPSD|12952371

Gráfica X1X6

0 50
500000

X1

0
50

X6

0
0 500000

Gráfica X2X5

100000150000200000250000
1.5e+07

1.0e+07

X2
5.0e+06

0
250000

200000

X5
150000

100000
0 5.0e+061.0e+071.5e+07

Downloaded by cuarto semestre ([email protected])


lOMoARcPSD|12952371

Gráfica X2X6

0 50
1.5e+07

1.0e+07

X2
5.0e+06

0
50

X6

0
0 5.0e+061.0e+071.5e+07

Gráfica X5X6

0 50
250000

200000

X5
150000

100000
50

X6

0
100000150000200000250000

Downloaded by cuarto semestre ([email protected])


lOMoARcPSD|12952371

Entre las variables X1 (“deflactor de precios implícito del PNB”) y X2 (“PNB,


millones de dólares”) se identifica una relación fuerte con tendencia a la forma
lineal. Del mismo modo, entre las variables X5 (“población no institucionalizada
mayor de 16 años”) y X6 (“año”) se evidencia una fuerte relación, presentando la
tendencia más clara de linealidad. Entre la variable X1 y las variables X5 y X6 se
observa una fuerte relación con tendencia a tomar forma lineal o cuadrática,
aunque no es tan clara como en el caso anterior; del mismo modo entre la
variable X2 y las variables X5 y X6 se observa una fuerte relación que podría ser
descrita a través de la forma funcional cuadrática.

“Y = número de personas empleadas, en millares


X1= deflactor de precios implícito del PNB
X2= PNB, millones de dólares
X3= número de personas desempleadas
X4= número de personas en las fuerzas armadas, en millares
X5= población no institucionalizada mayor de 16 años
X6= año, igual 1 en 1959, 2 en 1960 y47 en 2005”

Downloaded by cuarto semestre ([email protected])


lOMoARcPSD|12952371

Sin incluir la variable dependiente, las variables que parecen relacionarse más
entre sí son X5 (“población no institucionalizada mayor de 16 años”) y X6 (“año”)
ya que como lo indica su coeficiente de correlación es el más alto de todos, 0,999.
Entre la variable X1 (deflactor de precios implícito del PNB) y las variables X5 y
X6 también se observa una alta correlación, 0,9890 y 0,9889 respectivamente. La
variable X2(PNB, millones de dólares) se observa una correlación altas con las
variables X5 (“población no institucionalizada mayor de 16 años”) con 0.9600 y
con X6 (años) con 0.9626
Como se ve, varias de estas correlaciones a pares son muy altas, lo cual sugiere
que quizá haya un problema de colinealidad

En primera instancia se observa que el valor de R^2 es muy alto (0.9994). Los
coeficientes de las variables (X2, X3,X4, y X6) son negativos.
Se ejecuta la regresión estándar de MCO para estimar el modelo:
Y(estimado) = B0 + B1X1 + B2X2 + B3X3 + B4X4 + B5X5 + B6X6 + u
Los resultados estiman el siguiente modelo:

Downloaded by cuarto semestre ([email protected])


lOMoARcPSD|12952371

Yestimado = –11.31 + 0.000087 (X1) – 1.47e-06 (X2) – 1,4324(X3) – 0.001066(X4)


+ 0,0006433 (X5) – 0.0913 (X6) + u

El término constante es incoherente, ya que se puede recordar que éste indicaría


el valor predicho para Y cuando las variables independientes introducidas en el
modelo son iguales a cero. No es lógico que haya un punto donde el número de
personas empleadas en millares sea -11.304.
El coeficiente B2 correspondiente a la variable X2 no es el esperado. En teoría, un
alto nivel en la producción debería venir acompañado de altos niveles de empleo,
lo que implicaría una relación positiva con la variable Y (número de personas
empleadas)
El coeficiente B4 correspondiente a la variable X4 tampoco es el esperado. Lo
lógico es que entre más personas haya en las fuerzas armadas, mayor sea el
número de personas que pueden considerarse como empleadas. Pero en el
modelo el coeficiente es negativo, o sea que indica una relación inversa.

“Y = número de personas empleadas, en millares


X1= deflactor de precios implícito del PNB
X2= PNB, millones de dólares
X3= número de personas desempleadas
X4= número de personas en las fuerzas armadas, en millares
X5= población no institucionalizada mayor de 16 años
X6= año, igual 1 en 1959, 2 en 1960 y47 en 2005”

Downloaded by cuarto semestre ([email protected])


lOMoARcPSD|12952371

Al observar los datos anteriores, el ejercicio en cuestión sufre de multicolinealidad. Ahora


bien, ¿ qué acciones correctivas pueden llevarse a cabo?. En primer lugar, el PNB puede
expresarse no en términos nominales, sino en términos reales, lo cual se realiza al dividir
el PNB nominal entre el índice de deflación del precio implícito.
En Stata la anterior operación se ejecuta de la siguiente manera:

En segundo lugar, en vista de que la población no institucional mayor de 16 años (x5)


aumenta con el tiempo debido al crecimiento natural de la población, estará
correlacionada con el tiempo, la variable x6 del modelo. Por tanto, en lugar de conservar
esas dos variables, se mantiene la variable x5 y se desecha x6. En tercer lugar, se
desestima x3, el número de personas desempleadas.

Downloaded by cuarto semestre ([email protected])


lOMoARcPSD|12952371

Aunque R^2 disminuyó un poco en comparación con la R^2 original, aún es alta. Los
coeficientes estimados son significativos y sus signos tienen sentido.

Prueba de heteroscedasticidad

Al aplicar esta prueba a la anterior regresión se busca comprobar la


existencia o no de la heteroscedasticidad, para esto, hay que tener en
cuenta lo siguiente:

Prueba de White en Stata

Esta prueba se puede estimar vía imtest, White en Stata (comando)

Ho= existe homoscedasticidad


H1= No hay homoscedasticidad (existe heteroscedasticidad)

Valor > 0.05 No rechazar Ho (existe homocedasticidad)


Valor <0.05 Rechazar Ho (existe heteroscedasticidad)

Se busca que exista homoscedasticidad ya que es uno de los supuestos


de los estimadores de regresión lineal

Downloaded by cuarto semestre ([email protected])


lOMoARcPSD|12952371

El resultado obtenido es 0.0065 el cual es menor a 0.05, por lo tanto existe


heteroscedasticidad.

PRUEBA DE AUTOCORRELACIÓN

Downloaded by cuarto semestre ([email protected])


lOMoARcPSD|12952371

BIBLIOGRAFÍA

Villavicencio. J. (s.f).Introducción a las series de tiempo. Recuperado de


http://www.estadisticas.gobierno.pr/iepr/LinkClick.aspx?fileticket=4_BxecUaZmg
%3D

Pedrosa, S. J. (2020, 27 julio). Heterocedasticidad. Economipedia.


https://economipedia.com/definiciones/heterocedasticidad.html

Gujarati, D. (2009) Econometría, (5a. ed.), Ed. Mc Graw Hill.


Recuperado de http://www.ebooks7-
24.com.bibliotecavirtual.unad.edu.co/?il=279&pg=1

EcuRed. (s. f.). Normalidad del modelo de regresión lineal - EcuRed.


Recuperado 7 de octubre de 2020, de
https://www.ecured.cu/Normalidad_del_modelo_de_regresi
%C3%B3n_lineal#:%7E:text=La%20normalidad%20es%20uno
%20de,la%20distribuci%C3%B3n%20normal%20tambi%C3%A9n
%20llamada

Downloaded by cuarto semestre ([email protected])

También podría gustarte