0% encontró este documento útil (0 votos)
23 vistas40 páginas

Compendio Unidad 3 Modelos Econométricos - GG-P1-2025

El documento es un curso de econometría que se centra en el análisis de modelos econométricos, específicamente en la regresión lineal múltiple. Se abordan conceptos fundamentales como heterocedasticidad, multicolinealidad y especificación, así como la importancia de seleccionar adecuadamente las variables explicativas. El objetivo es proporcionar a los estudiantes herramientas para analizar datos económicos y validar teorías sobre fenómenos económicos y sociales.

Cargado por

vchavez3966
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
23 vistas40 páginas

Compendio Unidad 3 Modelos Econométricos - GG-P1-2025

El documento es un curso de econometría que se centra en el análisis de modelos econométricos, específicamente en la regresión lineal múltiple. Se abordan conceptos fundamentales como heterocedasticidad, multicolinealidad y especificación, así como la importancia de seleccionar adecuadamente las variables explicativas. El objetivo es proporcionar a los estudiantes herramientas para analizar datos económicos y validar teorías sobre fenómenos económicos y sociales.

Cargado por

vchavez3966
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

ECONOMÍA EN LINEA

MODELOS ECONOMÉTRICOS
3 créditos

Profesora:

Ing. Gabriela García, M.B.A., Ph.D.

Titulaciones Semestre

• ECONOMÍA Cuarto

PERÍODO: ABRIL 2025 – AGOSTO 2025


Índice

Tabla de contenido

Resultado de aprendizaje de la asignatura ..................................................................................... 2


Introducción.............................................................................................................................. 2
Tema 1. El modelo lineal de tres variables ..................................................................................... 4
La heterocedasticidad .............................................................................................................. 4
La multicolinealidad ................................................................................................................. 5
La Especificación ..................................................................................................................... 5
El Modelo de regresión lineal múltiple .................................................................................... 5
Tema 2: El coeficiente de determinación múltiple ........................................................................ 14
Definición Técnica .................................................................................................................. 14
Representación Gráfica del R Cuadrado .............................................................................. 15
Limitaciones Claves del R Cuadrado .................................................................................... 16
El problema del coeficiente de determinación ..................................................................... 16
El coeficiente de determinación ajustado (R cuadrado ajustado ....................................... 19
¿De qué se trata una prueba de significación? .................................................................... 23
¿Qué es un Estimador? ......................................................................................................... 23
Propiedades que debe ter un estimador ............................................................................... 23
Suficiente ................................................................................................................................ 23
Insesgado ............................................................................................................................... 23
Consistente ............................................................................................................................. 23
Eficiente .................................................................................................................................. 24
Robusto................................................................................................................................... 24
Matriz de varianzas y covarianzas de los estimadores......................................................... 24
Tema 4: Prueba de la significación global .................................................................................... 25
Tema 5: Coeficientes de correlación parcial ................................................................................. 35
¿Qué es la correlación? ......................................................................................................... 35
Interpretación del valor del índice de correlación ................................................................ 36

1
Resultado de aprendizaje de la asignatura

Dotar a los estudiantes de economía las herramientas necesarias para el análisis de la


información generada por las actividades económicas de los individuos, empresas y
gobiernos y validar o plantear teorías sobre los fenómenos económicos y sociales.

MODELOS ECONOMÉTRICOS

Unidad 3 Análisis de regresión lineal múltiple


Resultado de aprendizaje de la unidad:
Utilizar modelos de regresión lineal añadiendo más variables explicativas a la ecuación de regresión
simple.
Introducción

El curso de Econometría hace parte del área de métodos cuantitativos en economía y se


constituye en una herramienta importante en la investigación económica, el diseño y
análisis de política.

Los conocimientos fundamentales de matemáticas, estadística y teoría económica son un


requisito previo necesario para la econometría, ya que como explica, la econometría se
constituye por la unificación de la estadística, la teoría económica y las matemáticas. Cada
punto de vista, por sí mismo, es necesario, pero no suficiente para una comprensión real de
las relaciones cuantitativas en la vida económica moderna.

El objetivo de la presente unidad es utilizar modelos de regresión lineal añadiendo más


variables explicativas a la ecuación de regresión simple, el mismo que se vuelve mucho
más importante incorporar a esta área del conocimiento, puesto que se constituye en una
buena herramienta de interpretación y análisis de los parámetros utilizados, para ello
Iniciaremos con la descripción de conceptos fundamentales para entender y utilizar esta

2
técnica, así como la explicación de sus variables y métodos que se utilizan para el cálculo
de las mimas.

Dicha de otra manera, indicamos entonces que la regresión es una técnica estadística que
consiste en calcular dicha similitud en forma de función matemática. Esta función nos ofrece
mucha más información sobre dicha relación.

Determinamos entonces que, el modelo más sencillo: la regresión lineal simple, ya nos
informa de las siguientes magnitudes: la magnitud de la correlación; el incremento
marginal, el valor de una de ellas cuando la otra es cero y si dicha relación puede
considerarse significativa o fuerte (distinta de una relación normal) o no significativa o débil
(similar a una relación normal), en cambio un modelo de regresión lineal múltiple ya nos
muestro algo más complejo que va de la mano, pero que a la vez interpreta el modelo
desde la perspectiva de más de dos variables independientes.

3
Tema 1. El modelo lineal de tres variables

La regresión lineal múltiple trata de ajustar modelos lineales o linealizables entre


una variable dependiente (y) y más de una variables independientes (X1;X2,X3). En este
tipo de modelos es importante otorgar la heterocedasticidad, la multicolinealidad y la
especificación.

Pues bien para ello es necesario poder establecer cada uno de estos conceptos
que nos ayudan a comprender mejor este importante tema:

La heterocedasticidad

Se presentan cuando los errores nos son constantes a lo largo de toda la muestra,
pues de esta manera la podemos encontrar en los modelos de regresión lineal, cuando la
varianza de los errores, no es igual en todas las observaciones realizadas, es así que la
podemos desglosar en dos partes hetero (diferente) y cedasticidad (dispersión), en
pocas palabras tendríamos entonces que significaría diferente dispersión.

Para ello es importante tener en claro este tema y por lo tanto se presenta un ejemplo a
continuación:

Gráfico N° 1

Representación Gráfica de la Heterocedasticidad

Fuente: (Pedrosa, 2017)

4
La multicolinealidad

Se determina as a la relación de dependencia lineal que existe entre más de dos


variables explicativas en una regresión múltiple, la misma que incumple el
supuesto de
Gauss-Markov, cuando esta es exacta.

Pues ellos establecieron que este es un conjunto de supuestos que deben cumplir
un estimador de MCO (Mínimos cuadrados ordinarios), para que se considere Estimador
Lineal isesgado óptimo)

En consecuencia se establece que la multicolinealidad es la correlación alta ente


más de dos variables explicativas, la misma que debe de ser fuerte, por lo tanto es muy
común encontrar que las variables explicativas de la regresión estén correlacionadas,
entonces se puntualiza que esta debe ser Fuerte pero nunca Perfecta, para que se
considere un caso de multicolinealidad. Es importante destacar que la relación lineal sería
perfecta si el coeficiente de correlación fuese 1.

La Especificación.

Los errores de especificación, se refieren a cualquier error que se cometa en el


conjunto de hipótesis en que se apoya el modelo de regresión tanto si son lo que afectan
a los regresores, como si son los que afectan al término de perturbación. (Del et al., 2013)

El Modelo de regresión lineal múltiple

El modelo de regresión lineal múltiple es idéntico al modelo de regresión lineal


simple, con la única diferencia de que aparecen más variables explicativas o
Independientes.

Para poder diferenciarlos de una mejor manera, es muy importante establecer cada
una de sus variables, las cual las determinamos a partir de la fórmula de la ecuación lineal
simple, que se detalla a continuación.
Modelo de regresión simple

5
y = b0 + b1 ⋅ x

Modelo de regresión múltiple:

y = b0 + b1 ⋅ x1 + b2 ⋅ x2 + b3 ⋅ x3….

Los modelos de regresión múltiple estudian la relación entre una variable de interés

Y (variable respuesta o dependiente) y un conjunto de variables explicativas o regresoras

La regresión lineal múltiple permite generar un modelo lineal en el que el valor de la


variable dependiente o respuesta (Y) se determina a partir de un conjunto de variables
independientes llamadas predictoras (b1X1, b2X2, b3X3…). Es una extensión de la
regresión lineal simple, por lo que es fundamental comprender esta última.
X1, X2, , Xp

Los modelos de regresión múltiple pueden emplearse para predecir el valor de la variable
dependiente o para evaluar la influencia que tienen los predictores sobre ella (esto último
se debe que analizar con cautela para no malinterpretar causa- efecto)(Rodrigo, 2016)

En la práctica deberemos de elegir cuidadosamente qué variables vamos a

considerar como explicativas o independientes (x), puesto que se cumplan algunos

criterios, entre los que mencionamos los siguientes:

6
Tener sentido numérico.

No deberá de haber variables repetidas o redundantes

Las variables introducidas en el modelo deberán de tener una cierta justificación

teórica.

La relación entre variables explicativas en el modelo y casos debe de ser como

mínimo de 1 a 10.

La relación de las variables explicativas con la variable dependiente debe de ser

lineal, es decir, proporcional. (Rojo Abuín, 2007)

7
El sistema de ecuaciones anteriores se puede expresar de forma más compacta
utilizando notación matricial. Así, vamos a denominar:

El modelo de regresión lineal múltiple (1) expresado en notación matricial es el


siguiente:

Si consideramos como ejemplo el peso de los niños de 7 años, como variable


dependiente, debemos considerar las posibles varables independientes o explicativas,
entre las que podemos considerar:

✓ Estatura
✓ Pie
✓ Masa musbular
✓ Diámetro Cabeza

Entonces tenemos que

8
Peso = b0 + b1 ⋅ estatura + b2 ⋅ Masa musbular + b3 ⋅ D. CAbeza

Al igual que en regresión lineal simple, los coeficientes b van a indicar el incremento en el
peso por el incremento unitario de la correspondiente variable explicativa. Por lo tanto, estos
coeficientes van a tener las correspondientes unidades de medida.

V INDEPENDIENTES V DEPENDIENTE
MASA D.
ESTATURA PESO
MUSCULAR CABEZA
100 50 21 99
80 38 22 88
76 40 20 79
70 33 18 78
69 25 19 70
68 30 18 77

Estatura vs Peso y = 0,793x + 20,637


120
100

80
Peso

60

40

20

0
50 60 70 80 90 100 110
Estatura

Masa Muscular vs Pesoy = 1,0785x + 43,006


120
100

80
Peso

60

40

20

0
20 25 30 35 40 45 50 55 8
Masa Muscular
Diám. de Cabeza vs Peso y = 4,4x - 4,7
120

100

80
Peso

60

40

20

0
15 16 17 18 19 20 21 22 23
Diámetro de la Cabeza

Como podemos visualizar en cada una de las variables del presente ejercicio, existe
una relación que debe de estar presente siempre como condición principal entre las
variables, para ello, se ha considerado cada una de las variables independientes,
en base a la única variable dependiente.

1 100 50 21
1 80 38 22
1 76 40 20
1 70 33 18
1 69 25 19
1 68 30 18

Lo que hacemos a continuación es ubicar las variables independientes en


una nueva tabla, y colocamos en la primera columna una hilera de número
uno, acorde con el número de filas que tengamos, en este caso, nuestro
ejercicio se transforma en una Matriz 6x4

9
Para ello es importante incorporar el método más idóneo para poder encontrar la ecuación
de la recta a través de la matriz, tomando en consideración lo siguiente:

1 100 50 21
1 80 38 22
1 76 40 20
1 70 33 18
1 69 25 19
1 68 30 18

Matriz Transpuesta

1 1 1 1 1 1
100 80 76 70 69 68
XT 50 38 40 33 25 30
21 22 20 18 19 18

Lo que se ha realizado aquí es transformar las columnas en filas y ahora nuestra


Matriz se convierte en una Matriz 4x6

6 463 216 118


463 36461 17155 9175
XT * X 216 17155 8158 4295
118 9175 4295 2334

Resulta de la multiplicación de la filas por las columnas,


obteniendo un Matriz de 4x4

491
38470
18088
9715

Esta Matriz 1x4 se obtiene de multiplicar la matriz XT por cada


uno de los valores de la variable dependiente (Y)

10
6 463 216 118
463 36461 17155 9175
216 17155 8158 4295
118 9175 4295 2334
6 463 216 118
463 36461 17155 9175
216 17155 8158 4295
118 9175 4295 2334

Matriz Inversa
35,8114131 -0,12244076 0,29136312 -1,86536307
-0,12244076 0,00997669 -0,01118847 -0,01243945
0,29136312 -0,01118847 0,0171701 -0,00234457
-1,86536307 -0,01243945 -0,00234457 0,14794975

Esta matriz se obtiene de encontrar la inversa de cada uno de los


componentes de la matriz 4x4,

Para poder encontrar el valor el valor de las b0 y b1, b2 y b3, lo que hacemos es
multiplicar cada uno de los productos de la Matriz inversa por la matriz XT* Y

35,8114131 -0,12244076 0,29136312 -1,86536307 491


-0,12244076 0,00997669 -0,01118847 -0,01243945 38470
*
0,29136312 -0,01118847 0,0171701 -0,00234457 18088
-1,86536307 -0,01243945 -0,00234457 0,14794975 9715

b0 21,282
b1 0,459
b2 0,434
b3 0,484

y = 21,282+0,459 x1+0,434 x2+ 0,484 x3


11
Se ha obtenido la nueva ecuación de la recta, para lo cual nos pide el ejercicio, obtener el
peso de 3 niños al remplazar los valores de la variable independiente con los siguientes
datos:

MASA D.
ESTATURA
MUSCULAR CABEZA
70 42 83
65 39 80
64 37 79

Para ello lo que vamos a realizar es: remplazar en la ecuación cada uno de estos datos para
poder encontrar el valor de y o variable dependiente con lo cual obtenemos lo siguiente:

Y = ((21,282) + (0,459)*(70) + (0,434)*(42) + (0,484)*(83)) = 111,81

Y = ((21,282) + (0,459)*(65) + (0,434)*(39) + (0,484)*(80)) = 106,76

Y = ((21,282) + (0,459)*(64) + (0,434)*(37) + (0,484)*(79)) = 104,95

De esta manera logramos encontrar los valores para la variable PESO (Dependiente), la
misma que se establece en el siguiente cuadro a continuación.

MASA D.
ESTATURA PESO
MUSCULAR CABEZA
70 42 83 111,81
65 39 80 106,76
64 37 79 104,95

Donde podemos visualizar que para cada uno de los valores remplazados, hemos
encontrado nuestros nuevos pesos, lo que nos han determinado su respectiva vinculación
o relación existente entre las variables.

12
Visualizar video, para una mejor comprensión del tema, siguiendo el siguiente enlace:

https://www.youtube.com/watch?v=enSkBJ5XVPc

13
Tema 2: El coeficiente de determinación múltiple

¿Cómo se lo conoce?
Se lo conoce además como el coeficiente de determinación o coeficiente de regresión
múltiple como es nuestro caso (R Cuadrado). El mismo que se lo expresa de la siguiente
manera: R2

Definición Técnica.
Es la proporción de la varianza total de la variable explicada por la regresión, de esta
manera se puede decir entonces que este refleja la bondad del ajuste de un modelo, ala
variable que se pretende explicar.

Es una medida estadística, que nos muestra de que tan cerca están los datos de la línea
de regresión ajustada.(Editor, 2019)

Dicho de otro modo, es el porcentaje de la variación en la variable de respuesta que es


explicado por un modelo lineal. Es decir:

l
R-cuadrado = Variación explicada / variación total

El R-cuadrado siempre está entre 0 y 100%:

0% indica que el modelo no


explica ninguna porción de la
variabilidad de los datos de
respuesta en torno a su
media.

100% indica que el modelo


explica toda la variabilidad de
los datos de respuesta en
torno a su media

14
En general, cuanto mayor es el R-cuadrado, mejor se ajusta el modelo a los datos. Sin
embargo, hay condiciones importantes:

Es importante saber que el resultado del coeficiente de determinación oscila entre 0 y 1.


Cuanto más cerca de 1 se sitúe su valor, mayor será el ajuste del modelo a la variable que
estamos intentando explicar. De forma inversa, cuanto más cerca de cero, menos ajustado
estará el modelo y, por tanto, menos fiable será

Se calcula con la siguiente fórmula:

Representación Gráfica del R Cuadrado

Representar gráficamente los valores ajustados en función de los valores observados


ilustra diferentes valores del R-cuadrado para los modelos de regresión.

Gráfico N° 2
Representación Gráfica de del R Cuadrado

Fuente; Elaboración con información (Editor, 2019)

15
En consecuencia de esto se logra determinar que:
El modelo de regresión de la izquierda explica el 38% de la varianza, mientras que el
de la derecha explica el 87,4%. Cuanto mayor sea la varianza explicada por el modelo de
regresión, más cerca estarán los puntos de los datos de la línea de regresión ajustada.

En teoría, si un modelo pudiera explicar el 100% de la varianza, los valores ajustados


siempre serían iguales a los valores observados y, por lo tanto, todos los puntosde los datos
estarían sobre la línea de regresión ajustada.

Limitaciones Claves del R Cuadrado


Es importante tomar en cuenta las siguientes indicaciones;

R2

No puede determinar si las estimaciones y predicciones de los coeficientes


están sesgadas, y es por eso que se deben examinar las gráficas de residuos.

R2

No indica si un modelo de regresión es adecuado. Se puede tener un valor bajo


del R-cuadrado para un modelo adecuado o un valor alto del R-cuadrado para
un modelo que no se ajusta a los datos

El problema del coeficiente de determinación

El problema del coeficiente de determinación, y razón por el cual surge el coeficiente


de determinación ajustado, radica en que no penaliza la inclusión de variables explicativas
no significativas. Es decir, si al modelo se añaden cinco variables explicativas que guardan
poca relación con la variable dependiente, el R cuadrado aumentará. Es por ello que
muchos expertos económetras, estadísticos y matemáticos se oponen al uso del R
cuadrado como medida representativa de la bondad del ajuste real.

Con los siguientes datos ahora vamos a calcular el R cuadrado, donde se demostrará
cada una de las variables y su comportamiento por año, donde obtenemos:

16
x y
PRECIO
AÑOS DÓLAR
PROMEDIO
2014 93,17 62,33
2015 48,72 62,97
2016 43,58 66,46
2017 50,84 67,79
2018 64,90 70,09
2019 55,49 68,95

Lo que hacemos de esta manera para el cálculo es encontrar ahora cada una de las variables
que se presentan en la fórmula para que luego sean remplazado los valores respectivos conforma
lo indica paso a paso la fórmula, donde obtenemos el siguiente cuadro a continuación

x y
PRECIO
AÑOS
PROMEDIO
DÓLAR XY X2 Y2
2014 93,17 62,33 5807,29 8680,65 3885,03
2015 48,72 62,97 3067,90 2373,64 3965,22
2016 43,58 66,46 2896,33 1899,22 4416,93
2017 50,84 67,79 3446,44 2584,71 4595,48
2018 64,90 70,09 4548,84 4212,01 4912,61
2019 55,49 68,95 3826,04 3079,14 4754,10

Luego de esto lo que procedemos a realizar es la sumatoria respectiva de cada una de las
columnas para obtener los valores que se detallan a continuación:

n=6
(Σx) = 356,70
(Σy) = 398,59
(Σxy) = 23592,83
(ΣX2) = 22829,36
(Σy2) = 26529,38

Estos valores son los que vamos a remplazar en la siguiente fórmula, la misma que nos
queda representada de la siguiente manera:

17
r= (6*23592,83)-(356,7*398,59) / √ ((6*22829,36)-(356,70)2)*((6*26589,38)-(398,59)2)

r= -620,06 / 1715,95
Luego de esto para facilitar nuestro proceso, lo que hacemos es
elevar el resultado obtenido al cuadrado, de donde obtenemos

r= --0,3614

r2= (-0,3614)2 r2= 0,1306

Precio vs El Dolar R² = 0,1306


71
70
69
68
67
Dolar

66
65
64
63
62
61
40,00 50,00 60,00 70,00 80,00 90,00 100,00
Precio

Parece que existe una relación menor entre los cambios en los precios del petróleo

crudo y los cambios en el precio del dólar. A medida que aumenta el precio del petróleo

crudo, los cambios en el dólar también afectan. Pero dado que R cuadrado es solo

13%, los cambios en el precio del petróleo crudo explican mucho menos sobre los

cambios en el dólar, el mismo que también está sujeto a cambios en otras

variables, que deben tenerse en cuenta.


18
El coeficiente de determinación ajustado (R cuadrado ajustado

Es la medida que define el porcentaje explicado por la varianza de la regresión en


relación con la varianza de la variable explicada. Es decir, lo mismo que el R cuadrado, pero
con una diferencia: El coeficiente de determinación ajustado penaliza la inclusión de
variables.

El término “ajustado” se refiere a que es corregido por los correspondientes grados


de libertad. [Ca El mide la bondad de ajuste del modelo de regresión (porcentaje
de explicación de la variable dependiente por las variables independientes), así como lo
hace el R cuadrado convencional, sin embargo el tiene la particularidad de que permite
comparar modelos de regresión múltiple en los que se incluyen variables adicionales. No
obstante, se debe considerar que la comparación tiene validez cuando en cada modelo la
variable dependiente y el tamaño de la muestra sean iguales.

Como hemos dicho anteriormente, el coeficiente de determinación de un modelo


aumenta aunque las variables que incluyamos no sean relevantes. Ya que esto supone un
problema, para intentar solventarlo, el R cuadrado ajustado queda de la siguiente manera
expresado:

Donde tenemos que:


R2 a → R cuadrado ajustado o coeficiente de determinación ajustado

R2 → R cuadrado o coeficiente de determinación n

→ Número de observaciones de la muestra k

→ Número de variables independientes

19
Por deducción matemática, a valores más altos de k, más alejado estará el R
cuadrado ajustado del R cuadrado normal. Al revés, a valores más bajos de k, más cerca
estará de 1 la fracción central y, por tanto, más parecidos serán el R cuadrado ajustado y el
R cuadrado normal.

Al contrario que el coeficiente de determinación que varía entre 0 y 1 el coeficiente de


determinación ajustado podría ser negativo por 2 motivos:

• Cuanto más se aproxime k a n.


• Cuanto menor sea el coeficiente de determinación.

r2= 0,1306

Teniendo como base el ejercicio en que calculábamos la R cuadrado, vamos a


determinar para estos valores la R cuadrado ajustada, para lo cual vamos a obtener el
siguiente resultado.

r2= = 1-((6-1) / (6-1-1)*(1-0,1306))

r2= = 1-((5) / (4)*(0,8694))

r2= = 1-((1,25)*(0,8694))

r2= = 1-((1,08675)) r2= = - 0,08675))

r2= = -1,08675

20
Es importante poder ver como se cumple aquí uno de los
motivos en que esta variable es negativa, y esto sucede
cuando más se aproxima k (el número de variables

El R cuadrado ajustado y el R cuadrado normal no pueden tener el mismo


valor.
Es más, el R cuadrado ajustado será siempre inferior al R cuadrado normal.

21
Video de retroalimentación, para el cálculo de la correlación:

https://www.youtube.com/watch?v=fNeXC8d5En8

https://www.youtube.com/watch?v=A0OvIcjDUDg

22
Tema 3: Prueca de significación de los estimadores de los parametros

¿De qué se trata una prueba de significación?

Las pruebas de significación estadística sirven para comparar variables entre distintas muestras. Se
obtiene mucha mayor información cuando se puede rechazar la hipótesis nula, lo que quiere
decir que los estadísticos de las muestras que se comparan son diferentes entre sí con una
probabilidad mayor del 95%

¿Qué es un Estimador?

En estadística, un estimador es un estadístico (esto es, una función de la muestra) usado


para estimar un parámetro desconocido de la población ...... El valor de
un estimador proporciona lo que se denomina en estadística una estimación puntual del
valor del parámetro en estudio.

Propiedades que debe ter un estimador

Para que cumplan bien sus funciones, un estimador, además de que puedan cumplir sus
condiciones ´básicas, se recomiendan siempre que cumplan con ciertas propiedades
adicionales entre las que se destacan

Suficiente:
La propiedad de suficiencia indica que el estimador trabaja con todos los datos de la
muestra. Por ejemplo, la media no escoge solo el 50% de los datos. Tiene en cuenta el
100% de los datos para calcular el parámetro.

Insesgado:
La propiedad de insesgadez hace referencia a la centralidad de un estimador. Es decir, la
media de un estimador debe coincidir con el parámetro a estimar. No debemos confundir
media de un estimador con la estimadora media

Consistente:
El concepto de consistencia va aparejado del tamaño de la muestra y del concepto de límite.
En otras palabras, viene a decirnos que los estimadores cumplen esta propiedad cuando,
en caso de que la muestra sea muy grande, puedan estimar casi sin error.

23
Eficiente:
La propiedad de eficiencia puede ser absoluta o relativa. Un estimador es eficiente en
sentido absoluto cuando la varianza del estimador es mínima. No debemos confundir
varianza de un estimador con estimador varianza.

Robusto:
Se dice que un estimador es robusto en caso de que, a pesar de que la hipótesis de partida
sea incorrecta, los resultados se asemejan mucho a los reales.

Matriz de varianzas y covarianzas de los estimadores

La matriz de varianza-covarianza de los estimadores es relevante en la determinación de


los errores estándar de los coeficientes y en la ejecución de pruebas de hipótesis. Para
obtener la matriz de varianza-covarianza de los estimadores es necesario calcular
previamente la suma de cuadrados de los errores y la varianza del modelo:

1. Suma de cuadrados de los errores. Puede ser calculada así:

2. Varianza del modelo. Dado que en la mayoría de los casos la varianza es


desconocida, se utiliza la información de la muestra para obtener un estimador de la
misma:

Usando la información anterior, la matriz de varianza covarianza de los coeficientes se


puede calcular con la siguiente fórmula:

24
Se solicita para el siguiente tema.

Con los siguientes datos

Analizar cada una de las variables del presente ejercicio de análisis de regresión múltiple,
para lo cual se necesita:

a. Identificar las variables independientes y dependiente


b. Realizar el modelo de regresión lineal múltiple por el método matricial, paso a paso,
c. Identificar cada una de las matrices con su respectivo cálculo.
d. Encontrar la ecuación de la recta,
e. Luego de encontrar la ecuación, se pide para los siguientes tres periodos, remplazar
los valores de las variables independientes y encontrar para cada una de ellas, la
variable Y.
f. Graficar los puntos encontrados en el plano e identificar cada uno de ellos.
g. Encontrar el valor de r cuadrado para cada una de las variables independientes.
h. Encontrar r cuadrado ajustado, e interpretar si la relación es viable entre las
variables
i. Finalmente graficar ambas variables dentro la recta

Nichos X1 Bovedas X2 Precio $


3 2 78,8
4 1 74,3
5 3 83,8
2 1 74,3
3 2 79,2
3 2 74,9
5 3 88,4
4 2 82,9
1 3 2
1 4 1
Luego de identificar las variables,
1 5 3 realizamos una matriz con las variables
X 1 2 1 independientes y como primer paso
colocamos una columna de números 1,
1 3 2 a los lados de la misma, donde la matriz
1 3 2 quede 8x3, como la que estamos
presentando.
1 5 3
1 4 2
25
MATRIZ 8 X 3
Luego lo que hacemos es transponer la
1 1 1 1 1 1 1 1
matriz original, done las columnas se
convierten en fila, como la XT 3 4 5 2 3 3 5 4
demostramos a continuación: 2 1 3 1 2 2 3 2

1 3 2
1 4 1
1 5 3
X 1 2 1
1 1 1 1 1 1 1 1
1 3 2
XT 3 4 5 2 3 3 5 4
1 3 2
2 1 3 1 2 2 3 2
1 5 3
MATRIZ 3 X 8
1 4 2

Para encontrar esta matriz lo que


hacemos es multiplicar cada una de las
variables de la matriz, es decir cada fila
por cada una de las columnas de la
matriz ORIGINAL

(1+1+1+1+1+1+1+1) (3+4+5+2+3+3+5+4) (2+1+3+1+2+2+3+2)

XT * X (3+4+5+2+3+3+5+4) (9+16+25+4+9+9+25+16) (6+4+15+2+6+6+15+8)

(2+1+3+1+2+2+3+2) (6+4+15+2+6+6+15+ (4+1+9+1+4+4+9+4)

De esta manera, La Matriz queda de la


siguiente manera:
8 29 16
XT *X 29 113 62
16 62 36
MATRIZ 3 X 3

26
Lo que hacemos es ubicar nuestra matriz y por el
Luego vamos a encontrar la método más común, agregamos las dos primeras
Determinante columnas de nuestra matriz encontrada a nuestra
derecha como se muestra.

8 29 16 8 29
29 113 62 29 113 90080
16 62 36 16 62
DETERMINANTE X 124
8 29 16 8 29
29 113 62 29 113 89956
16 62 36 16 62

Estos valores resultas de la multiplicación diagonal


como lo representan los colores asignados, para lo
cual se ha separado para una mejor compresión,
luego lo que se hace es restar ambos y
encontramos la matriz de x

8 29 16
T
Adj ( X ) 29 113 62 113 62 29 62 29 113
16 62 36
62 36 16 36 16 62

29 16 8 16 8 29

62 36 16 36 16 62

29 16 8 16 8 29

113 62 29 62 29 113

Así nos queda nuestra matriz inversa, de la adjunta de la transpuesta,


8 29 16 la misma que se obtuvo como podemos visualizar paso a paso
colocando los valores resultados, a continuación se detalla la matriz
XT * X 29 113 62
primera fila, primera columna, al final lo que utilizamos es el método
MAT1R6IZ 3 X 632 36 del rombo que por regla general se aplica en estos casos para ubicar de
donde nacen estos signos negativos

27
(113*36)-(62*62)( - ) (29*36)-(62*16) (29*62)-(16*113)

Adj ( XT ) ( - ) (29*36)-(62*16)
(8*36)-(16*16) ( - ) (8*62)-(16*29)

(29*62)-(113*16)( - ) (8*62)-(29*16) (8*113)-(29*29)

224 -52 -10


Así queda nuestra matriz encontrada,
Adj ( XT ) -52 32 -32
luego de realizar el cálculo respectivo
-10 -32 63

224 -52 -10


1
(XT * X)-1 = 1/ (X) * adj (XT) X
124 -52 32 -32
-10 -32 63

78,8
74,3 1 1 1 1 1 1 1 1
83,8 XT 3 4 5 2 3 3 5 4
Y 74,3
2 1 3 1 2 2 3 2
79,2
74,9 MATRIZ 3 X 8
88,4
82,9 Lo que hacemos es multiplicar cada una de las
variables, para luego obtener nuestra nueva matriz

(78,8+74,3+83,8+74,3+79,2+74,9+88,4+82,9)
XT * Y (236,4+297,2+419+148,6+237,6+224,7+442+331,6)
(157,6+74,3+251,4+74,3+158,4+149,8+265,2+165,8)

637
XT * Y 2.337
1.297
28

MATRIZ 1 X 3
Una vez obtenida esta matriz, procedemos a obtener los
valores bo, b1, b2, los que determinan nuestra nueva
ecuación

B0
B1 = (XT * X)-1 * (XT * y)
B2

La cual lo obtenemos, desarrollando el


siguiente proceso

B0 224 -52 -10 637


B1 -52 32 -32 2337
B2
-10 -32 63 1297

B0 (224/124) (-52/124( (-10/124) 637


B1 = (-52/124) (52/124) (-32/124) 2337
B2
(-10/124) ('32/124) (63/124) 1297

B0 1,8065 -0,4194 -0,0806 637


B1 = -0,4194 0,2581 -0,2581 2337
B2
-0,0806 -0,2581 0,5081 1297

Así mismo se multiplica cada una de las filas de la primera matriz por
la columna de nuestra segunda matriz, donde su sumatoria horizontal
nos determina los valores para b0, b1, b2

1150,7405 -980,1378 -104,5382


= -267,1578 603,1797 -334,7557
-51,3422 -603,1797 659,0057
29
B0 66,06 y = B0 + B1 X1 + B2 X2
B1 = 1,2662
B2 y = 66,06 + 1,26,62 X1 + 4,4838 X2
4,4838

Ahora si luego de encontrada nuestra ecuación, con los siguientes datos nos piden encontrar
luego de remplazar cada uno de ellos los nuevos valores para nuestra variable dependiente.

Periodos X1 X2
9 4 5
10 2 6
11 3 2

((66,06+(1,2662)*(4)+(4,4838)*(5)))
93,54
((66,06+(1,2662)*(2)+(4,4838)*(6)))
95,50
((66,06+(1,2662)*(3)+(4,4838)*(2)))
78,83

Con los nuevos datos de las variables, podemos visualizar nuestra


nueva tabla con los datos encontrados

Periodos X1 X2 Y
9 4 5 93,54
10 2 6 95,50
11 3 2 78,83

30
Con los mismos datos encontramos los valores para R cuadrado, el mismo que detallamos a
continuación:

operac. Nichos X1 (y) Precio $


Año 1 3 78,8
Año 2 4 74,3
Año 3 5 83,8
Año 4 2 74,3
Año 5 3 79,2
Año 6 3 74,9
Año 7 5 88,4
Año 8 4 82,9

operac. Nichos X1 (y) Precio $ XY X2 Y2


Año 1 3 78,8 236,40 9,00 6209,44
Año 2 4 74,3 297,20 16,00 5520,49
Año 3 5 83,8 419,00 25,00 7022,44
Año 4 2 74,3 148,60 4,00 5520,49
Año 5 3 79,2 237,60 9,00 6272,64
Año 6 3 74,9 224,70 9,00 5610,01
Año 7 5 88,4 442,00 25,00 7814,56
Año 8 4 82,9 331,60 16,00 6872,41
8 29 636,6 2337,1 113 50842,5

n=8 r = (n*Σxy)-(Σx*Σy) /√(n*(ΣX2)-(Σx)2)*((n*(Σy2)-(Σy)2)


(Σx) = 29
r= (8*2337,1)-(29*636,6)/√((8*113)-(29)2 )*((8*50842,5)-(636,6)2)
(Σy) = 636,6
(Σxy) = 2337,1
r = (18696,8 - 18641,4) / √ (906-841)(406740-405259,56)
(ΣX2) = 113
(Σy2) = 50842,5
r = (18696,8 - 18461,4) / √ (63)(1480,44)

r = 235,4 / √ (93267,72)

r = 235,4 / 305,397624

r = 0,770798 r2 = ( 0,770798)2

r2 = 0,5941 31
R Cuadrado Ajustado

r2 =1-((8-1)/(8-1-1))*(1-0,5941)

r2 = 1 -
(1,166666667)(0,4057)

r2 = 1 - 0,47355

r2 = 0,5265

32
Realizamos el mismo proceso para nuestra segunda variable independiente y obtenemos:

Bovedas
operac. X2 (y) Precio $
Año 1 2 78,8
Año 2 1 74,3
Año 3 3 83,8
Año 4 1 74,3
Año 5 2 79,2
Año 6 2 74,9
Año 7 3 88,4
Año 8 2 82,9

Bovedas
operac. X2 (y) Precio $ XY X2 Y2
Año 1 2 78,8 157,60 4,00 6209,44
Año 2 1 74,3 74,30 1,00 5520,49
Año 3 3 83,8 251,40 9,00 7022,44
Año 4 1 74,3 74,30 1,00 5520,49
Año 5 2 79,2 158,40 4,00 6272,64
Año 6 2 74,9 149,80 4,00 5610,01
Año 7 3 88,4 265,20 9,00 7814,56
Año 8 2 82,9 165,80 4,00 6872,41
8 16 636,6 1296,8 36 50842,5

n=8 r = (n*Σxy)-(Σx*Σy) /√ (n*(ΣX2)-(Σx)2)*((n*(Σy2)-(Σy)2)


(Σx) = 16
r=((8*1296,8)-(16*636,6)/√((8*36)-(16)^2 )*((8*50842,5)-(636,6)^2))
(Σy) = 636,6
(Σxy) = 1296.8
r = - (10374,40 - 10185,60) /√ (288 - 256)(406740 - 405259,56)
(ΣX2) = 36
(Σy2) = 50842,5 r = - (10374,40 - 10185,60) /√ (32)(14,80,44)

r = - (188,80) /√ (47374,08)

r = - (188,80) / (217,6558752)

r = 0,8674243221 r2 = ( 0,8674243221)2

r2 = 0,7524
33
r2 =1-((8-1)/(8-1-1))*(1-0,7524)

r2 = 1 - (1,166666667)(0,2476)

r2 = 1 - 0,2888666667

r2 = 0,7111

Bóvedas vs Precio R² = 0,7525


90
88
86
84
82
Precio

80
78
76
74
72
0,8 1,3 1,8 2,3 2,8 3,3
Bövedas

34
Tema 5: Coeficientes de correlación parcial

¿Qué es la correlación?
La correlación es una medida estadística que expresa hasta qué punto dos variables están
relacionadas linealmente (esto es, cambian conjuntamente a una tasa constante). Es una
herramienta común para describir relaciones simples sin hacer afirmaciones sobre causa y
efecto.

La correlación parcial mide la variación conjunta que se da entre una variable independiente
y una variable dependiente, controlando o los efectos que sobre esa variación pudiera
ejercer otra independiente.

¿Qué mide la correlación?

La correlación parcial se expresa en términos de coeficiente de correlación de Pearson, y


en la fórmula se separa con un punto la variable controlada de las variables dependiente e
independiente.

Su fórmula para tres variables es la siguiente:

Donde:

es el coeficiente de correlación convencional entre A y B.

es el coeficiente de correlación convencional entre A y C.

es el coeficiente de correlación convencional entre B y C.

En la correlación parcial interesa no tanto la contribución de una determinada variable en el


modelo de regresión, como la eliminación de ciertas variables que resultan perturbadoras
para la cabal comprensión de la relación entre las variables de interés.(Córdova, 2016)

35
Interpretación del valor del índice de correlación
• Si r = 1: Correlación positiva perfecta ....
• Si 0 < r < 1: Refleja que se da una correlación positiva.
• Si r = 0: En este caso no hay una relación lineal ...
• Si 1 < r < 0: Indica que existe una correlación negativa.

https://www.youtube.com/watch?v=BmJoc4iR8GY

36
Bibliografía
Cordova, universidad de. (2016). 8.-CORRELACIÓN MULTIPLE Y CORRELACIÓN
CANÓNICA 8.1.-Correlación múltiple.
Del, T., Castro, B., Clar, M., Jordi, L., & Caralt, S. (2013). Errores de especificación,
multicolinealidad y observaciones atípicas.
Editor, M. B. (2019). Análisis de Regresión: ¿Cómo Puedo Interpretar el R-cuadrado y
Evaluar la Bondad de Ajuste? 2019. https://blog.minitab.com/es/analisis-de-
regresion-como-puedo-interpretar-el-r-cuadrado-y-evaluar-la-bondad-de-ajuste
Pedrosa, S. J. (2017). Heterocedasticidad - Qué es, definición y concepto | 2021 |
Economipedia. https://economipedia.com/definiciones/heterocedasticidad.html
Rodrigo, J. A. (2016). Introducción a la Regresión Lineal Múltiple.
https://www.cienciadedatos.net/documentos/25_regresion_lineal_multiple.html
Rojo Abuín, J. M. (2007). Regresión lineal múltiple.

37

También podría gustarte