Regresión Mínimos Cuadrados Relativos
Regresión Mínimos Cuadrados Relativos
ISSN: 1133-3197
[email protected]
Asociación Internacional de Economía
Aplicada
España
RESUMEN
El método de Mínimos Cuadrados con Errores Relativos (MCER) consiste en estimar los parámetros que carac-
terizan al modelo de regresión de manera que sea mínima la suma de los cuadrados de los errores relativos.
En este trabajo se realiza un planteamiento descriptivo del método de Mínimos Cuadrados con Errores Relativos,
se obtienen los estimadores de los parámetros para un modelo lineal simple y se propone una medida para analizar
la bondad del modelo, que tiene una interpretación similar al coeficiente de determinación. A continuación se ex-
tiende esta formulación al modelo lineal básico, derivando el vector de estimadores de mínimos cuadrados con
errores relativos. El trabajo concluye con una serie de aplicaciones del método de regresión propuesto, compa-
rando sus resultados con los proporcionados por el método de estimación mínimo cuadrática.
Palabras clave: Regresión; método de mínimos cuadrados con errores relativos; inquietud doble cuadrática.
ABSTRACT
The method of Minimum Squares with Relative Errors (MSRE) consists of estimating the parameters that charac-
terize the model of regression so that there is minimal the sum of the squares of the relative errors.
In this work there a descriptive exposition of the method of Minimum Squares with Relative Errors is realized, we
obtain the esteeming of the parameters for a linear model and we propose a measure to analyze the kindness of the
model, that admits an interpretation similar to the coefficient of determination. Later we formulate the linear basic
model, deriving the vector of esteeming from minimum squares with relative errors. The work concludes with
some applications of the method of regression proposed, comparing its results with provided by the method of
Ordinary Least Squares (OLS).
Keywords: Regression; Method of Minimum Squares with Relative Errors; Double Quadratic uncertainty involv-
ing Utilities.
————————
Artículo recibido en julio de 2007 y aceptado para su publicación en febrero de 2008.
Artículo disponible en versión electrónica en la página www.revista-eea.net, ref. e -26212.
∗
La autora desea agradecer las interesantes sugerencias y aclaraciones realizadas por dos evaluadores
anónimos que han contribuido a mejorar la versión inicial del presente trabajo.
1. INTRODUCCIÓN
1
Según autores como Einsenhart (1976) y Stigler (1981) las pruebas documentales y estadísticas
muestran que Gauss derivó el procedimiento antes, si bien sus aportaciones no tuvieron la difusión
de la publicación realizada por Legendre en 1805.
Dada una variable bidimensional (X, Y) que toma valores (Xi, Yi), i = 1,.., n, la ex-
plicación de la variable Y a partir de la variable X puede ser llevada a cabo median-
te la función Y = f(X).
La comparación por cociente de valores teóricos y observados, siendo estos úl-
timos no nulos, conduce a la definición de errores relativos:
Yˆi
uˆ Ri = −1 (2)
Yi
Si se plantea como objetivo minimizar el valor agregado de los errores relativos
al cuadrado, la función objetivo vendrá dada por la expresión:
2
n ⎛ Yˆ ⎞
S R = ∑ ⎜ i − 1⎟ (3)
⎜Y ⎟
i =1 ⎝ i ⎠
es decir la suma de los errores relativos cuadráticos.
El método de Mínimos Cuadrados con Errores Relativos (MCER) consiste, por
tanto, en estimar los parámetros que caracterizan al modelo de regresión de manera
que sea mínima la suma de los cuadrados de los errores relativos.
Podemos observar que este procedimiento de Mínimos Cuadrados con Errores
Relativos tiene en cuenta no sólo la magnitud de los errores sino también los va-
lores de la variable a los que van referidos, de modo que, a igual cuantía de errores
absolutos, se penalizan más aquellos errores cometidos entre valores reducidos de
la variable que los asociados a valores elevados.
Esta característica es el principal rasgo diferencial con respecto a los proce-
dimientos de Mínimos Cuadrados Ordinarios (MCO) o Mínimas Desviaciones Ab-
solutas (MDA), que tienen en cuenta sólo la magnitud de los errores, con indepen-
dencia de que éstos se produzcan entre valores bajos o elevados de la variable.
Como consecuencia, el procedimiento de Mínimos Cuadrados con Errores Relati-
vos (MCER) será menos sensible a la presencia de datos elevados en la variable y
llevará asociada una función de pérdida más flexible.
En el caso de considerar una sola variable causa X y un modelo lineal que explica
la variable Y a partir de X (Y = β 0 + β1 X ) , nuestro objetivo será aproximar los pa-
rámetros que caracterizan este modelo. A continuación presentamos, desde un pun-
to de vista descriptivo, las expresiones de los estimadores de Mínimos Cuadrados
con Errores Relativos, examinamos también algunas propiedades de interés y estu-
diamos las medidas adecuadas para evaluar la bondad del modelo.
Derivando la función anterior respecto a βˆ0 y βˆ1 e igualando a cero dichas de-
rivadas parciales obtenemos el siguiente sistema de ecuaciones normales:
n n X n
1 1
βˆ0 ∑ 2
+ ˆ
β1∑ 2
i
= ∑
i =1 Yi i =1 Yi i =1 Yi
(5)
n Xi n X i2 n X
βˆ0 ∑ 2
+ βˆ1 ∑ =∑ i
i =1 Yi i =1 Yi 2 i =1 Yi
Las expresiones obtenidas para estimar los parámetros resultan más complejas
que en el método clásico, puesto que en la función a minimizar (por considerar
errores relativos) figuran valores observados de la variable Y en el denominador.
Sin embargo si consideramos una función que normaliza los valores, las expresio-
nes son similares a las obtenidas en el método clásico.
Si definimos para toda variable X:
n
X
∑ Y 2i
i =1 i
gY ( X ) = n
(7)
1
∑Y2
i =1 i
Entonces se obtiene:
gY ( XY ) − gY ( X ) gY (Y )
βˆ1 =
gY ( X 2 ) − gY ( X )2
(8)
βˆ0 = gY (Y ) − βˆ1 gY ( X )
expresiones que presentan analogías con las obtenidas con el método de Mínimos
Cuadrados Ordinarios, considerando en este caso en lugar de la media la aplicación
definida como gY.
Como consecuencia, se observa que la línea de regresión de Mínimos Cua-
drados con Errores Relativos garantiza las siguientes propiedades:
( gY ( X ), gY (Y ) ) .
• Si X e Y son linealmente independientes, entonces se obtiene:
n
1
∑Y
βˆ1 = 0 , βˆ0 = i =1 i
n
(10)
1
∑Y 2
i =1 i
• Si Y = cX, entonces se obtiene βˆ1 = c , βˆ0 = 0 , es decir, que si hay una rela-
ción lineal exacta entre las variables entonces el modelo estimado refleja esa
relación.
Una vez llevada a cabo una regresión entre variables, resulta necesario disponer de
medidas adecuadas para evaluar su bondad. En este sentido, la regresión mínimo
cuadrática habitualmente utilizada proporciona también una medida de bondad, el
coeficiente de determinación, basado en la descomposición de la varianza de Y en
una varianza explicada más una varianza residual.
Diversos autores como Kvalseth (1985) y Scott y Wild (1991) han puesto de
manifiesto algunas limitaciones del coeficiente de determinación que aconsejan
prudencia en su utilización. Más concretamente, la utilización del coeficiente de
determinación debe tener en cuenta el tipo de modelo formulado (lineal o no lineal,
sobre variables originales o transformadas, con o sin término independiente,...), el
método de estimación utilizado y la finalidad para la que se calcula dicha medida.
En el caso de que la estimación de un modelo lineal realice por el método de
Mínimos Cuadrados con Errores Relativos, es posible llevar a cabo una descompo-
sición de la inquietud doble cuadrática2 asociada a la variable Y en la inquietud
doble cuadrática explicada por el modelo más la inquietud doble cuadrática resi-
dual3, es decir:
2
La inquietud doble cuadrática ha sido definida en Alvargonzález (2003) a partir de dos indicadores
de la familia de medidas de inquietud de orden β, y ha sido empleada en la medición de la desigual-
dad de la renta (López, Alvargonzález y Pérez (2006)).
3
La inquietud doble cuadrática explicada y la inquietud doble cuadrática residual no son medidas de
inquietud en sentido estricto, sino que en realidad son respectivamente las varianzas de los valores
teóricos y de los errores, ambos normalizados por los valores de la variable Y. Puesto que esas me-
didas tienen un carácter doble cuadrático las denotamos de esa manera por simplificar la notación
y por seguir la analogía con el método de Mínimos Cuadrados Ordinarios.
donde:
2
n ⎛Y ⎞
HU +*2
(Y ) = ∑ ⎜⎜ i − 1⎟⎟ fi
i =1 ⎝ Yi ⎠
2
n ⎛ Yˆ Y ⎞
HU +*2
( )
Yˆ = ∑ ⎜ i − i ⎟ fi
⎜ Yi ⎟⎠
(12)
i =1 ⎝ Yi
2
n ⎛ Yˆ ⎞
HU +*2
( uˆR ) = ∑ ⎜⎜ Yi − 1⎟⎟ fi
i =1 ⎝ i ⎠
1
siendo fi la frecuencia relativa del valor Yi, en general: .
n
Esta propiedad es análoga a la descomposición de la varianza de Y en una va-
rianza explicada más una varianza residual.
La descomposición de la inquietud doble cuadrática de la variable Y permite de-
finir una medida de la bondad del modelo similar al coeficiente de determinación
del método clásico. De la misma forma que el coeficiente de determinación se de-
fine a partir de la varianza de la variable Y y de la varianza residual, vamos a defi-
nir una medida de la bondad del modelo a partir de la inquietud doble cuadrática
asociada a la variable Y y de la inquietud doble cuadrática residual:
HU +*2 (uˆR )
• R2 =1− (13)
HU +*2 HU +*2 (Y )
Esta medida presenta en el caso lineal las siguientes propiedades:
HU +*2 (Yˆ )
• R2 +*2 = (14)
HU HU +*2 (Y )
La medida de bondad del modelo se puede expresar como el cociente entre la
inquietud doble cuadrática explicada por el modelo y la inquietud doble cuadrática
de la variable Y, es decir es la proporción de inquietud doble cuadrática de la va-
riable Y que es explicada por el modelo.
• 0 ≤ R2 ≤1 (15)
HU +*2
La medida de bondad del modelo está acotada entre 0 y 1, al igual que el coefi-
ciente de determinación del método clásico.
• Si Y=cX entonces:
2
RHU + *2 = 1
La medida de bondad del modelo se anula cuando el modelo lineal es una cons-
tante igual a la media de la variable Y.
donde X2, X3, ..., Xk son k − 1 variables explicativas, β1 , β 2 ,..., β k son parámetros y u
es un error o perturbación aleatoria.
Con el objeto de estimar los k parámetros del modelo se considera una muestra
de tamaño n, teniéndose un sistema de ecuaciones que puede ser expresado de
forma matricial como:
y = Xβ + u (18)
donde:
⎛ Y1 ⎞ ⎛ 1 X 21 ... X k1 ⎞ ⎛ β1 ⎞ ⎛ u1 ⎞
⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟
Y 1 X 22 ... X k 2 ⎟ β u
y =⎜ 2⎟ X=⎜ β=⎜ 2⎟ u=⎜ 2⎟ (19)
⎜ ... ⎟ ⎜ ... ... ... ... ⎟ ⎜ ... ⎟ ⎜ ... ⎟
⎜⎜ ⎟⎟ ⎜ ⎟ ⎜⎜ ⎟⎟ ⎜ ⎟
⎜u ⎟
⎝ Yn ⎠ ⎝ 1 X 2n ... X kn ⎠ ⎝ βk ⎠ ⎝ n⎠
El modelo básico de regresión lineal puede ser descrito como:
y = Xβ + u
E (u ) = 0
(20)
E ( uu′ ) = σ 2 I n
ρ ( X) = k < n
S = uˆ ′uˆ = ( y − X βˆ )′ ( y − X βˆ ) (21)
La condición necesaria de extremo conduce a la siguiente expresión habitual-
mente utilizada:
−1
βˆ MCO = ( X′ X) X ′y (22)
4
A diferencia de lo que ocurre en el método de mínimos cuadrados generalizados la matriz de trans-
formación tiene una componente aleatoria.
5
La hipótesis de homocedasticidad puede plantear problemas en este caso, como consecuencia de la
aparición de una variable aleatoria en el denominador.
⎛ Y1 − Y ⎞
⎜ ⎟
⎜ Y1 ⎟
⎜Y −Y ⎟
⎜ 2 ⎟
y cR = ⎜ Y2 ⎟ (30)
⎜ ⎟
⎜ ........... ⎟
⎜Y −Y ⎟
⎜⎜ n ⎟⎟
⎝ Yn ⎠
5. APLICACIONES
1. En primer lugar se plantea la estimación del consumo final de los hogares (Y)
en función de la renta bruta disponible (X), a partir de la información suministrada
por la Contabilidad Regional de España (CRE) para las Comunidades Autónomas
españolas en el año 2002, considerando ambas variables expresadas en miles de eu-
ros.
Los resultados obtenidos se resumen en la Tabla 1 donde se aprecia que los dos
métodos de estimación considerados proporcionan resultados similares para las pro-
pensiones marginales al consumo, existiendo en cambio algunas diferencias en lo
que se refiere a los consumos autónomos.
TABLA 1
Estimación del consumo final de los hogares a partir de la renta bruta disponible.
2
β̂ 0 β̂1 RHU +*2 R2
Método de Mínimos
Cuadrados con 50.527,4385 0,8329 99,98% 99,44%
Errores Relativos
Método de Mínimos
390.844,632 0,8631 99,96% 99,56%
Cuadrados Ordinarios
Fuente: Elaboración propia.
Por lo que se refiere a las medidas de bondad de los modelos, los resultados son
similares, como corresponde a la elevada capacidad explicativa asociada a estos
datos, pudiendo apreciarse que los resultados más elevados corresponden a la me-
dida de bondad adecuada para cada método de estimación (el coeficiente de deter-
minación es superior en el modelo estimado por el método de MCO, mientras el
coeficiente basado en la inquietud es superior en el modelo estimado con errores
relativos). La representación de estos resultados aparece recogida en el Gráfico 1.
GRÁFICO 1
Consumo final de los hogares por Comunidades Autónomas. Estimaciones por Mínimos
Cuadrados con Errores Relativos y por Mínimos Cuadrados Ordinarios.
8 0 .0 0 6 .0 0 0
7 0 .0 0 6 .0 0 0
6 0 .0 0 6 .0 0 0
5 0 .0 0 6 .0 0 0
4 0 .0 0 6 .0 0 0
3 0 .0 0 6 .0 0 0 C O NS U M O FIN AL
E st im a ci ón M CE R
2 0 .0 0 6 .0 0 0
E st im a ci ón M CO
1 0 .0 0 6 .0 0 0
6 .0 0 0
7 .0 0 0 10 . 0 07 . 00 0 2 0 . 00 7 . 00 0 3 0 . 00 7 . 00 0 4 0 .0 0 7 .0 0 0 5 0 .0 0 7 .0 0 0 6 0 .0 0 7 .0 0 0 7 0 .0 0 7 .0 0 0 8 0 .0 0 7 .0 0 0 9 0 .0 0 7 .0 0 0
6
La información aparece en http://www.lacaixa.es, donde también puede consultarse la metodología
de elaboración de los distintos índices.
TABLA 2
Estimación del índice provincial de oferta cultural y ocio.
Modelo simple 2
β̂ 0 β̂1 RHU R2
Yˆ = βˆ0 + βˆ1 X 1
+*2
Método de Mínimos
0,8722 0,3995 0,7561 0,1494
Cuadrados con Errores Relativos
Método de
3,2744 0,3865 0,2903 0,1496
Mínimos Cuadrados Ordinarios
Modelo múltiple 2
β̂ 0 β̂1 β̂ 2 RHU R2
Yˆ = βˆ0 + βˆ1 X 1 + βˆ2 X 2
+*2
Método de Mínimos
0,4309 −0,0083 0,6835 0,8561 0,4127
Cuadrados con Errores Relativos
Método deMínimos
2,2700 −0,0861 0,6825 0,6602 0,4189
Cuadrados Ordinarios
Fuente: Elaboración propia.
Como puede verse, en el caso del modelo simple el 75,61% de la inquietud do-
ble cuadrática asociada al índice de oferta cultural y ocio queda explicada por el
índice de nivel educativo mediante el método de MCER, mientras que si se Fonsi-
dera el método de MCO dicha variable sólo explica el 29,03% de la inquietud do-
ble cuadrática de Y. Así pues, el coeficiente basado en la inquietud doble cuadrá-
tica nos inclinaría a favor de MCER, mientras que el coeficiente de determinación
R2 apenas presenta diferencias entre ambos procedimientos, situándose en niveles
cercanos al 15%.
Esta situación aparece ilustrada en el Gráfico 2, donde se aprecia bastante dis-
persión entre las observaciones, quedando la recta obtenida por MCER por debajo
de la obtenida por MCO, como consecuencia del mayor peso asignado a las obser-
vaciones con valores reducidos por la medida de inquietud doble cuadrática.
GRÁFICO 2
Índice de oferta cultural y ocio. Estimaciones por Mínimos Cuadrados
con Errores Relativos y por Mínimos Cuadrados Ordinarios.
12
10
Estimación MCO
0
0 2 4 6 8 10 12
6. CONCLUSIONES
REFERENCIAS BIBLIOGRÁFICAS