0% encontró este documento útil (0 votos)
13 vistas20 páginas

Validación de Modelos de Regresión

La unidad temática aborda la diagnosis y validación de modelos de regresión, enfocándose en el análisis de residuos para verificar hipótesis sobre el error. Se discuten métodos gráficos y pruebas numéricas para evaluar la normalidad, homocedasticidad e independencia de los residuos, así como problemas de especificación del modelo. Se enfatiza la importancia de normalizar los residuos y utilizar gráficos como el papel probabilístico normal para identificar problemas en el modelo.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
13 vistas20 páginas

Validación de Modelos de Regresión

La unidad temática aborda la diagnosis y validación de modelos de regresión, enfocándose en el análisis de residuos para verificar hipótesis sobre el error. Se discuten métodos gráficos y pruebas numéricas para evaluar la normalidad, homocedasticidad e independencia de los residuos, así como problemas de especificación del modelo. Se enfatiza la importancia de normalizar los residuos y utilizar gráficos como el papel probabilístico normal para identificar problemas en el modelo.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

UNIDAD TEMÁTICA 03

DIAGNOSIS Y VALIDACIÓN
DEL MODELO DE REGRESIÓN

INTRODUCCIÓN

1. ANÁLISIS DE LOS RESIDUOS


2. ERROR DE ESPECIFICACIÓN

RESUMEN Y CONCLUSIONES
CUESTIONES
03.2 MODELOS DE REGRESIÓN LINEAL MÚLTIPLE

INTRODUCCIÓN

Esta unidad temática se centra en la validación del modelo de regresión, y más


concretamente, en su validación mediante la observación de la representación gráfica de los
residuos del ajuste. No basta con que las pruebas de hipótesis realizadas sobre los parámetros
indiquen que el modelo resulta adecuado, además, se establecieron unas hipótesis sobre el
modelo que es necesario verificar. En particular, las hipótesis relativas al error o perturbación,
que son las más relevantes en esta validación, fueron:

1- Las perturbaciones Uj son variables aleatorias de media nula.


2- Todas las perturbaciones tienen la misma varianza.
3- Todas las perturbaciones están incorrelacionadas entre sí.
4- Las perturbaciones tienen una distribución conjunta normal.
5- La perturbación no depende de las variables explicativas Xi.

Para la comprobación de dichas hipótesis, en el primer apartado de la unidad temática se va


a proponer una serie de gráficos de los residuos del ajuste, en los que se podrán determinar
los problemas del modelo. Pese a la gran cantidad de información que pueda extraerse de un
gráfico de residuos, que no es comparable a la información que se extrae de una prueba
numérica, el uso de los gráficos puede suponer frustración puesto que es necesario un cierto
“entrenamiento” previo para poder interpretarlos y aprovechar su información de forma
conveniente. En unidades temáticas posteriores se propondrán un conjunto de pruebas
numéricas para validar las hipótesis, siendo estos gráficos un complemento para ellas.

También se tratarán brevemente en la presente unidad temática los problemas del error de
especificación del modelo, problema que consiste esencialmente en que el modelo propuesto
no refleja adecuadamente la relación entre la variable a explicar y las explicativas, o bien que
falta alguna variable explicativa relevante, o que sobra alguna del modelo.

1. ANÁLISIS DE LOS RESIDUOS

Una vez estimado el modelo de regresión, se debe comprobar si se cumplen las hipótesis
referentes al error o perturbación, a las variables explicativas y la explicada, y a los parámetros
del modelo. En particular, y en lo referente a la perturbación o error, se debe comprobar la
normalidad, homocedasticidad e independencia del error, la no dependencia del error de las
variables explicativas, la no existencia de relaciones entre las propias variables explicativas, la
linealidad de la relación y la no presencia de observaciones anómalas. Las hipótesis referentes
a las variables y a los parámetros no se validarán mediante gráficos.

Existen varios problemas a la hora de realizar las comprobaciones sobre el error. El primero
es que no es posible contrastar dichas hipótesis puesto que el error o perturbación (U) no es
observable. Si que lo son, sin embargo, los residuos del ajuste (e), por lo que se tratará de
comprobar el cumplimiento de las hipótesis en el residuo con la esperanza de que los
resultados puedan extrapolarse al error o perturbación. Sin embargo, error y residuo no son
lo mismo, y se puede demostrar que la relación entre ambos viene dada a partir de una matriz
M obtenida a partir de la matriz de datos X de las variables explicativas.
DIAGNOSIS Y VALIDACIÓN DEL MODELO DE REGRESIÓN 03.3

= donde = − ( ′ ) = −

Por otra parte, se tiene un segundo problema, un problema de escala que impide determinar
si un error (residuo) es grande o es pequeño. Una vez realizado el ajuste, se puede observar
el valor del residuo para tener así una idea de la importancia del error cometido, de lo bueno
o malo que es el ajuste realizado. Para no equivocarse en el análisis, hay que tener en cuenta
que el residuo tiene las mismas unidades de medida que la variable analizada, y así se pueden
llegar a conclusiones totalmente contrarias si se cambia la unidad de medida de dicha variable.

Aunque el ajuste para explicar el consumo de un producto sea el mismo, los resultados son
aparentemente muy diferentes si el consumo se mide en euros o si se mide en miles de
millones de euros. En el primer caso el residuo parecerá extremadamente grande, mientras
que en el segundo parecerá muy pequeño. El ajuste es igual de bueno (o malo), y los valores
de los residuos pueden engañar a este respecto.

Para mejorar la observación de los residuos, y evitar el problema de escala, es conveniente


normalizarlos de alguna manera. En este apartado se van a presentar los residuos
estandarizados y los residuos estudentizados como valores normalizados habituales.

Los residuos estandarizados se definen como el cociente entre el residuo y la estimación


desviación típica del error:
=

Se tiene así de forma sencilla un valor adimensional, con lo que se evitan problemas de escala
(unidades de medida). Si bien su sencillez resultaba útil en el pasado, cuando apenas existía
potencia de cálculo, tienen el inconveniente de que no tienen una distribución conocida, y por
lo tanto no están acotados sus valores. Para evitar esto, se definen los residuos estudentizados
rti:
=
() 1−

en donde cada residuo se divide por una estimación de la desviación típica, teniendo en cuenta
que para cada residuo rti, se elimina la observación correspondiente en el cálculo de la
varianza. Se rehace el cálculo obteniendo una nueva estimación ( ) , y de esta forma el residuo
estudentizado tiene distribución t de student.

= ≡
() 1−

Autoevaluación 1: ¿Entre qué dos valores oscilarán, aproximadamente, los residuos estudentizados
teniendo en cuenta su distribución?

Una vez normalizados, los residuos ei, ri y rti aportarán una información que será
determinante sobre lo adecuado del ajuste realizado, y sobre posibles anomalías en los datos
originales.
03.4 MODELOS DE REGRESIÓN LINEAL MÚLTIPLE

1.1 ANÁLISIS GRÁFICO DE LOS RESIDUOS

Los gráficos más importantes para el análisis de los residuos son:

(1) Gráfico probabilístico normal de los residuos.


(2) Gráfico de los residuos frente a los valores estimados.
(3) Gráfico de los residuos frente a las variables explicativas.
(4) Gráficos parciales de los residuos.
(5) Gráfico de los residuos frente a las variables no incluidas.

A continuación, se presentan cada uno de estos gráficos, así como su utilidad en la


comprobación de las hipótesis realizadas sobre el error o perturbación.

(1) Gráfico o papel probabilístico normal de los residuos

El cumplimiento de la hipótesis de normalidad del error es indispensable para poder realizar


las pruebas de significación y obtener los intervalos de confianza que permitan realizar
predicciones. Además de las pruebas de hipótesis específicas (de dudosa utilidad), es posible
comprobar la normalidad del error representando los residuos en un histograma o en un papel
probabilístico normal. En particular, el papel normal es un gráfico muy útil para analizar la
normalidad de los residuos, identificar valores o comportamientos anómalos en los mismos,
y proponer soluciones en el caso de falta de normalidad del error.

Respecto al histograma, éste es un gráfico que podría utilizarse para determinar la


normalidad de una variable. Sin embargo, tiene como inconveniente que debe disponerse de
un número suficientemente grande de residuos (50 valores o más) para poder representarlo
e interpretarlo con garantías de éxito. Lamentablemente lo habitual es que el número de
datos utilizado sea reducido, y no permita construir el histograma. Además, se debe buscar la
forma típica de campana, cuestión importante porque debe tener un aspecto muy preciso en
cuanto a la simetría y al apuntamiento, cuestiones difíciles de observar.

En cuanto a pruebas de hipótesis de normalidad, hay muchas disponibles, y la mayoría de


ellas tratan de responder a la pregunta de si una variable tiene distribución normal con una
media y una desviación típica concretas, cuando lo único que interesa es saber si tiene
distribución normal o no. En este sentido, una prueba que podría ser razonable es el test de
Jarque-Bera, una prueba de bondad de ajuste que permite aceptar si una muestra de datos
tiene una asimetría y un apuntamiento compatibles con el de una distribución normal. El test
utiliza el estadístico JB, que se define como:

H0 Se acepta la normalidad = ( + ! (" − 3)$ ) con ≡χ


H1 No se acepta la normalidad
Si JB ≤ &'' ),)+ o si P-Valor ≥ α se acepta la normalidad del
error

donde n es el número de residuos, k el número de variables explicativas del modelo del que
provienen, y se calculan para ellos el coeficiente de asimetría, S, y el de apuntamiento, C.
DIAGNOSIS Y VALIDACIÓN DEL MODELO DE REGRESIÓN 03.5

En cualquier caso, resulta más conveniente representar los residuos en el papel


probabilístico normal, dado que la alineación de los residuos indicará la normalidad de los
mismos, y una alineación es más sencilla de observar que el aspecto que pueda tener una
campana.

La Figura 1 es un papel probabilístico normal, un gráfico en el que en el eje de ordenadas se


representa la probabilidad en una escala especial. Como puede verse, no es una escala
proporcional, y ha sido escogida de forma que al representar los datos en el mismo (en el eje
de abscisas), éstos aparezcan alineados si es que tienen distribución normal.

Para poder representar los residuos, éstos se


Normal Probability Plot
99.9

ordenan de menor a mayor valor, se numeran 99

desde i = 1 hasta n (número total de residuos), 95

se calcula la probabilidad de cada uno de ellos 80

como:

% Percentage
50

(- − 0,5)
, = 20

y se representan las parejas de valores (ei;Pi), 0.1

compuesta por el residuo del ajuste y la -400000 -200000 0


RESIDUOS
200000 400000 600000

probabilidad que le corresponde. Figura 1 Papel probabilístico normal de los residuos del
ajuste.

El papel probabilístico normal ofrece una mayor cantidad de información sobre la


distribución de los residuos que cualquier otro gráfico o prueba numérica. El papel normal se
hace imprescindible cuando existe falta de normalidad de los residuos, puesto que permite
tomar decisiones sobre la forma de transformar el modelo para conseguir la normalidad del
error.

La falta de normalidad de los residuos puede ser debida causas muy diversas. Por ejemplo,
a unas pocas observaciones atípicas. Otro motivo para la falta de normalidad es la falta de
linealidad en el modelo, una relación no adecuada entre variable explicada y explicativas. Si
es éste el caso, se elige una transformación adecuada, y lo más probable es que los residuos
puedan aceptarse como normales. La existencia de varias poblaciones mezcladas en los datos
es otro motivo habitual de falta de normalidad, y para solucionarlo se identifican las
poblaciones y se crean las variables ficticias adecuadas.

Es posible realizar y aceptar los resultados de las pruebas de hipótesis para los parámetros y
para el modelo en el caso de que la falta de normalidad no sea muy importante, aunque no
debe mostrarse demasiada confianza en los resultados.

Finalmente, es posible deducir, de la distribución de los residuos, la distribución del error.


Con esta distribución se crea así una nueva teoría de modelo de regresión, o se utiliza un
modelo de regresión que tenga un error con distribución diferente de la normal, pero la
propuesta de otros modelos de regresión con error no normal escapa por completo a los
objetivos de la presente unidad temática.
03.6 MODELOS DE REGRESIÓN LINEAL MÚLTIPLE

Los residuos en el papel probabilístico normal pueden presentar aspectos característicos de


no normalidad, aspectos que nos pueden permitir transformar de forma sencilla el modelo
para que se cumpla esta hipótesis.

Normal Probability Plot


Normal Probability Plot
99.9
99.9

99
99

95
95

80
80
% Percentage

% Percentage
50
50

20
20

5
5

1
1

0.1
0.1
-2000 -1000 0 1000 2000 3000
-15000 -10000 -5000 0 5000 10000 15000 20000
RESIDUOS
RESIDUOS

(a) (b)
Figura 2 Papel probabilístico normal de residuos que no tienen distribución normal.

Es posible que no pueda admitirse la normalidad porque los residuos aparezcan formando
una curva en su parte negativa (Figura 2a). En este caso tomando logaritmos de la variable
analizada (y posiblemente de las explicativas, si tienen una relación lineal con la explicada) se
solucionará la falta de normalidad.

Por otra parte, es posible que los residuos aparezcan en el gráfico formando dos o más grupos.
En la Figura 2b se aprecia una clara separación en el cero y dos grupos de residuos a su
izquierda y derecha. Esto indica que existen dos poblaciones, que es necesario identificar
(según cual sea la variable analizada) y crear las variables ficticias necesarias. El número de
poblaciones existentes es el número de grupos que pueda observarse.

Proponemos el papel probabilístico normal como la mejor forma de determinar si el error tiene
distribución normal. Si los residuos aparecen más o menos alineados en el gráfico, se acepta la
normalidad del error. La ventaja de este método es que, en caso de rechazarla, es posible proponer
transformaciones en el modelo para su mejora.

(2) Gráfico de los residuos frente a la estimación

Los gráficos de los residuos frente a la estimación de la variable explicada pueden mostrar
problemas del modelo como la heterocedasticidad, la falta de linealidad, los valores atípicos
o la autocorrelación. Si existe alguno de estos problemas en el modelo, entonces los gráficos
de residuos frente a la estimación lo mostrarán de forma más o menos clara.

Para comenzar a identificar los diferentes problemas en el modelo, hay que conocer en
primer lugar el aspecto del gráfico de residuos frente a variable estimada en un modelo sin los
problemas en el error o perturbación antes mencionados. Dicho aspecto se encuentra en la
Figura 3. En ella puede verse que los residuos (trama de puntos) ocupan completamente una
franja sin un orden definido (incorrelación) cuyos límites superior e inferior son paralelos al
eje de abscisas (varianza constante), y situados a la misma distancia del mismo (valor medio
cero).
DIAGNOSIS Y VALIDACIÓN DEL MODELO DE REGRESIÓN 03.7

En realidad, no se suele disponer de suficientes puntos e


para llenar de forma homogénea esta banda, así que
hay que tener cierta flexibilidad para admitir que sea
éste el gráfico es el que se está observando en la
realidad.
Y
Por otra parte, es poco probable que un modelo no
tenga ningún tipo de problema, aunque el modelo haya
salido de una teoría económica reconocida, de forma Figura 3 Gráfico de residuos de un modelo sin
que la Figura 3 difícilmente se encontrará en la problemas.
realidad.

Comenzando con los casos en los que existen problemas en el error, en la Figura 4 se
presenta el caso de que exista heterocedasticidad, esto es, que la varianza del error o
perturbación no se mantenga constante, (σ2(Ui)=σi2).

En este caso la franja que contiene los residuos no tiene una altura constante. La altura de la
franja representa la variabilidad de los residuos para cada valor de 01, y si ese alto no es
constante entonces la variabilidad tampoco tiene que serlo, siendo lo más habitual que ésta
aumente con la predicción, ya sea de forma lineal como en la Figura 4a, o no lineal como en
la Figura 4b. Solucionar este problema es complicado y se dedicará una unidad temática a ello.
No obstante, cuando se tenga un problema de escala y las observaciones aparezcan en un
rango muy amplio, muy dispersas, tomar logaritmos puede solucionar el problema.

e e

Y Y

(a) (b)
Figura 4 Ejemplos de gráficos de residuo para un modelo con problemas de heterocedasticidad. En el caso (a) la varianza
aumenta de forma lineal con la estimación, y en el caso (b) el aumento es no lineal.

Otro de los problemas importantes es la autocorrelación del error, expresado bien mediante
la autocovarianza, cov(UiUj )≠0, o mediante el coeficiente de autocorrelación. La solución a la
autocorrelación es complicada, y también se dedicará una unidad temática a ello.

Habitualmente se analiza la autocorrelación de un error Ui y su valor inmediatamente anterior


Ui-1. En este caso los residuos aparecen alternando su signo, o bien derivan de valores positivos
hacia los negativos y a la inversa. En el primer caso, Figura 5a, la autocorrelación es negativa
(ρ<0), mientras que, en el segundo (Figura 5b), la autocorrelación es positiva (ρ>0). La
evolución del cambio de signo de los residuos es sencilla de explicar si se atiende al signo de
la autocorrelación. Si el coeficiente de autocorrelación es positivo (ρ1>0) entonces la relación
entre Ut y Ut-1 es positiva, y al aumentar Ut-1 también lo hace Ut, y por ello tienden a mantener
el signo. Si el coeficiente de autocorrelación es negativo (ρ1<0) entonces la relación entre Ut y
03.8 MODELOS DE REGRESIÓN LINEAL MÚLTIPLE

Ut-1 es negativa, y al aumentar Ut-1 disminuye Ut y se produce el cambio de signo. Se supone


que los residuos, e, siguen la misma pauta de comportamiento.

e
e

t-1 t
Y
Y
t-1 t
(a) (b)
Figura 5 Ejemplos de gráficos de los residuos para un modelo con problemas de autocorrelación. La autocorrelación puede
ser negativa (a) o positiva (b).

Un problema fácilmente identificable es la presencia de residuos anómalos, es decir,


residuos que se separan mucho de la pauta marcada por el resto de los residuos del ajuste. En
la Figura 6 se presentan un par de ejemplos de residuos anómalos, si bien en el primer caso
(a) resulta tan anómalo que exista un residuo que esté separado de los demás como que el
resto de residuos estén alineados. El segundo caso (b) es más claro, pues hay un residuo
claramente separado de la pauta marcada por los demás. La solución a este problema es la
definición de una variable ficticia que afecte a esta observación y sólo a esta.

e e

Y Y

(a) (b)
Figura 6 Ejemplo de residuos anómalos.

En el gráfico de residuos frente a la predicción también es posible determinar si la


perturbación depende de alguna variable explicativa. Si es ese el caso, los residuos no están
distribuidos al azar, sino más bien se presenta una figura geométrica reconocible.

En la Figura 7 se muestra el caso de ajustar una e


relación lineal cuando en realidad la relación es
cuadrática. Este ejemplo es un caso muy particular,
pues la forma de la relación puede ser cualquiera.

El gran inconveniente de este gráfico es que no es


posible determinar, a partir del mismo, cuál es la Y
variable explicativa causante del problema.
Figura 7 Los residuos se presentan formando
una curva.
DIAGNOSIS Y VALIDACIÓN DEL MODELO DE REGRESIÓN 03.9

Si la teoría económica así lo exige, es posible que el e


modelo no tenga término constante (β0), y por ello se
deba realizar el ajuste sin el mismo. Sin embargo,
puede ocurrir que los residuos muestren finalmente
que realmente si debería tener término constante. En
este caso los residuos aparecerán en una franja
inclinada, como se presenta en la Figura 8. Aunque es Y
un gráfico de residuos típico, no va a ser nada habitual
encontrarlo. Figura 8 Gráfico de residuos de un ajuste sin
constante.

Por último, se debe señalar que los problemas del e


modelo no se presentan de forma aislada, y que es
habitual que los gráficos de los residuos tengan un
aspecto más complicado. Ese es el caso de la Figura 9,
en que se combinan dos problemas, por un lado, la
existencia de heterocedasticidad y por otro una
incorrecta formulación del modelo, al considerar Y
relación lineal cuando en realidad es cuadrática.
Figura 9 Gráfico de residuos con problemas de
heterocedasticidad y de falta de linealidad.

(3) Gráfico de los residuos frente a las variables explicativas.

Los gráficos de los residuos frente a las variables explicativas ayudan a identificar los
problemas del modelo como debidos a alguna variable explicativa del modelo en particular.
El aspecto de los gráficos de los residuos frente a las variables explicativas es similar a los vistos
en el punto anterior, por lo que no se repiten aquí. Pese a ello hay que puntualizar que, a pesar
de la brevedad de la explicación, estos gráficos de residuos son los más importantes por el
motivo expuesto anteriormente.

(4) Gráficos parciales de los residuos.

En estos gráficos se observa la tercera y última interpretación del término U del modelo de
regresión. Este término puede entenderse como que es la variable explicada a la cual se le ha
quitado el efecto de las variables explicativas consideradas en el modelo.

0 − (23 + 2 + 2 +⋯+2 )=

En una función consumo, el término U se interpretaría como el consumo del producto libre
del efecto que tiene sobre el mismo la renta y el precio del producto. De esta forma, y una vez
filtrado el error del efecto de ambas variables, se podría apreciar mejor el efecto que tienen
los precios de otros productos sobre el consumo, o cualquier otra variable que se desee
considerar.

De forma alternativa, si se explica el consumo de un producto mediante de la renta (haciendo


el ajuste de regresión) en el error se tendría el consumo del producto libre del efecto de la
renta, y entonces podría apreciarse mejor el efecto que tiene el precio del producto. O a la
inversa. Una idea que podría resultar interesante en un gráfico.
03.10 MODELOS DE REGRESIÓN LINEAL MÚLTIPLE

Con estos gráficos se pretende estudiar la relación que tiene la variable Y con una variable
explicativa en particular Xk, eliminando o filtrando el efecto del resto de las variables
explicativas consideradas en el modelo, con lo que la relación queda ahora más clara. Para
ello, se debe:

1) Realizar la regresión de la variable explicada frente al resto de las variables explicativas


del modelo
0 = 23∗ + 2 ∗ + 2 ∗ + ⋯ + 2 ∗ 6 + 7 = 0∗ + 7

2) obtener los residuos de la regresión, estimaciones de la perturbación V del modelo


anterior, que son la propia variable explicada a la cual se le ha “quitado el efecto” de
las variables explicativas,

= 0 − 0∗

3) y por último representar los residuos e* frente a la variable explicativa Xk

Una aproximación aceptable y bastante más sencilla puede ser realizar el ajuste con todas
las variables, obtener los residuos (e) del ajuste y calcular un nuevo residuo como e*=e+bkXk.
Su representación frente a la variable explicativa Xk puede mostrar, aproximadamente, el
efecto marginal de Xk sobre Y.

(5) Gráfico de los residuos frente a las variables no incluidas.

Dado que los modelos proporcionados por la teoría económica pueden no incluir todas las
variables explicativas, es interesante representar los valores del residuo e frente al tiempo,
frente el orden de introducción o frente al orden de medida para poder asignar a esas
variables los problemas que se detecten en el modelo.

Estos gráficos tienen el mismo aspecto que los gráficos de los residuos frente a estimaciones,
o frente a variables explicativas, por lo que no se vuelven a presentar en este apartado.

Ejemplo 1. Los siguientes gráficos son de los residuos del problema sobre la tasa de
ocupación de las mujeres frente a la tasa de desempleo, planteado en el primer ejemplo de la
primera unidad temática.

En los tres primeros gráficos se aprecia de forma clara que la distribución de los residuos no
es aleatoria, y que el modelo está mal formulado.

 En el gráfico de residuos frente a la predicción (Figura 10) y frente a la Tasa de Paro (Figura
12) se puede apreciar que los residuos se agrupan en dos bandas claramente
diferenciadas. Esto quiere decir que existen dos rectas y no sólo una, que existen dos
grupos de datos.

 En el gráfico de residuos frente al índice (Figura 11), u orden de introducción de los datos
(el año), se observan claramente dos comportamientos, una parte de residuos positivos
(primeros años) y otra parte de residuos negativos que incluye unas oscilaciones (últimos
años). Estos dos grupos, positivos y negativos, están separados en un instante de tiempo
determinado, el año 1986, que es el momento de entrada de España en la CEE.

 Por último, en el papel probabilístico normal (Figura 13) vemos que los residuos están
DIAGNOSIS Y VALIDACIÓN DEL MODELO DE REGRESIÓN 03.11

separados en dos partes, una a cada lado del cero. Esta separación en el cero indica la
presencia de dos poblaciones, las ya mencionadas del antes y el después de la entrada en
la CEE.
Regression residuals (= observed - fitted TASAOCUM) Regression residuals (= observed - fitted TASAOCUM)
4 4

3 3

2 2

1 1
residual

residual
0 0

-1
-1

-2
-2

-3
-3

-4
70 75 80 85 90 95 -4
TASAOCUM 1980 1985 1990 1995 2000

Figura 10 Residuos de Tasa de Ocupación de las mujeres Figura 11 Residuos de Tasa de Ocupacióan de las mujeres
representados respecto a la predicción. representados frente al orden de introducción.
Regression residuals (= observed - fitted TASAOCUM) Normal Probability Plot
4 99.9

3 99

2 95

% Percentage
1 80
residual

0 50

-1 20

-2 5

-3 1

-4 0.1
6 8 10 12 14 16 18 20 22 24 -3 -2 -1 0 1 2 3
TASAPARO RESIDUOSM1

Figura 12 Residuos de Tasa de Ocupación de las mujeres Figura 13 Papel probabilístico normal de los residuos del
representados respecto a la Tasa de Paro. ajuste de Tasa de Ocupación de las mujeres.

La conclusión final sería que el modelo no está bien formulado, que existen dos periodos en
el intervalo de tiempo observado, lo que nos llevaría a introducir una variable ficticia en el
ajuste para separar ambos. Respecto al papel probabilístico normal, en principio no parece
necesaria una transformación adicional de la variable estudiada, aunque la decisión final
habría que tomarla tras realizar el ajuste con la variable ficticia.

Los gráficos de residuos son una herramienta muy útil para encontrar problemas en el ajuste de un
modelo, si bien tienen dos problemas fundamentales: pueden ser complicados de interpretar y no son
una prueba definitiva de la existencia del problema.

2. ERROR DE ESPECIFICACIÓN DEL MODELO

Se comete un error de especificación del modelo cuando se establece una dependencia


incorrecta entre la variable a estudiar y las variables explicativas. Los errores de especificación
pueden ser de tres tipos:

1 - Omisión de variables explicativas importantes.


2 - Introducción de variables explicativas innecesarias.
3 - Establecer una relación incorrecta entre variable explicada y explicativa.
03.12 MODELOS DE REGRESIÓN LINEAL MÚLTIPLE

En los siguientes apartados se detallará cada uno de estos tres casos, la forma en que afecta
al modelo, la manera de identificar que se tiene el problema y la solución del mismo. Se
prestará especial atención al tercero, pues es complicado tener en cuenta una variable
explicativa que no se conoce, y las pruebas para los parámetros se encargan de determinar si
una variable explicativa lo es realmente o no lo es. Establecer la relación correcta entre
variable explicada y explicativas es un problema que requiere especial atención.

2.1 OMISIÓN DE VARIABLES EXPLICATIVAS IMPORTANTES

La omisión de una variable explicativa importante se puede detectar en el valor del


coeficiente de determinación. Un porcentaje pequeño de explicación de la variable estudiada
puede indicar la ausencia de una variable explicativa importante.

La ausencia de una variable explicativa importante puede implicar problemas:

 La estimación de los parámetros puede ser sesgada, esto es, estimadores que en promedio
no coinciden con el parámetro que se desea estimar. Si la variable explicativa que no se
ha incluido en el modelo (porque se desconoce) está incorrelacionada con las variables
incluidas en el mismo (lo habitual), entonces el estimador b es insesgado y no hay
problema. En caso contrario el estimador es segado, y el sesgo aumenta con la correlación
con las variables del modelo.

 La estimación de la varianza del error ( ) puede verse también afectada. Si la variable no


incluida está incorrelacionada con las existentes (lo más habitual), entonces su efecto está
en los residuos, y la estimación de la varianza del error será mayor que si estuviera en el
modelo. Existirá entonces un sesgo por exceso que conducirá a errores en la prueba t y tal
vez se considerarán como no explicativas algunas variables explicativas que sí lo son (dado
que la varianza está en el denominador). Por el contrario, si la variable no incluida está
correlacionada con las demás, entonces la estimación de la varianza del error tiende a
disminuir, haciendo que variables no explicativas sean consideradas como tales al realizar
la prueba t.

2.2 INCLUSIÓN DE VARIABLES IRRELEVANTES

La inclusión de variables irrelevantes en el modelo se puede detectar mediante la prueba de


significación de los parámetros, aunque no está exenta de peligros.

 El estimador de los parámetros sigue siendo insesgado.

 La estimación de la varianza del error puede verse muy afectada. Así, si la variable que se
ha incluido está muy correlacionada con las existentes, la estimación de la varianza del
error aumenta mucho, y se podrían considerar como no explicativas algunas variables
explicativas que sí lo son. Si no está correlacionada (lo más habitual), entonces la
estimación de la varianza del error aumenta también, aunque poco. Estos efectos son
menos apreciables a medida que aumenta el tamaño de la muestra.

En resumen, la inclusión de "variables explicativas" irrelevantes puede conducir a la


DIAGNOSIS Y VALIDACIÓN DEL MODELO DE REGRESIÓN 03.13

exclusión de variables explicativas relevantes. Sobre todo, con tamaños de muestra pequeños,
que es lo habitual.

2.3 ESTABLECER UNA RELACIÓN INCORRECTA ENTRE VARIABLE EXPLICADA Y EXPLICATIVA

El modelo más sencillo, el inicial o el modelo por defecto cuando se trata de establecer una
relación entre variable explicada y variable explicativa es un modelo lineal en las variables
explicativas (además de lineal en los parámetros). Una relación no lineal puede aproximarse
por una relación lineal si el intervalo donde toma valores las variables explicativas es
relativamente estrecho. Pero si ese intervalo no es estrecho, o si se pretende predecir valores
fuera del mismo, ese modelo lineal aproximado no será adecuado en absoluto.

La mejor forma de determinar si la relación entre variable explicada y explicativa no es lineal


es observar un gráfico de residuos, aunque existen algunas pruebas numéricas para tratar de
responder a la pregunta. En los siguientes apartados se tratarán ambos temas.

2.3.1 GRÁFICO DE RESIDUOS

La primera forma que se presenta de determinar si una relación lineal entre variable
explicada y explicativa está bien planteada es observar un gráfico de residuos. El motivo de
hacerlo es que, además de saber que está mal planteada, se puede tratar de determinar el
tipo de relación real existente entre las variables, y modificar el modelo para tenerla en
cuenta.

Los gráficos de residuos necesarios para detectar errores de especificación (no linealidad)
son los gráficos de los residuos ya vistos:

(1) Gráfico de los residuos frente a los valores estimados.


(2) Gráfico de los residuos frente a las variables explicativas.
(3) Gráficos parciales de los residuos.
(4) Gráfico de los residuos frente a las variables no incluidas.

Prestando mayor atención al gráfico de residuos frente a las variables explicativas o tal vez el
gráfico parcial de los residuos frente a los demás gráficos. El motivo de prestar atención es
que tanto en uno como en otro se representan los residuos frente a una variable explicativa
determinada, variable explicativa que es la causa de la no linealidad.

Ejemplo 2. Se desea determinar si resulta razonable utilizar el NÚMERO DE OFICINAS


BANCARIAS y de CAJAS DE AHORRO como indicador del nivel de riqueza o de desarrollo de
España.

Para ello se propone un modelo lineal en el que se relaciona el PIB, medido en miles de millones
de pesetas, con el número de oficinas bancarias y de cajas de ahorro, ambos medidos en
unidades. Proponer y ajustar el modelo, determinando si la relación lineal resulta razonable
para el mismo, y proponer su modificación en caso de que no lo sea.

El modelo propuesto para el estudio del PIB es un modelo lineal, donde el parámetro β1
cuantifica el aumento del PIB, en promedio, por cada oficina de banco abierta, cuando se
03.14 MODELOS DE REGRESIÓN LINEAL MÚLTIPLE

mantiene el número de oficinas de caja de ahorro. El parámetro β2 cuantifica el aumento del


PIB, en promedio, por cada oficina de caja de ahorro abierta, cuando se mantiene el número
de oficinas de banco.

, = 23 + 2 8 "9 + 2 ""88 +
Realizado el ajuste, todos los parámetros son significativos, y el modelo resulta adecuado, tal
y como se aprecia en los P-Valor del Cuadro 1, con un porcentaje de explicación de la
variabilidad del PIB de un 97,57%. Aunque todo es razonable, será necesario centrar la atención
en el aspecto que presentan los gráficos de residuos del ajuste.

Cuadro 1 Ajuste del PIB frente al número de BANCOS y CCAA.


Model 1: OLS, using observations 1982-2001 (T = 20)
Dependent variable: PIB
-------------------------------------------------------------
coefficient std. error t-ratio p-value
-------------------------------------------------------------
const −156237 52904.6 −2.953 0.0089 ***
BANCO 2.07225 0.801490 2.585 0.0192 **
CCAA 7.22545 0.291619 24.78 8.81e-015 ***
-------------------------------------------------------------
R-squared 0.975756 Adjusted R-squared 0.972904

Analysis of Variance:
-----------------------------------------------------------
Sum of squares df Mean square
-------------------------------------------------------------
Regression 9.54116e+010 2 4.77058e+010
Residual 2.37062e+009 17 1.39448e+008
Total 9.77823e+010 19 5.14644e+009
-----------------------------------------------------------
R^2 = 9.54116e+010 / 9.77823e+010 = 0.975756
F(2, 17) = 4.77058e+010 / 1.39448e+008 = 342.105 [p-value 1.86e-014]

Regression residuals (= observed - fitted PIB) Regression residuals (= observed - fitted PIB)
25000 25000

20000 20000

15000 15000

10000 10000

5000 5000
residual

residual

0 0

-5000 -5000

-10000 -10000

-15000 -15000

-20000 -20000
60000 62000 64000 66000 68000 70000 72000 45000 50000 55000 60000 65000 70000 75000
BANCO CCAA

(a) (b)
Regression residuals (= observed - fitted PIB)
Regression residuals (= observed - fitted PIB)
25000
25000

20000
20000

15000
15000

10000
10000

5000 5000
residual

residual

0 0

-5000 -5000

-10000 -10000

-15000 -15000

-20000 -20000
350000 400000 450000 500000 1982 1984 1986 1988 1990 1992 1994 1996 1998 2000
PIB AÑO

(c) (d)
Figura 14 Gráficos de residuos frente al número de bancos (a), el número de cajas de ahorro (b), la predicción (c) y el orden
de introducción (d).
DIAGNOSIS Y VALIDACIÓN DEL MODELO DE REGRESIÓN 03.15

Como se observa en la Figura 14, los residuos no están distribuidos al azar, forman figuras
geométricas reconocibles si se unen los puntos mediante una línea, por lo que debe admitirse
que el modelo está mal formulado. Entre otras cuestiones, puede observarse una clara curva
en el gráfico de residuos frente al número de BANCOS (Figura 14a), lo cual indicaría una
relación de tipo cuadrático entre el número de BANCOS y el PIB. Así mismo puede observarse
la existencia de un antes y un después en el gráfico de residuos frente al tiempo (Figura 14d),
puesto que en la observación 10 se aprecia un salto o discontinuidad, separando los residuos
en dos grupos. Esta observación corresponde al año 1992, año de una importante crisis
económica en España.

Cuadro 2 Ajuste del modelo que incluye el cuadrado del número de BANCOS.
Model 2: OLS, using observations 1982-2001 (T = 20)
Dependent variable: PIB
-----------------------------------------------------------------
coefficient std. error t-ratio p-value
-----------------------------------------------------------------
const 3.07251e+06 429008 7.162 2.26e-06 ***
BANCO −95.5591 12.9552 −7.376 1.56e-06 ***
CCAA 7.20101 0.140916 51.10 3.72e-019 ***
BANCO_2 0.000736274 9.76560e-05 7.539 1.19e-06 ***
-----------------------------------------------------------------
R-squared 0.994675 Adjusted R-squared 0.993676

Analysis of Variance:
-----------------------------------------------------------
Sum of squares df Mean square
-----------------------------------------------------------
Regression 9.72616e+010 3 3.24205e+010
Residual 5.20703e+008 16 3.25439e+007
Total 9.77823e+010 19 5.14644e+009
-----------------------------------------------------------
R^2 = 9.72616e+010 / 9.77823e+010 = 0.994675
F(3, 16) = 3.24205e+010 / 3.25439e+007 = 996.208 [p-value 2.15e-018]

Suponiendo una relación cuadrática con el número de oficinas de banco y realizado el ajuste,
puede comprobarse que el P-Valor de la nueva variable es prácticamente igual a cero, por lo
que es conveniente la introducción del término al cuadrado, como se aprecia en el Cuadro 2.

Cuadro 3 Ajuste del modelo que incluye a la variable ficticia que indica la crisis.
Model 5: OLS, using observations 1982-2001 (T = 20)
Dependent variable: PIB
-----------------------------------------------------------------
coefficient std. error t-ratio p-value
-----------------------------------------------------------------
const 128231 43686.1 2.935 0.0102 **
CCAA 7.49732 0.427167 17.55 2.07e-011 ***
BANCO −2.57197 0.916794 −2.805 0.0133 **
PERIODO_CCAA −1.80723 0.579952 −3.116 0.0071 ***
PERIODO_BANCO 2.07320 0.520838 3.980 0.0012 ***
-----------------------------------------------------------------
R-squared 0.996864 Adjusted R-squared 0.996028

Analysis of Variance:
-----------------------------------------------------------------
Sum of squares df Mean square
-----------------------------------------------------------------
Regression 9.74757e+010 4 2.43689e+010
Residual 3.06609e+008 15 2.04406e+007
Total 9.77823e+010 19 5.14644e+009
-----------------------------------------------------------------
R^2 = 9.74757e+010 / 9.77823e+010 = 0.996864
F(4, 15) = 2.43689e+010 / 2.04406e+007 = 1192.18 [p-value 1.41e-018]
03.16 MODELOS DE REGRESIÓN LINEAL MÚLTIPLE

Suponiendo la existencia de dos poblaciones, un antes y un después de la crisis de 1992,


introduciendo la variable ficticia PERIODO y realizado el ajuste, puede comprobarse que el P-
Valor de los parámetros que acompañan a la variable ficticia son menores a un 5%, por lo que
parecía conveniente la introducción de dicha variable, como se aprecia en el Cuadro 3.

2.3.2 CONTRASTE DE MALA ESPECIFICACIÓN FUNCIONAL (RESET)

Se han propuesto algunas pruebas de hipótesis con el objeto de determinar si la relación


existente entre variable explicada y explicativa es realmente la establecida en el modelo.
Lamentablemente su utilidad es bastante reducida, dado que las pruebas no indican cuál es la
variable explicativa que no tienen relación lineal con la variable explicada, ni la forma de su
relación (cuadrática, cúbica, exponencial, ...).

Una de las pruebas es el contraste de error de especificación de la regresión, conocida como


RESET. La prueba se basa en que, si la relación lineal es la correcta, ninguna función no lineal
que se pueda añadir al modelo original hará que este mejore. Puesto que no se conoce a priori
la variable explicativa que tiene relación incorrecta con la explicada, lo que se propone es
añadir al modelo diferentes potencias (hasta la potencia 3) de la estimación 01 de la variable
explicada.

0 = 23 + 2 + 2 + ⋯+ 2 + : 01 + : 01 $ +

la prueba que se utiliza sería la prueba F para un conjunto de parámetros

H0 γ1 = γ2 = 0 ∆ "@⁄A
;<=>< =
La relación es lineal y está bien formulada "@C ⁄( − D − 1)

H1 al menos uno de los parámetros es distinto de cero ;<=>< ≡ ;E


La relación con alguna variable explicativa no es lineal

Si Fcalc ≤ Fs n-k-1α entonces se acepta H0 (γ1 = γ2 = 0) y la relación es lineal.

En el caso del PIB y de las oficinas de banco y cajas de ahorro, se realiza el ajuste del RESET
en el Cuadro 4.

, = 23 + 2 8 "9 + 2 ""88 + : ,F + : ,F $
+

Como Fcalc = 4,267 > F2,150,05 = 3,68, o como P-Valor = 0,0341 < 0,05, entonces se rechaza H0
y la relación entre el PIB y alguna variable explicativa no es lineal, como se había señalado
anteriormente.

Autoevaluación 2: ¿Según esta prueba, cuál es la variable explicativa que tiene una relación no lineal
con el PIB?
DIAGNOSIS Y VALIDACIÓN DEL MODELO DE REGRESIÓN 03.17

Cuadro 4 Ajuste con el cuadrado y el cubo de la estimación del PIB para determinar si la relación está bien planteada
Auxiliary regression for RESET specification test
OLS, using observations 1982-2001 (T = 20)
Dependent variable: PIB
-------------------------------------------------------------
coefficient std. error t-ratio p-value
-------------------------------------------------------------
const 1.34015e+06 1.06878e+06 1.254 0.2291
CCAA −31.5180 26.3975 −1.194 0.2510
BANCO −6.59956 8.11543 −0.8132 0.4288
yhat^2 1.12414e-05 9.31071e-06 1.207 0.2460
yhat^3 −7.58837e-012 7.77527e-012 −0.9760 0.3446
-------------------------------------------------------------
Test statistic: F = 4.266987,
with p-value = P(F(2,15) > 4.26699) = 0.0341

Cuando se dispone de dos variables explicativas en el modelo, un gráfico en tres dimensiones no


suele aclarar mucho la naturaleza de la relación variable explicada-explicativa. Si son tres o más
variables explicativas, el gráfico no siquiera se puede realizar. Por lo tanto, es habitual comenzar con
un modelo lineal, y que los gráficos de residuos indiquen más tarde la verdadera naturaleza de la
relación entre la variable explicada y las explicativas.

RESUMEN Y CONCLUSIONES

1. Realizar las pruebas hipótesis sobre los parámetros y sobre el modelo no es suficiente para
dar como válido un modelo de regresión. Además, es necesario comprobar que las
hipótesis establecidas sobre el modelo se cumplen, siendo las más importantes las
referidas al error o perturbación.

2. En la presente unidad temática se han presentado una serie de gráficos que permiten la
validación del modelo, al menos en lo que respecta al error o perturbación. Dicha
validación se produce por medio de los residuos del ajuste, la diferencia existente entre el
valor real de la variable explicada y el valor aproximado propuesto por el modelo.

3. También se ha presentado la importancia que tiene la correcta formulación del modelo


sobre las estimaciones de sus parámetros. De nuevo los gráficos de residuos son
determinantes para ello.

4. Por último, es posible que el ajuste realizado esté condicionado por sólo unas pocas
observaciones disponibles, bien porque los valores son muy diferentes del resto de las
observaciones, bien porque son fruto de algún tipo de error. En la presente unidad
temática se han presentado una serie de pruebas que permiten identificar dichas
observaciones, y determinar la naturaleza de su influencia.
03.18 MODELOS DE REGRESIÓN LINEAL MÚLTIPLE

CUESTIONES

P1.- Dados los siguientes GRÁFICOS DE LOS RESIDUOS, explicar que problemas tienen los
modelos respectivos (si los tienen).

0.4 0.4
0.4

0.2 0.2
0.2

0 0
0

-0.2 -0.2
-0.2
-0.4 -0.4
-0.4
-1.6 0.4 2.4 4.4 6.4 -1.6 0.4 2.4 4.4 6.4 -1.6 0.4 2.4 4.4 6.4
Prediccion Prediccion Prediccion

(a) (b) (c)

P2.- Durante diez años consecutivos (1986-1995) se ha observado anualmente la producción


de carne de AVE en España, y el índice ponderado de precios de venta de dicho producto.
La producción de carne (PAVE) se mide en miles de toneladas y el IPC es un número índice
con base a la media ponderada de precios de 1992.

a) Determinar si la relación entre ambas variables es cuadrática (o de orden superior)


mediante dos pruebas diferentes a partir de las tablas presentadas, detallando en cada
caso las hipótesis, el estadístico de prueba y la conclusión. La variable PAVEP es el valor
esperado de la producción de la carne de ave.
Analysis of Variance PAVE = β0+β1IPC+U
Sum of squares df Mean square
Regression 8.37094e+009 1 8.37094e+009
Residual 1.0801e+010 8 1.35012e+009
Total 1.91719e+010 9 2.13021e+009
R^2 = 8.37094e+009 / 1.91719e+010 = 0.436625
F(1, 8) = 8.37094e+009 / 1.35012e+009 = 6.20012 [p-value 0.0375]

Analysis of Variance PAVE = β0+β1IPC+β2IPC2+U


Sum of squares df Mean square
Regression 1.293e+010 2 6.46498e+009
Residual 6.24196e+009 7 8.91709e+008
Total 1.91719e+010 9 2.13021e+009
R^2 = 1.293e+010 / 1.91719e+010 = 0.674422
F(2, 7) = 6.46498e+009 / 8.91709e+008 = 7.2501 [p-value 0.0197]

Analysis of Variance PAVE = β0+β1IPC+β2PAVEP2+β3PAVEP3+U


Sum of squares df Mean square
Regression 1.36595e+010 3 4.55317e+009
Residual 5.51242e+009 6 9.18736e+008
Total 1.91719e+010 9 2.13021e+009
R^2 = 1.36595e+010 / 1.91719e+010 = 0.712475
F(3, 6) = 4.55317e+009 / 9.18736e+008 = 4.95591 [p-value 0.0460]

b) Para la segunda prueba realizada, la prueba RESET, compara el resultado obtenido con el
ofrecido por el gretl
DIAGNOSIS Y VALIDACIÓN DEL MODELO DE REGRESIÓN 03.19

RESET test for specification (squares and cubes)


Test statistic: F = 2.878180,
with p-value = P(F(2,6) > 2.87818) = 0.133

RESET test for specification (squares only)


Test statistic: F = 5.112685,
with p-value = P(F(1,7) > 5.11268) = 0.0582

RESET test for specification (cubes only)


Test statistic: F = 5.050323,
with p-value = P(F(1,7) > 5.05032) = 0.0594

P3.- En su informe del año 2010 la Asociación Española de Renting de Vehículos proporciona
datos sobre su sector. Entre ellos se detalla la evolución en el tiempo del tamaño de la
flota (FLOTEVEH) y de los ingresos que generan (FACTURACIÓN en millones de euros).

a) Determinar si la relación entre ambas variables es cuadrática o de orden superior


mediante la prueba adecuada, detallando las hipótesis, el estadístico de prueba y la
conclusión. La variable FACTURACIONP es el valor esperado de la facturación.
Analysis of Variance FACTURACION = β0+β1FLOTAVEH+U
Sum of squares df Mean square
Regression 2.33769e+007 1 2.33769e+007
Residual 457382 11 41580.2
Total 2.38343e+007 12 1.98619e+006
R^2 = 2.33769e+007 / 2.38343e+007 = 0.980810
F(1, 11) = 2.33769e+007 / 41580.2 = 562.213 [p-value 8.55e-011]

Analysis of Variance FACTURACION = β0+β1FLOTAVEH+β2FACTURACIONP2+β3FACTURACIONP3+U


Sum of squares df Mean square
Regression 2.36363e+007 3 7.87878e+006
Residual 197965 9 21996.1
Total 2.38343e+007 12 1.98619e+006
R^2 = 2.36363e+007 / 2.38343e+007 = 0.991694
F(3, 9) = 7.87878e+006 / 21996.1 = 358.19 [p-value 1.12e-009]

b) Compara la prueba realizada con la correspondiente prueba ofrecida por el Gretl

RESET test for specification (squares and cubes)


Test statistic: F = 5.896898,
with p-value = P(F(2,9) > 5.8969) = 0.0231

RESET test for specification (squares only)


Test statistic: F = 12.601583,
with p-value = P(F(1,10) > 12.6016) = 0.00527

RESET test for specification (cubes only)


Test statistic: F = 11.120782,
with p-value = P(F(1,10) > 11.1208) = 0.00756

c) Observa el gráfico de los residuos frente a la 250


Regression residuals (= observed - fitted FACTURACIAN)

variable explicativa (FLOTEVEH) y determina si su 200

150

relación con la facturación es lineal o cuadrática. 100

50
residual

-50

-100

-150

-200

-250
150000 200000 250000 300000 350000 400000 450000 500000 550000
FLOTAVEH
03.20 MODELOS DE REGRESIÓN LINEAL MÚLTIPLE

P4.- Determinar los posibles problemas que aparecen en los siguientes gráficos de los
residuos:

CONSUMO HORAS VENTAS


5 0.8 2.2
2 0.5 1.2
-1 0.2
0.2
-4 -0.1
-7 -0.8
-0.4
-10 -0.7 -1.8
0 4 8 12 16 20 0 3 6 9 12 15 0 5 10 15 20 25 30
Index Predicted Index
(a) (b) (c)
PRECIOS TRAFICO TRAFICO
58 0.15 0.14

38 0.1 0.1
0.05 0.06
18
0 0.02
-2
-0.05 -0.02
-22 -0.1 -0.06
-42 -0.15 -0.1
0 5 10 15 20 25 30 6.5 6.9 7.3 7.7 8.1 8.5 8.9 0 48 12 16
Index Predicted Index
(d) (e) (f)
FBC VENTAS VENTAS/POBLACION
1.6 19 0.5
1.1 15
0.3
0.6 11
0.1 7 0.1
-0.4 3
-0.1
-0.9 -1
-1.4 -5 -0.3
100 150 200 250 300 350 400 0 100 200 300 400 500 600 0 2 4 6 8 10
Ventas POBLACION Index
(g) (h) (i)

También podría gustarte