0% encontró este documento útil (0 votos)
830 vistas20 páginas

Modelo de Regresión para Ventas Anuales

Este documento presenta 10 problemas de regresión lineal y múltiple para ser resueltos usando Excel. Los problemas involucran ajustar modelos de regresión lineal y no lineal a diferentes conjuntos de datos para predecir valores y analizar la relación entre variables. Se pide determinar parámetros de regresión, varianzas explicadas, coeficientes de determinación y realizar predicciones usando los modelos ajustados.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
830 vistas20 páginas

Modelo de Regresión para Ventas Anuales

Este documento presenta 10 problemas de regresión lineal y múltiple para ser resueltos usando Excel. Los problemas involucran ajustar modelos de regresión lineal y no lineal a diferentes conjuntos de datos para predecir valores y analizar la relación entre variables. Se pide determinar parámetros de regresión, varianzas explicadas, coeficientes de determinación y realizar predicciones usando los modelos ajustados.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como PDF, TXT o lee en línea desde Scribd

TALLER SOBRE REGRESION LINEAL Y MÚLTIPLE

Se pide resolver los siguientes problemas mediante la aplicación informática EXCEL y remitir al
correo del docente con fecha de presentación 06/02/2020.
1. Para la economía española, disponemos de los datos anuales redondeados sobre consumo
final de los hogares a precios corrientes (Y) y renta nacional disponible neta (X), tomados de
la Contabilidad Nacional de España base 1995 del INEC, para el período 1995-2002, ambos
expresados en miles de millones de dólares:
Año 1995 1996 1997 1998 1999 2000 2001 2002
Yt 258,6 273,6 289,7 308,9 331,0 355,0 377,1 400,4
Xt 381,7 40,2 426,5 454,3 486,5 520,2 553,3 590,0
Considerando que el consumo se puede expresar como función lineal de la renta
(Yt=a+b·Xt), determine:
a) Los parámetros a y b de la recta de regresión.
b) La varianza de la variable consumo y su descomposición en varianza explicada y no
explicada por el modelo.
c) El coeficiente de determinación de dicha regresión.
d) La predicción del valor que tomará el consumo para una renta de 650.000 millones de
dólares.
2. Se supone que se puede establecer cierta relación lineal entre las exportaciones de un país y
la producción interna de dicho país. En el caso de Ecuador, tenemos los datos anuales
(expresados en millones de dólares) para tales variables correspondientes al quinquenio
2010-14 en la siguiente tabla:

Años Producción Exportaciones


2010 52,65 10,42
2011 53,97 11,84
2012 57,38 14,44
2013 61,83 16,73
2014 65,38 18,76
A partir de tal información, y considerando como válida dicha relación lineal, se pide:
a) Si la producción para el año 2015 fue de 68,11 millones de dólares, ¿cuál sería la
predicción de las exportaciones para este año? ¿Qué grado de precisión tendría dicha
predicción?
b) Si sabemos que las exportaciones para 2015 fueron de 20,54 millones de dólares, ¿cuál
sería la producción interna aproximada para ese año? ¿Qué grado de confianza daría
usted a esta predicción?
c) ¿Qué tanto por ciento de la varianza de las exportaciones no vienen explicadas por la
producción interna, y se debe a otro tipo de variables?
3. De una distribución de dos variables se conocen los siguientes datos:
rxy = 0,9; sx = 1,2; sy = 2,1; x́ ; =5; ý =10
A partir de los mismos, obténganse las rectas de regresión mínimo cuadráticas de X sobre Y
y de Y sobre X.
4. Para un mismo grupo de observaciones de las variables X e Y, hemos obtenido las dos rectas
de regresión siguientes:
3x + 2y = 26
6x + 2y = 32
En función de las mismas, responda a las siguientes cuestiones:
a) ¿Qué valores tomarían las medias de X e Y?
b) Represente gráficamente ambas rectas de regresión.
c) Determine el valor del coeficiente de correlación lineal rxy.
d) ¿Porqué la regresión de Y sobre X y la de X sobre Y no coinciden?
5. A partir de un conjunto de valores de las variables X e Y, se ha determinado la regresión de Y
sobre X, obteniéndose la siguiente recta:
Y*=10+0,45X; R2=0,9; x́ =20
Se pide que, a partir de la definición de la anterior recta, determine los parámetros de la
recta de regresión de X sobre Y.
6. Se han observado, en varios modelos de automóviles, los datos de potencia del motor (X),
en caballos, y la aceleración (Y), medida en el número de segundos necesarios para acelerar
de 0 a 100 Km./h. La tabla adjunta refleja los valores obtenidos.
X 50 75 90 100 120 150
Y 15 12 10 5 10 9 8
A partir de tales datos, se ha decidido expresar la aceleración en función de la potencia
mediante el ajuste de una función potencial (mediante el correspondiente cambio
logarítmico). Bajo esta hipótesis:
a) Determine la función de ajuste y el ECM conseguido.
b) Si aumenta la potencia de un motor en un 10%, ¿en qué porcentaje repercutirá dicho
aumento en la aceleración prevista? ¿Depende ello de la potencia que tenga el motor en
cuestión?
7. En un nuevo proceso artesanal de fabricación de cierto artículo que está implantado, se ha
considerado que era interesante ir anotando periódicamente el tiempo medio (medido en
minutos) que se utiliza para realizar una pieza (variable Y) y el número de días desde que
empezó dicho proceso de fabricación (variable X). Con ello, se pretende analizar cómo los
operarios van adaptándose al nuevo proceso, mejorando paulatinamente su ritmo de
producción conforme van adquiriendo más experiencia en él. A partir de las cifras recogidas,
que aparecen en la tabla adjunta, se decide ajustar una función exponencial que explique el
tiempo de fabricación en función del número de días que se lleva trabajando con ese
método.
X 10 20 30 40 50 60 70
Y 35 28 23 20 18 15 13
Desde el correspondiente ajuste propuesto, se pide que determine:
a) ¿Qué tiempo se predeciría para la fabricación del artículo cuando se lleven 100 días?
b) ¿Qué tiempo transcurriría hasta que el tiempo de fabricación que se prediga sea de 10
minutos?
c) ¿Qué porcentaje de tiempo se reduce por cada día que pasa?
8. La empresa COLOBONA S.A., ha trabajado hasta ahora con la hipótesis de que las ventas de
un período dependen linealmente de los gastos de publicidad efectuados en el período
anterior. En este momento, le solicitan a usted la realización de un análisis que ponga de
manifiesto si la hipótesis, hasta ahora mantenida, se puede seguir sosteniendo en función
de los datos que le suministran.
AÑOS GASTOS VENTAS
1987 21 ...
1988 22 19
1989 25 20
1990 26 22
1991 27 23
1992 29 24
1993 30 26
En el informe final de su análisis, deberá responder a las siguientes preguntas:
a) ¿Se incrementarán las ventas del período siguiente al aumentar los gastos en publicidad
del período actual?
b) ¿Es adecuado suponer que el ajuste entre estas variables es efectivamente lineal
teniendo en cuenta los valores de las variables? Ajuste el modelo lineal e interprete los
coeficientes del mismo. ¿Qué porcentaje de la varianza de las ventas no son explicadas
por las variaciones de los gastos en publicidad?
c) ¿Cuál será la predicción de las ventas para 1994? ¿Qué precisión tendrá ese pronóstico?
d) Si para el año 1994 se piensa incrementar los gastos de publicidad en un 10%, ¿qué
incremento relativo cabría esperar para las ventas de 1995 con respecto a las de 1994,
según el modelo ajustado?
9. Un estudiante de la Escuela Universitaria de Estudios Empresariales de la Universidad de
Sevilla, para poder pagarse sus estudios, debe trabajar como camarero en un bar de copas
de su localidad. A este establecimiento, suelen acudir todos los jóvenes de la zona. Este año,
con los conocimientos aprendidos, decide por fin estudiar la relación existente entre la
cantidad de sal de las galletas saladas y el consumo de bebidas, ya que es costumbre dar al
cliente este aperitivo cuando pide una consumición. Se sabe que las galletas no pueden
tener una concentración de sal superior a 3,5 gramos por cada 1000 galletas y, por ello,
decide ir variando a partir de 1 gramo la concentración de 0,5 en 0,5 gramos cada semana e
ir anotando el incremento en caja semanalmente, obteniendo la siguiente tabla:
Gramos de sal por
Ingresos (dólares)
1000 galletas
1,0 1403
1,5 1500
2,0 1650
2,5 1750
3,0 2000
A partir de tales cifras, se quiere conocer:
a) ¿Considera justificado el planteamiento de un modelo lineal para expresar la relación
entre las variables?
b) Si el propietario desea unos ingresos de 1600 dólares, ¿qué cantidad de sal debería
aportar por cada 1000 galletas? Si aporta el máximo permitido de sal, ¿cuál sería el
ingreso en caja? Explicar cuál de las dos predicciones le merece mayor confianza.
c) ¿Cuál sería la variación porcentual de los ingresos cuando la cantidad de sal aumenta en
un 1% sobre el último valor de la tabla? Si aumentamos en 1gr. la sal por cada 1000
galletas, ¿cuánto variarán los ingresos?
10. Cierta empresa ha analizado estadísticamente la relación existente entre dos de las
magnitudes que más le preocupan: los costes totales (Y) y los costes variables (X),
expresados en unidades monetarias y considerados ambos a corto plazo. Analizados los
datos se comprueba que:
 Si se construyeran las rectas de regresión de Y sobre X y de X sobre Y ambas rectas se
cortarían en el punto de coordenadas (6,4).
 Si para un coste variable de 12 unidades monetarias se incrementa el mismo en un 1%, el
incremento que experimentarían los costes totales, bajo el modelo lineal de Y sobre X, sería
del 0,8 %.
 Si se incrementan en una unidad monetaria los costes totales, los costes variables
aumentarían 1,8225 unidades monetarias bajo el modelo lineal de X sobre Y.
 La dispersión relativa de los costes variables (X), medida en términos de su coeficiente de
variación, ha sido del 50 %.
Bajo estos supuestos, se pide que determine las rectas de regresión de Y sobre X y de X
sobre Y y mida las bondades de ambos ajustes.
11. La dirección de una empresa ha llevado a cabo un análisis del coste salarial mensual S (datos
en 103 dólares) de sus 115 empleados en relación con un determinado indicador de
productividad P, habiendo resultado la siguiente tabla de frecuencias conjunta:

Intervalo de Intervalos de P
S 6-8 8-10 10-12 12-14
10-12 28 2 0 0
12-15 3 31 1 0
15-18 2 19 2 0
18-22 0 6 6 0
22-28 0 0 8 1
A partir de estos datos, se pretende conocer lo siguiente:
a) ¿En qué medida puede pensarse que el coste salarial explica mediante una relación
lineal el indicador de la productividad?
b) Supuesto que se ha calculado esta relación lineal, ¿para qué coste salarial se verifica
que un incremento del 1% se traduce en un incremento del 0,5 % del indicador de la
productividad?
12. Cierto distribuidor de productos de droguería y limpieza tiene su centro de distribución en
una importante ciudad de nuestra provincia. Desde dicho centro reparte sus productos
entre los comercios del sector de todos los pueblos de la comarca. Entre los artículos que
distribuye, se ha seleccionado una muestra de 7 de ellos, que son los que se consideran
más importantes, debido a su demanda por parte de los comerciantes y del público en
general. De esos 7 artículos se tienen los datos correspondientes al mes de abril último.
Estos datos, que corresponden al precio unitario del artículo en pesetas (variable X) y al
volumen de ventas correspondientes a dicho artículo en 10 3 dólares (variable Y), son los
siguientes:
 Si se construyera la recta de regresión que explicara el volumen de ventas en función del
precio unitario, el porcentaje de varianza explicado sería de un 65,61%.
 Con dicha recta, para un artículo cuyo precio unitario fuese de 100 pesetas, el pronóstico
que se efectuaría de ventas sería de 7500 dólares. Además, si dicho precio lo
incrementásemos un 1%, las ventas crecerían un 0,333% (1/3%).
 Para un precio unitario igual al precio medio, se pronosticarían unas ventas de 8500
pesetas.
 Para los datos de este mes de abril, se conoce que la desviación típica de las ventas fue de
2000 pesetas.
Se dispone, además, de los datos de ventas (en 10 5 pesetas) de esos mismos artículos
correspondientes al mes de mayo:

Lejía 6,1
Amoníaco perfumado 8,2
Estropajo fibra verde 7,3
Detergente
concentrado 14,1
Suavizante 12,3
Detergente lavavajillas 11,2
Limpiacristales 9,1
Teniendo en cuenta que los precios de esos artículos durante el mes de mayo no han
variado con respecto al mes anterior, y suponiendo que se mantiene la misma correlación
entre precio y ventas que el mes de abril, se pide:
a) Hallar el precio medio de esos artículos y el volumen medio de ventas para el mes de
abril.
b) Construir la recta de regresión del volumen de ventas con respecto al precio unitario
para el mes de abril.
c) Construir la recta de regresión del volumen de ventas con respecto al precio unitario
para el mes de mayo.
d) Pronóstico de las ventas para el mes de mayo de un artículo cuyo precio unitario sea de
100 pesetas. ¿Qué fiabilidad le merece dicho pronóstico?
13. En un determinado hotel, el responsable de la piscina del mismo debe añadir
periódicamente un compuesto de cloro al agua para mantenerla en buenas condiciones.
Dicha persona ha observado la relación existente entre el número de días que dura el efecto
del producto (variable X1) y los gramos de cloro empleado (variable X 2), obteniendo los
siguientes resultados:
 s12=5,4 días·gramo; s22 = 12 gramos2
 El porcentaje de varianza explicada por la regresión lineal de X1 sobre X2 sería del 78,387%.
 A partir de la regresión lineal de X 1 sobre X2, el valor estimado para 21 gramos de cloro sería
de 4 días.
 x́ = 25 gramos
A partir de esta información, determine ambas rectas de regresión y, en función de ellas,
calcule qué cantidad de cloro habría que utilizar para que los efectos del producto durasen
7 días.
14. La factura mensual del gasto telefónico de una pequeña empresa se ha incrementado
notablemente en los últimos meses. Los estudios realizados por el administrador de la
misma argumentan que el mayor uso de Internet dentro de la misma es la principal causa
del mayor gasto en teléfono, lo que ha hecho que se estudie la posibilidad de acogerse a
alguno de los múltiples bonos o tarifas especiales que ofrecen las compañías, lo que hasta la
fecha todavía no se llevó a cabo. Las últimas cifras mensuales no hacen sino confirmar esta
relación:
Mes Enero Febrero Marzo Abril Mayo
Cuantía de la factura telefónica ($) 55 100 118 120 142
Tiempo de conexión (minutos) 200 500 700 800 1000
De acuerdo con la información anterior, responda a las siguientes preguntas:
a) Suponiendo la existencia de una relación de tipo lineal entre tiempo de conexión y gasto
telefónico, ¿qué porcentaje de las variaciones en la cuantía de la factura telefónica no
podrían ser explicadas linealmente por el tiempo de conexión a Internet dentro de la
compañía?
b) ¿Cuál sería la cuantía de la factura telefónica de la compañía de acuerdo a esta relación
lineal si no se conectase a Internet en la empresa?
c) ¿Cuál sería el gasto telefónico estimado según esta relación lineal si el tiempo de
conexión a Internet fuera de 2000 minutos? ¿Le parece aceptable tal predicción?
Razone su respuesta.
d) Se considera que un incremento del 20% en el tiempo de conexión a Internet respecto al
realizado en el mes de mayo conllevaría a que la factura telefónica se elevase de forma
extraordinaria. ¿Cuál sería el incremento relativo en la misma si ello se produjese?
Razone su respuesta.
15. En una muestra de familias se han analizado las variables ahorro anual (Y) y renta anual (X),
medidas ambas en miles de dólares. Los datos obtenidos han sido los siguientes:
Ahorro (Y) 9 18 20 21 19 20 22 23 27 30
Renta (X) 20 5 20 8 21 2 21 7 22 1 22 3 22 2 22 6 23 1 23 5
A partir de tales datos, se pide:
a) Obtener el modelo lineal que explica el ahorro de las familias en función de su renta.
b) ¿Qué familia aumentaría en un mayor porcentaje su ahorro si su renta se viese
incrementada en un 5%, la familia que tiene la menor renta de entre todas o la que
posee la mayor renta?
c) ¿Cuál será el incremento absoluto del ahorro cuando una familia aumente su renta
anual en 500?
d) ¿Qué porcentaje de varianza de la variable ahorro queda explicado por la variable renta
a través del modelo lineal planteado?

16. Con el objetivo de estudiar la relación lineal entre el precio de los automóviles y el número
de unidades vendidas, se procedió a recoger datos sobre tales magnitudes durante el
pasado mes en una determinada región. Los resultados obtenidos fueron los siguientes:

Cantidad Vendida
Precio
(Unidades
(miles $)
vendidas)
5,0 450
9,0 425
10,5 400
12,0 350
14,0 325
16,0 300
18,0 290
20,5 280
23,5 260
27,0 200
En función a los datos recabados para esa región y mes:
a) Una empresa radicada en la región tiene previsto para el mes próximo aumentar el
precio de su modelo más vendido en 500. Si suponemos como válida la relación lineal
entre las dos variables analizadas para los datos del pasado mes, ¿cómo afectaría este
hecho a las ventas de dicho modelo?
b) Si el modelo más caro de la tabla anterior se abaratase para el mes próximo un 3%,
¿cómo variarían las ventas de dicho modelo?
c) Obtenga la descomposición de la varianza total de las cantidades vendidas en varianza
explicada y varianza no explicada por el modelo lineal y, a partir de ella, determine el
coeficiente de determinación.
d) Si expresamos el precio en y las cantidades vendidas en 10 2 unidades, ¿cuál sería el
modelo lineal que explica las ventas en función del precio? ¿Y el coeficiente de
determinación de tal modelo?
17. Para 8 comunidades norteamericanas, se ha recogido información sobre la venta en 1998
de prensa diaria escrita (variable Y, en ejemplares diarios vendidos por cada mil habitantes),
relacionándola con su producción económica, en concreto con el Producto Interior Bruto
por habitante (variable X, en 10 3 $). Las cifras de ambas variables se recogen en la tabla
siguiente:
X 8,3 9,7 10,7 11,7 12,4 15,4 16,3 17,2
Y 57,4 106,8 104,4 131,9 144,6 146,4 177,4 186,9
Con esta información, y teniendo en cuenta que x́ = 12,7125·103, sx2 = 9,2436·(103
$)2, ý =131,9750 ejemplares y sy2 =1550,4069 ejemplares2, se pregunta:
a) ¿Puede afirmarse que existe realmente una relación de tipo lineal entre las dos variables
consideradas? Cuantifique y justifique la respuesta. ¿Qué porcentaje de la variabilidad
de Y no viene explicada por su relación lineal con X?
b) ¿Cuál sería la venta de prensa que se podría predecir para una comunidad cuyo PIB por
habitante fuese de 25000 $? Y si se supiese que la venta diaria de prensa es de 150
ejemplares por cada mil habitantes, ¿qué PIB se podría predecir? ¿Cuál de las dos
predicciones merece mayor confianza y por qué?
c) Si para 1999, el PIB de la región más rica aumenta un 1%, ¿en qué porcentaje se estima
que crecería la venta de ejemplares de prensa? Y si para una región cualquiera el valor
del PIB aumenta en 2500 $, ¿cómo cabría esperar que variase la venta de prensa diaria?
d) En la regresión de Y sobre X, calcule la suma de los cuadrados de los residuos
correspondientes y el coeficiente de variación de las predicciones Y * para los valores
observados de X, pero sin calcular ni los residuos ni las predicciones. Exponga
claramente en qué se ha basado para obtener los resultados.
18. Para un conjunto de personas que están siguiendo una dieta de adelgazamiento, se han
recogido datos sobre el peso perdido desde el inicio de la misma (variable Y, en Kg.) y el
tiempo que llevan siguiendo la dieta (variable X, en semanas), los cuales se muestran en la
siguiente tabla:
Y 2,4 5,4 5,6 8,4 10,6 13,5 15 15
X 3 5 6 8 11 13 15 16
A partir de esta información, responda a las siguientes cuestiones:
a) Estime el modelo lineal que explica el peso perdido en función del tiempo que se lleva
siguiendo la dieta e interprete los parámetros.
b) Para el modelo estimado en el apartado anterior, descomponga la varianza total como
suma de la explicada y la no explicada por el mismo y obtenga, a partir de tal
descomposición, el coeficiente de determinación.
c) Según el modelo considerado, ¿qué peso esperaría perder una persona que siga la dieta
durante 2 meses (8 semanas)? ¿Y una persona que esté dispuesta a seguir la dieta
durante dos años (108 semanas)? ¿Qué fiabilidad le otorga a cada una de las
estimaciones anteriores?
19. Conocemos, para una gasolinera situada en Barranquilla, la información acerca de su
recaudación durante las últimas 7 semanas, así como del número de clientes que acudieron
a la misma durante estos períodos:
Recaudación (103 USD
) 5 10 8 3 5 15 2
2
Nº de clientes (10 ) 3 6 5 5 4 8 32
A partir de tal información, responda razonadamente a las siguientes cuestiones:
a) De acuerdo con los datos anteriores, y a partir de un ajuste lineal que exprese la
recaudación en función del nº de clientes, determine cuál sería la recaudación prevista
si llegasen a la gasolinera 720 clientes. ¿Qué fiabilidad otorgaría a dicha predicción?
b) ¿Qué variación experimenta la recaudación por cada 10 clientes más? ¿Y por una
disminución del 3% en los clientes sobre la media?
c) Si expresásemos la recaudación en y el número de clientes en unidades, ¿cuál sería la
expresión de la recta de regresión? ¿Se modificaría la bondad del ajuste?
20. Una juguetería ha examinado la evolución reciente de las ventas de su muñeco “KUKO” (Y,
en millones de dólares) junto con los gastos de publicidad de ese muñeco (X, en millones de
dólares), obteniéndose los siguientes resultados:
Año 1996 1997 1998 1999 2000 2001 2002
Y 126 135 156 156 150 150 180
X 20 25 30 32 5 35 32 34
Además se sabe que:
x́ = 29,79; ý = 150,43; sx 2 = 25,1327; sy 2 = 253,1020; s =
64,3776
a) ¿Se puede afirmar que al aumentar los gastos en publicidad se incrementarán las
ventas? Obtenga los parámetros del ajuste lineal que explique las ventas en función de
los gastos. Interprete dichos coeficientes e indique la bondad del ajuste realizado.
b) Si para el año 2003 aumentásemos los gastos de publicidad en un 1%, ¿en qué
porcentaje se espera que variasen las ventas, según el modelo lineal?
c) Suponiendo que entre X e Y existe la relación Y * = A X b , calcular A y b. ¿Qué utilizaría
para medir la bondad de dicho ajuste?
d) Si para el año 2003 aumentamos los gastos de publicidad en un 1%, ¿en qué porcentaje
se espera que varíe las ventas, según el modelo del apartado c)?

Distribuciones tridimensionales

1. No es algo desconocido el hecho de que las entradas de turistas extranjeros en España no


han hecho sino crecer de forma continuada durante las últimas décadas, coadyuvando a
este hecho las peculiares características climatológicas, económicas y culturales de nuestro
país. A partir de esta idea de principio, se ha querido ahondar en el tema, analizando si la
riqueza del turista y la distancia de su país al nuestro son factores vinculantes a la hora de
tomar la decisión de visitarnos. Para ello, hemos recogido en la siguiente tabla las entradas
de turistas procedentes de 5 países diversos para un determinado ejercicio económico,
junto con su PIB per capita (en miles de dólares) y la distancia en kilómetros desde cada uno
de los países considerados al nuestro:
PIB per cápita (103 Distancia
País Nº turistas entrados
$) (Kms)
A 1800000 1 1500
B 2500000 2 1200
C 700000 7 3100
D 1200000 0 2500
E 1900000 0 1800
A partir de tal información, se le pide que:
a) Determine la relación lineal que explicaría las entradas de turistas en función del PIB per
cápita y de la distancia.
b) ¿Es dicho modelo suficientemente explicativo?
c) ¿Cuál de las dos variables explicativas está más correlacionada con la entrada de turistas?
2. La siguiente tabla proporciona los valores para un determinado año de las variables X1
Saldo de imposiciones, X2 Renta Familiar Disponible y X 3 Renta per cápita, para 10 provincias
españolas:

Provincia
s X1 X2 X3
Alicante 27 86 96
Almería 7 29 71
Baleares 24 61 120
Málaga 20 67 77
Soria 8 45 80
Tarragon
5 9 89
a
Tenerife 17 43 107
Toledo 9 37 81
Zamora 3 17 65
Zaragoza 35 71 102
Desde tales cifras, determine:
a) La matriz de varianzas-covarianzas y la matriz de correlaciones de la distribución.
b) La relación lineal que explique X1 mediante X2 y X3.
c) El coeficiente de correlación múltiple entre X 1 y X2, X3 y los coeficientes de correlación
parcial de X1 con X2 y de X1 con X3. Interprete cada uno de tales coeficientes.
3. Porfirio Labrador es un joven agricultor de la provincia de Sevilla, que adquirió
conocimientos de estadística en su formación universitaria en esta escuela. Tiene una finca
de su propiedad, dedicada fundamentalmente a la producción de trigo duro especial para la
fabricación de pastas, dadas las importantes subvenciones que recibe de la Comunidad
Europea. Dada la influencia que supone que ejerce la cantidad de lluvia caída sobre la
producción, utiliza un pluviómetro para medir ésta, mes a mes. En el cuadro adjunto
aparece recogida la producción de trigo duro en Quintales métricos por hectárea (X 1) y la
cantidad de lluvia caída en su finca, medida en litros por metro cuadrado (X 2), durante las
cinco últimas campañas:
CAMPAÑA X1 X2
2000/2001 80 120
01/02 95 145
02/03 83 108
03/04 75 90
2004/2005 72 85
a) Este agricultor, que es pesimista como la mayoría de los de su sector, piensa que la
pertinaz sequía va a continuar para la próxima campaña 2005/2006, y que la cantidad de
lluvia para esa campaña va a ser la misma que la recogida en la campaña anterior. Desde
este supuesto, ¿qué predicción haría para la producción de la campaña venidera? ¿Qué
fiabilidad otorgaría a tal predicción? Si pensara que la cantidad de lluvia recogida
aumentase en un 1%, ¿cuál sería dicha predicción?
b) La cantidad de abono (urea y nitrato) que utiliza, medida en quintales métricos por
hectárea (X3), factor que influye también en la producción alcanzada, se ha constatado
que es prácticamente la misma en cada campaña, siendo la media de las últimas 5
campañas de 3 Qm./Ha. con un coeficiente de variación del 2,9814%. La recta de
regresión de X1 sobre X3, obtenida con los datos de las últimas cinco campañas es X *1 =
51 + 10.X3 , siendo la covarianza entre X2 y X3 de 0,04. Si el Sr. Labrador utilizase durante
la próxima campaña 3 Qm./Ha., y bajo el supuesto de que la cantidad de lluvia caída no
se modificase respecto de la recogida en la campaña 2004/2005, ¿qué producción se
alcanzaría en la campaña 94/95, considerando las dos variables explicativas? ¿Qué
fiabilidad le otorgaría a tal predicción?
4. Un estudiante de la Universidad de Detroit observó, en su estancia desde el primer
trimestre de 2005 hasta el cuarto trimestre de 2008, los importantes beneficios que habían
obtenido las floristerías de la ciudad y pensó que ello era debido a la gran demanda de rosas
que existía en la misma durante cualquier época del año. Después de analizar con cierto
detenimiento el fenómeno, recabó información acerca de las variables cantidad de rosas
vendidas (X1), expresada en docenas por trimestre, precio medio de las rosas (X 2), expresada
en dólares por docena y trimestre, e ingreso medio disponible semanal (X 3), expresado en
dólares por trimestre. A partir de los datos proporcionados por un mayorista del área
metropolitana de Detroit para los 16 trimestres considerados, realizó una serie de cálculos
previos que arrojaron los siguientes valores:
∑ x 1 i=121 ;∑ x2 i=52 ; ∑ x 3 i=2887
∑ x 1 i2=981 ;∑ x2 i2=174 ;∑ x3 i2=522407 ;
∑ x 1 i . x 2i =380 ;∑ x1 i . x 3 i=21705 ; ∑ x 2 i . x 3i =9420 ;
Desde estas cifras, se pretende analizar la influencia lineal que, sobre la demanda de rosas,
ejercen las otras dos variables consideradas. Para ello, responda a las siguientes cuestiones:
a) ¿Cuál sería la ecuación matemática que defina la correspondiente regresión múltiple?
b) A partir de la anterior relación, determine la contribución marginal del precio medio de
las rosas y del ingreso medio familiar disponible sobre la demanda de rosas. Cuantifique
y razone su respuesta.
c) ¿Se puede afirmar que la subida del precio de las rosas conduce a una menor demanda
de las mismas? Razone su respuesta.
d) ¿Qué porcentaje de la variabilidad de la demanda puede explicarse por la influencia
lineal del precio medio y del ingreso familiar?
e) Si para el segundo semestre de 2009 se previese una reducción del precio medio de 0,5
dólares/docena, respecto al último trimestre de 2008, no experimentando el ingreso
familiar disponible variación alguna en dicho período, ¿cuál sería la variación absoluta
que se esperaría en la demanda de rosas en ese período?
5. En una determinada economía se conocen los datos relativos a tres indicadores, expresados
como tasa de variación (porcentaje respecto al período inicial): número de empresas (X 1),
empleo (X2) e inflación (X3). Acerca de ellos, se tiene determinada información:
a) El valor medio de la inflación es de 4,057, mientras que, para el empleo, el valor medio es
de 2,9 y la varianza de 2,2714. Además, el número medio de empresas se situó en 4,1.
b) La inflación explica el 89,41% de la varianza del número de empresas, mientras que los
datos de empleo explican el 94,97% de la varianza del número de empresas,
entendiendo que estas explicaciones son a través de relaciones lineales y directas.
c) El grado de relación lineal que se aprecia entre la inflación y el empleo, medido a través
de la covarianza, es de 1 7985, lo que indica una relación directa. Por otra parte, el
coeficiente de correlación entre estas variables se sitúa en 0 95385.
d) El incremento que experimenta la tasa de inflación cuando la tasa de variación del
número de empresas aumenta un punto porcentual es de 0 6126. Por otra parte, si la
tasa de inflación aumenta en un punto, la tasa de variación del número de empresas se
incrementa, a su vez, en 1 4602 puntos porcentuales.
Con estos datos, se desea conocer:
a) ¿Cuál de las tres variables está mejor representada por su media aritmética?
b) ¿Cuál de las variables, individualmente sin el efecto de las otras, explica mejor (en el
sentido de una relación lineal) las tasas de variación del número de empresas, la
inflación o el empleo?
c) Si se incrementa la tasa de inflación en un punto, sin que el empleo cambie, ¿en cuánto
variará la tasa de variación del número de empresas?
d) ¿Qué valor alcanzará la tasa de variación del número de empresas cuando las tasas de
inflación y empleo se sitúan en la mitad de sus valores medios? ¿Cómo mediría el grado
de credibilidad o fiabilidad del valor resultante?
6. Una determinada empresa se ha planteado investigar si resultan rentables los gastos en
publicidad para sus productos, utilizando para ello las cifras de gastos y beneficios (en miles
de millones de pesetas), proporcionados por algunas empresas de su sector:
Empresa A B C D E F G
Gastos en publicidad (X2) 0,3 1,0 0,7 1,0 1,2 2,0 1,1
Beneficios (X1) 1,3 3,5 2,8 3,0 3,3 4,0 3,7
En todo caso, conoce que una variable que también podría coadyuvar sobre tales beneficios
sería el número de horas extraordinarias que mensualmente trabajan los empleados (X 3). A
partir de los datos recogidos para tales empresas, conocemos también que:
a) s23=0 58
b) La recta de regresión estimada de X1 sobre X3: X 1* = – 0,18 + 0,37 X 3 , con R 132 = 0,697
Desde esta información, ¿podría indicar qué variable ejerce más influencia sobre el
beneficio anual de las dos consideradas? Razone su respuesta.
7. Una determinada cooperativa agrícola dedicada a la producción y comercialización de fresas
se plantea hacer un estudio para explicar el volumen de sus ventas (X 1), expresadas en
millones de pesetas. Para ello, a partir de los datos semestrales obtenidos desde la creación
de la cooperativa, se plantea un modelo lineal usando como variables explicativas el gasto
en publicidad (X2), expresado en millones de pesetas, y el número de supermercados que
comercializan sus productos (X3). Seguidamente recogemos la información de la que
dispone la empresa:
Semestre X2 X3 X1
2º de 2004 1,5 15 13
1º de 2005 1,7 17 41
2º de 2005 2,0 19 16
1º de 2006 2,3 20 47
2º de 2006 2,5 23 19
1º de 2007 3,0 25 55
2º de 2007 3,5 26 22
1º de 2008 4,0 29 63
2º de 2008 4,3 31 25
1º de 2009 4,5 34 65
Desde tales cifras, responda a las siguientes cuestiones:
a) Determine el vector de medias, la matriz de varianzas y covarianzas y la matriz de
correlación de la distribución. A partir de tal información, ¿qué variable considera que
está mejor representada por su media? ¿Entre qué dos variables existe una mayor
relación lineal?
b) Determine el modelo de regresión planteado e interprete sus coeficientes, indicando a
su vez cuál es la capacidad explicativa del mismo.
c) A partir de los resultados obtenidos en el apartado anterior, ¿sugeriría usted que
pueden existir otras variables no tenidas en cuenta aquí y de importancia relevante para
la explicación de las ventas?
Observando los datos, nos damos cuenta que las ventas correspondientes al primer
semestre son siempre mucho mayores que las del segundo semestre del mismo año. Para
recoger este aspecto,
se decidió introducir una nueva variable explicativa X4, cuyo valor sería uno si el dato
corresponde al primer semestre, y cero en caso contrario. Utilizando esta variable adicional:
d) Determine el nuevo modelo de regresión planteado e interprete sus coeficientes,
indicando la capacidad explicativa del mismo.
e) Bajo este modelo, ¿en cuánto se incrementarían las ventas en el segundo semestre de
2009 (con respecto al segundo semestre de 2008) si los gastos en publicidad se
incrementasen en 500000 dólares y se espera que dos nuevos supermercados
comercialicen los productos de la cooperativa? ¿Y si los incrementos fuesen del 2% en
ambas variables explicativas?
8. La Asociación de Consumidores y Usuarios de una determinada ciudad andaluza está
analizando la relación existente entre tres variables que consideran íntimamente
interconectadas y de influencia en la economía de la ciudad, como son: la renta bruta (X 1), la
renta disponible (X2) y el nivel de consumo medio de los ciudadanos (X 3), expresadas todas
en miles de unidades monetarias. Para ello, seleccionó una muestra de 100 hogares de la
ciudad y obtuvo los siguientes datos:
 Los valores medios de las variables enunciadas se situaron, respectivamente, 45 35;
32,06 y 16,42.
 La varianza de X1 resultó ser de 43,98 y la de X3 6,28.
 La covarianza entre X1 y X2 fue de 25,25; mientras que la existente entre X 1 y X3 alcanzó
un valor de 16,41.
 Si se establece la relación lineal entre el consumo y la renta disponible, la pendiente de
tal recta de regresión sería de 0 64; logrando explicar la renta disponible el 99,32% de
las variaciones del consumo.
A partir de la información suministrada, responda a las siguientes cuestiones:
a) ¿Cuál sería la ecuación del plano de regresión que explica el consumo en función de la
renta bruta y la renta disponible, sabiendo que el determinante de la matriz de
varianzas y covarianzas es igual a 0,4214? Interprete los parámetros del modelo y valore
razonadamente su fiabilidad.
b) ¿Qué variable cree que tiene realmente más influencia (en términos lineales) sobre el
consumo, la renta bruta o la disponible? Cuantifique su respuesta.
c) Si se produce un incremento de la renta bruta en 1000 u.m. en un determinado período,
¿qué incidencia tendría este hecho en el consumo estimado, supuesto que la renta
disponible se mantiene constante?
9. Se han recogido datos sobre X1 = Número de habitantes (en miles) , X2 = Número de lectores
habituales de periódicos por cada 100 habitantes y X 3 = Renta por habitante en unidades
monetarias en varios municipios de Andalucía. De los datos disponibles se deduce que:
x1 = 10,542; x2 = 24; x3 = 84; s1 = 12,342; s2 = 3,2; s3 = 14; r12 = 0,25; r13 = 0,33; r23 = 0,19
A partir de tal información:
a) ¿Qué grado de ajuste se conseguirá al expresar la renta por habitante como función
lineal del número de habitantes y de la proporción de lectores de periódicos?
b) Según la anterior función lineal, ¿qué variación ocurrirá en el pronóstico de X 3 al
disminuir el número de habitantes en 1500 personas (manteniéndose constante X2)?
c) ¿En qué grado y cuantía variaría la proporción de lectura de periódicos al incrementarse
la renta, suponiendo constante el tamaño de la población del municipio? Cuantifique la
respuesta.
10. En una conocida empresa hortofrutícola se decidió dedicar hace cinco años un pequeño
terreno a la producción de fresas, habiendo obtenido unos resultados altamente
satisfactorios durante ese período. Intentando profundizar en las cifras, se ha descubierto
una relación muy significativa en términos lineales entre la producción obtenida (en miles
de toneladas de fresas), el volumen de agua utilizado (en miles de litros) y la cantidad de
abono específico utilizado (en kilos), que hacen ser muy optimistas a los propietarios de la
empresa para el futuro, toda vez que ambas variables pueden ser controlables.
Para el pasado quinquenio los datos correspondientes a las tres variables arrojaron las
siguientes cifras:
Año Producción (X1) Agua (X2) Abono (X3)
2003 120 100 10
2004 150 130 12
2005 200 175 14
2006 270 240 17
2007 350 310 20
Medidas Producción (X1) Agua (X2) Abono (X3)
Media 218 191 14,6
Varianza 6936 5764 12,64
Se conoce además la siguiente información:
a) La recta de regression de la producción sobre la cantidad de abono utilizado
( X1* = -123 + 23,354 × X3 ) consigue explicar el 99 4% de las variaciones en la producción.
b) La covarianza entre las variables agua y abono utilizado es igual a 269 4.
c) Para la matriz de varianzas y covarianzas: c11= 280,6; c22= 528; c33= 11420; |C|=104
A partir de este conjunto de datos, se le pide que responda a las siguientes cuestiones:
a) Calcule la matriz de varianzas y covarianzas de las tres variables consideradas.
b) Si se hubiera incrementado la cantidad de agua utilizada en 40000 litros y el abono en 5
Kg. para 2008 respecto de las cantidades de 2007, ¿cómo habría variado la producción
de fresas? ¿Qué fiabilidad le merece tal predicción?
c) ¿Cómo habría variado la producción de fresas para 2008 si sólo se hubiera
incrementado por razones presupuestarias la cantidad de agua utilizada en 20000 litros,
permaneciendo fija la cantidad de abono utilizado? ¿Qué fiabilidad le merece tal
predicción?
d) ¿Qué influye más en la producción de fresas, el volumen de agua utilizado o la cantidad
de abono utilizado? Razone su respuesta.
11. Se dispone de los siguientes datos para 6 familias sobre gasto anual en libros de texto (X 1),
número de miembros (X2) y renta anual (X3):
Gasto anual Número Renta anual
(103 u.m.)) de miembros (106 u.m.)
20 1 1,0
30 2 2,0
45 3 3,0
35 2 2,5
30 2 1,8
40 2 3,2
Adicionalmente, se conoce también que
a) El determinante de la matriz de varianzas y covarianzas C es 0,050.
b) El adjunto C11 es igual a 0,075.
c) El adjunto C22 es igual a 2,651.
d) El adjunto C33 es igual a 3,914.
Las varianzas correspondientes a las tres variables son iguales a 63,889; 0,333 y 0,559
respectivamente.
A partir de tal información, responda a las siguientes cuestiones:
a) Calcule la matriz de varianzas y covarianzas de las tres variables consideradas.
b) Determine los parámetros de la función lineal que explica el gasto anual en libros a
partir del número de miembros y de la renta anual.
c) ¿Qué variación cabría esperarse en el gasto ante un aumento de la renta en un millón
de u.m., permaneciendo constante el número de miembros de la familia?
d) Determine si el modelo es adecuado para realizar predicciones. ¿Qué proporción de la
varianza del gasto anual en libros explica el modelo?
e) ¿Podría afirmarse que, en términos estrictos, existe una fuerte relación lineal entre el
gasto anual y el tamaño familiar? Razone su respuesta.
12. Como es bien sabido, se puede establecer una dependencia entre el consumo de una
familia (variable X1, en miles ptas./mes) y su renta (variable X 2, en miles ptas./mes). Con el
objeto de concretar tal relación en una determinada economía, se recogieron datos
referentes a 200 familias, obteniéndose los siguientes resultados:
X1\ X2 50 ‒ 100 100 - 150 150 - 200 200 - 250 250-350
0-50 14 5 2 0 0
50 ‒ 150 2 19 62 3 1
150 - 300 0 0 1 62 3
300 - 350 0 0 0 0 26
A partir de ellos, se desea conocer, suponiendo que existe una relación lineal entre ambas
variables,
a) ¿Cuál sería el consumo esperado para una renta nula?
b) ¿Cuál sería la propensión marginal al consumo de estas familias?
c) ¿Qué porcentaje de varianza de X1 no vendría explicada por X2?
d) Con objeto de disminuir el porcentaje del apartado anterior se consideró una tercera
variable, X3, el número de hijos de la familia. Constrúyase el modelo de regresión lineal
múltiple para explicar X1, si sabemos que, a partir de dicho modelo, si una familia
aumenta
en 2 el número de hijos, manteniéndose la misma renta, el consumo se incrementaría
en 29176 ptas. Además, la correlación parcial entre X 1 y X3 resultó ser de 0,3327; y la
covarianza entre dichas variables es de 16 (103 ptas. por hijo).
e) Calcule el coeficiente de determinación del plano de regresión de X 1 sobre X2 y X3.
13. Un hipermercado ha decidido ampliar el negocio y decide estudiar de forma exhaustiva el
número de cajas registradoras que va a instalar, para evitar grandes colas. Para ello, se
obtuvieron los siguientes datos procedentes de otros establecimientos similares acerca del
número de cajas registradoras (variable X2) y del tiempo medio de espera (variable X1)
Número de cajas registradoras 10 12 14 16 18 20
Tiempo medio de espera (minutos) 59 51 42 32 26 22
Bajo el supuesto de que el tiempo de espera medio depende linealmente del número de
cajas registradoras, se pretende saber:
a) ¿Cómo variaría el tiempo de espera por cada unidad de caja adicional?
b) Si se instalarán 22 cajas registradoras, ¿cuál sería el tiempo medio de espera? ¿Es fiable
dicho pronóstico?
c) Posteriormente, se pensó que podría ser conveniente para explicar el tiempo de espera
tener en cuenta además el número de clientes que acuden diariamente a estos
establecimientos (variable X3), por lo que se estudió el tema, obteniéndose un
coeficiente de correlación lineal entre ambas variables de 0,9343, siendo el número
medio de clientes para los establecimientos anteriores de 850 personas, con un
coeficiente de variación del 10,74%. Además, la covarianza entre el número de cajas y el
número de clientes resultó ser de -300. Calcule los parámetros del modelo lineal que
explica el tiempo medio de espera, en función del número de cajas y del número de
clientes que acude directamente.
14. Del Instituto Nacional de Estadística se ha obtenido la siguiente información del año 2001
referida a 8 de las comunidades autónomas españolas, respecto al consumo de agua en los
hogares, donde las variables X1 = litros por habitante y día y X2 = precio del m3 de agua en
céntimos de dólares y X3 = media de habitantes por hogar, siendo los datos los siguientes:
X1 183 171 114 125 174 200 134 163
X2 64 59 145 166 53 48 95 50
X3 4,1 4,2 3,9 3,3 3,0 2,6 4,2 3,5
Desde esta información, responda a las siguientes cuestiones:
a) ¿Qué porcentaje de la variabilidad en el consumo de agua no viene explicado por su
precio?
b) ¿Cuánto se incrementa en términos absolutos el consumo de agua cuando se aumenta
en 1 céntimo el precio del m3?
c) ¿Qué consumo de agua se podría predecir si el precio del agua fuese de 3 dólares por
cada m3? ¿Qué grado de confianza le merece tal predicción?
d) Si el gobierno de la comunidad en la que el agua es más barata (0.48 $) decide subir su
precio un 1 %, ¿en qué porcentaje disminuiría el consumo de agua en dicha comunidad?
e) Calcule la desviación típica de los residuos que se obtendrían al explicar el consumo de
agua a través del precio para las 8 comunidades cuyos datos están disponibles ¿Cuál
sería el coeficiente de variación de Pearson de tales residuos?
f) Calcule la expresión lineal mínimo cuadrática que explica X 1 en función de la variable X1 ,
que sería el Precio del m3 de agua en dólares.
g) Obtenga el modelo de regresión lineal mínimo cuadrático que explica X1 en función de
las otras dos variables. ¿Qué predicción del consumo tiene lugar si el precio del agua es
de 1,5 por m3 y el número de habitantes por hogar es de 4,2?
h) ¿Qué influye más en la variación absoluta del consumo de agua: la subida de 1 céntimo
de dólares en el precio del m3 sin alterar el valor de X 3 o el aumento en una unidad de X
3
3 sin que se altere el precio del m ? Justifique claramente la respuesta.
i) ¿En cuánto disminuye la proporción de la varianza de X1 explicada por el modelo del
apartado a) si se utiliza X 2 como única variable explicativa del comportamiento de X1?
15. Para montar una empresa dedicada a la venta de artículos deportivos, un empresario
analiza la información correspondiente al beneficio (variable X 1, expresada en miles de
dólares) e inversión (variable X2, expresada en miles de dólares) de 30 empresas del sector
que ya están en marcha, obteniendo la siguiente información:
X1\X2 0-2 2-5 5-10
6-10 10 2 0
10-14 1 4 1
14-20 0 2 10
a) Si suponemos una relación lineal entre beneficios e inversión, determine el beneficio
que se obtendría en el caso de que la inversión se situase en el valor que más se da y
cuantifique la fiabilidad de esta predicción.
Para aumentar la información, el empresario antes citado analiza el volumen de ventas
(variable X3, expresada en miles de dólares) de las mismas 30 empresas. Obtiene que el
volumen medio de ventas de éstas fue de 25000, con una dispersión del 32%, medida a
través de su coeficiente de variación. Se sabe además que las variaciones del beneficio se
deben en un 90% a variaciones en las ventas según el correspondiente modelo lineal entre
las dos variables y se conoce también la existencia de una correlación directa entre las
ventas y la inversión, que determina un coeficiente de correlación lineal simple entre ambas
variables igual a 0´89. A partir de estos datos, responda a las siguientes cuestiones:
b) Calcule, si decide invertir 8000 y espera unas ventas de 23000, cuál sería el beneficio
previsible y la fiabilidad que otorgaría a tal predicción.
c) Determine qué variable en sentido estricto, la inversión o el volumen de ventas, ejerce
más influencia sobre los beneficios.
16. Una empresa está analizando las ventas de un perfume que comercializa. Para ello dispone
de las ventas (X1, en miles de unidades), del precio de los perfumes (X 2, en dólares por
unidad) y del precio medio de sus competidores más directos (X 3, en dólares por unidad),
durante los últimos veinte cuatro años. Del análisis de la información recabada, obtenemos
los siguientes datos:
∑ x 1 i=2430 ;∑ x 2i =144,9; ∑ x 3 i=128,3
∑ x 1 i2=250419 ; ∑ x2 i2=937,83; ∑ x 3 i2=752,21 ;
∑ x 1 i . x 2i =15055,5; ∑ x 1 i . x 3 i=13428,4 ; ∑ x 2 i . x 3 i=835,41 ;
182,521 16,016 18 251
Matriz Var-Cov 16,016 2,625 2,533
18,251 2,533 2,764

A partir de estas cifras, responda a las siguientes cuestiones:


a) Estime la función lineal que explica la demanda en función del precio del perfume. ¿Son
los resultados razonables desde el punto de vista del grado de explicación?
b) Según esta función, si aumentamos en un dólar el precio del perfume, ¿cómo variará su
demanda?
c) ¿En qué porcentaje variaría la demanda del perfume si su precio se encareciese un 5%,
pasando de 6 a 6,30 $?
d) Estime la función lineal que explica la demanda del perfume, considerando tanto su
precio como el medio de sus competidores. Según esta función, ¿cómo afectaría a la
demanda del perfume el encarecimiento en su precio en un dólar, permaneciendo
constante el precio de la competencia?
e) ¿Cuál de los dos precios guardaría mayor relación lineal, en términos estrictos, con la
demanda del perfume, su precio o el de los competidores?
17. Los últimos estudios sobre el comportamiento del sector del transporte ferroviario de
pasajeros en un país de la Unión Europea muestran un comportamiento muy favorable de
éste, que hacen ser optimistas a las empresas del mismo sobre las posibilidades de futuro.
Para confirmar tal perspectiva, se le ofrece información de los últimos diez años para ese
país acerca de los ingresos obtenidos (variable X 1, expresada en millones de dólares), del
número de viajeros que utilizaron dicho transporte (variable X 2, expresada en miles de
personas) y de los costes por consumo eléctrico y carburantes (variable X 3, expresada en
millones de dólares). Así mismo, también conocemos la matriz de varianzas y covarianzas C
de esa distribución:
Año X1 X2 X3
1995 610 193,98 10,45
1996 650 190,284 10,59
1997 680 194,265 11,03
1998 700 181,891 10,92
1999 780 274,35 11,41
2000 800 316,327 11,78
2001 850 358,615 11,82
2002 820 339,416 11,17
2003 840 351,53 11,44
2004 930 365,503 11,74
Media 766 276,616 11,24

9324 6795,843 40,03


[ C=
6795,843 5579,922 29,265
40,03 29,265 0,215 ]
A partir de tal información, responda a las siguientes cuestiones:
a) Si definimos la relación lineal que explica los ingresos en función exclusivamente del
número de viajeros, ¿cuál sería el porcentaje de varianza explicada por la regresión?
Desde este modelo, ¿en cuántos millones de dólares variarían los ingresos si se aumenta
el número de pasajeros en 20000 en 2005 respecto del año anterior? ¿Qué fiabilidad le
otorgaría a dicha predicción? Razone su respuesta.
b) Considerando la misma relación lineal del apartado anterior, si se supusiese que en 2005
el número de viajeros se incrementa en un 10% respecto del año anterior, ¿en qué
porcentaje variarían los ingresos? Razone su respuesta.
c) Si suponemos que los ingresos obtenidos (X 1) dependen linealmente del número de
pasajeros (X2) y de los costes por consumo eléctrico y carburantes (X 3), a través del
correspondiente plano de regresión, ¿en cuánto variaría el porcentaje de varianza
explicada de los ingresos para este modelo con respecto al inicial? (1 punto)
d) Si consideramos el modelo de regresión múltiple, ¿en cuántos millones de dólares
variarían los ingresos en 2005 si se aumenta en 20000 el número de viajeros respecto de
2004, suponiendo que los costes no varían?
e) A partir de la distribución conjunta definida, ¿qué variable considera que ejerce una
mayor influencia sobre los ingresos, el número de viajeros o los costes por consumo
eléctrico y carburantes, eliminando la influencia de la tercera variable? Justifique la
respuesta.
18. La Comisión de Control de un Plan de Pensiones de una determinada organización está
interesada en saber qué factores influyen en la rentabilidad de su cartera de valores. Del
estudio previo realizado, parece razonable pensar que una de las magnitudes que podrían
influir en tal rentabilidad sería la cantidad de renta variable dentro de la composición de la
cartera del Plan. Con idea de ahondar en esta idea inicial, seleccionó una muestra de 40
Planes de parecidas características al de su organización y recogió los valores de los
porcentajes de rentabilidad obtenida a medio plazo (variable X 1) y el porcentaje de renta
variable de la cartera (variable X2), obteniéndose los siguientes resultados:
X1/X2 0-10 10-25 25-35
0,00 2 2 0
1,50 4 2 1
2,00 0 5 5
2,25 3 1 1
3,00 2 0 8
3,65 0 0 4
A partir de estos datos, se desea saber:
a. ¿En cuánto variaría la rentabilidad de la cartera si aumentamos cinco puntos
porcentuales el porcentaje de renta variable, supuesta una relación lineal entre ambas
variables? ¿Qué fiabilidad le merece esta respuesta?
Ante los resultados obtenidos, la Comisión de Control se está planteando la posibilidad de
considerar también como variable que influye en la rentabilidad, el porcentaje de renta fija
de que disponen esas mismas empresas en sus respectivas carteras de valores (variable X 3).
Para plantear el correspondiente análisis, recoge la siguiente información complementaria
sobre los 40 Planes de referencia:
 El porcentaje medio de renta fija es de16,45, siendo su varianza de 1,78.
 Si aumentamos en diez puntos el porcentaje de renta fija, bajo el supuesto de una relación
de tipo lineal simple, el de renta variable aumenta en 0,862 puntos.
 Si disminuimos el porcentaje de renta fija en un punto, bajo el supuesto de una relación de
tipo lineal simple, la rentabilidad disminuye 0,057 puntos.
A partir de esta información se desea conocer:
a) ¿En cuánto variaría la rentabilidad estimada para la cartera si el porcentaje de renta fija
aumentase en 1,5 unidades, permaneciendo constante el porcentaje de renta variable?
¿Qué grado de confianza daría a esta respuesta?
b) ¿Qué variable ejerce más influencia sobre la rentabilidad, el porcentaje de renta fija o el
de renta variable? Razone su respuesta.

Docente: Ing. Omar Cevallos Muñoz, MSc.


Fecha de entrega: Febrero 06/2020 hasta las 24h00

También podría gustarte