REGRESIÓN LINEAL
Cuando la línea de regresión se asemeja a una recta (regresión lineal), puede
ajustarse a esta forma geométrica por medio de un método general conocido como
método de los mínimos cuadrados. La recta de ajuste tendrá por ecuación:
Y = β0 + β 1 X
Vamos a llamar a “X: VARIABLE INDEPENDIENTE o EXPLICATIVA”, y a la otra la
llamaremos “Y: VARIABLE DEPENDIENTE o EXPLICADA”.
Donde los coeficientes β0 y β1 se calculan teniendo en cuenta que:
La recta debe pasar por el punto ( ).
La separación de los puntos de la gráfica de dispersión con respecto a la recta
de regresión debe ser mínima.
CÁLCULO DE LOS COEFICIENTES β0 y β1:
Cov( x , y)
1° Cálculo de β1: β 1=
V ( x)
2° Cálculo de β0: β 0=Y −β 1 X
Donde:
n
∑ Yi: Media Aritmética de Y.
i=1
Y=
n
n
∑ Xi : Media Aritmética de X.
X = i=1
n
CORRELACIÓN (r)
El coeficiente de correlación (r) mide el grado de relación lineal (intensidad) de la
relación entre dos variables cuantitativas. El coeficiente r puede tomar valores entre -
1.00 y 1.00.
Básicamente, esta información se refiere a dos características de la relación lineal: la
dirección o sentido y la cercanía o fuerza.
Correlación
Correlación nula
Correlación
perfecta perfecta
negativa Positiva
-1 0 1
Fuerte Débil Débil Fuerte
Negativa Negativa Positiva Positiva
Es importante notar que el uso del coeficiente de correlación sólo tiene sentido
si la relación a analizar es del tipo lineal. Si ésta no fuera no lineal, el
coeficiente de correlación sólo indicaría la ausencia de una relación lineal
más no la ausencia de relación alguna.
El coeficiente de correlación se expresa como:
Cov ( x , y ) SC xy
R= =
σx σy √ ( SC x )( SC y )
Donde:
( )(∑ )
n n
n ∑ Xi Yi
: Suma Cruzada de X e Y.
SC xy=∑ X i Y i−
i=1 i=1
i=1 n
(∑ )
n 2
Xi
n : Suma de Cuadrados de X.
SC x =∑ X i −
2 i=1
i=1 n
( )
n 2
n ∑Yi : Suma de Cuadrados de Y.
SC y =∑ Y i −
2 i=1
i=1 n
Correlación negativa perfecta (r=-1) Correlación Positiva perfecta
(r=1)
Correlación Nula
Correlación Positiva Fuerte
EL COEFICIENTE DE DETERMINACION “R2”
El coeficiente de determinación, r2 - la proporción de la variación total en la variable
dependiente Y que está explicada por o se debe a la variación en la variable
independiente X. El coeficiente de determinación es el cuadrado del coeficiente de
correlación, y toma valores de 0 a 1.
El objetivo principal del análisis de regresión es proyectar el valor de la variable
dependiente conociendo o suponiendo valores para la variable independiente. La
confiabilidad de las proyecciones está dada por la confiabilidad de la ecuación, la cual
se mide a través del coeficiente de determinación y de los errores de los coeficientes
de regresión.
Una vez ajustada la recta de regresión a la nube de observaciones es importante
disponer de una medida que mida la bondad del ajuste realizado y que permita decidir
si el ajuste lineal es suficiente o se deben buscar modelos alternativos. Como medida
de bondad del ajuste se utiliza el coeficiente de determinación, definido como sigue:
R %=( R ) ×100
2 2
Donde:
R: Coeficiente de Correlación.
EJERCICIOS
Después de haber leído la bibliografía básica propuesta en el punto 2.1, resuelve
los siguientes ejercicios:
1. Para cada uno de los siguientes conjuntos de datos bivariantes graficar sus
correspondientes diagramas de dispersión de puntos. ¿Qué tipo de relación
funcional, cree usted, se podría ajustar mejor a los datos?, ¿Por qué?
X 5 10 8 19 14 19 15 15 25 20 20
a)
Y 2 7 13 14 15 16 10 5 7 10 5
X 3 6 5 1 4 2 3 7 4
b)
Y 16 14 12 8 18 11 11 5 20
X 6 2 1 4 1 3 4 1 3 2 4
c)
Y 10 16 14 10 16 13 11 15 14 14 12
X 6 14 15 18 10 16 14 12 18 17
d)
Y 8 11 16 17 11 14 13 10 14 18
2. Se realiza un estudio para determinar el efecto de la reducción de las horas de
sueño sobre la habilidad para resolver problemas sencillos. La reducción de
las horas de sueño es de 8, 12, 16, 20 y 24 horas sin dormir. En el estudio
participaron un total de 10 individuos, con dos en cada nivel de reducción.
Después de su período específico de reducción de horas de sueño, cada
individuo fue sometido a un conjunto de problemas simples de suma,
observándose el número de errores. Los resultados fueron:
Número de errores (Y) 8, 6 6, 10 8, 14 14, 12 16, 12
Reducción de horas de 8 12 16 20 24
sueño (X)
a) Grafica el diagrama de dispersión de puntos.
b) Encuentra la recta de mínimos cuadrados apropiada para estos datos.
c) En el diagrama de dispersión de puntos, grafica la recta de mínimos
cuadrados.
d) Interpreta los coeficientes de regresión.
3. Los gastos semanales de publicidad y las ventas semanales de una empresa,
en dólares, para una muestra de diez semanas son:
Gastos
semanales de 41 54 63 54 48 46 62 61 64 71
publicidad
Ventas 1250 1380 1425 1425 1450 130 1400 1510 1575 1650
semanales 0
a) Establece la recta de regresión de mínimos cuadrados que permita
predecir las ventas semanales en función de los gastos en publicidad.
b) Representa gráficamente los puntos y la recta de mínimos cuadrados.
Comenta.
c) Interpreta la pendiente de la recta de regresión.
d) Pronostica las ventas para gastos semanales de publicidad de 50 y 60
dólares.
e) ¿Cuáles son los errores de estimación cuando se predice las ventas
semanales para gastos semanales de publicidad de 61, 62 y 63 dólares
respectivamente?
4. Las calificaciones en un examen de estadística y el número de horas de
estudio para el examen, de una muestra de doce estudiantes de una sección,
se presentan en el siguiente cuadro.
Tiempo de
3 3 3 4 4 5 5 5 6 6 7 8
estudio
Calificación 9 12 11 12 15 14 16 15 18 16 15 17
a) Halla la recta de regresión de mínimos cuadrados considerando la
calificación en el examen como variable dependiente.
b) Interpreta la pendiente de la recta de regresión.
c) Calcula el error estándar de estimación. ¿Para qué se utiliza esta
medida?
5. En una empresa se tiene interés en pronosticar el tiempo, en minutos, que
toma atender a un cliente en caja (Y) y se decide utilizar como variable
independiente el monto de las compras en dólares (X). Se tomó una muestra
de 18 clientes y se obtuvieron los siguientes resultados: x = 861, x2 =
60323, xy = 5177.3, y = 75.4, y2 = 455.86.
a) Halla la recta de regresión que mejor se ajusta a los datos e interpreta la
pendiente.
b) Grafica la recta de regresión.
c) Utiliza el gráfico de la recta de regresión para realizar dos predicciones de
la variable dependiente.
d) Calcula el error de estimación.
e) Calcula e interpreta el coeficiente de correlación
6. Para los puntajes de ansiedad (X) y de aptitud académica (Y) de diez
postulantes a un trabajo se han obtenido los siguientes resultados: x=
847, x2 = 71927, y = 446, y2 = 20058, xy = 37615.
a) Halla la recta de regresión de mínimos cuadrados que se ajusta a estos
datos. Interpreta la pendiente.
b) Interpreta la pendiente de la recta de regresión.
c) Grafica la recta de regresión.
d) Calcula e interpreta el coeficiente de correlación
7. Se ha tomado una muestra de 16 ventas de una casa comercial. Para cada
venta se han observado el precio de venta (X) y la cantidad vendida (Y) y se
han obtenido los siguientes resultados: x = 77.9, y = 749, SCx = 75.53,
SCy = 7114.44 y SCxy = - 489.89.
a) Halla la recta de regresión de mínimos cuadrados.
b) Interpreta la pendiente.
c) Pronostica la cantidad vendida para precios de venta de X=3 y x=5.
d) Calcula e interpreta el coeficiente de determinación.
8. Según investigaciones, el porcentaje de desembolso por empresas
manufactureras estadounidenses en plantas y equipo que fue destinado al
control de polucióín durante el periodo 1975–1987 fue como sigue:*
1975 1980 1981 1984 1987
9.3 4.8 4.3 3.3 4.3
*Fuente: Survey of Current Business.
a) Obtenga un modelo de regresión lineal, donde X: tiempo en años desde
1975.
b) Grafique la ecuación de la Recta.
c) Use el modelo calculado en (a) para estimar el porcentaje en 1985.
3.9. La siguiente tabla muestra el beneficio neto, en millones de dólares, de
la empresa Disney durante los años 1984-1992.
Beneficios estimados al $5 millón más cercano.
Fuente: Informes de compañía/The New York Times, Dic. 1992.
a) Estime la ecuación de la recta de mejor ajuste para estos datos.
b) Interprete el coeficiente β1.
c) Use el modelo calculado para hacer una estimación.
9. La siguiente tabla muestra la producción de soja, en millones de toneladas, en
la región Cerrados de Brasil, como función del área cultivada en millones de
hectáreas.
Área
10,1 12,1 12,9 16,2 21,0
(Millones de hectáreas)
Producción
15 25 30 40 60
(Millones de toneladas)
*Fuente: Ministerio de Agricultura de Brasil/New York Times.
a) Obtenga la ecuación de la recta de regresión lineal.
b) Interprete el coeficiente β1.
Use el modelo calculado para hacer una estimación.
10. Para una muestra de 20 operadores de máquinas se tienen registrados, la nota
del examen de ingreso (X) y la evaluación de eficiencia laboral (Y). A partir
de estos datos se han obtenido los siguientes coeficientes para la recta de
regresión de mínimos cuadrados: 0 = 28.64 y 1 = 1.01.
a) Escribe la recta de regresión e interpretar 1 .
b) Estima el puntaje promedio de evaluación de eficiencia laboral para los
operadores que obtuvieron 75 puntos en el examen de ingreso.
c) Grafica la recta de regresión.
11. La siguiente información corresponde a calificaciones obtenidas por 10
estudiantes en un examen de Estadística y su calificación final promedio.
Calificación
en examen 14 18 16 12 10 15 17 11 08 12
Calificación
promedio 12 14 15 10 11 12 12 11 10 11
a) Grafica el diagrama de dispersión. Comentar
b) Halla la recta de regresión de mínimos cuadrados. Interpretar la
pendiente.
c) Calcula el coeficiente de correlación lineal. Interpreta.
d) Calcula el coeficiente de determinación. Interpreta.
12. En un estudio con 15 observaciones mensuales, un analista financiero quiere
determinar la relación de la tasa porcentual de rendimiento (Y) de las
acciones de una empresa sobre la tasa porcentual de rendimiento (X) de un
índice bursátil. Dispone de la siguiente información:
x = 33.8, y = 33.5, xy = 79.22, x2 = 80.34, y2 = 79.45
a) Estima la regresión lineal de Y sobre X. Realiza una predicción.
b) Calcula el coeficiente de correlación lineal. Interpreta.
c) Calcula el coeficiente de determinación. Interpreta.
13. Un vendedor de bienes desea establecer la relación entre el número de
semanas que las casas están en el mercado antes de venderse y el precio
que por ellas se pide. La información es la siguiente:
Semana 6.2 6.7 7.5 8.5 11. 9.5 12.2 9.8
5
Precio
(miles) 25 82 100 95 120 110 130 135
a) Grafica la dispersión de puntos.
b) Halla la ecuación de regresión de Y sobre X. Interpreta la pendiente.
c) Realiza dos predicciones.
d) Calcula e interpreta el coeficiente de determinación.
e) Calcula el error estándar de estimación.
14. La siguiente tabla y gráfica muestran el consumo mensual de energía en
función del área del domicilio:
Área 183,
119,8 125,4 136,6 148,8 158,9 170,9 207,2 223,0 272,2
(m )
2
9
Consumo
1180 1170 1260 1490 1570 1710 1800 1840 1960 1950
(kw-hrs)
a) Establezca la recta de regresión de mínimos cuadrados que permita
predecir el consumo de energía en función del área del domicilio.
b) Represente gráficamente los puntos y la recta de mínimos cuadrados.
Comenta al respecto.
c) Interprete la pendiente de la recta de regresión.
d) Calcule e interprete el Coeficiente de Correlación R.
e) Calcule e interprete el Coeficiente de Determinación R2.
15. En el servicio central de turismo del país se ha observado que el número de
plazas hoteleras ocupadas es diferente según sea el precio de la habitación.
Sobre el total de plazas ocupadas en un año se tiene:
Precio 260 650 1000 1400 210 2500 270 3300 4000
(US$./noche 0 0
)
Nº Habitac 4725 261 1872 943 750 700 700 580 500
Ocupadas 0
a) Representa gráficamente para comprobar que existe cierta dependencia
lineal entre las variables.
b) Halle la ecuación de la recta de regresión del precio sobre el número de
habitaciones.
c) ¿Cuántas habitaciones se llenarían a US$1500?
16. El volumen de ahorro y la renta del sector familias en billones de pesos, para el
período 77-86 fueron:
Año 77 78 79 80 81 82 83 84 85 86
Ahorro 1.9 1.8 2.0 2.1 1.9 2.0 2.2 2.3 2.7 3.0
Renta 20.5 20.8 21.2 21.7 22.1 22.3 22.2 22.6 23.1 23.5
a) Encuentre la recta de regresión considerando el ahorro como variable
independiente.
b) Encuentre la recta de regresión considerando la renta como variable
independiente
c) Para el año 87 se supone una renta de 24.1 billones de pesos. ¿Cuál será
el ahorro esperado para el año 87?
17. La tabla presenta datos ficticios para un estudio de adolescentes en riesgo de
desarrollar obesidad.
N° de comidas 2 2 5 2 4 3 3 2
rápidas consumidas
la última semana
Peso (Kg.) 50,8 59,4 77,6 72,6 82,6 74,8 67,6 62,1
a) Trace un diagrama de dispersión del peso regresionado a partir del
número de comidas rápidas consumidas en la última semana.
b) Calcule el coeficiente de correlación R de Pearson para estas dos
variables, así como la ecuación de regresión Y = β0 + β 1 X .
18. La tabla siguiente contiene la edad (X) y la máxima de la presión sanguínea (Y)
de un grupo de 10 mujeres:
Edad 56 42 72 36 63 47 55 49 38 42
Presión 14,8 12,6 15,9 11,8 14,9 13,0 15,1 14,2 11,4 14,1
a) Determine la recta de regresión de Y sobre X, justificando la adecuación de
un modelo lineal.
b) Interprete la pendiente.
c) Mida la bondad del modelo.
d) Realice las siguientes predicciones, sólo si tienen sentido:
Presión sanguínea de una mujer de 51 años.
Presión sanguínea de una niña de 10 años.
Presión sanguínea de un hombre de 54 años.
19. El crecimiento de los niños desde la infancia a la adolescencia generalmente
sigue un patrón lineal. Se calculó una recta de regresión mediante el método
de mínimos cuadrados con datos de alturas de niñas norteamericanas de 4 a
9 años y el resultado fue: β0 = 80 y β1 = 6. La variable dependiente Y es la
altura (en cm.) y X es la edad (en años).
a) Interprete los valores estimados del intercepto y de la pendiente.
b) Cuál será la altura predicha de una niña de 8 años.
c) Cuál será la altura predicha de una mujer de 25 años. Comente el
resultado.
20. En 1991 se publicó un trabajo “Diseñando plantas en climas difíciles” en la
revista Field Crops Research, los datos usados en la investigación son:
Duración 92 92 96 100 102 102 106 106 121 143
Rendimiento 1,7 2,3 1,9 2,0 1,5 1,7 1,6 1,8 1,0 0,3
Con X = la duración de la cosecha de porotos de soya en días, Y = rendimiento
de la cosecha en toneladas por hectárea.
a) Estime la recta de regresión mediante el método de mínimos cuadrados.
Interprete los estimadores en el contexto de la pregunta
b) ¿Existe una relación lineal significativa entre la duración y el rendimiento de
la cosecha?
c) Estime el rendimiento si la duración de la cosecha fue de 104 días.
21. Un investigador cree que la inteligencia de los niños, medida a través del
coeficiente intelectual (CI en puntos), depende del número de hermanos.
Toma una muestra aleatoria de 15 niños y ajusta una regresión lineal simple.
Los resultados aparecen en la tabla adjunta.
CI 110 115 120 118 110 108 105 104 98 99 99 100 90 93 90
N° Hmos 0 1 1 1 2 2 2 3 3 4 4 5 5 5 6
a) Encuentre e interprete el coeficiente de correlación R.
b) Dé la ecuación de la recta de regresión. Interprete los estimadores en el
contexto de la pregunta.
¿Existe una relación lineal significativa entre el número de hermanos y el
coeficiente intelectual?
22. Se desea saber si existe alguna relación entre la ingestión y la absorción de
grasas en lactantes desnutridos. Se realizan 20 determinaciones de ingestión
y absorción cuyos resultados se muestran en la tabla que sigue:
INGESTIÓN Y ABSORCIÓN DE GRASAS EN 20 LACTANTES
DESNUTRIDOS
Caso N° Ingestión Absorción Caso N° Ingestión Absorción
1 1,4 0,7 11 2,0 1,4
2 1,6 1,2 12 1,4 1,1
3 2,1 1,6 13 1,9 1,5
4 1,7 1,1 14 1,8 1,3
5 1,8 1,3 15 1,9 1,5
6 2,6 2,0 16 1,6 1,4
7 1,5 1,2 17 1,9 1,7
8 2,5 1,5 18 2,1 1,7
9 2,7 2,4 19 1,6 1,3
10 1,8 1,5 20 1,6 1,1
a) Estime β0 y β1 mediante el método de mínimos cuadrados. Interprete los
coeficientes de regresión.
b) Encuentre e interprete el coeficiente de correlación R.
c) ¿Existe una relación lineal significativa entre la ingestión y la absorción de
grasas?
23. La siguiente tabla presenta los datos sobre el número de cambios de aceite al
año (X) y el costo de la reparación (Y), en miles de pesos, de una muestra
aleatoria de 8 autos de una cierta marca y modelo.
N°
Cambios 3 5 2 3 1 4 6 4
de Aceite
Costo
(miles de 150 150 250 200 350 200 50 125
pesos)
a) Haga un gráfico de dispersión con los datos, verifique el supuesto de
linealidad.
b) Encuentre la recta de regresión de mínimos cuadrados.
c) Interprete los valores estimados del intercepto y de la pendiente.
d) Estima cuál será el costo de reparación de un auto que ha tenido 4 cambios
de aceite.
e) Si cambia X por Y, ¿obtendrá la misma recta de regresión?
f) Calcule el residuo para la primera observación (X=3, Y=150).
24. Para la economía española, disponemos de los datos anuales redondeados
sobre consumo final de los hogares a precios corrientes (Y) y renta nacional
disponible neta (X), tomados de la Contabilidad Nacional de España base
1995 del INE , para el período 1995-2002, ambos expresados en miles de
millones de euros:
Año 1995 1996 1997 1998 1999 2000 2001 2002
Y 258,6 273,6 289,7 308,9 331,0 355,0 377,1 400,4
X 381,7 402,2 426,5 454,3 486,5 520,2 553,3 590,3
Considerando que el consumo se puede expresar como función lineal de la
renta, determine:
a) Los parámetros β0 y β1 de la recta de regresión.
b) El coeficiente de determinación de dicha regresión.
c) La predicción del valor que tomará el consumo para una renta de 650.000
millones de euros.
25. Se supone que se puede establecer cierta relación lineal entre las
exportaciones de un país y la producción interna de dicho país. En el caso de
España, tenemos los datos anuales (expresados en miles de millones de
pesetas) para tales variables correspondientes al quinquenio 2002-06 en la
siguiente tabla:
Año Producción Exportaciones
2002 52,654 10,420
2003 53,972 11,841
2004 57,383 14,443
2005 61,829 16,732
2006 65,381 18,760
A partir de tal información, y considerando como válida dicha relación lineal, se
pide:
a) Si la producción para el año 2007 fue de 2.210.610 millones de pesetas,
¿cual sería la predicción de las exportaciones para este año? ¿Qué grado
de precisión tendría dicha predicción?
b) ¿Qué tanto por ciento de la varianza de las exportaciones no vienen
explicadas por la producción interna, y se debe a otro tipo de variables?
26. Un estudiante de la Escuela Universitaria de Estudios Empresariales de la
Universidad de Sevilla, para poder pagarse sus estudios, debe trabajar como
camarero en un bar de copas de su localidad. A este establecimiento, suelen
acudir todos los jóvenes de la zona. Este año, con los conocimientos
aprendidos, decide por fin estudiar la relación existente entre la cantidad de
sal de las galletas saladas y el consumo de bebidas, ya que es costumbre
dar al cliente este aperitivo cuando pide una consumición. Se sabe que las
galletas no pueden tener una concentración de sal superior a 3,5 gramos por
cada 1000 galletas y, por ello, decide ir variando a partir de 1 gramo la
concentración de 0,5 en 0,5 gramos cada semana e ir anotando el
incremento en caja semanalmente, obteniendo la siguiente tabla:
Gramos de sal por Ingresos
1000 galletas (pesetas)
1 140,3
1,5 150
2 165
2,5 175
3 200
A partir de tales cifras, se quiere conocer:
a) ¿Considera justificado el planteamiento de un modelo lineal para expresar
la relación entre las variables?
b) Si el propietario desea unos ingresos de 160.000 pesetas, ¿qué cantidad de
sal debería aportar por cada 1000 galletas? Si aporta el máximo permitido
de sal, ¿cuál sería el ingreso en caja? Explicar cuál de las dos predicciones
le merece mayor confianza.
¿Cuál sería la variación porcentual de los ingresos cuando la cantidad de sal
aumenta en un 1% sobre el último valor de la tabla? Si aumentamos en 1gr.
la sal por cada 1000 galletas, ¿cuánto variarán los ingresos?
27. La factura mensual del gasto telefónico de una pequeña empresa se ha
incrementado notablemente en los últimos meses. Los estudios realizados
por el administrador de la misma argumentan que el mayor uso de Internet
dentro de la misma es la principal causa del mayor gasto en teléfono, lo que
ha hecho que se estudie la posibilidad de acogerse a alguno de los múltiples
bonos o tarifas especiales que ofrecen las compañías, lo que hasta la fecha
todavía no se llevó a cabo. Las últimas cifras mensuales no hacen sino
confirmar esta relación:
Mes Enero Febrero Marzo Abril Mayo
Cuantía de la factura 55 100 118 120 142
telefónica (€)
Tiempo de conexión 200 500 700 800 1000
(minutos)
De acuerdo con la información anterior, responda a las siguientes preguntas:
a) Suponiendo la existencia de una relación de tipo lineal entre tiempo de
conexión y gasto telefónico, ¿qué porcentaje de las variaciones en la
cuantía de la factura telefónica no podrían ser explicadas linealmente por el
tiempo de conexión a Internet dentro de la compañía?
b) ¿Cuál sería la cuantía de la factura telefónica de la compañía de acuerdo a
esta relación lineal si no se conectase a Internet en la empresa?
c) ¿Cuál sería el gasto telefónico estimado según esta relación lineal si el
tiempo de conexión a Internet fuera de 2000 minutos? ¿Le parece
aceptable tal predicción? Justifique su respuesta.
Se considera que un incremento del 20% en el tiempo de conexión a Internet
respecto al realizado en el mes de mayo conllevaría a que la factura
telefónica se elevase de forma extraordinaria. ¿Cuál sería el incremento
relativo en la misma si ello se produjese? Justifique su respuesta.
28. Una juguetería ha examinado la evolución reciente de las ventas de su muñeco
“Qco” (Y, en millones de euros) junto con los gastos de publicidad de ese
muñeco (X, en millones de euros), obteniéndose los siguientes resultados:
Año 2003 2004 2005 2006 2007 2008 2009
Y 126 135 156 156 150 150 180
X 20 25 30 32,5 35 32 34
A partir de esta información, responda a las siguientes cuestiones:
a) ¿Se puede afirmar que al aumentar los gastos en publicidad se
incrementarán las ventas? Obtenga los parámetros del ajuste lineal que
explique las ventas en función de los gastos. Interprete dichos coeficientes
e indique la bondad del ajuste realizado.
b) Si para este año 2010 aumentásemos los gastos de publicidad en un 1%,
¿en qué porcentaje se espera que variasen las ventas, según el modelo
lineal?
29. Para un conjunto de personas que están siguiendo una dieta de
adelgazamiento, se han recogido datos sobre el peso perdido desde el inicio
de la misma (variable Y, en Kg.) y el tiempo que llevan siguiendo la dieta
(variable X, en semanas), los cuales se muestran en la siguiente tabla:
Y 2,4 5,4 5,6 8,4 10,6 13,5 15 15
X 3 5 6 8 11 13 15 16
a) Estime el modelo lineal que explica el peso perdido en función del tiempo
que se lleva siguiendo la dieta e interprete los parámetros.
b) Para el modelo estimado en el apartado anterior, descomponga la varianza
total como suma de la explicada y la no explicada por el mismo y obtenga, a
partir de tal descomposición, el coeficiente de determinación.
c) Según el modelo considerado, ¿qué peso esperaría perder una persona
que siga la dieta durante 2 meses (8 semanas)? ¿Y una persona que esté
dispuesta a seguir la dieta durante dos años (108 semanas)? ¿Qué
fiabilidad le otorga a cada una de las estimaciones anteriores?
30. Con el objetivo de estudiar la relación lineal entre el precio de los automóviles y
el número de unidades vendidas, se procedió a recoger datos sobre tales
magnitudes durante el pasado mes en una determinada región. Los
resultados obtenidos fueron los siguientes:
Precio
7,5 9 10,5 12 14 16 18 20,5 23,5 27
(miles de euros)
Cantidad
450 425 400 350 325 300 290 280 260 200
vendida por mes
En función a los datos recabados para esa región y mes:
a) Una empresa radicada en la región tiene previsto para el mes próximo
aumentar el precio de su modelo más vendido en 500 . Si suponemos
como válida la relación lineal entre las dos variables analizadas para los
datos del pasado mes, ¿cómo afectaría este hecho a las ventas de dicho
modelo?
b) Si el modelo más caro de la tabla anterior se abaratase para el mes
próximo un 3%, ¿cómo variarían las ventas de dicho modelo?
31. En una muestra de familias se han analizado las variables ahorro anual (Y) y
renta anual (X), medidas ambas en miles de euros. Los datos obtenidos han
sido los siguientes:
Ahorr
1,9 1,8 2,0 2,1 1,9 2,0 2,2 2,3, 2,7 3,0
o (Y)
Renta
20,5 20,8 21,2 21,7 22,1 22,3 22,2 22,6 23,1 23,5
(X)
A partir de tales datos, se pide:
a) Obtener el modelo lineal que explica el ahorro de las familias en función de
su renta.
b) ¿Qué familia aumentaría en un mayor porcentaje su ahorro si su renta se
viese incrementada en un 5%, la familia que tiene la menor renta de entre
todas o la que posee la mayor renta?
c) ¿Cuál será el incremento absoluto del ahorro cuando una familia aumente
su renta anual en 500 euros?
¿Qué porcentaje de varianza de la variable ahorro queda explicado por la variable
renta a través del model