ANÁLISIS DE REGRESIÓN SIMPLE.
REGRESIÓN LINEAL SIMPLE.
Con frecuencia las decisiones gerenciales se basan en la relación entre dos o más variables.
cuando los datos están disponibles, puede emplearse un procedimiento estadístico llamado
análisis de regresión para obtener una ecuación que indique cuál es la relación entre las
variables. En la terminología que se emplea en la regresión, la variable a predecir se llama
variable dependiente o variable respuesta, y a la variable o variables que se usan para
predecir su valor se les llama variables independientes.
Regresión lineal simple: es un análisis de regresión en el que interviene una variable
independiente y una variable dependiente, donde la relación entre estas variables se aproxima
mediante una línea recta. La ecuación que describe cómo se relaciona y con x, y se da un
término para el error, se llama modelo de regresión. El siguiente es el modelo que se emplea
en la regresión lineal simple.
𝒚 = 𝜷𝟎 + 𝜷𝟏 𝒙 + ∈
Donde:
β0 y β1 se conocen como parámetros del modelo, y ϵ (la letra griega épsilon) es una variable
aleatoria denominada término del error. Este último da cuenta de la variabilidad de y, que
no puede ser explicada por la relación lineal entre x y y.
A la ecuación que describe la relación entre el valor esperado de y, que se denota E(y), y x
se le llama ecuación de regresión. La siguiente es la ecuación de regresión para la regresión
lineal simple.
𝑬(𝒚) = 𝜷𝟎 + 𝜷𝟏 𝒙
La gráfica de esta ecuación es una línea recta, donde: β0 es la intersección de la recta de
regresión con el eje y, β1 es la pendiente y E(y) es la media o valor esperado de y para un
valor dado de x.
1
Ecuación de regresión estimada.
Si se conocieran los valores de los parámetros poblacionales β0 y β1, se podría emplear la
ecuación de regresión anteriormente descrita, para calcular el valor medio de y para un valor
dado de x. Sin embargo, en la práctica no se conocen los valores de estos parámetros y es
necesario estimarlos usando datos muestrales. Se calculan estadísticos muestrales (que se
denotan como b0 y b1) como estimaciones de los parámetros poblacionales β0 y β1. Al sustituir
b0 y b1 por β0 y β1 en la ecuación de regresión, se obtiene la ecuación de regresión estimada.
La ecuación de regresión estimada de una regresión lineal simple se da a continuación.
ŷ = 𝒃𝟎 + 𝒃𝟏 𝒙
A la gráfica de la ecuación de regresión lineal simple estimada se le llama recta de regresión
estimada, donde: b0 es la intersección con el eje y (es el valor estimado de y cuando x = 0.),
b1 es la pendiente de la recta, x es cualquier valor de la variable independiente y, ŷ (que se
lee y prima) es el valor estimado de y.
Diagramas de dispersión.
Debido a que siempre conviene explorar los datos muestrales antes de aplicar un
procedimiento estadístico formal, deberíamos usar un diagrama de dispersión para explorar
visualmente los datos pareados. Los diagramas de dispersión para el análisis de regresión se
trazan colocando la variable independiente x en el eje horizontal y la variable dependiente y
en el eje vertical. Este diagrama permite observar gráficamente los datos y obtener
conclusiones acerca de la relación entre las variables. Ejemplo:
Principio de los mínimos cuadrados.
El método de mínimos cuadrados es un procedimiento en el que se usan los datos muestrales
para encontrar la ecuación de regresión estimada que mejor represente la relación entre las
dos variables y que proporciona lo que comúnmente se conoce como “recta del mejor ajuste”.
2
Este procedimiento determina una ecuación de regresión al minimizar la suma de los
cuadrados de las desviaciones o distancias verticales entre los valores reales de y, y los
valores pronosticados de y.
En conclusión, el criterio de mínimos cuadrados permite elegir la ecuación de mejor ajuste.
Si se empleara otro criterio, como minimizar la suma de las desviaciones absolutas entre yi y
ŷi, se obtendría una ecuación diferente. En la práctica el método de mínimos cuadrados es el
más utilizado. El criterio de mínimos cuadrados es:
𝒎𝒊𝒏 ∑(𝒚𝒊 − ŷ𝒊 )𝟐
Donde:
yi = valor observado de la variable dependiente en la observación iésima.
ŷi = valor estimado de la variable dependiente en la observación iésima.
Para ilustrar este concepto, se trazan los mismos datos en las tres gráficas siguientes. Los
puntos son los valores reales u observados de y, y los asteriscos son los valores predichos u
estimados de y para un valor dado de x. La recta de regresión de la gráfica 13-9 se determinó
con el método de los mínimos cuadrados. Es la recta de mejor ajuste porque la suma de los
cuadrados de las desviaciones verticales respecto de sí misma es la mínima.
Estimación de los parámetros en el modelo por mínimos cuadrados.
̅)(𝒚𝒊 − 𝒚
∑(𝒙𝒊 − 𝒙 ̅)
𝒃𝟏 = 𝟐
̅)
∑(𝒙𝒊 − 𝒙
̅ − 𝒃𝟏 𝒙
𝒃𝟎 = 𝒚 ̅
Donde:
xi = valor de la variable independiente en la observación iésima.
yi = valor de la variable dependiente en la observación iésima.
𝑥̅ = media de la variable independiente.
𝑦̅ = media de la variable dependiente.
n = número total de observaciones.
3
Relación entre STC, SCR y SCE.
Se denomina residuales, o valores de error, a la diferencia entre los valores reales y los valores
pronosticados (𝒚𝒊 − ŷ). El valor de la suma de cuadrados debido al error (SCE) es una
medida de la variabilidad de las observaciones reales respecto de la línea de regresión
estimada. Su fórmula es:
𝑺𝑪𝑬 = ∑(𝒚𝒊 − ŷ𝒊 )𝟐
Se puede entender la suma total de cuadrados (STC) como una medida de cuánto se agrupan
las observaciones en torno a la línea 𝑦̅, y la SCE como una medida de cuánto se agrupan las
observaciones en torno de la recta ŷ.
̅ )𝟐
𝑺𝑻𝑪 = ∑(𝒚𝒊 − 𝒚
Para medir cuánto se desvían de 𝑦̅, los valores ŷ en la recta de regresión, se calcula otra suma
de cuadrados, la cual se llama suma de cuadrados debido a la regresión y se denota como
SCR.
̅ )𝟐
𝑺𝑪𝑹 = ∑(ŷ𝒊 − 𝒚
Por lo antes dicho, se esperaría que hubiera alguna relación entre STC, SCR y SCE. En efecto,
la relación entre estas tres sumas de cuadrados constituye uno de los resultados más
importantes de la estadística.
𝑺𝑻𝑪 = 𝑺𝑪𝑹 + 𝑺𝑪𝑬
Por consiguiente, si se conocen los valores de dos de estas sumas, es fácil calcular la tercera
suma de cuadrados.
Estimación del coeficiente de determinación.
El coeficiente de determinación proporciona una medida de la bondad de ajuste para la
ecuación de regresión estimada. Indica la proporción de la variación total de la variable
dependiente y que se explica, o contabiliza, por la variación de la variable dependiente x.
Este es el coeficiente de correlación al cuadrado, por lo tanto, también se usa el termino r2.
Se calcula mediante la siguiente formula:
𝑺𝑪𝑹
𝒓𝟐 =
𝑺𝑻𝑪
Probar la significación de la pendiente.
Consiste en determinar si la pendiente de la recta de regresión es distinta a cero, utilizando
el método de prueba de hipótesis (prueba t de student).
La importancia de esto radica en que, si no podemos demostrar que la pendiente de la recta
es distinta de cero, podríamos utilizar la media de la variable dependiente como factor de
predicción, en vez de usar la ecuación de regresión.
4
Desviación estándar estimada de b1.
El error cuadrado medio (ECM) proporciona una estimación de σ2, su fórmula es:
𝑺𝑪𝑬
𝒔𝟐 = 𝑬𝑪𝑴 =
𝒏−𝟐
Para estimar σ se calcula la raíz cuadrada de s2. Al valor que se obtiene, s, se le conoce como
error estándar de estimación. Su fórmula es:
𝑺𝑪𝑬
𝒔 = √𝑬𝑪𝑴 = √
𝒏−𝟐
Como no se conoce el valor de σ, se obtiene una estimación de 𝜎𝑏1 , que se denota 𝑠𝑏1 ,
estimando σ mediante la siguiente ecuación:
𝒔
𝒔𝒃𝟏 =
̅ )𝟐
√∑(𝒙𝒊 − 𝒙
Probar la significación de la regresión.
Una prueba F basada en la distribución de probabilidad F también puede emplearse para
probar la significancia en la regresión. Cuando sólo se tiene una variable independiente, la
prueba F lleva a la misma conclusión que la prueba t; es decir, si esta t indica que 𝛽1 ≠ 0 y
por tanto existe una relación significativa, la prueba F también indicará que existe esta
relación. Pero cuando hay más de una variable independiente, sólo la prueba F puede usarse
para probar que existe una relación significativa general.
Si la hipótesis nula H0: 𝛽1 = 0 es verdadera, la suma de cuadrados debido a la regresión,
SCR, dividida entre sus grados de libertad proporciona otra estimación independiente de σ2.
A esta estimación se le llama cuadrado medio debido a la regresión, y se denota como CMR.
5
𝑺𝑪𝑹
𝑪𝑴𝑹 =
𝑵𝒖𝒎𝒆𝒓𝒐 𝒅𝒆 𝒗𝒂𝒓𝒊𝒂𝒃𝒍𝒆𝒔 𝒊𝒏𝒅𝒆𝒑𝒆𝒏𝒅𝒊𝒆𝒏𝒕𝒆𝒔
Ejemplo: Armand’s Pizza Parlors es una cadena de restaurantes de comida italiana que
abarca un área de cinco estados. Las ubicaciones con mayor éxito se encuentran cerca de los
campus universitarios. Los gerentes creen que las ventas trimestrales de estos restaurantes
(denotadas por y) están directamente relacionadas con el tamaño de la población estudiantil
(denotada por x); es decir, en los establecimientos que están cerca de algún campus con una
población estudiantil grande se generan más ventas que en aquellos situados cerca de algún
campus con una población estudiantil pequeña. La población de restaurantes de esta cadena,
puede verse también como un conjunto de subpoblaciones, una para cada uno de los valores
de x, es decir, una subpoblación está formada por todos los restaurantes Armand’s localizados
cerca de los campus universitarios con 8,000 estudiantes; otra subpoblación consta de todos
6
los restaurantes Armand’s localizados cerca de los campus universitarios con 9,000
estudiantes, y así sucesivamente. A continuación, se presentan los datos de una muestra
aleatoria de 10 restaurantes de la cadena Armand’s Pizza Parlors:
Población de estudiantes Ventas trimestrales
Restaurantes
en miles en miles
(i)
(xi) (yi)
1 2 58
2 6 105
3 8 88
4 8 118
5 12 117
6 16 137
7 20 157
8 20 169
9 22 149
10 26 202
Primer paso: se empieza por hacer un supuesto acerca del modelo apropiado para la relación
entre las variables dependientes e independientes. Para comprobar si la relación entre las
variables es lineal o no lineal, se realiza un diagrama de dispersión para observar
gráficamente los datos y obtener conclusiones acerca de la relación entre las variables. En el
caso de la regresión lineal simple, se supone que el modelo de regresión es: 𝑦 = 𝛽0 + 𝛽1 𝑥 + ∈
A simple vista parece existir una relación lineal positiva entre ambas las variables. Conforme
aumenta la población estudiantil, aumentan las ventas trimestrales.
Segundo paso: empleando el método de mínimos cuadrados, se usan los datos muestrales
para obtener los valores b0 y b1, que son las estimaciones de los parámetros del modelo β0 y
β1, respectivamente.
7
Error al Desviación al
Restaurantes Pronosticado Error
𝒙𝒊 𝒚𝒊 𝒙𝒊 − 𝒙 ̅ (𝒙𝒊 − 𝒙
̅ 𝒚𝒊 − 𝒚 ̅)(𝒚𝒊 − 𝒚 ̅ )𝟐
̅ ) ( 𝒙𝒊 − 𝒙 cuadrado cuadrado
(i) ŷ𝒊 = 𝟔𝟎 + 𝟓𝒙𝒊 𝒚𝒊 − ŷ𝒊
(𝒚𝒊 − ŷ𝒊 )𝟐 ( 𝒚𝒊 − 𝒚̅ )𝟐
1 2 58 -12 -72 864 144 70 -12 144 5,184
2 6 105 -8 -25 200 64 90 15 225 625
3 8 88 -6 -42 252 36 100 -12 144 1,764
4 8 118 -6 -12 72 36 100 18 324 144
5 12 117 -2 -13 26 4 120 -3 9 169
6 16 137 2 7 14 4 140 -3 9 49
7 20 157 6 27 162 36 160 -3 9 729
8 20 169 6 39 234 36 160 9 81 1,521
9 22 149 8 19 152 64 170 -21 441 361
10 26 202 12 72 864 144 190 12 144 5,184
TOTALES 140 1,300 - - 2,840 568 - - SCE=1,530 STC=15,730
∑ 𝑥𝑖 140
𝑥̅ = = = 14
𝑛 10
∑ 𝑦𝑖 1,300
𝑦̅ = = = $ 130
𝑛 10
̅)(𝒚𝒊 − 𝒚
∑(𝒙𝒊 − 𝒙 ̅) 𝟐, 𝟖𝟒𝟎
𝒃𝟏 = = =𝟓
̅ )𝟐
∑(𝒙𝒊 − 𝒙 𝟓𝟔𝟖
̅ = 𝟏𝟑𝟎 − 𝟓(𝟏𝟒) = 𝟔𝟎
̅ − 𝒃𝟏 𝒙
𝒃𝟎 = 𝒚
Tercer paso: determinar la ecuación de regresión estimada: ŷ = 𝑏0 + 𝑏1 𝑥
ŷ = 𝟔𝟎 + 𝟓𝒙
Nota: se utilizará esta ecuación cuando el tamaño de la población esté expresado en miles
de estudiantes, por tanto, la venta esperada también estará expresada en miles de dólares.
𝑳𝒂 𝒗𝒆𝒏𝒕𝒂 𝒕𝒓𝒊𝒎𝒆𝒔𝒕𝒓𝒂𝒍 𝒆𝒔𝒕𝒊𝒎𝒂𝒅𝒂 = 𝟔𝟎, 𝟎𝟎𝟎 + 𝟓 (𝒑𝒐𝒃𝒍𝒂𝒄𝒊𝒐𝒏 𝒅𝒆 𝒆𝒔𝒕𝒖𝒅𝒊𝒂𝒏𝒕𝒆𝒔)
Nota: se utilizará esta ecuación cuando el tamaño de la población esté expresado en
estudiantes, por tanto, la venta esperada estará expresada en dólares.
La constante de la ecuación de regresión estimada (b0 = 60) es positiva y nos indica que un
restaurante ubicado en un área con una población estudiantil cero, podría vender
trimestralmente un promedio de $ 60,000 dólares.
La pendiente de la ecuación de regresión estimada (b1 = 5) es positiva, lo que implica que a
medida que aumenta el tamaño de la población de estudiantes, las ventas se incrementan. Se
concluye que (con base en las ventas dadas en miles de $ y el tamaño de la población en
miles), un aumento de 1,000 en el tamaño de la población de estudiantes corresponde a un
incremento de $ 5,000 en las ventas esperadas; es decir, se prevé que las ventas trimestrales
se incrementen $5 por cada estudiante.
8
La ecuación de regresión estimada nos indica que, a cada valor de la población de estudiantil,
le corresponde un pronóstico de venta trimestral basado en un incremento constante de $
60,000 dólares, más 5 veces el valor de la población estudiantil.
Cuarto paso: se calcula el coeficiente de determinación para saber ¿qué tan bien se ajusta a
los datos la ecuación de regresión estimada?
𝑺𝑪𝑹 = 𝑺𝑻𝑪 − 𝑺𝑪𝑬 = 𝟏𝟓, 𝟕𝟑𝟎 − 𝟏, 𝟓𝟑𝟎 = 𝟏𝟒, 𝟐𝟎𝟎
𝑺𝑪𝑹 𝟏𝟒, 𝟐𝟎𝟎
𝒓𝟐 = = = 𝟎. 𝟗𝟎𝟐𝟕
𝑺𝑻𝑪 𝟏𝟓, 𝟕𝟑𝟎
El r2 nos indica que el 90.27% de la suma total de cuadrados se explica mediante el uso de la
ecuación de regresión estimada, por tanto, se concluye que el 90.27% de la variabilidad en
las ventas trimestrales, se explica por la relación lineal que existe entre éstas y el tamaño de
la población de estudiantes.
Quinto paso: se realiza un análisis para determinar si el modelo empleado es apropiado.
Utilizar un nivel de significación de 5%.
Prueba del supuesto de normalidad.
Shapiro-Wilks (modificado)
Variable n Media D.E. W* p(Unilateral D)
RDUO Ventas trimestrales (.. 10 0.00 13.04 0.91 0.4441
H0: Los residuos del modelo de regresión tienen distribución normal.
H1: Los residuos del modelo de regresión no tienen distribución normal.
Se aprecia en la prueba de normalidad de Shapiro-Wilks que no hay evidencia para rechazar
el supuesto de distribución normal (p=0.4441) > (α=0.05), por tanto, se acepta la hipótesis
nula y se sostiene la idea de que los residuos del modelo de regresión tienen una distribución
normal.
Prueba del supuesto de homogeneidad de las varianzas.
Análisis de la varianza
Variable N R² R² Aj CV
RABS Ventas trimestrales 10 0.90 0.55 39.28
Cuadro de Análisis de la Varianza (SC tipo III)
F.V. SC gl CM F p-valor
Modelo 327.60 7 46.80 2.60 0.3057
Poblacion de estudiantes (.. 327.60 7 46.80 2.60 0.3057
Error 36.00 2 18.00
Total 363.60 9
9
H0: La varianza de ϵ (término del error), es la misma para todos los valores de x.
H1: Al menos dos varianzas son distintas.
Se puede apreciar en la prueba de Levene para el modelo de regresión, que (p=0.3057) >
(α=0.05) para los grupos, por tanto, no hay evidencias para rechazar el supuesto de igualdad
de varianzas, por lo que se acepta la hipótesis nula y se sostiene la idea de que las varianzas
de ϵ (término del error) son homogéneas.
Prueba del supuesto de independencia.
Si las observaciones con las que contamos fueron producto de haber tomado una muestra
aleatoria de sujetos de alguna población, entonces en principio, tendremos observaciones
independientes, por tanto, como los datos proceden de una muestra aleatoria de 10
restaurantes tomados de la población de restaurantes de la cadena Armand’s Pizza Parlors,
podemos asumir que se cumple el supuesto de independencia, y se concluye que los valores
de ϵ (término del error) son independientes.
Prueba de significancia de la pendiente del modelo.
𝑺𝑪𝑬 𝟏, 𝟓𝟑𝟎
𝒔𝟐 = 𝑬𝑪𝑴 = = = 𝟏𝟗𝟏. 𝟐𝟓
𝒏−𝟐 𝟖
𝑺𝑪𝑬
𝒔 = √𝑬𝑪𝑴 = √ = √𝟏𝟗𝟏. 𝟐𝟓 = 𝟏𝟑. 𝟖𝟐𝟗
𝒏−𝟐
𝒔 𝟏𝟑. 𝟖𝟐𝟗
𝒔𝒃𝟏 = = = 𝟎. 𝟓𝟖𝟎𝟑
̅ )𝟐
√∑(𝒙𝒊 − 𝒙 √𝟓𝟔𝟖
Hipótesis:
H0: 𝛽1 = 0 (la pendiente del modelo de regresión es igual a cero)
Ha: 𝛽1 ≠ 0 (la pendiente del modelo de regresión es diferente de cero)
Estadístico de prueba:
𝒃𝟏 𝟓
𝒕= = = 𝟖. 𝟔𝟐
𝒔𝒃𝟏 𝟎. 𝟓𝟖𝟎𝟑
Grados de libertad (gl) = n – 2 = 10 – 2 = 8
Regla de decisión: rechazar la hipótesis nula si el valor calculado con la fórmula es mayor al
valor critico de la prueba que es de 2.306 (para un α = 0.05/2 = 0.025 y 8 gl).
Como el valor calculado (8.62) > el valor critico de la prueba (2.306), se rechaza la hipótesis
nula (H0) y se concluye que la pendiente del modelo es diferente de cero.
10
Prueba de significancia del modelo de regresión.
𝑺𝑪𝑹 𝟏𝟒, 𝟐𝟎𝟎
𝑪𝑴𝑹 = = = 𝟏𝟒, 𝟐𝟎𝟎
𝑵𝒖𝒎𝒆𝒓𝒐 𝒅𝒆 𝒗𝒂𝒓𝒊𝒂𝒃𝒍𝒆𝒔 𝒊𝒏𝒅𝒆𝒑𝒆𝒏𝒅𝒊𝒆𝒏𝒕𝒆𝒔 𝟏
Hipótesis:
H0: 𝛽1 = 0 (Entre la variable independiente y la dependiente, no existe una relación lineal
significativa).
Ha: 𝛽1 ≠ 0 (Entre la variable independiente y la dependiente, existe una relación lineal
significativa).
Estadístico de prueba:
𝑪𝒖𝒂𝒅𝒓𝒂𝒅𝒐 𝒎𝒆𝒅𝒊𝒐 𝒅𝒆𝒃𝒊𝒅𝒐 𝒂 𝒍𝒂 𝒓𝒆𝒈𝒓𝒆𝒔𝒊𝒐𝒏 (𝑪𝑴𝑹) 𝟏𝟒, 𝟐𝟎𝟎
𝑭= = = 𝟕𝟒. 𝟐𝟓
𝑬𝒓𝒓𝒐𝒓 𝒄𝒖𝒂𝒅𝒓𝒂𝒅𝒐 𝒎𝒆𝒅𝒊𝒐 (𝑬𝑪𝑴) 𝟏𝟗𝟏. 𝟐𝟓
Grados de libertad (gl) en el numerador = numero de variables independientes = 1
Grados de libertad (gl) en el denominador = n – 2 = 10 – 2 = 8
Regla de decisión: rechazar la hipótesis nula si el valor calculado con la fórmula es mayor o
igual al valor critico de la prueba que es de 7.57 (para un α = 0.05/2 = 0.025; 1 gl en el
numerador y 8 gl en el denominador).
Como el valor calculado (74.25) ≥ el valor critico de la prueba (7.57), se rechaza la hipótesis
nula (H0) y se concluye que 𝛽1 ≠ 0, lo que implica que entre el tamaño de la población de
estudiantes y las ventas trimestrales existe una relación significativa.
Sexto paso: si el modelo empleado es apropiado, se utiliza la ecuación de regresión estimada
a fin de pronosticar el valor de y para un valor dado de x.
Dado que el modelo de regresión cumple todos los supuestos y es significativo, se considera
apropiado a fin de realizar pronósticos, por tanto, si se quisieran predecir las ventas
trimestrales de un restaurante ubicado cerca de un campus de 16,000 estudiantes, se
calcularía, como sigue:
ŷ = 60 + 5(16) = $ 140 (𝑚𝑖𝑙𝑒𝑠 𝑑𝑒 𝑑𝑜𝑙𝑎𝑟𝑒𝑠)
De manera que las ventas trimestrales pronosticadas para este restaurante serían de $140,000
dólares.
11
SALIDA DEL MODELO DE REGRESIÓN LINEAL SIMPLE USANDO INFOSTAT.
Análisis de regresión lineal
Variable N R² R² Aj ECMP AIC BIC
Ventas trimestrales (yi) 10 0.90 0.89 322.91 84.68 85.59
Coeficientes de regresión y estadísticos asociados
Coef Est. E.E. LI(95%) LS(95%) T p-valor CpMallows VIF
constante 60.00 9.23 38.72 81.28 6.50 0.0002
Poblacion de estudiantes (. 5.00 0.58 3.66 6.34 8.62 <0.0001 74.25 1.00
Cuadro de Análisis de la Varianza (SC tipo III)
F.V. SC gl CM F p-valor
Modelo 14200.00 1 14200.00 74.25 <0.0001
Poblacion de estudiantes (.. 14200.00 1 14200.00 74.25 <0.0001
Error 1530.00 8 191.25
Total 15730.00 9
El análisis de varianza informa que el modelo es estadísticamente significativo (p=0.0001) <
(α=0.05), por tanto, se puede concluir que entre estas variables existe una relación lineal
significativa.
Según Di Rienzo (Manual de INFOSTAT, 2011, p.36): “si el modelo está bien ajustado y los
supuestos del modelo (normalidad, homoscedasticidad e independencia se cumplen), el 95%
de los residuos estudentizados estarán entre -2 y 2”.
12
En el gráfico anterior se aprecia que el 100% de los residuos estudentizados se encuentra
dentro del rango -2 y 2, que está encerrado por líneas rojas, por tanto, se puede sostener la
idea de que el modelo está bien ajustado.
La grafica del modelo de regresión lineal simple es:
La ecuación de regresión estimada es:
𝑳𝒂 𝒗𝒆𝒏𝒕𝒂 𝒕𝒓𝒊𝒎𝒆𝒔𝒕𝒓𝒂𝒍 𝒆𝒔𝒕𝒊𝒎𝒂𝒅𝒂 = 𝟔𝟎, 𝟎𝟎𝟎 + 𝟓 (𝒑𝒐𝒃𝒍𝒂𝒄𝒊𝒐𝒏 𝒅𝒆 𝒆𝒔𝒕𝒖𝒅𝒊𝒂𝒏𝒕𝒆𝒔)
13