0% encontró este documento útil (0 votos)
35 vistas8 páginas

Regresion Lineal

1. El documento trata sobre el análisis de regresión lineal simple y correlación. Explica los conceptos de coeficiente de determinación, error estándar, análisis de varianza en regresión, y validación del modelo de regresión. 2. Incluye un ejemplo numérico que encuentra que el 79.4% de la variabilidad en la fuerza de impulso de un motor se explica por la temperatura de escape. El error estándar es de 0.4253 unidades de fuerza. 3. También revisa los supuestos del modelo de
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
35 vistas8 páginas

Regresion Lineal

1. El documento trata sobre el análisis de regresión lineal simple y correlación. Explica los conceptos de coeficiente de determinación, error estándar, análisis de varianza en regresión, y validación del modelo de regresión. 2. Incluye un ejemplo numérico que encuentra que el 79.4% de la variabilidad en la fuerza de impulso de un motor se explica por la temperatura de escape. El error estándar es de 0.4253 unidades de fuerza. 3. También revisa los supuestos del modelo de
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd

Unidad 3: Análisis de regresión

Tema: Análisis de regresión lineal simple y análisis de correlación


Bibliografía:
 Mendenhall W., Beaver R. y Beaver B. (2015). Introducción a la Probabilidad y Estadística. 14va
Edición. Cengage Learning Editores, México D. F. Capítulo 12
 Montgomery, D. y Runger G. (2005). Probabilidad y Estadística aplicada a la Ingeniería. México D.
F.: Limusa Wiley. Capítulo 10.
 Jay L. Devore (2008). Probabilidad y estadística para ingeniería y ciencias. México, D.F.: Cengage
Learning. Capítulo 12.

Después de la revisión de la infografía

Sobre la relación entre las variables, se puede usar el diagrama de dispersión o el coeficiente de
correlación para identificar la relación entre dos variables dependiente (y) e independiente (x).

Relación linea positiva Relación lineal negativa

40 40

35 35
Y

30 30

25 25

20 r = 0.998 20 r = -0.998
10 12 14 16 18 20 22 24 10 12 14 16 18 20 22 24
X X

Relación no lineal Sin relación


500
60

400

50

300

40
Y

200

30
100

0 r = 0.594 20 r = -0.078
0 5 10 15 20 10 15 20 25 30 35 40
X X

46
Sobre las medidas de bondad de ajuste
El coeficiente de determinación mide la proporción o el porcentaje de la variación total en Y
explicada por el modelo de regresión, su notación es R 2. El error estándar mide la variabilidad, o
dispersión, de los valores muestrales alrededor de la recta de regresión, su notación es S o se.

El análisis de varianza en la regresión lineal simple:


Fuente de variación Grados de libertad Suma de cuadrados Cuadrado medio Fcal
SCR
Regresión 1 SCR CMR =
1
CMR
SCE
Error n-2 SCE CME = CME
n-2
Total n-1 SCT

SCR SCE
R2 =
SCT
S=
n-2 √
= √ CME

1. A continuación, se muestra el análisis de varianza en la regresión lineal simple, de un estudio


realizado sobre la fuerza de impulso de un motor (y) en función de la temperatura de escape (x) en
°F, es:

Grados de Cuadrado
Fuente de variación Suma de cuadrados Fcal
libertad medio
Regresión 1 6.2881 6.2881
Error 9 1.6283 0.1809 34.7601
Total 10 7.9164

A partir de esta información, el coeficiente de determinación es:


SCR 6.2881
R2= = = 0.794 ≈ 79.4%
SCT 7.9164
“El 79.4% de la dispersión/variabilidad de la fuerza de impulso del motor (Y) es explicado por la
temperatura de escape (X)”

y el error estándar es s = √ CME = √ 0.1809 = 0.4253 unidades de fuerza

“S = 0.4253 unidades fuerza, expresa la dispersión de los datos alrededor de la recta”

2. Sobre los supuestos, marque con una “X” la opción correcta.


a) Los supuestos del modelo de regresión son:

Varianza constante de errores


Normalidad de las variables
(homocedasticidad)

Independencia de los errores


Normalidad de los errores
(Independencia = no autocorrelación)

47
Heterocedasticidad
Autocorrelación de los errores

b) Para asumir la no autocorrelación de los errores y la homocedasticidad, el estadístico


Durbin Watson debe estar comprendido en el intervalo:

. i. [0, 4] ii. [1, 3] iii. [1.5, 2.5] iv. [-1.5, 2.5] v. [1.5, 3.5]

3. Sobre la validación del modelo, marque con una “X” la opción correcta.

a) En la prueba individual (coeficientes), la hipótesis alterna para evaluar la adecuación del


modelo a la población es:

. i. H1: β0 ≠ 0 ii. H0: β0 = 0 iii. H1: β1 = 0 iv. H1: β1 ≠ 0

Y i = β0 + β1 X + e i
H 0 : β1 = 0 (Si la pendiente es cero, entonces no hay modelo)
H 1 : β1 ≠ 0 (Sí la pendiente es diferente de cero, entonces sí hay modelo)

b) Para validar la prueba de hipótesis individual (coeficientes) se utiliza:

i. Distribución Normal ii. Distribución t – student ii. Distribución de Fisher

c) La validación del modelo de regresión lineal simple puede realizarce usando ANOVA o la
prueba de coeficientes.

i. Verdadero ii. Falso

“La validación del modelo de regresión simple se puede realizar con ANOVA o con la
prueba individual de coeficientes (β1)”

En resumen, el análisis de regresión se puede esquematizar así:

Análisis de regresión Más de una


Una variable X
(Estimar Y) variable X

Regresión Simple Regresión


Múltiple
Relación
Relación no lineal
lineal

Regresión Regresión no
lineal simple lineal simple

48
Caso: Ciudad Campo Verde
En la ciudad Campo Verde existe una flota considerable de combis
antiguas que, no solo congestionan el tráfico sino también, podrían
estar emitiendo cantidades alarmantes de monóxido de nitrógeno (NO).

La Gerencia Municipal de Campo Verde desea saber, si efectivamente la


antigüedad de los vehículos y la emisión de NO están relacionadas; de
ser así, estimar en cuánto se incrementa la emisión de NO por cada año de antigüedad de los
vehículos.

Para comprobar lo anterior, la gerencia municipal solicita al ingeniero Flores un estudio técnico al
respecto, a partir de una muestra seleccionada al azar de 30 combis. Si en este estudio comprueba
que la emisión media de NO, de una combi con una antigüedad de 15 años, supera los 11 mg/m 3;
la Gerencia Municipal solicitará el retiro de circulación de las unidades de 15 años a más de
antigüedad.

1. ¿Cuál es la problemática que deberá resolver? Marque con una “X” la opción correcta.
a. ¿Cuál es la emisión de NO de una combi con una antigüedad de 15 años?
b. ¿La Gerencia Municipal solicitará el retiro de circulación de las unidades que tengan 15 años
a más de antigüedad?
c. ¿Existe relación lineal entre la emisión de NO y la antigüedad de las combis?

2. Defina la variable dependiente (Y) e independiente (X) del problema

Y: Emisión de NO de una combi (mg/m3)

X: Antigüedad de la combi (años)

3. A partir del caso, se obtuvo el siguiente diagrama de dispersión de las variables de estudio,
¿cuál es la relación entre ellas?

49
La relación entre la emisión de NO y la antigüedad de la combi es lineal y directa (creciente o
pendiente positiva), es decir, conforme pasan los años la emisión de NO se incrementa

4. Teniendo en cuenta el siguiente reporte: “Coeficientes”, modele la ecuación de regresión lineal


simple estimado e interprete el coeficiente de regresión.

Coeficientes
EE del
Término Coef coef. Valor T Valor p FIV
Constant 0.358 0.770 0.47 0.645  
e
X 1.0276 0.0907 11.33 0.000 1.00

Modelo de regresión lineal


^y = β^ 0 + β^ 1 X  ^y = 0.358 + 1.0276 X
simple estimado
Interpretación del coeficiente de β^ 1 =1.0276  “Por cada año que pasa, la emisión de NO se
regresión estimado (β^ 1) incrementa en 1.0287 mg/m3”

Por cada unidad que incrementa X , entonces Y aumenta(o disminuye) en {widehat { β }} rsub {1}

5. Teniendo en cuenta el siguiente reporte: “Resumen del modelo”, indique la interpretación del
coeficiente de determinación y el error estándar.

Resumen del modelo


R-cuad. R-cuad.
S R-cuad. (ajustado) (pred)
1.94392 82.10% 81.46% 78.42%

El 82.10% de la dispersión de la emisión de NO es explicada por la


R2 = 82.10%
antigüedad de las combis.
S = 1.944 mg/m3 La dispersión de los puntos alrededor de la recta es 1.944 mg/m 3

Tener en cuenta:
 El coeficiente de determinación R2 mide la proporción o el porcentaje de la
variación total en Y explicada por el modelo de regresión
 El coeficiente de no determinación (1 - R2) mide la proporción o el
porcentaje de la variación total en Y no explicada por el modelo de regresión
 El error estándar S mide la variabilidad, o dispersión, de los valores
muestrales ( y i ) alrededor de la recta de regresión ( ^y i ), en las mismas
unidades que la variable

50
6. Según la prueba de Anderson Darling, verifique si se cumple el supuesto de normalidad de los
errores. Usar nivel de significación del 5%.

H0: Los errores sí provienen de una Distribución normal


H1: Los errores no provienen de una Distribución normal

AD = 0.501 p – valor = 0.192

Decisión: Como p – valor > α, no se rechaza H0.


Conclusión: Al nivel de significación de 5%, se asume que los errores tienen un comportamiento
normal.

Tener en cuenta para el supuesto de normalidad de los errores:


 Estadístico Anderson Darling: Es más efectivo en tamaño de muestras pequeñas
 Estadístico Kolgomorov – Smirnov: Es más efectivo en tamaño de muestras
grandes (n > 30)

7. Con el estadístico Durbin Watson, verifique el cumplimiento de los supuestos


correspondientes:

Estadístico de Durbin-Watson
Estadístico de Durbin-Watson = 1.82889

H0: Los errores no están autocorrelacionados (los errores son independientes)


51
H1: Los errores están autocorrelacionados (los errores son dependientes)

Como d = 1.8289  [1.5, 2.5], entonces se asume que el supuesto de no autocorrelación de los
errores sucesivos se cumple.
Tener en cuenta:
Según Ángeles, C. (2002), si el estadístico Durbin Watson (d) está en el intervalo [1.5,
2.5], puede asumirse que el supuesto de independencia de errores se cumple.

Bajo el mismo criterio del estadístico Durbin Watson se puede asumir que se cumple
el supuesto de homocedasticidad

8. Teniendo en cuenta el siguiente reporte del programa MINITAB, verifique la validez del
modelo, usando la prueba global (ANOVA) o la prueba individual (coeficiente), con un nivel de
significación del 5%. (para la toma decisión utilice el criterio del valor – p)
Coeficientes
EE del
Término Coef coef. Valor T Valor p FIV
Constante 0.358 0.770 0.47 0.645  
X 1.0276 0.0907 11.33 0.000 1.00

Análisis de Varianza
Fuente GL SC Ajust. MC Ajust. Valor F Valor p
Regresión 1 485.18 485.185 128.40 0.000
 X 1 485.18 485.185 128.40 0.000
Error 28 105.81 3.779    
  Falta de ajuste 9 79.15 8.795 6.27 0.000
  Error puro 19 26.65 1.403    
Total 29 590.99      

H0: β1 = 0 (No existe un modelo de regresión lineal entre la emisión de NO


y la antigüedad de las combis)
Hipótesis:
H1: β1 ≠ 0 (Sí existe un modelo de regresión lineal entre la emisión de NO y
la antigüedad de las combis)

Estadístico 485.185
F cal = = 128.40
de prueba: 3.779

F crítico = F( α = 0.05, 1, n - 2 = 28 )
= 4.1959 p – valor = 0.000
Decisión:
Como el p – valor < α ó F cal > F crítico, se rechaza H0
Al nivel de significación de 5%, la evidencia muestral suficiente para
Conclusión
afirmar que sí existe un modelo de regresión lineal entre la emisión de NO
estadística:
y la antigüedad de las combis.

52
9. Con un nivel de confianza del 95%, la emisión media de NO de una combi con una antigüedad
de 15 años es:

Formula del IC
2
1 ( x 0 - x́ )
Valor medio ^y0 ± t α
(2 ,n-2)
*s e * +

n s xx
2
1 ( x0 - x́ )
Valor individual ^y0 ± t α
(2 ,n-2)
SCR

*s e * 1+ +
n s xx

s e = √ CME S xx =
β^ 12

Estadísticas
Variable N Media [Link].
X 30 7.5333 3.9804

SCR 485.18
x́ = 7.5333 n = 30 Sxx = = = 459.1099 t (0.025,28) =2.048 Se = S = 1.944
β^ 21 1.0282
x0 = 15 ^y0 = 0.358 + 1.028 X0 = 0.358 + 1.028 ( 15 ) = 15.778
2
1 ( x 0 - x́ ) 2
^y0 ± t α
(2 ,n-2)
5.778 ± 1.5663
*s e *
√ +
n s xx
 15.778 ± ( 2.048)(1.944)
√ 1
+
( 15 - 7.5333 )
30 459.1099

14.2117 < μ y < 17.3443

El intervalo que va de 14.2117 mg/m3 a 17.3443 mg/m3 ofrece un 95% de confianza de contener a
la verdadera emisión media de NO de una combi cuya antigüedad es 15 años.

Si en este estudio se comprueba que la emisión media de NO, de una combi con una antigüedad de
15 años, supera los 11 mg/m3; la Gerencia Municipal solicitará el retiro de circulación de las
unidades de 15 años a más de antigüedad.

10. ¿Cuál es la respuesta a la pregunta de investigación?

En vista que la emisión media de NO supera los 11 mg/m 3; la Gerencia Municipal solicitará el retiro
de circulación de las unidades de 15 años a más de antigüedad.

53

También podría gustarte