0% encontró este documento útil (0 votos)
128 vistas9 páginas

Análisis de Regresión Lineal en Gastos y Salarios

Este documento presenta un análisis de regresión lineal simple entre la variable dependiente de gastos semanales (Y) y la variable independiente de salarios semanales (X) para 20 empleados. Se estima un modelo de regresión lineal con una pendiente significativa de 0.8203, lo que indica que los gastos aumentan en $0.8203 por cada dólar de aumento salarial. El coeficiente de determinación R^2 es alto, lo que sugiere una fuerte asociación lineal entre las variables.

Cargado por

Luis Mocarro
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
128 vistas9 páginas

Análisis de Regresión Lineal en Gastos y Salarios

Este documento presenta un análisis de regresión lineal simple entre la variable dependiente de gastos semanales (Y) y la variable independiente de salarios semanales (X) para 20 empleados. Se estima un modelo de regresión lineal con una pendiente significativa de 0.8203, lo que indica que los gastos aumentan en $0.8203 por cada dólar de aumento salarial. El coeficiente de determinación R^2 es alto, lo que sugiere una fuerte asociación lineal entre las variables.

Cargado por

Luis Mocarro
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd

REGRESIÓN LINEAL.

El gerente de personal de la empresa agroindustrial “Alfa Mayo” estudia la relación entre la


variable dependiente Y=gastos y la variable independiente X=Salarios, de su personal obrero. Si
una muestra aleatoria de 20 obreros reveló los siguientes datos en dólares por semana.

SALARIOS GASTOS
25 18 21 24
28 22 24 27
35 29 32  
40 33 35 37
50 39 42 46
70 50 54 58
80 65 70 75

a) Analice el diagrama de dispersión.

b) Estime un modelo de regresión lineal simple utilizando el mm.co.

c) Comente acerca del valor de la pendiente de la regresión.

d) ¿Cuánto sería el monto de los gastos de un obrero que va a ganar $90 la próxima semana?

e) Encontrar e interpretar el R^2.

f) Calcule el error estándar de estimación.

a) Analice el diagrama de dispersión.

Gráfica de dispersión de Gastos vs Sueldos


80

70

60

50

40

30

20

10

0
20 30 40 50 60 70 80 90

Tiene un crecimiento, es decir, la tendencia lineal es creciente.


b) Estime un modelo de regresión lineal simple utilizando el mm.co.

Inferencia acerca de los coeficientes de regresión. Antes de realizar predicciones con el modelo
estimado se analiza si el valor de la pendiente b es o no significativo.

Salarios Gastos X^2 Y^2 XY


25 18 625 324 450
28 22 784 484 616
35 29 1225 841 1015
40 33 1600 1089 1320
50 39 2500 1521 1950
70 50 4900 2500 3500
80 65 6400 4225 5200
25 21 625 441 525
28 24 784 576 672
35 32 1225 1024 1120
40 35 1600 1225 1400
50 42 2500 1764 2100
70 54 4900 2916 3780
80 70 6400 4900 5600
25 24 625 576 600
28 27 784 729 756
40 37 1600 1369 1480
50 46 2500 2116 2300
70 58 4900 3364 4060
80 75 6400 5625 6000
949 801 52877 37609 44444
n=20

949
X= =47.45
20
801
Y= =40.05
20
S XY ∑ XY −n ( X )(Y ) 44444−20∗47.45∗40.05
b= = = =0.8202613754
S XX ∑ X 2−n ( X )2 52877−20∗47.45
2

a=Y −b X=40.05−0.8203∗47.45=1.128597737

Y^ =1.129+ 0.8203(X )
c) Comente acerca del valor de la pendiente de la regresión.

b=0.8203: indica que para un aumento de $ en los salarios semanales, corresponde un gasto
promedio de $0.8203 en los gastos semanales. Así mismo un aumento de $10 en los salarios,
corresponde a un gasto promedio de 0.8203*$10=$8.203 en los gastos semanales.

d) ¿Cuánto sería el monto de los gastos de un obrero que va a ganar $90 la próxima semana?

X=90

Y^ =1.129+ 0.8203 ( 90 )=74.95212152


e) Encontrar e interpretar el R^2.

Varianza de la regresión poblacional:

S=
2∑ Y i2−a ∑ Y i−b ∑ X i Y i 37609−1.129∗801−0.8203∗44444
= =13.84981358
n−2 20−2
S= √13.85=3.721533767
Varianza estimada de b:

S xx=∑ X 2−n ( X )2=52877−20∗47.452=7846.95


2
S 13.849
σ^ b2= = =0.001764993224
S xx 7846.95
Error estándar de b:

σ^ b=√ 0.001765=0.04201182243
t 0.05 =t 0.025,18=2.1009
,n−2
2

Intervalo de confianza del 95% para β.

b−t 0 σ^ b ≤ β ≤b+ t 0 σ^ b

0.8203−2.1009∗0.042 ≤ β ≤ 0.8203+2.1009∗0.042
0.732 ≤ β ≤ 0.9085
β ∈ [ 0.732; 0.9085 ], con confianza del 95%.
Conclusión: La pendiente se encuentra dentro de los límites del intervalo de confianza del 95%.

¿Es significativa la pendiente de regresión muestral?

H 0 : β=0

H0 : β ≠ 0

α=0.05

b 0.8203
t cal= = =19.52453686
σ^ b 0.042

t 0.05 =t 0.025,18=2.1009
,n−2
2

t cal >t tab Se rechaza H0

Conclusión: La pendiente es altamente significativa.


ANVA.

H 0 : β=0

H0 : β ≠ 0

α=0.05
n
SCT =∑ Y i2 −n ( Y ) =37609−20∗40.052=5528.95
2

i=1

( )
n
SCR=b ∑ X i Y i−n ( Y ) ( X ) =0.8203( 44444−20∗47.45∗40.05)=5279.653356
i=1

SCE=SCT−SCR=5528.95−5279.65=249.2966442

ANÁLISIS DE VARIANZA
Grados de Suma de Promedio de los Valor
  libertad cuadrados cuadrados F crítico de F
381.2075 1.4586E-
Regresión 1 5279.65336 5279.65336 4 13
Residuos 18 249.296644 13.8498136
Total 19 5528.95      

F tab=F 0.95 ;1 ;18 =4.41

CMR 5279.65
F cal= = =381.2075
CME 13.8498136
F cal > Ftab Se rechaza la H0

Conclusión: Podemos afirmar que hay un efecto altamente significativo entre los salarios y los
gastos semanales de los obreros.

Si un obrero tuviera un salario de $90, ¿en cuánto se estima el promedio de sus gastos
semanales? Calcule el intervalo de confianza del 95% para esta estimación X0=90.

Y^ =1.129+ 0.8203 ( 90 )=74.95212152


2
1 (X 0−X )
X
( )
IC μ Y =^y 0 ± t α
( ,n−2)
2
S
n
+
S XX


2
1 (90−47.45)
( )
IC μ Y =74.95± 2.1009∗3.72
X
20
+
7846.95

70.81 ≤ ^y 0 ≤79.09
Si un obrero tuviera un salario de $90, ¿en cuánto se estima o predice su gasto semanal?
Calcule el intervalo de confianza del 95% para esta predicción.


2
1 ( X 0 −X )
( )
IC μ Y =^y 0 ± t α
X
( ,n−2)
2
S 1+ +
n S XX


2
1 ( 90−47.45)
( )
IC μ Y =74.95± 2.1009∗3.72 1+ +
X
20 7846.95

66.104 ≤ ^y 0 ≤83.8

Compruebe si el coeficiente de correlación de Pearson r=0.9772 obtenido en la muestra es


significativo.

b∗S X 0.8203∗20.32
r= = =0.97719531
SY 17.059
H 0 : ρ=0

H 0 : ρ≠ 0

α=0.05

t cal=0.977
√ 20−2
1−0.977
2
=19.52453746

t tab=t 0.05 =2.1009


;n−2
2

t cal ∈ RR Se rechaza la H0

Conclusión: Existe asociatividad lineal, por lo tanto, podemos afirmar que existe alta
correlación entre las variables.

Si es significativo, pruebe:

H 0 : ρ=0.9

H 0 : ρ>0.9

α=0.05

Z cal= √
n−3
2
ln
[
(1+r )(1−ρ0 )
(1−r )(1+ ρ0 )
=
]√
20−3
2
ln
[
(1+0.977)(1−0.9)
(1−0.977)(1+ 0.9)
=3.112
]
Z1−0.05 =1.64

Z cal ∈ RR Se rechaza la H0

Conclusión: Existe evidencia estadística que permite demostrar que el coeficiente de


correlación poblacional excede al valor 0.9.
Datos de pobreza en Colombia en 2010 y 2011. Información en porcentajes % (X: 2010; Y:
2011).

X 43.2 39.7 39.5 39.3 34.2 26.1 25.4 26.6 26.8 23.8 22 15.5 10.9
Y 40.6 37.5 34.7 33.9 33.4 25.1 23 22 21.6 19.2 19.2 12.1 10.7

Analice el diagrama de dispersión.

Gráfica de dispersión del porcentaje de pobreza


45 en 2010 vs 2011
40
35
30
25
20
15
10
5
0
5 10 15 20 25 30 35 40 45 50

Tiene un crecimiento, es decir, la tendencia lineal es creciente.

Estime un modelo de regresión lineal simple utilizando el m.m.c.

X Y X^2 Y^2 XY
43.2 40.6 1866.24 1648.36 1753.92
39.7 37.5 1576.09 1406.25 1488.75
39.5 34.7 1560.25 1204.09 1370.65
39.3 33.9 1544.49 1149.21 1332.27
34.2 33.4 1169.64 1115.56 1142.28
26.1 25.1 681.21 630.01 655.11
25.4 23 645.16 529 584.2
26.6 22 707.56 484 585.2
26.8 21.6 718.24 466.56 578.88
23.8 19.2 566.44 368.64 456.96
22 19.2 484 368.64 422.4
15.5 13.1 240.25 171.61 203.05
10.9 10.7 118.81 114.49 116.63
373 334 11878.38 9656.42 10690.3
n=13

373
X= =28.69230769
13
334
Y= =25.69230769
13
S XY ∑ XY −n ( X )(Y ) 10690.3−13∗28.69∗25.69
b= = = =0.94126596
S XX ∑ X 2−n ( X )2 11878.38−13∗28.69
2

a=Y −b X=25.69−0.94∗28.69=−1.31478475
Y^ =−1.31+ 0.94 X + ε i

b=0.9413: indica que la pendiente de la recta es positiva, lo que implica que en las ciudades
donde se observó mayor pobreza en 2010, también se observó mayor pobreza en 2011. Pero
como la pendiente es un número entre 0 y 1, significa que el incremento en el porcentaje de
pobreza en 2011 entre una ciudad y otra es menor que en el 2010.

Interprete los coeficientes.

Estime la varianza de la regresión.

Error estándar de la estimación.

Y          
2.4578180
40.6 39.3479046 1.25209543 1.56774297 1.9629638 1
4.3782979
37.5 36.0534737 1.44652628 2.09243827 3.02676695 3
- - 1.8434548
34.7 35.8652205 1.16522053 1.35773888 1.58206522 8
- - 9.9705193
33.9 35.6769673 1.77696734 3.15761292 5.61097504 8
40.551384
33.4 30.876511 2.52348904 6.36799693 16.0695705 9
11.656456
25.1 23.2522567 1.84774329 3.41415526 6.30848246 1
23 22.5933705 0.40662946 0.16534752 0.06723517 0.0273398
- 8.8110951
22 23.7228897 1.72288969 2.96834889 -5.1141377 1
- - 28.530355
21.6 23.9111429 2.31114288 5.34138142 12.3446957 5
- - 12.688351
19.2 21.087345 1.88734501 3.5620712 6.72285731 2
- -
19.2 19.3930663 0.19306629 0.03727459 0.00719647 0.0013894
- - 0.0009344
13.1 13.2748376 0.17483757 0.03056818 0.00534447 1
9.4862475
10.7 8.94501417 1.75498583 3.07997525 5.40531292 7
130.40364
      33.1426523 1.4530599 4

H0: La distribución de los errores de los datos se aproxima a una normal.


H0: La distribución de los errores de los datos no se aproxima a una normal.

α=0.05

[ ]
2 2
A (K −3)
JB=T +
6 24

∑ e t3
n 0.1118
A= = =0.2745834

( )
2 3 4.0707
∑e t 2

∑ et 4
n 10.031
K= = =1.54332915

(∑ )
2 2 6.499
et
n

[ ]
2
0.27452 (1.54−3)
JB=13 + =1.312715159
6 24
2 2
X tab =X 1−0.05,2 =5.991
2
JB> X tab Se rechaza la H0

Conclusión: Los errores no se aproximan a una normal.

También podría gustarte