REGRESIÓN LINEAL SIMPLE
Coeficiente de correlación, R de Pearson, sirve para analizar la relación
entre variables cuantitativas. Se obtiene mediante la fórmula siguiente:
n (Σxy)- (Σx) (Σy)
R=
√(n (Σx2)- (Σx)2) (n (Σy2)- (Σy)2)
n= número de valores emparejados.
X = valores de la variable independiente.
Y = valores de la variable dependiente.
R = Se denomina Coeficiente de correlación, analiza solo cualitativamente la
relación entre dos variables, pudiendo variar de -1 a +1.
Valores positivos significan relación directamente proporcional, directa o positiva.
VI VD ó VI VD
Valores negativos significan relación inversamente proporcional, inversa o negativa.
VI VD ó VI VD
.
Sus resultados se interpretan de la siguiente manera:
+ 1,000 = Correlación positiva perfecta.
+ 0,750 = Correlación positiva fuerte
+ 0,500 = Correlación positiva media
+ 0,250 = Correlación positiva débil
0 = No existe correlación alguna entre las variables
-0,250 = Correlación negativa débil
-0,500 = Correlación negativa media.
-0,750 = Correlación negativa fuerte
-1,000 = Correlación negativa perfecta.
Coeficiente de determinación
Si R se eleva al cuadrado se obtiene R2 que es el Coeficiente de
Determinación. Los valores decimales de R2 deben ser convertidos en
porcentaje que expresa cuantitativamente la influencia de la variable
independiente sobre la dependiente.
Ejm:
R = 0,40
R2 = 0,402 = 0,16 = 16%
EJERCICIO 1
Se controla la albumimenia de 7 pacientes al inicio de su hospitalización, para establecer
relaciones con la estancia hospitalaria. Los resultados fueron:
X Y XY X2 Y2
3,4 2 6,8 11,56 4
2,6 5 13 6,76 25
2,8 6 16,8 7,84 36
2 7 14 4 49
1,9 11 20,9 3,61 121
1,4 13 18,2 1,96 169
1,3 14 18,2 1,69 196
∑ X=15,4 ∑ Y= 58 ∑ XY = 107,9 ∑ X2 = 37,42 ∑ Y2 = 600
(∑ X)2 (∑ Y)2
15,42 =237,16 582=3 364
n=7
Coeficiente de correlación
R= - 0,958
+ 1,000 = Correlación positiva perfecta.
+ 0,750 = Correlación positiva fuerte
+ 0,500 = Correlación positiva media
+ 0,250 = Correlación positiva débil
0 = No existe correlación alguna entre las variables
-0,100 = Correlación negativa débil
-0,250 = Correlación negativa débil
-0,500 = Correlación negativa media.
-0,750 = Correlación negativa fuerte
-1,000 = Correlación negativa perfecta.
La correlación entre la Albuminemia y la Estancia hospitalaria es inversa entre fuerte
y perfecta.
Coeficiente de determinación
R2 = - 0,9582 =0,9177 = 91,77%
La Albuminemia influye en 91,77% en la Estancia hospitalaria. El
restante 8,23% de influencia dependerá de variables que no han
participado en el estudio.
Permite obtener valores de Y conociendo valores de X.
Se utilizan las siguientes fórmulas.
Y= A + B.X
A = (Σy- B. Σx) / n
B = (n. Σxy- Σx.Σy) / n. Σx2- (Σx)2
Para el ejercicio desarrollado, los resultados son los
siguientes:
B = (n. Σxy- Σx.Σy) / n. Σx2- (Σx)2
B = (7 x 107,9 – 15,4 x 58) / 7 x 37,42 - 237,16
B = 755,3 - 893,2 / 261,94 - 237,16
B = -137,9/ 24,78
B = -5,56
Reemplazando valores en la
siguiente fórmula
A = (Σy- B. Σx) / n
A = (58-(-5,56x15,4) / 7
A = (58-(-85,624) / 7
A = (58+85,624) / 7
A = 143,624/7= 20,52= 21 DÍAS
Finalmente, la Fórmula para obtener valores de Y, conociendo valores de X
sería:
Y= A + B.X
¿Cuántos días de estancia hospitalaria tendrán un paciente con
pancreatitis cuya albuminemia es de 0,8 gr%?
Y= 21 + ( - 5, 56 X )
Y= 21 – 5,56 x 0,8)
Y = 21- 4,48 = 16,52 = 17 días.
Un paciente con pancreatitis cuya albuminemia es de 0,8 gr%, tendrá 17
días de estancia hospitalaria.
Para obtener el gráfico de la Regresión lineal hay que calcular los
promedios de X y Y
X Y
3,4 2
2,6 5
2,8 6
2 7
1,9 11
1,4 13
1,3 14
∑ X=15,4 ∑ Y= 58
X=15,4/7=2,2 g% Y=58/7=8,28=8 días
También hay que tener el concepto de Intercepto
A = 143,624/7= 20,52= 21 DÍAS
Intercepto es el valor de A que corresponde a un valor de la Variable
dependiente a partir del cual se traza la línea de Regresión lineal
A
EJERCICIO 2
Se controla la edad de 5 pacientes, y los valores de Presión sistólica correspondientes. Los
resultados fueron:
EDAD (AÑOS) PRESIÓN SISTÓLICA (mm Hg)
X Y
19 90
22 90
34 100
50 110
63 120
X Y XY X2 Y2
19 90 1 710 361 8 100
22 90 1 980 484 8 100
34 100 3 400 1 156 10 000
50 110 5 500 2 500 12 100
63 120 7 560 3 969 14 400
∑ X=188 ∑ Y= 510 ∑ XY = 20 150 ∑ X2 = 8 470 ∑ Y2 = 52 700
(∑ X)2 (∑ Y)2
1882 =35 334 5102=260 100
n=5
Coeficiente de correlación, R de Pearson, sirve para analizar la relación
entre variables cuantitativas. Se obtiene mediante la fórmula siguiente:
n (Σxy)- (Σx) (Σy)
R=
√(n (Σx2)- (Σx)2) (n (Σy2)- (Σy)2)
n= número de valores emparejados.
X = valores de la variable independiente.
Y = valores de la variable dependiente.
100 750 - 95 880
R=
√ (42 350 - 35 334) (263 500 - 260 100)
5 (20 150)- (188) (510)
R=
√ (5 (8 470)-35 334) (5 (52 700)- 260 100)
4 870
R=
√ 23 854 400
4 870
R=
4 884
R= 0,9971
COEFICIENTE DE CORRELACIÓN
R= 0,9971
+ 1,000 = Correlación positiva perfecta.
+ 0,750 = Correlación positiva fuerte
+ 0,500 = Correlación positiva media
+ 0,250 = Correlación positiva débil
0 = No existe correlación alguna entre las variables
-0,100 = Correlación negativa débil
-0,250 = Correlación negativa débil
-0,500 = Correlación negativa media.
-0,750 = Correlación negativa fuerte
-1,000 = Correlación negativa perfecta.
La correlación entre la EDAD y la PRESIÓN SISTÓLICA es DIRECTA entre fuerte y
perfecta.
COEFICIENTE DE DETERMINACIÓN
R2 = 0,99712 =0,9942 = 99,42%
La EDAD influye en 99,42% en la PRESIÓN SISTÓLICA. El
restante 0,58% de influencia dependerá de variables que no han
participado
Permite obtener valores de Y conociendo valores de X.
Se utilizan las siguientes fórmulas.
Y= A + B.X
A = (Σy- B. Σx) / n
B = (n. Σxy- Σx.Σy) / n. Σx2- (Σx)2
Para el ejercicio desarrollado, los resultados son los
siguientes:
B = (n. Σxy- Σx.Σy) / n. Σx2- (Σx)2
B = (5 x 20 150 – 188 x 510) / 5 x 8 470 – 35 334
B = 100 750 – 95 880 / 42 350 - 35 334
B = 4 870/ 7 016
B = 0,69
Reemplazando valores en la
siguiente fórmula
A = (Σy- B. Σx) / n
A = (510-(0,69x188) / 5
A = (510-(129,72) / 5
A = 380 / 5
A = 76 mm Hg.
Finalmente, la Fórmula para obtener valores de Y, conociendo valores de X
sería:
Y= A + B.X
¿Cuánto será la Presión sistólica de una persona de 72 años?
Y= 76 + ( 0,69 X )
Y= 76 + (0,69 x 72)
Y = 76 + 49,68
Y = 76 + 50
Y= 126 mm.Hg
Un paciente de 72 años de edad tendrá 126 mm. Hg de Presión sistólica
Para obtener el gráfico de la Regresión lineal hay que calcular los
promedios de X y Y
X Y
19 90
22 90
34 100
50 110
63 120
∑ X=188 ∑ Y= 510
X=188/5= 38 años Y=510/5=102 mm.Hg
También hay que tener el concepto de Intercepto
A = 76 mm Hg.
Intercepto es el valor de A que corresponde a un valor de la Variable
dependiente a partir del cual se traza la línea de Regresión lineal
A