Coeficientes de correlación simples, parciales y múltiples
3. Coeficiente de correlación simple
Se define como:
cov( X , Y ) 2 cov 2 ( X , Y )
rY , X = ; r Y ,X =
S X SY S X2 SY2
-Dadas dos variables Y y X, el coeficiente de correlación simple
al cuadrado mide la proporción de la varianza de Y que queda
explicada por X.
- Nota: en regresión simple, el coeficiente de correlación simple al
cuadrado coincide con el coeficiente de determinación.
4. Coeficientes de correlación parciales.
- Miden el grado de correlación que queda entre dos variables
cuando se elimina de ambas la correlación que en común puede
estar creando una tercera variable X2 a un modelo en el que ya
estaba X1.
a) Corr. Parcial de primer orden:
(X3 se añade a un modelo en el que ya estaba X2)
2
rYX X3 •
expresa el % de varianza no explicada de Y por X2 que
2
explica X3.
rYX − rYX rX X2
rYX X2 = 3 2 3
3 •
1 − rX2 X
3 2
2
1 − rYX 2
b) Corr. Parcial de segundo orden:
2
rYX X X expresa la proporción de la varianza de Y explicada por
4 • 3 2
X4 que no explicaba ni X3 ni X2.
2
rYX 3 •
X2X4 expresa la proporción de la varianza de Y explicada por
X3 que no explicaba ni X2 ni X4.
rYX =
rYX 3•
X2 − rYX ( X 2 rX 3 X 4• X 2
4•
)
X2X4 2
1 − rYX 1 − rX23 X 4• X 2
3 •
4•
X2
En general:
r12 345... p = •
[
r12 34..( p −1) − r1 p 34..( p −1) r2 p 34..( p −1) • •
]
1 − r12p 34...( p −1) 1 − r22p 34...( p −1)
•
• •
* Coeficiente de correlación múltiple
Dado un modelo: Yi = β1 + β 2 X 2i + β 3 X 3i + β 4 X 4i + ui
el coeficiente de corr. Múltiple se expresa: rYX X X coincidiendo 2 3 4
el coef. de corr. Múltiple al cuadrado con el coef. de
2 2
determinación: rYX X X = RYX X X 2 3 4 2 3 4
2 2
- rYX 2
X3X4 = RYX X X expresa la proporción de la varianza de Y
2 3 4
que viene explicada por X2,X3 y X4.
- Dado el modelo: Yi = β1 + β 2 X 2i + β 3 X 3i + ui
a) Si introducimos en primer lugar sólo X2:
Yi = β1 + β 2 X 2i + ui
2
rYX es la proporción de la varianza de Y explicada por X2.
(1 − r ) es la proporción de la varianza de Y no explicada por
2
2
YX 2
X2
2
rYX 2
+ 1 − rYX =1
2
( 2
)
SY2 rYX
2 2 2 2
+ SY 1 − rYX = SY
2
( 2
)
Varianza de Y Varianza de Y no
explicada por X2 explicada por X2
b) Añadiendo ahora X3: Yi = β1 + β 2 X 2i + β 3 X 3i + ui
2
rYX 3 •
X 2 es la proporción de la varianza de Y no explicada por X2
que es explicada por X3.
2
rYX X2 ( 2
+ 1 − rYX X2 )= 1
( )
3 • 3•
SY2 1 − rYX
2 2
rYX 2 3•
X 2 => varianza de Y explicada por X3
Varianza de Y no explicada
por X2
(
SY2 1 − rYX
2 2
(1 −rYX 2
) 3•
X2 ) ( 2
≡ 1 − RYX 2
X3 )SY2 => varianza de Y no
explicada por la inclusión de X3
Regresión Varianza explicada Varianza residual
Y=f(X2,X3) SY2 R 2 (1 − R 2 ) SY2
Y=f(X2) SY2 rYX
2
(
SY2 1 − rYX
2
)
( ) rYX2 X SY2 (1 − rYX2 )(1 − rYX2 X )SY2
2 2
Y=f(X2,X3) 2
1 − rYX 2 3• 2 2 3• 2
(1 − R 2 ) SY2 = 1 − rYX
2 2
1 − rYX ( 2
)( 3•
X2 )SY2
despejando:
R 2 = rYX
2 2
+ 1 − rYX
2
( 2
) rYX2 X 3• 2