ESTADISTICA GENERAL
COEFICIENTE DE CORRELACION LINEAL ( r )
El análisis de correlación, emplea métodos, para medir la significación del
grado o intensidad de relación entre dos o más variables cuantitativas
(numéricas).
El coeficiente de correlación lineal de Pearson, mide la relación entre variables
cuantitativas (numéricas) de datos normales, para su cálculo se utiliza la
siguiente fórmula matemática:
n ∑ XY −∑ X ∑ Y
r= 2
√ n ∑ X −¿¿ ¿
El coeficiente de correlación, tiene una variación de −1 ≤r ≤ 1
Para interpretar el coeficiente de correlación utilizaremos la siguiente escala:
Valor Significado
-1 Correlación negativa perfecta
-0.90 – -0.99 Correlación negativa muy fuerte
-0.75 – -0.89 Correlación negativa considerable
-0.50 – -0.74 Correlación negativa media
-0.25 – -0.49 Correlación negativa débil
-0.10 – -0.24 Correlación negativa muy débil
No existe correlación alguna entre las
0
variables
0.10 – 0.24 Correlación positiva muy débil
0.25 – 0.49 Correlación positiva débil
0.50 – 0.74 Correlación positiva media
0.75 – 0.89 Correlación positiva considerable
0.90 – 0.99 Correlación positiva muy fuerte
1 Correlación positiva perfecta
Fuente: Hernández, Fernández y Baptista[CITATION Her14 \n \t \l 10250 ]
El coeficiente de correlación tiene una variación de −1 ≤r ≤ 1
Si r = 0, no existe ninguna correlación. El índice indica, por tanto, una
independencia total entre las dos variables, es decir, que la variación de una de
ellas no influye en absoluto en el valor que pueda tomar la otra.
Si r = 1, existe una correlación positiva perfecta. El índice indica una
dependencia total entre las dos variables denominada relación directa: cuando
una de ellas aumenta, la otra también lo hace en idéntica proporción.
ESTADISTICA GENERAL
Si 0 < r < 1, existe una correlación positiva.
Si r = -1, existe una correlación negativa perfecta. El índice indica una
dependencia total entre las dos variables llamada relación inversa: cuando una
de ellas aumenta, la otra disminuye en idéntica proporción.
Si -1 < r < 0, existe una correlación negativa.
COEFICIENTE DE DETERMINACION ( R2 )
Es la variación explicada por la recta de regresión, es decir en que porcentaje la variable
independiente X explica la variabilidad en la variable dependiente (o respuesta) Y. para
su cálculo se utiliza la siguiente relación:
R2=r 2∗100 %
VARIBLE
Ejemplo DEPENDIENTE
Y
1. Un
VARIBLE VARIBLE VARIBLE VARIABLE
INDEPENDIENTE INDEPENDIENTE INDEPENDIENTE INDEPENDIENTE
x1 x2 x3 Xn
investigador desea establecer la relación que existe entre el tiempo de vida de
una persona y la cantidad de cigarros que fuma mensualmente. Con tal fin
selecciona una muestra de 12 personas obteniendo los siguientes resultados.
Nº de 12 1 16 2 25 26 3 32 3 36 3 40
cigarrillos 5 4 0 5 8
Tiempo de vida 75 7 70 6 66 66 6 64 6 58 5 55
3 8 5 0 7
a) Halle el coeficiente de correlación
Nº de
N cigarrillos Tiempo de Y2
(X) vida (Y)
1 12 75 900 144 5625
2 15 73 1095 225 5329
3 16 70 1120 256 4900
4 24 68 1632 576 4624
5 25 66 1650 625 4356
6 26 66 1716 676 4356
7 30 65 1950 900 4225
8 32 64 2048 1024 4096
9 35 60 2100 1225 3600
10 36 58 2088 1296 3364
ESTADISTICA GENERAL
11 38 57 2166 1444 3249
12 40 55 2200 1600 3025
329 777 20665 9991 50749
n ∑ XY −∑ X ∑ Y
r= 2
√ n ∑ X −¿¿ ¿
−7653
r= = - 0.9777
107.9398(72.5189)
Interpretación : Existe una correlación negativa muy fuerte al 97.77% entre el consumo de
cigarros y el tiempo de vida.
b) Halle el coeficiente de determinación
R2 = ( - 0.9777 )2 = 0.9559
Y
Tiempo de vida
95.59%
4.41%
X
Consumo de alcohol, drogas, el
Consumo de no hacer ejercicio, malos
cigarros habitos alimenticios, etc
Interpretación : El tiempo de vida es afectado o depende del consumo de cigarros en un
95.59%, el 4.41% lo afectara otros factores como el consumo de alcohol drogas, no hacer
ejercicio, malos hábitos alimenticios, etc.
BONDAD DE AJUSTE DEL MODELO
Dado el modelo lineal en la ecuación de regresión:
^y =¿ 82.85 – 0.666 x
a) Si la persona fumaría 45 cigarrillos cual sería su tiempo de vida esperado?
Como x = 45
y=? ^y =¿ 82.85 – 0.666 x
^y =82.85 – 0.666 ( 45 ) =53.15=53
ESTADISTICA GENERAL
Rpta:__ Si una persona fuma 45 cigarros al mes, su tiempo de vida esperado sera de 53
años aprox, estimación valida al 95.59%____________________________
2. Realizar un análisis completo para la Regresión Lineal entre la cantidad de Producción y el
correspondiente Costo unitario de cierto producto. Los datos se muestran e la siguiente tabla.
PRODUCCION EN MILES 2 4 8 12 14 18 16 10
(X)
COSTO UNIT EN SOLES (Y) 15 12 9 6 5 2 5 8
PRODUCCIO COSTO
N EN MILES UNIT EN XY X2 y*2
X SOLES Y
1 2 15 30 4 225
2 4 12 48 16 144
3 8 9 72 64 81
4 12 6 72 144 36
5 14 5 70 196 25
6 18 2 36 324 4
7 16 5 80 256 25
8 10 8 80 100 64
84 62 488 1104 604
a) Halle el coeficiente de correlación
n ∑ XY −∑ X ∑ Y
r= 2
√ n ∑ X −¿¿ ¿
r= -0.985
Interpretación : Existe una correlación negativa muy fuerte al 98.5% entre el costo
unitario y el producto en miles
b) Halle el coeficiente de determinación
R2 = ( -0.985 )2 = 0.97
Y
Costo unitario
97%
ESTADISTICA GENERAL
3%
X
Product en miles Por factores de
producción en planta
Interpretación : El costo unitario es afectado o depende de la producción en miles en un 97 %,
el 3% lo afectara otros factores como el producción en planta
BONDAD DE AJUSTE DEL MODELO
Dado el modelo lineal en la ecuación de regresión:
^y =bo+b 1 x
^y =15.457−0.734 x
La ecuación matemática mide la validez de la estimación en un 96.90%
C) Si la producción fuera de 13 mil productos, ¿Cuánto seria el costo?
Como x = 13
y=¿ y = 15.457 – 0.734(13)
y = 5.915
Rpta:__ Si la producción fuera de 13 mil productos, entonces el costo unitario seria de 5.915 soles,
3. Con los datos de la siguiente tabla que representan las estaturas (m.) y los
pesos (kg) de una muestra de 12 hombres adultos. Para cada estatura fijada previamente se
observó el peso de una persona seleccionada de entre el grupo con dicha estatura,
resultando:
Estatura 1.52 1.5 1.52 1.5 1.57 1.5 1.57 1.6 1.62 1.7 1.83 1.78
(X) 5 5 2 5 8
Peso (y) 50 61. 54.5 57. 63.5 59 61 72 66 72 84 82
5 5
Estatura(m) Peso (kg)
XY X2
X Y y*2
1 1.52 50 76 2.3104 2500
2 1.55 61.5 95.325 2.4025 3782.25
3 1.52 54.5 82.84 2.3104 2970.25
ESTADISTICA GENERAL
4 1.55 57.5 89.125 2.4025 3306.25
5 1.57 63.5 99.695 2.4649 4032.25
6 1.52 59 89.68 2.3104 3481
7 1.57 61 95.77 2.4649 3721
8 1.65 72 118.8 2.7225 5184
9 1.62 66 106.92 2.6244 4356
10 1.78 72 128.16 3.1684 5184
11 1.83 84 153.72 3.3489 7056
12 1.78 82 145.96 3.1684 6724
19.46 783 1282 31.7 52297
a) Halle el coeficiente de correlación
n ∑ XY −∑ X ∑ Y
r= 2
√ n ∑ X −¿¿ ¿
r= 0.934
Interpretación : Existe una correlación positiva de 93.4% entre el peso y la estatura
b) Halle el coeficiente de determinación
R2 = ( 0.934 )2 = 0.87
Y
peso
87%
13%
X
Los factores que lo afectan pueden ser
altura la obesidad u otros males
Interpretación : El peso es afectado o depende de la altura en un 87 %, el 13% lo afectara
otros factores como el la obesidad u otros males
BONDAD DE AJUSTE DEL MODELO
Dado el modelo lineal en la ecuación de regresión:
^y =−73.97+85.94 x
La ecuación matemática mide la validez de la estimación en un 87.97%
Si la estatura fuera 1.60, cuanto seria el peso esperado
ESTADISTICA GENERAL
Como x = 1.60
y=¿ ^y =−73.97+85.94 ( 1.60 )=63.534
Rpta:___ Si la estatura fuera 1.60m , el peso esperado será de 63.534 kg,