ENP
Noemyz
20/8/2021
Actividad
1. Presentar las diferencias que existen entre los dos coeficientes presentados, si
existen.
2. Presentar un ejemplo donde se aplique el coeficiente tau de Kendall.
Solución:
A continuació n, se ilustran ejemplos para el coeficiente tau de Kendall, en el cual se van a
presentar dos casos sin empates y con empates.
Ejemplo 1 sin empates
Determinar la relació n entre las variables notas de universidad y salarios (m.m) donde el
salario comprende un rango de 13,5 a 40,5 millones de bolívares.
tabla
## Sujetos Notas_de_la_Universidad Salario
## 1 1 10 34.5
## 2 2 12 36.5
## 3 3 13 28.3
## 4 4 18 40.5
## 5 5 14 13.5
## 6 6 11 33.5
## 7 7 15 27.0
## 8 8 17 40.0
## 9 9 19 38.0
## 10 10 16 25.3
Se plantea el sistema de hipó tesis H O : ρ=0 vs H 1 : ρ≠ 0
Nivel de significancia α =0.05
Cargando la librería
library(Kendall)
## Warning: package 'Kendall' was built under R version 4.0.5
Mediante el siguiente có digo en R, arroja la siguiente sintaxis.
Kendall(Notas_de_la_Universidad,Salario)
## tau = 0.156, 2-sided pvalue =0.59151
Del anterior resultado, se puede observar una posible correlació n entre las variables notas
de universidad y salario (m.m) es de 0.156 lo cual indica que es baja y directamente
proporcional, es decir, el aumento de la variable notas de universidad corresponde al
aumento del salario y viceversa.
Ejemplo con empates
Utilizando el coeficiente de Tau de Kendall se desea determinar la asociació n entre la edad
y el peso de 13 sujetos:
Se plantea el sistema de hipó tesis H O : ρ=0 vs H 1 : ρ≠ 0
Nivel de significancia α =0.05
tabla2
## Sujetos Edad Peso
## 1 1 75 96.5
## 2 2 19 84.5
## 3 3 45 94.5
## 4 4 30 72.0
## 5 5 35 86.5
## 6 6 19 80.5
## 7 7 90 99.0
## 8 8 46 87.0
## 9 9 22 72.0
## 10 10 97 108.5
## 11 11 69 99.5
## 12 12 32 96.0
## 13 13 25 87.5
Mediante el siguiente có digo en R, arroja la siguiente sintaxis.
summary(Kendall(Edad,Peso))
## Score = 50 , Var(Score) = 266.6795
## denominator = 77
## tau = 0.649, 2-sided pvalue =0.0026948
La correlació n entre las variables edad y peso es de 0.649 lo cual indica que es media y
directamente proporcional, es decir, el aumento de la variable edad corresponde al
aumento del peso y viceversa
Dado que el valor de p − v a l o r es menor que el nivel de significancia α =0.05, se rechaza la
hipó tesis nula H 0, es decir el el valor del coeficiente de correlació n de rangos de Kendall
(Tau-b) es diferente de cero.
3. Presentar un ejemplo donde se aplique el coeficiente de correlació n de rangos de
Spearman.
Solución:
A continuació n, se ilustran ejemplos para l coeficiente de correlació n r s de rangos de
Spearman, en el cual se van a presentar dos casos sin empates y con empates.
Ejemplo sin empates
Se realiza un estudio para determinar la asociació n entre la concentració n de nicotina en
sangre de un individuo y el contenido en nicotina de un cigarrillo.
X =C o n c e nt r a c i ó n d e N ic o t i n a e n s a n g r e
Y =C o n t e n id o d e N ic o t i n a p o r c i g a r r il lo
Se plantea el sistema de hipó tesis H O : ρ=0 vs H 1 : ρ≠ 0
Nivel de significancia α =0.05
datos1
## X Y
## 1 185.7 1.51
## 2 197.3 0.96
## 3 204.2 1.21
## 4 199.9 1.66
## 5 199.1 1.11
## 6 192.8 0.84
## 7 207.4 1.14
## 8 183.0 1.28
## 9 234.1 1.53
## 10 196.5 0.76
Se carga la libreria
library(pspearman)
Mediante el siguiente có digo en R, arroja la siguiente sintaxis.
cor.test(X,Y,method ="spearman", exact = TRUE)
##
## Spearman's rank correlation rho
##
## data: X and Y
## S = 120, p-value = 0.4483
## alternative hypothesis: true rho is not equal to 0
## sample estimates:
## rho
## 0.2727273
Dado que el p − v a l o r=0.4483>α =0.05, no se rechaza la hipó tesis nula H 0,es decir la
concentració n de nicotina en sangre de un individuo y el contenido en nicotina de un
cigarrillo, no estan correlacionadas.
Ejemplo con empates
En una academia de baile, se desea estudiar si existe correlació n entre el nú mero de días
que los alumnos faltan a la academia y el nú mero de evaluaciones reprobadas. Para ello, se
seleccionó aleatoriamente una muestra de 10 alumnos de las cuales se obtuvieron los
siguientes resultados:
N d e d í a s q u e f al t a n l o s a lu m n o s a la a c a d e m ia=x
N d e e v al u a c io n e s r e p r o b a d a s= y
datos2
## x y
## 1 0 0
## 2 0 0
## 3 0 1
## 4 2 1
## 5 3 1
## 6 5 2
## 7 7 1
## 8 7 3
## 9 12 2
## 10 15 3
Mediante el siguiente có digo en R, arroja la siguiente sintaxis.
cor.test(x,y,method ="spearman",alternative = "t", exact = FALSE,continuity =
FALSE)
##
## Spearman's rank correlation rho
##
## data: x and y
## S = 26.397, p-value = 0.002351
## alternative hypothesis: true rho is not equal to 0
## sample estimates:
## rho
## 0.8400198
Mediante el cá lculo del coeficiente de correlació n de rango de Spearman se concluye la
existencia de una asociació n positiva del 84 % entre el nú mero de días que los alumnos
faltan a la academia y el nú mero de evaluaciones reprobadas, por lo tanto es una
correlació n directamente proporcional y muy fuerte. Se dice que es directamente
proporcional ya que mientras má s faltas tengan los alumnos en la academia, mayores será n
las evaluaciones reprobadas.
4. Es posible identificar la asociació n para este par de casos grá ficamente.
Solución:
De acuerdo a los resultados ilustrados anteriormente, si es posible identificar la asociació n
grá ficamente para las mediadas de asociaciones (coeficiente tau de Kendall y coeficiente
rangos de Spearman).
A continuació n, veamos lo dicho anteriormente de manera grá fica para ambos coeficientes
coeficiente tau de Kendall
library(ggplot2)
ggplot(data = tabla1, aes(x = Notas_de_la_Universidad, y =Salario)) +
geom_point() +
xlab('Notas_de_la_Universidad') +
ylab('Salario') +
ggtitle('Relación entre notas de universidad y salarios (m.m)') +
theme_minimal()
De acuerdo al primer ejemplo, observe que mediante el diagrama de dispersió n no se
puede evidenciar una asociació n entre las variables notas de universidad y salarios (m.m),
dado que a simple vista no se evidencia ningú n tipo de comportamiento.
grafico2<-ggplot(tabla2, aes(Edad,Peso)) + geom_point()+ggtitle('Relación
entre Edad y peso de 13 sujetos') +
theme_minimal()
grafico2
Ahora en este caso, si es claro observar una asociació n entre las variables Edad y peso de
13 sujetos
Coeficiente rangos de Spearman
ggplot(data =datos1, aes(X,Y)) +
geom_point() +
xlab('Concentración_de_Nicotina_en_sangre') +
ylab('Contenido_de_Nicotina_por_cigarrillo') +
ggtitle('Relación entre Concentración_de_Nicotina_en_sangre y
Contenido_de_Nicotina_por_cigarrillo') +
theme_minimal()
ggplot(data =datos2, aes(x,y)) +
geom_point() +
xlab('N_de_días_que_faltan_los_alumnos_a_la_academia') +
ylab('N_de_evaluaciones_reprobadas') +
ggtitle('Relación entre x e y') +
theme_minimal()
De manera aná loga mediante los anteriores grá ficos se puede identificar la asociaciones
entre las variables en estudios para Coeficiente rangos de Spearman.