0% encontró este documento útil (0 votos)
135 vistas2 páginas

Cálculo de la Covarianza y Correlación

El coeficiente de correlación de Pearson mide la relación lineal entre dos variables cuantitativas, calculando la covarianza de las variables y dividiéndola por el producto de sus desviaciones estándar. Los valores de correlación van de -1 a 1, donde 1 es una correlación positiva perfecta, -1 es una negativa perfecta y 0 indica ausencia de relación lineal entre las variables.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOC, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
135 vistas2 páginas

Cálculo de la Covarianza y Correlación

El coeficiente de correlación de Pearson mide la relación lineal entre dos variables cuantitativas, calculando la covarianza de las variables y dividiéndola por el producto de sus desviaciones estándar. Los valores de correlación van de -1 a 1, donde 1 es una correlación positiva perfecta, -1 es una negativa perfecta y 0 indica ausencia de relación lineal entre las variables.
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOC, PDF, TXT o lee en línea desde Scribd

El coeficiente de correlación de Pearson es un índice estadístico que mide la relación lineal entre dos variables

cuantitativas. A diferencia de la covarianza (busca comparar los resultados obtenidos en diferentes grupos de una
variable cuantitativa pero corrigiendo las posibles diferencias existentes entre los grupos en otras variables que
pudieran afectar también al resultado (covariantes) la correlación de Pearson es independiente de la escala de
medida de las variables.

El cálculo del coeficiente de correlación lineal se realiza dividiendo la covarianza por el producto de las desviaciones
estándar de ambas variables:

Siendo:

σXY la covarianza de (X,Y)

σX y σY las desviaciones típicas de las distribuciones marginales.

El valor del índice de correlación varía en el intervalo [-1, +1]:

 Si r = 0, no existe relación lineal. Pero esto no necesariamente implica una independencia total entre las
dos variables, es decir, que la variación de una de ellas puede influir en el valor que pueda tomar la otra.
Pudiendo haber relaciones no lineales entre las dos variables. Estas pueden calcularse con la razón de
correlación.
 Si r = 1, existe una correlación positiva perfecta. El índice indica una dependencia total entre las dos
variables denominada relación directa: cuando una de ellas aumenta, la otra también lo hace en idéntica
proporción.
 Si 0 < r < 1, existe una correlación positiva.
 Si r = -1, existe una correlación negativa perfecta. El índice indica una dependencia total entre las dos
variables llamada relación inversa: cuando una de ellas aumenta, la otra disminuye en idéntica proporción.
 Si -1 < r < 0, existe una correlación negativa.

DEFINICION:
Correlación: es la relación que existe entre dos variables, su intensidad y su sentido (positivo o negativo).
Covarianza: promedio de las desviaciones conjuntas de dos variables sobre sus respectivas medias, no es una
medida adecuada de la relación que hay entre dos variables, pues su valor esta relacionado con el valor de la
media de X y con el valor de la media de Y; por este motivo, si cambiamos la unidad de medida la covarianza se ve
modificada. El valor de la covarianza depende de la unidad de medida.
Para evitar el efecto de la covarianza las varianzas de X e Y, se dividen las PUNTUACIONES DIFERENCIALES, por
las respectivas DESVIACIONES TIPICAS, este nuevo índice es invariante ante cualquier cambio en la unidad de
medida; y es el COEFICIENTE DE CORRELACION DE PEARSON.

CONDICIONES DE APLICACIÓN:
 Que las variables estén medidas al menos en escala intervalar
 Que se de una relación lineal entre ellas, es decir, que los puntos del diagrama de dispersión se posicionen
en la forma aproximada de una línea recta.
 Por lo tanto utilizar la correlación lineal de pearson presupone la sospecha de que entre grupos los grupos
de puntuaciones se da una relación lineal.

PROPIEDADES:
a. El coeficiente de correlación de Pearson esta comprendido entre los valores 1 y -1.
b. El caso de que (rxy) valga 1, tendrá que cumplirse que para cada pareja de valores, sus
PUNTUACIONES TIPICAS son iguales: Zx=Zy. En el otro extremo si rxy vale -1, se cumple que
para todo par de valores, las PUNTUACIONES TIPICAS son iguales pero con distinto signo:
Zx= -Zy.
c. En el caso de que rxy sea cero, lo que sucede es que no hay relación lineal, entre las variables
medidas.
d. La transformación lineal de las variables no modifica el valor del coeficiente de correlación,
aunque si podría cambiar de signo. Es decir, si calculamos la correlación entre las variables X
e Y, el valor será, en valor absoluto, el mismo que obtengamos entre la variable ax+b, donde a
y b son constantes.
INTERPRETACION:
Descripción:
 la correlación entre dos variables es cuando a puntuaciones por encima de la media en X corresponde
puntuaciones por encima de la media en Y. POSITIVA
 a puntuaciones por debajo de la media en X corresponden, puntuaciones por debajo de la media en Y.
POSITIVA
 la correlación ente X e y será negativa cuando las puntuaciones por encima de la media en X corresponde
con puntuaciones por debajo de la media en Y, y viceversa.
Si tenemos en cuenta el valor de la correlación se puede afirmar que un coeficiente de correlación de pearson igual
a 1 o -1, implica que en el diagrama de dispersión correspondiente a las variables X e Y los puntos se disponen a lo
largo de una línea recta, y por lo tanto, podemos decir que la covariacion entre ambas variables es total.
Un coeficiente de variación igual o próximo a cero indica que no hay relación lineal, aunque podría haber otro tipo
de relación no lineal.
La existencia de correlación no implica que deba existir una relación causal directa, o sea que una es causa de la
otra.

Ejemplo:
 El equipo directivo de una escuela desea saber la relación que existe entre el tiempo semanal que dedican
los alumnos al estudio, y las calificaciones medias de los mismos al final del trimestre. Se eligen 11 alumnos
y calcular el coeficiente de correlación de pearson.
 Se saca la media de las puntuaciones, la covarianza ambas de cada una de las variables.
 Suponiendo que la covarianza sea positiva, indicaría cierta tendencia a que a un tiempo semanal de estudio
por encima de la media corresponden a las calificaciones por encima de media, y tiempo semanal por
debajo de la media corresponde a calificaciones por debajo de la media.
 Para calcular pearson se toman los resultados de las medias y covarianzas y se calcula la desviación típica
de X e Y, por lo tanto hay que sacar las varianzas respectivas.
 Suponiendo que el resultado del coeficiente de pearson sea alto (cuanto mas cerca del 1 mas alto, cuanto
mas cerca del -1 mas bajo), quiere decir que a puntuaciones altas les corresponden altas horas de estudio
semanal.

También podría gustarte