Lab - Correlation Analysis in Python
• Documentar resultados en cada gráfico.
• Observe la diagonal de izquierda a derecha en la tabla de correlación generada
arriba. ¿Por qué la diagonal está plagada de 1? ¿Se trata de una coincidencia?
Explique.
No, no es una coincidencia. El 1 representa la correlación entre una variable
y sí mismo. La correlación de cualquier variable determinada con sí misma
siempre da 1 (correlación completa).
• Si continuamos observando la tabla de correlación que figura arriba, notaremos
que los valores se duplican; los valores debajo de la diagonal 1 tienen valores
homólogos duplicados sobre la diagonal 1. ¿Se trata de una coincidencia?
Explique.
No, no es una coincidencia. La duplicación se produce porque los valores de
correlación no dependen del orden de la variable. En otras palabras, corr(A,B)
= corr(B,A), donde A y B son variables para las que se calcula la correlación.
• Muchos pares de variables presentan una correlación cercana a cero. ¿Qué
significa?
El coeficiente de correlación r cercano a cero indica débil o sin correlación.
La correlación débil sugiere que el tamaño del cerebro tiene poco que ver
con la inteligencia de una persona.
• ¿Por qué se separan los géneros?
Debido al tamaño de los cuerpos (alturas y pesos), la separación se hizo para
evitar sesgar los resultados.
• ¿Qué variables tienen una correlación más estrecha con el tamaño del cerebro
(MRI_Count)? ¿Es eso lo que se espera? Explique.
La estatura y el peso corporal tienen una fuerte correlación, como se
esperaba. Los índices de inteligencia medidos a través de pruebas también
tienen una fuerte correlación, como se esperaba. Porque cuanto mayor es la
persona, más grande es la cabeza, y, en consecuencia, más grande es el
cerebro.