ANÁLISIS DE CORRESPONDENCIAS
Es una técnica descriptiva o exploratoria cuyo objetivo es resumir una gran cantidad de datos
en un número reducido de dimensiones, con la menor pérdida de información posible. En esta
línea, su objetivo es similar al de los métodos factoriales, salvo que en el caso del análisis de
correspondencias el método se aplica sobre variables categóricas u ordinales.
El análisis de correspondencias simples se utiliza a menudo en la representación de datos que
se pueden presentar en forma de tablas de contingencia de dos variables nominales u
ordinales. Otras utilizaciones implican el tratamiento de tablas de proximidad o distancia entre
elementos, y tablas de preferencias.
Si se trata de una tabla de contingencia de dos variables cualitativas, una variable cuyas
categorías aparecen en filas y la otra variable cuyas categorías son representadas en columnas,
el análisis de correspondencias consiste en resumir la información presente en las filas y
columnas de manera que pueda proyectarse sobre un subespacio reducido, y representarse
simultáneamente los puntos fila y los puntos columna, pudiéndose obtener conclusiones sobre
relaciones entre las dos variables nominales u ordinales de origen.
La extensión del análisis de correspondencias simples al caso de varias variables nominales
(tablas de contingencia multidimensionales) se denomina Análisis de Correspondencias
Múltiples, y utiliza los mismos principios generales que la técnica anterior. En general se
orienta a casos en los cuales una variable representa ítems o individuos y el resto son variables
cualitativas u ordinales que representan cualidades.
Entre la utilización del Análisis de Correspondencias Simple y Múltiple, estudios:
Preferencias de consumo en Investigación de Mercados.
Posicionamiento de empresas a partir de las preferencias de consumidores.
Búsqueda de tipologías de individuos respecto a variables cualitativas (patrones de
enfermedades en medicina, perfiles psicológicos, comportamiento de especies en
biología, etc.).
INTRODUCCIÓN: OBJETIVOS DE LA TÉCNICA.
El Análisis de Correspondencias tiene dos objetivos básicos:
Asociación entre categorías de columnas o filas: Medir la asociación de solo una fila o columna,
para ver, por ejemplo, si las modalidades de una variable pueden ser combinadas.
Asociación entre categorías de filas y columnas: Estudiar si existe relación entre categorías de
las filas y columnas.
El análisis de correspondencias solo requiere que los datos representen las respuestas a una
serie de preguntas y que estén organizadas en categorías. Dependiendo si existen dos o más
variables el análisis será simple o múltiple.
Uno de los objetivos del análisis de correspondencias es describir las relaciones existentes
entre dos variables nominales, recogidas en una tabla de correspondencias, sobre un espacio
de pocas dimensiones, mientras que al mismo tiempo se describen las relaciones entre las
categorías de cada variable. Para cada variable, las distancias sobre un gráfico entre los puntos
de categorías reflejan las relaciones entre las categorías, con las categorías similares
representadas próximas unas a otras. La proyección de los puntos de una variable sobre el
vector desde el origen hasta un punto de categoría de la otra variable describe la relación
entre ambas variables.
PROCESO DE ELABORACIÓN DE UNA TABLA DE DATOS PARA EL ANÁLISIS DE
CORRESPONDENCIAS SIMPLES.
Abra el conjunto de datos de muestra.
Elija Estadísticas > Análisis multivariado > Análisis de correspondencia simple.
En Datos de ingreso, seleccione Columnas de una tabla de contingencia, Nombres de
filas, Nombres de columnas,
Haga clic en Resultados y seleccione Perfiles de la fila. Haga clic en Aceptar.
Haga clic en Datos suplementarios. En Filas suplementarias, ingrese Nombres de filas,
Haga clic en Aceptar.
Haga clic en Gráficas. Seleccione Mostrar los puntos suplementarios en todas las
gráficas. Seleccione Gráfica simétrica que muestra sólo las filas y Gráfica de fila
asimétrica que muestra las filas y las columnas.
Haga clic en Aceptar en cada cuadro de diálogo.
EJEMPLO
Un gerente de investigación universitaria desea determinar la forma cómo diez disciplinas
académicas se comparan entre sí en relación con cinco diferentes categorías de fondos. El
gerente recopila datos de clasificación de 2 factores de 796 investigadores.
Para esta clasificación de dos factores, las disciplinas académicas están en filas y las categorías
de fondos están en columnas. A es la categoría de fondos más alta, D es la más baja y la
categoría E no tiene fondos. El gerente realiza un análisis de correspondencia simple para
representar las asociaciones entre las filas y columnas.
El gerente también desea examinar datos complementarios que no se incluyeron en el
conjunto de datos principal. Los datos complementarios incluyen una fila adicional para los
investigadores de museos y una fila para las ciencias matemáticas, que es la suma de
matemáticas y estadística.
Abra el conjunto de datos de muestra, FondosInvestigación.MTW.
Elija Estadísticas > Análisis multivariado > Análisis de correspondencia simple.
En Datos de ingreso, seleccione Columnas de una tabla de contingencia e ingrese CT1-
CT5. En Nombres de filas, ingrese NombresFila. En Nombres de columnas, ingrese
NombresCol.
Haga clic en Resultados y seleccione Perfiles de la fila. Haga clic en Aceptar.
Haga clic en Datos suplementarios. En Filas suplementarias, ingrese FilaCompl1
FilaCompl2. En Nombres de filas, ingrese NombresFC. Haga clic en Aceptar.
Haga clic en Gráficas. Seleccione Mostrar los puntos suplementarios en todas las
gráficas. Seleccione Gráfica simétrica que muestra sólo las filas y Gráfica de fila
asimétrica que muestra las filas y las columnas.
Haga clic en Aceptar en cada cuadro de diálogo.
Interpretar los resultados
La tabla Perfiles de fila muestra las proporciones de cada categoría de fila por columna. Por
ejemplo, para Geología, el 3.5% de los investigadores se encuentra en la categoría de
financiamiento A, el 22.4% está en la categoría de financiamiento B, y así sucesivamente. El
total de cada fila indica la proporción de investigadores en todo el conjunto de datos. Por
ejemplo, el total para Geología es 0.107, lo que indica que el 10.7% de los investigadores se
encuentra en el campo Geología.
Puede utilizar los valores de las tablas Contribuciones de fila y Contribuciones de columna para
interpretar los diferentes componentes. La columna con la etiqueta Cal, es decir, calidad,
indica la proporción de la inercia representada por los dos componentes.
Por ejemplo, para las contribuciones de fila, Zoología (0.929) y Geología (0.916) son los campos
mejor representados por el desglose de los dos componentes. Matemáticas tiene la peor
representación, con un valor de calidad de 0.319. Para las contribuciones de columna, los dos
componentes explican la mayor parte de la variabilidad en las categorías de financiamiento B,
D y E. Las categorías con financiamiento A, B, C y D son las que más contribuyen al
componente 1, mientras que la categoría sin financiamiento, E, es la que más contribuye al
componente 2.
La gráfica de filas muestra las coordenadas principales de fila. El componente 1, que es el que
explica mejor Física y Zoología, muestra estos dos campos más alejados del origen, pero con
signo opuesto. Por lo tanto, el componente 1 contrasta las ciencias biológicas Zoología y
Botánica con Física. El componente 2 contrasta Bioquímica e Ingeniería con Geología.
En la gráfica asimétrica de filas, la escala de las filas corresponde a las coordenadas principales
y la escala de las columnas corresponde a las coordenadas estándar. Entre las categorías de
financiamiento, el Componente 1 contrasta los niveles de financiamiento, mientras que el
Componente 2 contrasta el recibir financiamiento (A hasta D) con el no recibir financiamiento
(E). Entre las disciplinas, Física tiende a mostrar el nivel de financiamiento más alto y Zoología
el más bajo. Bioquímica tiene a mostrar un nivel de financiamiento intermedio, pero el más
elevado entre los investigadores que no reciben financiamiento. Los Museos tienden a recibir
financiamiento, pero a un nivel más bajo que los investigadores académicos
ANÁLISIS DE CORRESPONDENCIAS SIMPLES.
El análisis de correspondencias simple En AC existe una matriz similar a la matriz de
correlaciones o de varianzas covarianzas en AFE denominada matriz de dispersión o matriz de
inercia. La matriz de inercia se obtiene multiplicando la matriz X cuyo término general es;
por la transpuesta de X. La matriz de inercia a partir de las filas viene dada por
La suma de los elementos de la diagonal de S equivale a la varianza inicial a factorizar y viene
dada por
El resto de los elementos de S equivalen a las covarianzas.
Análogamente la matriz de dispersión para las columnas se puede obtener mediante el
producto
La suma de la inercia de las filas (traza de la matriz X’X) es igual a la suma de la inercia de las
columnas (traza de la matriz XX’) y como s e puede comprobar la inercia es igual al estadístico
P2 dividido por el número de sujetos N. Una vez obtenida la matriz de inercia, el AC es
equivalente al ACP. Si recordamos, se obtiene la primera componente de manera que explique
la máxima varianza, la segunda componente de manera que explique la máxima varianza de la
restante y así hasta obtener tantas componentes como (J-1) (I-1).
La suma de los elementos de la diagonal de S equivale a la varianza inicial a factorizar y viene
dada por
El resto de los elementos de S equivalen a las covarianzas. Una vez obtenida la matriz de
inercia, el AC es equivalente al ACP. Si recordamos, se obtiene la primera componente de
manera que explique la máxima varianza, la segunda componente de manera que explique la
máxima varianza de la restante y así hasta obtener tantas componentes como (J-1) (I-1).
ANÁLISIS DE LOS COMPONENTES GRÁFICOS.
Gráfica de filas
La gráfica de filas muestra las coordenadas principales para las categorías de fila. Minitab
grafica los puntos de fila con círculos rojos, utilizando círculos completos para los puntos
regulares y círculos abiertos para los puntos complementarios.
Interpretación
Utilice la gráfica de filas para buscar relaciones entre las categorías de fila y como ayuda para
interpretar los componentes principales en relación con las categorías de fila. Los puntos que
están más lejos del origen indican categorías que son más influyentes. Los puntos situados en
los lados opuestos de la gráfica indican que un componente contrasta estas categorías.
Gráfica de columnas
La gráfica de columnas muestra las coordenadas principales para las categorías de columna.
Minitab grafica los puntos de columna con cuadrados azules, utilizando cuadrados completos
para los puntos regulares y cuadrados abiertos para los puntos complementarios.
Interpretación
Utilice la gráfica de columnas para buscar relaciones entre las categorías de columna y como
ayuda para interpretar los componentes principales en relación con las categorías de columna.
Los puntos que están más lejos del origen indican categorías que son más influyentes. Los
puntos situados en los lados opuestos de la gráfica indican que un componente contrasta estas
categorías.
Gráfica simétrica
La gráfica simétrica es una gráfica de coordenadas principales de filas y columnas en una
presentación conjunta. Las distancias de fila a fila y de columna a columna son las distancias
aproximadas de chi-cuadrada entre los perfiles respectivos.
Interpretación
Utilice la gráfica simétrica para buscar relaciones entre las categorías de fila y entre las
categorías de columna. También puede interpretar los componentes principales en relación
con las categorías de fila o las categorías de columna. Los puntos que están más lejos del
origen indican categorías que son más influyentes. Los puntos situados en los lados opuestos
de la gráfica indican que un componente contrasta estas categorías. En una gráfica simétrica,
los perfiles se muestran separados para facilitar la visualización de las distancias entre ellos.
Gráfica asimétrica de filas
La gráfica asimétrica de filas muestra las coordenadas principales de fila y las coordenadas
estandarizadas de columna en la misma gráfica. Las distancias entre los puntos de fila son las
distancias aproximadas de chi-cuadrada entre los perfiles de fila.
Interpretación
Utilice la gráfica asimétrica de filas para buscar relaciones entre las categorías de fila y columna
y como ayuda para interpretar los componentes principales. Los puntos que están más lejos
del origen indican categorías que son más influyentes. Los puntos situados en los lados
opuestos de la gráfica indican que un componente contrasta estas categorías. Cuanto más
cerca esté un punto correspondiente a una categoría de fila de un punto correspondiente a
una categoría de columna, mayor será el valor del perfil de fila de la categoría de columna.
Gráfica asimétrica de columnas
La gráfica asimétrica de columnas muestra las coordenadas principales de columna y las
coordenadas estandarizadas de fila en la misma gráfica. Las distancias entre los puntos de
columna son las distancias aproximadas de chi-cuadrada entre los perfiles de columna.
Interpretación
Utilice la gráfica asimétrica de columnas para buscar relaciones entre las categorías de fila y
columna y como ayuda para interpretar los componentes principales. Los puntos que están
más lejos del origen indican categorías que son más influyentes. Los puntos situados en los
lados opuestos de la gráfica indican que un componente contrasta estas categorías. Cuanto
más cerca esté un punto correspondiente a una categoría de columna de un punto
correspondiente a una categoría de fila, mayor será el valor del perfil de columna de la
categoría de fila.