Lebart ACS
Lebart ACS
(Traducción provisional) 1
1.3 Análisis de correspondencias
Análisis de correspondencias
1
Los ancestros más lejanos del análisis de correspondencias se presentaron de forma totalmente
independiente, Richardson y Kuder (1933) y Hirschfeld (1935). Los primeros autores pretendían una mejor
selección de vendedores de la sociedad Procter and Gamble, mientras que el último estudió una propiedad de
estadística matemática. Esta variedad de contextos es característica del análisis de correspondencias, método
Tabla 1.3 – 1. Tabla de contingencia, repartición de 592 mujeres según los colores de sus ojos
y de sus cabellos
En las filas se presenta la variable “color de los ojos” con n = 4 modalidades (o categorías)
y en las columnas aparece la variable “color del cabello” con p = 4 modalidades. En la intersección
de una fila y una columna, se tiene el número kij de mujeres que tienen simultáneamente el color i de
ojos y el color j del cabello. El total marginal ki. Es el número de mujeres con los ojos de color i,
mientras que el total marginal k.j es el número de mujeres con el cabello de color j.
Se tienen las siguientes relaciones:
p n n p
k i o . = ∑ k ij k o j = ∑ k ij ∑ ∑k ij =k
j =1 i =1 i =1 j =1
tanto útil en la práctica como estimulante desde el punto de vista teórico. Cf. las referencias históricas de Hill
(1974), Benzécri (1982 a).
1
Una presentación técnica más detallada será el objeto de los parágrafos siguientes de la misma
sección.
Hay independencia entre el color de los ojos y el color del cabello? De lo contrario, qué
tipos de asociaciones existen entre tales colores?
f ij k ij
y los perfiles columna: =
f•j k• j
La tabla 1.3 - 2 de los perfiles fila (multiplicados por 100) indican la repartición del color
del cabello para cada modalidad de color de los ojos. Estas son, en resumen, las probabilidades
condicionales de tener cabello de color j dado que los ojos son de color i. Esta repartición sobre el
conjunto de la población estudiada da el perfil medio:
k• j
f.j =
k
La tabla 1.3 - 3 de perfiles columna (multiplicados por 100) contiene la repartición de los
colores de los ojos según cada modalidad de color del cabello y el perfil medio del color de los ojos:
ki•
f i• =
k
b - Hipótesis de independencia
Nos interesamos en las relaciones eventuales entre colores de ojos y de cabello. Se dice que
hay independencia entre dos variables aleatorias i y j que toman sus valores sobre dos conjuntos de
tamaño n y p, donde la ley conjunta es pij y las leyes marginales pi. y p.j , si para todo i y para todo j
se tiene (con las notaciones usuales):
pij = pi o po j
La traducción de esta relación en términos de estimaciones empíricas es la siguiente:
f ij = f io f o j
Naturalmente, así se cumpla la hipótesis de independencia, tal relación es solamente
aproximadamente cierta. El “test” estadístico clásico χ2 de Karl Pearson para las tablas de
contingencia permite precisamente apreciar la desviación entre las dos leyes empíricas fij y fi. f.j .
Consultemos la tabla 1.3 - 4 de frecuencias observadas fij que es la tabla 1.3 - 1 dividida por
su suma (592) y multiplicada por 100 para mayor legibilidad.
Dentro del 37% de las mujeres con ojos marrones por ejemplo, se debe observar, bajo la
hipótesis de independencia, 18% de mujeres pelinegras (es decir alrededor del 7% del conjunto de
las mujeres, en lugar del 11% realmente observado), 48% con cabello castaño (es decir 18% en
lugar de 20%), etc.
Construimos la tabla de “frecuencias teóricas” fi. f.j bajo la hipótesis de independencia (cf.
tabla [1.3 - 5]:
Tabla 1.3 – 5. Tabla de frecuencias teóricas
Esta hipótesis se expresa también sobre los perfiles fila. En efecto, se deduce que, para
f ij
cualquier j: = fo j
f io .
Si todos los perfiles “color de los ojos” son idénticos entre si, y por consiguiente idénticos
al perfil medio correspondiente, hay independencia entre los colores de los ojos y entre los colores
de los cabellos ya que el conocimiento de un color de los ojos no cambia por la repartición del color
de los cabellos.
Lo mismo sucede para los perfiles columna donde, para cualquier i:
f ij
= f io
fo j .
Así, examinar las proximidades entre los perfiles es lo mismo que examinar la proximidad
entre cada perfil y su perfil medio, lo que permite estudiar la relación entre dos variables nominales,
es decir la desviación a la independencia. Sobre una tabla de dimensión importante, la lectura
directa de los perfiles fila y columna es difícil , lo mismo que la comparación de estos perfiles con
su perfil medio.
Vamos a ver como la construcción de una nube, la selección de un criterio de ajuste y un
criterio de distancia, se impone por la naturaleza misma de los datos analizados.
f ij
; j = 1,2..... p
fi .
El cual se afecta con un peso fi. que es su frecuencia relativa.
p
f ij
Puesto que: ∑f = 1 , los n puntos de la nube están situados en un subespacio de p - 1
i =1 io .
dimensiones.
El centro de gravedad de esta nube es el promedio de los perfiles fila afectados por sus
pesos y corresponde al perfil medio, es decir al perfil de los cabellos sobre el conjunto de la
población. Su j-ésima componente da:
n f ij
∑f
i =1
io
f io .
= fo j
El centro de gravedad de la nube de perfiles columna es el perfil medio del color de los
ojos. Su i-ésima componente da:
p
f ij
∑f oj
fo j .
= f io
i =1
d - Criterio de ajuste
Se busca representar geométricamente las similitudes entre las diferentes modalidades de
una misma variable, lo que nos conduce a representar las proximidades entre perfiles y el perfil
medio definido sobre el conjunto de la población1 . Esto nos lleva, como en el análisis en
componentes principales en el caso de los puntos individuos, a considerar la nube de individuos
centrada sobre su centro de gravedad.
En la construcción de las nubes de Rp y de Rn (cf. tablas 1.3 - 2 y 1.3 -3), la selección de los
perfiles como coordenadas dan a todas las modalidades de color de los ojos y a las de color del
cabello la misma importancia. La importancia se recupera luego, a través del peso con que se afecta
a cada punto (proporcional a su frecuencia), con el fin de no privilegiar a las clases de baja
frecuencia y respetar la repartición real de la población. Este peso intervendrá por una parte en el
cálculo de las coordenadas del centro de gravedad de la nube y por otra en el criterio de ajuste.
Para el cálculo del ajuste, la cantidad a maximizar será entonces las suma de cuadrados
ponderada de las distancias entre los puntos y el centro de gravedad de la nube (es decir la inercia
de la recta de longitud máxima de la nube) utilizando una distancia entre perfiles que se va a definir.
1
Una nube de puntos concentrada alrededor de su centro de gravedad es una nube en la cual los
puntos perfiles están próximos del perfil medio, y por lo tanto se traduce en cierta independencia entre las
dos variables nominales.
1
La inercia total de las nubes de puntos fila (o de puntos columna) calculada con esta distancia es
proporcional al clásico χ2 de Karl Pearson utilizado para probar la independencia de las filas y las columnas
de una tabla de contingencia. De ahí el nombre de distancia del χ2 .
(j)
Perfil i: f ij
(i ) “color de los ojos
gris“ f i• ( j )
Perfil i’:
“color de los ojos
fi' j
(i’)
azul“
f i '• ( j )
f - Equivalencia distribucional
La propiedad de equivalencia distribucional permite agregar dos modalidades de una misma
variable que tengan sus perfiles idénticos en una nueva modalidad afectada de la suma de sus pesos,
sin que cambien, ni las distancias entre las modalidades de esta variable, ni las distancias entre las
modalidades de la otra variable.
Si por ejemplo los dos perfiles fila i’ e i” son idénticos en Rp , se agregan en un perfil fila i
donde el peso será la suma de las frecuencias de los dos perfiles i’ e i” . Los dos puntos están
confundidos y la unión no modifica las configuración de la nube en Rp .
p p
R R
(i’;fi’•) (i’;fi’•)
0 0
Pero sobretodo, las distancias entre columnas permanecen invariantes. Lo mismo sucede
para los perfiles columna en Rn donde se cumplen las mismas propiedades.
Esta propiedad es fundamental porque garantiza una cierta invarianza de los resultados con
respecto a la nomenclatura seleccionada para la construcción de las modalidades de una variable,
bajo la condición de agrupar modalidades con perfiles semejantes.
No se pierde información al agregar ciertas clases y tampoco se gana al subdividir clases
homogéneas.
j j’ j j’
i’ i=i’+ i”
d2 (j,j’) d2(j,j’)
Figura 1.3 – 3. Equivalencia distribucional: invarianza de las distancias entre columnas con
respecto a la agregación de filas
Eje 2
[Link]
[Link]
[Link] Eje 2
Eje 1
[Link]
[Link]
Consideremos ahora el histograma que describe el perfil de cabello negro según el color de
los ojos (cf. tabla 1.3 - 3 de los perfiles columna) representados en la figura 1.3 - 5.
80
60
40
20
Eje 2
[Link]
[Link]
[Link] Eje 2
[Link]
Baricentro de los
puntos i
Eje 1
“color de los ojos”
[Link]
[Link]
Figura 1.3 – 6. Posición del punto “pelinegros” como baricentro de los puntos “colores de los
ojos”
Eje 2
[Link]
[Link]
[Link] Eje 2
[Link] [Link]
[Link]ño
Eje 1
[Link]
[Link]
[Link]
Figura 1.3 – 7. Posición de los puntos “colores de ojos” y posicionamiento de los puntos
“colores del cabello” en baricentros
[Link]
Eje 2 [Link]
Eje 2
[Link]
[Link]
[Link]
Eje 1
[Link]
[Link]ÑO [Link]
[Link]
Figura 1.3 – 8. Posición de los puntos “colores del cabello” y posicionamiento de los “colores
de ojos” en baricentros
1
Esta posibilidad se debe al hecho de que las coordenadas del origen (los perfiles) son números
positivos donde la suma da 1.
[Link] Eje 2
[Link]
[Link]
[Link]
Eje 1
[Link]ÑO
[Link]
[Link]
[Link]
Esto es a priori imposible por la definición misma de baricentro, ya que cada conjunto
deberá estar contenido en el otro. Sin embargo es posible forzar esta representación dilatando (sobre
cada eje) los centros de gravedad (figura 1.3 - 9). Se puede entonces representar sobre los mismos
ejes (y por lo tanto sobre el mismo plano) el conjunto de las filas y el de las columnas con el fin de
aproximarse a la situación ideal. Las relaciones serán cuasi-baricéntricas (cf. § 1.3.3).
Los ojos azules se asocian al cabello rubio, los ojos marrones al cabello negro. El cabello
pelirrojo es atraído por los ojos grises y verdes que ellos caracterizan. La categoría de cabello
castaño está muy próxima del origen del plano de representación, que es el perfil medio y no tiene
especificidad en cuanto al color de ojos1.
Nosotros veremos que el desarrollo del análisis de correspondencias, que tiene en cuenta los
roles simétricos de las filas y las columnas de la tabla de contingencia y las propiedades de la
distancia χ2 , conduce naturalmente a las relaciones bibaricéntricas (tiene un coeficiente que es el
coeficiente de dilatación que permite la representación simultánea única).
1
La mayoría de las veces se dispone de una tabla de datos de dimensión importante y la
representación de la nube de puntos no dilatada y de los baricentros correspondientes, en uno de los espacios,
produce una gráfica confusa debido a que los baricentros serán localizados cerca al origen del plano. Una sola
representación simultánea, la representación llamada cuasi-baricéntrica, debido a la dilatación de las nubes de
puntos que ella necesita, ofrece la ventaja de una lectura más fácil de la gráfica.
i kij kj•
k•j k
j j j
fij fij
i 1 i fij fj• i fj•
fj• fj•
f•j 1 f•j 1 1 1
Nube de n Nube de p
puntos en R p puntos en Rn
Rp Rn
j M árgenes fila D n
i fij fj• 0
Perfiles fila D -1 n F
Frecuencias f ij
relativas F
0 f io ( j )
0 Perfiles co lumna D -1 p F’
f•j
p f ij
0
f o j ( i )
M árgenes columna D p
Las dos nubes de puntos (en el espacio de las columnas y en el espacio de las filas) se
construyen de maneara análoga. Nosotros recapitulamos aquí los elementos de base del análisis que
va a permitir la construcción de los factores.
Notas
1) La matriz N de pesos de un espacio esta ligado a la métrica M utilizada en el otro espacio.
2) Existe una diferencia fundamental con el análisis en componentes principales: las
transformaciones hechas sobre los datos brutos en los dos espacios son idénticas (pues los
conjuntos puestos en correspondencia juegan papeles análogos). Ellas corresponden a
transformaciones analíticas diferentes : la tabla de las nuevas coordenadas en el espacio de
las columnas no es la simple transpuesta de la tabla de las nuevas coordenadas en el espacio
de las filas. En componentes principales, de transformaciones muy diferentes se obtiene una
misma fórmula analítica.
De donde, debido a que los denominadores son iguales, se tiene para todo j:
f i1 j + f i2 j = f i0 j
Estos dos términos se reemplazan por un solo término A(i0) tal que:
2
1 f i0 j f i0 j '
A(i 0 ) = −
f i0 • f•j f • j '
1
La distancia euclidiana usual entre perfiles no posee la propiedad de equivalencia distribucional,
pero hay otras distancias que poseen esta propiedad (cf. Escofier, 1978).
Max ∑ f
u i
i• d 2 (i , O)
y que maximiza la cantidad:
u' D −p1 F' D n−1 FD −p1 u
con la restricción:
u' D −p1 u = 1
u es vector propio de la matriz:
S = F' D n−1FD −p1
1
Este eje esta asociado al valor propio igual a 1, llamado valor propio trivial.
2
Teniendo en cuenta la simetría de la tabla de contingencia, las demostraciones en el otro espacio se
deducen por permutación de los índices i y j (es decir transposición de F y permutación de las matrices Dp y
Dn.
En Rp Elementos de construcción En Rn
S = F' D n−1FD −p1 Matriz a diagonalizar T = FD −p1 F' D n−1
Su α = λ α u α Eje factorial Tv α = λα v α
r r
ψ α = D n−1FD −p1u α ϕ α = D −p1F ' D n−1 v α
p
Coordenadas factoriales
f ij n f ij
ψ αi = ∑ uαj ϕ αj = ∑ vαi
j =1 f i• f • j i =1 f i• f • j
∑f i •ψ αi = ∑ f • j ϕ αj = 0
[1.3-4]
i =1 j =1
∑f ψ
i•
2
αi = ∑ f • j ϕ 2 αj = λ α [1.3-5]
i =1 j =1
λα
ψ αi = vαj
f i•
λα
ϕ αj = uαj
f• j
1 p f ij
ψ αi =
λα
∑f
j =1
ϕ αj [1.3-12]
i•
1 n f ij
ϕ αj =
λα
∑f
i =1
ψ αi [1.3-13]
•j
1
Así, exceptuando el coeficiente de dilatación , las proyecciones de los puntos
λα
representativos de una nube, son, sobre un eje, los baricentros de las proyecciones de los puntos
representativos de la otra nube.
f ij
La matriz de término general que permite calcular las coordenadas de un punto i a
f i•
partir de todos los puntos j (relación [1.3-12]) es la tabla de los perfiles fila.
La coordenada de la modalidad i de una de las variables es la media de las modalidades j de
la otra variable ponderadas por las frecuencias condicionales del perfil de i. Del mismo modo, la
relación [1.3-13] muestra que la coordenada de la modalidad j es la media del conjunto de
modalidades i ponderadas por las frecuencias condicionales del perfil j.
Notas:
1) Todos los valores propios son necesariamente inferiores o iguales a . En efecto puesto que:
p
f ij
λ α ψ αi =
f
j =1 i •
∑
ϕ αj
se tiene:
min {ϕ α } ≤ j λ α ψ αi ≤ max {ϕ α } j
( )
j ( ) j
de donde:
max
()
{i
λ α ψ αi } ≤ max
( )j
{ϕ } αj
max
( )
{
j
λ α ϕ αj } ≤ max {ψ
(i )
αi }
como λα ≥ 0:
max
( )
{
j
λ α ϕ αj } ≤ max {ϕ
( j)
αj }
y finalmente:
λα ≤ 1:
2) Las relaciones cuasi-baricéntricas no son casos particulares de las relaciones de transición establecidas
en el análisis general pues las matrices “de paso” no son las transpuestas las unas de las otras.
f - Representación simultánea
Las relaciones cuasi-baricéntricas justifican la representación simultánea de filas y de
columnas. La figura 1.3-12 ilustra esquemáticamente el proceso del análisis de correspondencias
Los métodos factoriales se fundamentan en el cálculo de distancias entre puntos fila y
puntos columna, sin embargo, la distancia entre un punto fila y un punto columna no tiene sentido
debido a que esos puntos están en espacios diferentes. El análisis de correspondencias ofrece
.n filas p columnas
i
Tabla de
contingencia
Nube de n Nube de p
puntos en Rp puntos en Rn
∇
∇
∇
p
R ∇
∇ Rn
∇
∇
∇
∇ ∇
∇
Relaciones cuasi-baricéntricas
∇ ∇
∇
∇
∇ ∇
Representación simultánea
constituyen, para cada columna j, los perfiles columna de la tabla de datos con n
.
∑ pi = 1
i =1
II. Cada punto fila es el baricentro de los puntos columna j, cada punto columna esta afectado de la
f ij
masa qj, representando la parte de la modalidad j dentro de la modalidad i es decir: q j = .
fi •
p
Estas masas constituyen, para cada fila i, los perfiles fila de la tabla de datos con ∑q j =1
j = 1.
Definimos así a las relaciones estrictamente baricéntricas entre los dos conjuntos. Si ϕj
designa la coordenada del punto columna j sobre un eje, y si ψi designa la coordenada de un punto
fila sobre ese mismo eje, las condiciones I y II se escriben respectivamente:
n
f ij
ϕ = Dp−1F 'ψ
ϕ j =
∑f
i =1 •j
ψi
o sea p
f ij
ψ = D −1Fϕ
n
ψ =
i ∑f ϕj
j =1 i•
Estas relaciones son en general posibles de realizar simultáneamente, puesto que ellas
implican que cada conjunto este contenido dentro del otro. (Existe una solución trivial, para la cual
todos los puntos de los dos conjuntos están confundidos con el punto de abscisa 1).
Para aproximar esta situación ideal, buscamos un coeficiente β positivo y lo más cercano
posible a 1, tal que se tengan las relaciones:
ϕ = βDp−1F'ψ [1.3 - 14]
ψ = βD −1Fϕ [1.3 - 15]
n
Recordando que las coordenadas factoriales en Rn valen (cf. fórmula [1.3 - 11]):
r
ϕ α = λ α D −p1 u α
Se tiene:
D −p1F ' D n−1Fϕ = λϕ
1
Puesto que el coeficiente β debe ser superior o igual a 1, se demuestra igualmente de esta manera el
resultado ya establecido en el parágrafo (e) anterior según el cual, en análisis de correspondencias, todos los
valores propios son inferiores o iguales a 1.
2
Veremos igualmente en el capítulo 3 otras presentaciones del análisis de correspondencias (caso
particular del análisis canónico y discriminante). Otros puntos de vista complementarios son desarrollados por
Escoufier (1985, 1988).
las variables en fila y columna si el valor observado χ2 sobrepasa el valor χo2 que tiene una
probabilidad de ser sobrepasado inferior a un umbral predeterminado1.
El valor de la inercia es un indicador de la dispersión de la nube y mide la relación entre las
dos variables.
Sin embargo, no interesa solamente la dispersión de la nube sino sobretodo la existencia de
direcciones privilegiadas en la nube.
Se consultan las inercias de cada eje (valores propios) así como las tasas de inercia
correspondientes. Este análisis nos informa sobre la forma de la nube: forma “esférica” (sin
dirección privilegiada) o forma no esférica (direcciones privilegiadas).
Traza .2336
La tabla 1.3 - 8 da los valores de los tres valores propios no nulos del análisis de la tabla
1.3-1. La inercia total (0.2336), suma de los tres valores propios, multiplicada por la frecuencia total
de la tabla (592) da el valor 138.29 que debe ser una realización de un χ2 con 9 grados de libertad
bajo la hipótesis de independencia de las filas y de las columnas de la tabla. Un χ2 de 21.7 solo es
sobrepasado en un 1% de los casos (umbral 0.01).
La hipótesis de independencia de los colores de ojos y de cabello es por lo tanto rechazada.
Es en esta circunstancia donde el análisis de correspondencias intervendrá de manera útil, para
describir esta dependencia entre filas y columnas.
De una manera general, dos variables son independientes si los perfiles de sus modalidades
son idénticos (con las fluctuaciones de muestreo presentes) a los perfiles medios (cf. 1.3.3.b): la
inercia total es pequeña y no existe dirección privilegiada. Geométricamente, eso significa que
todos los puntos están concentrados alrededor del centro de gravedad de la nube, la cual sigue una
forma esférica. Esto se muestra en el esquema de la figura 1.3 - 13.
1
Esta manera de efectuar una prueba de hipótesis corresponde al uso clásico de las tablas estadísticas
que dan los valores χo2 para cada grado de libertad y para ciertos umbrales convencionales (generalmente 0.05
y 0.01). Ahora los programas de computador dan directamente la probabilidad de que χ2 calculado sea
sobrepasado. Es suficiente por lo tanto, sin recurrir a una tabla, comparar esta probabilidad con los umbrales
precedentes.
Perfil-medio
Envoltura próxima
al centro
Estos indicadores, basados de una parte en la inercia total y de otra parte sobre la inercia de
los ejes y sus tasas de inercia, tienen por lo tanto un interés en el momento de la interpretación.
En la figura 1.3 - 14 se esquematizan los principales casos. Nótese que en las situaciones 2
y 4, las nubes tienen tasas de inercia idénticas pero tienen inercia total diferente. En cambio las
situaciones 3 y 4 revelan dos nubes de la misma inercia total y tasas de inercia diferentes.
La prueba del χ2 permite detectar estas dos últimas situaciones, pero no permite poner en
evidencia la situación 2 (cf. sección 4.1 para el estudio de este aspecto).
En fin, la inercia de un factor mide la relación que el pone en evidencia. La inercia no puede
ser superior a 1. (cf. § 1.3.3.f). Un valor propio que tiende a 1 indica una dicotomía a nivel de los
datos; se obtiene para cada variable dos grupos de modalidades separando la nube de puntos en dos
subnubes. Esto puede significar igualmente la existencia de un grupo de puntos aislados de los
otros puntos (constituyendo entonces el otro grupo).
Direcciones
Tasa de inercia de los ejes
Forma “esférica” Forma “no-esférica”
Inercia
baja
I 1-INDEPENDENCIA 2-DEPENDENCIA
N • baja inercia total • baja inercia total
E • no hay dirección privilegiada • dirección privilegiada
R
C
I
A Inercia
3-DEPENDENCIA 4-DEPENDENCIA
fuerte • fuerte inercia total
• fuerte inercia total
• no hay dirección privilegiada • dirección privilegiada
Cuando dos valores propios son próximos a 1, se obtienen tres subnubes y las modalidades
de las variables se descomponen en tres grupos. Si todos los valores propios están próximos a 1,
cada modalidad de una variable esta en correspondencia casi exclusivamente con una sola
modalidad de la otra variable.
Entonces los valores propios pequeños (significan que los perfiles están próximos al perfil
medio) no deben impedir una interpretación de los ejes de inercia asociados. Ellos pueden revelar
una estructura interesante y más difícilmente perceptible. Este punto será reabordado en el capítulo
4, § 4.1.3.
J1 J2
I1 0
I2 0
Puede ser interesante analizar separadamente las dos subnubes definidas por las dos tablas
de correspondencias (I1, J1) e (I2, J2) .
J1 J2 J3
0 0
I1
I2 0 0
I3 0 0
I
0
Esta situación pone en evidencia “el efecto Guttman” que significa una redundancia de las
dos variables: del conocimiento de la fila i se puede deducir la columna j. Casi toda la información
esta dada por el primer factor.
A pesar de ello la tabla no es de rango 1 y se dispondrá de p-1 factores. Pero el segundo
factor es una función de segundo grado del primer factor. , el tercero es una función de tercer grado,
etc. La información dada por los eje de rangos siguientes muestran el mismo fenómeno. Sin
embargo el examen del segundo factor afina la interpretación del primer eje1.
Generalmente el efecto Guttman aparece cuando las variables son ordinales (variables
continuas transformadas en variables nominales). Un eje (a menudo el primero) opone los valores
extremos y algún otro eje opone los valores intermedios con los valores extremos. El efecto
Guttman pone a veces en evidencia una estructura trivial la cual podrá ser sin embargo interesante si
la forma parabólica no es perfecta. Los puntos de ruptura son entonces interesantes de analizar.
1
Sobre el efecto Guttman en análisis de correspondencias, cf. Benzécri (1973, capítulo II.B-7 y II.B-
10), Heiser (1986), Van Rijckevorsel (1987); Tenenhaus (1994, capítulo 7, §9).
a - Contribuciones
∑ Crα (i ) = 1
i =1
G i G G i
i
G i’ G i’ G i’
f o j ϕ α2j
Crα (i ) =
λα
con la relación:
p
∑ Crα ( j ) = 1
i =1
b - Cosenos cuadrados
Se busca apreciar si un punto está bien representado en el subespacio factorial. Los ejes
factoriales de cada espacio constituyen las bases ortonormales. El cuadrado de la distancia de un
punto a su centro de gravedad se descompone en la suma de cuadrados sobre sus ejes.
Para un punto i en Rp, se tiene:
2
p
1 f ij
d (i , G) = ∑
2
− fo j
j =1 f . j f i.
Nótese que la distancia es nula cuando el perfil del punto es igual al perfil medio.
El cuadrado de la proyección de la variable i sobre el eje α vale:
d α2 (i , G ) = ψ α2 i
Recordemos que:
∑
α
d α2 (i , G ) = d 2 (i , G )
Un punto i en Rp está mas o menos próximo al eje α. La proximidad entre dos puntos
proyectados sobre el eje α corresponde mejor a su distancia real si los puntos están próximos al eje.
i
d(i,G)
G α
dα(i,G) ψ αi
Figura 1.3 – 19. Proyección de un punto i sobre el eje α
2 d α2 (i , G ) ψ α2 i
Cosα (i ) = =
d 2 (i , G ) d 2 (i , G )
∑
α
2
Cosα (i ) = 1
i
G α G α
Cos2α(i)≅0 Cos2α(i)≅1
Aquí cabe decir que los n puntos fila pueden transponerse a los p elementos del otro
conjunto. Se mide la contribución relativa del factor α a la posición del punto j por el coseno
cuadrado de j:
2
ϕ α2 j
Cosα ( j ) =
d 2 ( j, G)
y se tiene para todo j igualmente:
∑
α
2
Cosα ( j ) = 1
Para analizar las proximidades entre puntos, nos interesamos sobretodo en los puntos que
tienen un coseno cuadrado elevado. Las proximidades entre estos puntos, observados en el
subespacio factorial, dan una buena imagen de sus proximidades reales.
Nota
Ni para las contribuciones ni para los cosenos cuadrados, hay valores “umbrales” a partir de los
cuales se pueda decir que tal o cual valor es “alto” o “bajo”. La apreciaciones se hacen
empíricamente, en función del conjunto de valores calculados y varían de un conjunto de datos a
otro1.
c - Ejemplo numérico
El ejemplo hace referencia siempre a análisis de correspondencias de la tabla 1.3 - 1. Las
coordenadas sobre el primer eje (tabla 1.3 - 9) muestran que el color de cabello “rubio” se opone a
todos los otros sobre el primer eje, pero sobretodo a “pelinegros”. El punto “rubio” tiene una
contribución de 71.7% al primer eje y un coseno cuadrado de 0.99: es decir que esta prácticamente
sobre este eje y no podrá caracterizar a los demás ejes. Notemos que el punto “pelirrojo” tiene una
contribución muy baja sobre el primer eje (1.0%).
Tabla 1.3 – 9. Coordenadas, contribuciones, cosenos cuadrados para el análisis de
correspondencias de la tabla 1.3 -1
+------------------------------------------+--------------------+----------------+----------------+
| COLUMNAS | COORDENADAS |CONTRIBUCIONES |COSENOS CUADRADO|
|------------------------------------------+--------------------+----------------+----------------|
| IDEN - ETIQUETA CORTA PESO R DIST | 1 2 3 | 1 2 3 | 1 2 3 |
+------------------------------------------+--------------------+----------------+----------------+
| CNEG - NEGRO 18.24 .30 | -.50 .21 -.06 | 22.2 37.9 21.6 | .84 .15 .01 |
| CCAS - CASTANO 48.31 .03 | -.15 -.03 .05 | 5.1 2.3 44.3 | .86 .04 .09 |
| CROJ - PELIROJO 11.99 .13 | -.13 -.32 -.08 | 1.0 55.1 31.9 | .13 .81 .05 |
| CRUB - RUBIO 21.45 .70 | .84 .07 -.02 | 71.7 4.7 2.2 | .99 .01 .00 |
|------------------------------------------+--------------------+----------------+----------------|
+---------------------------------------+---------------------+------------------+-----------------+
| FILAS | COORDENADAS | CONTRIBUCIONES |COSENOS CUADRADOS|
|---------------------------------------+---------------------+------------------+-----------------|
| IDENTIFICADOR [Link] DIST. | 1 2 3 | 1 2 3 | 1 2 3 |
+---------------------------------------+---------------------+------------------+-----------------+
| marrón 37.16 .25 | -.49 .09 -.02 | 43.1 13.0 6.7 | .97 .03 .00 |
| gris 15.71 .08 | -.21 -.17 .10 | 3.4 19.8 61.1 | .54 .34 .12 |
| verde 10.81 .15 | .16 -.34 -.09 | 1.4 55.9 31.9 | .18 .77 .05 |
| azul 36.32 .31 | .55 .08 .00 | 52.1 11.2 .3 | .98 .02 .00 |
+---------------------------------------+---------------------+------------------+-----------------+
El segundo eje (que corresponde como se ha visto a un valor propio cerca de diez veces más
pequeño que el primero) es esencialmente construido por el “pelirrojo” (55.1%) que se opone
simultáneamente a “pelinegro” y “rubio”. El color “pelirrojo” es el único bien representado sobre el
eje 2 (coseno cuadrado de 0.81). Para los puntos fila, el primer eje está construido casi
exclusivamente por los ojos “marrones” y “azules” (contribuciones de 43.1% y 52.1%), puntos
situados prácticamente sobre el eje (cosenos cuadrados de 0.97 y 0.98), el segundo eje está
sobretodo ligado a los ojos “verdes”.
1
Notemos que es usual multiplicar las contribuciones por 100 para expresar en porcentaje la
participación de cada punto.
(9.5%)
(89.4%)
Figura 1.3 – 21. Primer plano factorial para el análisis de la tabla 1.3 -1
Una observación de las coordenadas puede hacer pensar que los ojos “grises” y “verdes”
juegan un cierto papel en la construcción del primer eje. La figura 1.3 - 21 que utiliza las dos
primeras coordenadas, muestra la característica sugestiva de la representación gráfica simultánea de
las filas y las columnas. Ella permite interpretar las proximidades o distancias entre puntos de un
mismo conjunto por su asociación con los del otro conjunto.
Porqué por ejemplo el punto “[Link]” está más alejado que el punto “[Link]” sobre el
primer eje, muy dominante?. Porque los cabellos rubios están más caracterizados por los ojos azules
que a la inversa: en la tabla 1.3 - 3 (perfiles columna), 74% de rubios tienen los ojos azules,
mientras que observando la tabla 1.3 - 2 (perfiles fila) 44% de las personas de ojos azules tienen los
cabellos rubios.
En otros términos, en la relación cuasi-baricéntrica que permite ubicar el punto “[Link]”, el
punto “[Link]” tiene un peso relativo de 0.74, mientras que en la relación cuasi-baricéntrica que
permite posicionar el punto “[Link]”, el punto “rubio” solo tiene un peso relativo de 0.44.
k ij+ n
+ ; i = 1,2,..., n con k o j = ∑ k ij
+ +
k o j i =1
Se proyecta este punto j sobre el eje α utilizando la misma fórmula de transición [1.3 - 13]
que para las columnas de la tabla de contingencia es:
1 n k ij+
+
ϕ αj = ∑ ψ αi
λ α j =1 k o+j
Para una modalidad i de una variable puesta en fila suplementaria, se tendrá de modo
análogo (fórmula de transición 1.3 - 12):
1 p k ij+
ψ α+i = ∑ ϕ αj
λ α j =1 k i+o
Al igual que con los elementos analizados, las modalidades suplementarias se calcular e
interpretan como cuasi-baricentros.
Notas
1) Los elementos suplementarios, que no intervienen en la construcción de la nube, están afectados
por un peso nulo y su contribución es por lo tanto nula. En cambio los cosenos cuadrados sirven
de ayuda a la interpretación de estos elementos1 .
1
Para una vista de conjunto sobre el papel y la utilización de las variables suplementarias en análisis
de correspondencias, cf. Cazes (1982).
2
Esta nota vale igualmente para el análisis en componentes principales.
f ij f ij
El análisis con respecto al centro de gravedad se encuentra al reemplazar por − f• j ,
fi• fi•
f ij − f i • f • j
es decir por .
fi •
Este subespacio contiene al centro de gravedad G y a los ejes factoriales del análisis con
respecto a G. La suma de los componentes de estos factores es nula.
Análisis con respecto al origen inicial de los ejes Análisis con respecto al centro de gravedad de
la nube
u2
1 Η Η
i G
u2 u3 iG
1
u3
O 1 O
En el análisis con respecto al origen , la primera dirección u1 es el eje que une al origen con
el centro de gravedad de la nube ortogonalmente a Η. La ionercia proyectada sobre este eje vale 1,
igual a la distancia entre el origen y el centro de gravedad, puesto que la proyección de los puntos
sobre este eje se confunde con el centro de gravedad. Los p-1 ejes siguientes contenido en
Η.constituye una base que define las direcciones de las rectas de inercia máxima de la nube. El
análisis coincide con el de los p-1 primeros ejes con respecto al centro de gravedad (u°°1,…, u°°α, …,
u°°p-1).
El pésimo eje correspondiente a u1 da la dirección de Η. puesto que no está contenido en Η.
Su inercia (valor propio asociado) es nulo.
Las matrices a diagonalizar S de la nube no centrada y S°° de la nube centrada, tienen las
siguientes relaciones:
s ojj ′ = s jj ′ − f • j
y para 1 < α < p-1:
u αo = u α + 1 y λoα = λ α +1
u op = u 1 y λop = 0 y λ 1 = 1
Así en Rp (y es igual en Rn), es equivalente realizar el análisis de correspondencias sobre la
tabla de datos centrados de término general:
f ij
− f• j
fi•
1
Teniendo en cuenta el criterio de ajuste, se considera la inercia total de la nube centrada, igual a la
traza tr(S°) de S° y se tiene: tr(S°) = tr(S) - 1.
La matriz
$ −1 2 = D −1 2 F ′D −1 2 FD −1 2
A = D −p1 2 AD p p n p
es simétrica-y Aw =λw
Las matrices S y A tienen los mismos valores propios λ. Los vectores propios están ligados
por la relación:
u = Dp1/2w
Es más fácil diagonalizar la matriz A de término general:
n f ij f ij ′
a jj ′ = ∑
i =1 f i• f • j f • j′
Nota:
Es la matriz a diagonalizar si se toman como coordenadas iniciales del punto i, las p cantidades:
f ij
xi j = (j = 1,…,p)
f io fo j
En este caso la distancia χ2 entre dos puntos i e i’ se convierte, con la nuevas coordenadas, en la
distancia euclidiana usual:
2
f ij
p
f ij
d 2 (i , i ′) = ∑ −
j =1 f i . f.j f i ′. f . j
Esta transformación de la tabla de frecuencias relativas conduce a la diagonalización de una matriz
simétrica.
Notemos que las coordenadas del centro de gravedad son entonces:
Gj = f.j
y las coordenadas del punto i luego del centrado:
f ij f ij − f i o f o j
− foj =
f io foj f io foj
Tabla 1.3 – 10. Tablas de contingencia cruzando los tipos de contactos-medio (columnas) con
profesiones, sexo, edad, nivel de educación (filas)
Radio Tele Diario N. Diario R. Pre. Rev. Pren. TV
Profesiones
Agricultor 96 118 2 71 50 17
Microemp. 122 136 11 76 49 41
Ejecutivo 193 184 74 63 103 79
Prof. interm. 360 365 63 145 141 184
Empleados 511 593 57 217 172 306
Obrero cal. 385 457 42 174 104 220
Obrero no c. 156 185 8 69 42 85
Inactivo 1474 1931 181 852 642 782
Sexo
Hombre 1630 1900 285 854 621 776
Mujer 1667 2069 152 815 683 938
Edad
15-24 años 660 713 69 216 234 360
25-34 años 640 719 84 230 212 380
35-49 años 888 1000 130 429 345 466
50-64 años 617 774 84 391 262 263
1
Hay 12388 contactos para 4433 individuos encuestados. Las cifras publicadas aquí se han
redondeado y rectificado luego, los totales relativos a las diferentes particiones de la población pueden no
coincidir.
Se busca describir las afinidades eventuales entre los grupos socio-profesionales y los
diferentes tipos de medios.
El análisis de correspondencias de la tabla K conduce a los valores propios consignados en
la tabla 1.3 - 11.
Tabla 1.3 – 11. Valores propios, porcentajes de inercia para la tabla K, “Profesiones-
contactos medio” (8 primeras filas de la tabla 1.3 - 11)
No VALOR % %
PROPIO ACUMU
Como el número de grados de libertad n supera el valor 30, se considera que la variable
χ n2 − n es una variable normal estándar. Aquí u = 28.8 (28.8 desviaciones estándar de la
u=
2n
media). La hipótesis de independencia es evidentemente rechazada.
Dos factores son dominantes y representan cerca del 95% de la inercia total. Las
coordenadas y las ayudas a la interpretación correspondientes figuran en la tabla 1.3 - 12. También
aparecen igualmente las coordenadas y los cosenos cuadrados de las filas suplementarias.
Se nota que el elemento “Diario nacional” cuya frecuencia relativa es muy baja (3.54%)
tiene una distancia al punto medio (columna DIS) muy elevada: el perfil correspondiente es por lo
tanto atípico. El contribuye con el 74.6% en la construcción del primer eje, que está muy próximo
(coseno cuadrado : 0.99). Este mismo primer eje está caracterizado por la fila activa “Ejecutivo”
(profesional liberal, ejecutivos) y por la fila suplementaria “Superior” (nivel de educación superior).
El segundo eje separa la “Prensa Revista de Televisión” (asociada a las categorías
empleados y obreros, y los grupos de edad más jóvenes) de la prensa revista (Prensa TV excluida) y
Tabla 1.3 – 12. Pesos relativos ([Link]), Distancias al origen (DIS), coordenadas,
contribuciones y cosenos cuadrados de los elementos sobre los tres primeros ejes
|------------------------------------------+-------------------------------+--------------------------+--------------------------|
| FRECUENCIAS | COORDENADAS | CONTRIBUCIONES | COSENOS CUADRADOS |
|------------------------------------------+-------------------------------+--------------------------+--------------------------|
| IDEN - ETIQUETA CORTA PESO R DIST | 1 2 3 4 5 | 1 2 3 4 5 | 1 2 3 4 5 |
+------------------------------------------+-------------------------------+--------------------------+--------------------------+
| FRECUENCIAS ACTIVAS |
| |
| RADI - Radio 26.61 .00 | -.01 .02 -.05 .00 .00 | .4 1.8 70.4 .6 .1 | .08 .17 .75 .00 .00 |
| TELE - Televisión 32.04 .00 | .05 .00 .02 -.01 .01 | 6.6 .0 10.5 13.3 37.6 | .85 .00 .08 .04 .03 |
| DNAL - Diario Nacional 3.54 .29 | -.54 -.01 .02 -.04 -.01 | 74.6 .0 1.8 18.2 1.9 | .99 .00 .00 .01 .00 |
| DREG - Diario regional 13.46 .02 | .11 -.11 .01 -.01 -.02 | 11.5 22.4 .4 7.5 44.6 | .49 .49 .00 .01 .01 |
| PRRE - Prensa revista 10.52 .03 | -.09 -.13 .02 .04 .00 | 6.8 25.6 4.5 50.8 1.8 | .32 .62 .01 .05 .00 |
| PRTV - Prensa [Link] 13.84 .03 | .01 .16 .03 .01 -.01 | .1 50.1 12.4 9.6 14.0 | .00 .96 .03 .01 .00 |
|------------------------------------------+-------------------------------+--------------------------+--------------------------|
INDIVIDUOS ACTIVOS
+---------------------------------------+-------------------------------+--------------------------+--------------------------+
| INDIVIDUOS | COORDENADAS | CONTRIBUCIONES | COSENOS CUADRADOS |
|---------------------------------------+-------------------------------+--------------------------+--------------------------|
| IDENTIFICADOR [Link] DIST. | 1 2 3 4 5 | 1 2 3 4 5 | 1 2 3 4 5 |
+---------------------------------------+-------------------------------+--------------------------+--------------------------+
| Agricultor 2.86 .13 | .17 -.31 -.07 .01 .02 | 5.7 38.0 17.9 2.0 15.9 | .21 .74 .04 .00 .00 |
| Microemp. 3.51 .03 | .07 -.14 -.06 -.02 -.03 | 1.2 10.0 17.7 4.8 28.0 | .15 .67 .14 .01 .02 |
| Ejecutivo 5.62 .19 | -.43 -.06 .00 -.02 .01 | 75.0 2.9 .1 5.2 8.6 | .98 .02 .00 .00 .00 |
| Prof. inte 10.15 .01 | -.11 .03 -.03 .03 -.01 | 8.3 1.5 11.8 21.5 17.6 | .80 .08 .07 .05 .01 |
| Empleados 14.98 .01 | .02 .10 -.01 .02 .00 | .3 18.9 .5 20.4 2.2 | .03 .93 .00 .04 .00 |
| Obrero cal 11.16 .01 | .04 .10 -.02 -.04 .00 | 1.5 15.9 5.1 45.9 .4 | .14 .74 .03 .09 .00 |
| Obrero no 4.40 .02 | .12 .09 -.04 .00 .02 | 4.4 5.5 8.4 .2 26.9 | .56 .36 .06 .00 .02 |
| Inactivo 47.32 .00 | .03 -.03 .03 .00 .00 | 3.6 7.3 38.7 .0 .5 | .37 .39 .24 .00 .00 |
+---------------------------------------+-------------------------------+--------------------------+--------------------------+
INDIVIDUOS ILUSTRATIVOS
+---------------------------------------+-------------------------------+--------------------------+--------------------------+
| INDIVIDUOS | COORDENADAS | CONTRIBUCIONES | COSENOS CUADRADOS |
|---------------------------------------+-------------------------------+--------------------------+--------------------------|
| IDENTIFICADOR [Link] DIST. | 1 2 3 4 5 | 1 2 3 4 5 | 1 2 3 4 5 |
+---------------------------------------+-------------------------------+--------------------------+--------------------------+
| Hombre 48.97 .01 | -.05 -.02 -.01 -.04 -.02 | .0 .0 .0 .0 .0 | .48 .11 .02 .32 .06 |
| Mujer 51.05 .00 | .05 .02 .01 .04 .02 | .0 .0 .0 .0 .0 | .49 .10 .02 .33 .06 |
| 15-24 años 18.18 .02 | -.02 .10 -.04 .06 .05 | .0 .0 .0 .0 .0 | .02 .56 .08 .21 .14 |
| 25-34 años 18.28 .02 | -.03 .12 -.01 .02 .02 | .0 .0 .0 .0 .0 | .05 .87 .01 .04 .03 |
| 35-49 años 26.30 .00 | -.03 .01 -.01 .01 -.02 | .0 .0 .0 .0 .0 | .61 .10 .07 .03 .18 |
| 50-64 años 19.30 .01 | .02 -.10 .00 -.04 -.02 | .0 .0 .0 .0 .0 | .05 .80 .00 .12 .03 |
| 64 años o 17.92 .03 | .07 -.14 .07 -.05 -.03 | .0 .0 .0 .0 .0 | .14 .58 .16 .09 .03 |
| Primaria 30.07 .03 | .13 -.08 .02 -.05 -.01 | .0 .0 .0 .0 .0 | .63 .24 .02 .10 .00 |
| Secundaria 26.01 .00 | .00 .04 .00 .03 -.01 | .0 .0 .0 .0 .0 | .00 .69 .00 .29 .02 |
| Tec. prof. 23.98 .07 | -.03 .18 -.04 .10 .17 | .0 .0 .0 .0 .0 | .01 .46 .02 .13 .38 |
| Superior 17.73 .09 | -.29 -.02 -.01 .01 .02 | .0 .0 .0 .0 .0 | .99 .00 .00 .00 .00 |
+---------------------------------------+-------------------------------+--------------------------+--------------------------+
(32.4%)
(62.2%)
(32.4%)
(62.2%)
Es claro en un análisis de este tipo que el primer eje corresponde a una interpretación
puntual: los contactos medios con la prensa diaria nacional están, de manera significativa,
sobretodo hechos por los ejecutivos y personas d e un alto nivel de educación. Este resultado no es
visible de entrada en la tabla 1.3 - 10.
Por el contrario, las posiciones de los puntos sobre las dos figuras dan una interpretación
más anunciada del segundo eje: los empleados, de nivel de educación media, compuestos sobretodo
de jóvenes (contacto medio : Prensa revista TV), se oponen a los pequeños empresarios y
agricultores, en promedio sensiblemente mayores y menos instruidos (contactos : prensa revista
diferente a la TV, y prensa diaria regional).
Que pasa si se suprime, de las columnas activas, la columna “Diario nacional” cuyo papel
es predominante, para proyectarla en suplementario?.
Se ha visto que esta columna está casi situada sobre el eje 1 (coseno cuadrado de 0.99). Su
supresión quitará 74.6% de la inercia en esta dirección (valor de la contribución), y por lo tanto la
inercia en esta dirección será inferior a la del segundo eje actual1 sobre el cual la columna eliminada
tiene además una contribución nula. Entonces el nuevo primer eje de inercia máxima será muy
1
25.4% (complemento a 100 de 74.6%) de 0.0139 (primer valor propio λ1) es en efecto muy inferior
a 0.0072 (segundo valor propio λ2).