ANÁLISIS FACTORIAL MÚLTIPLE (AFM)
Espacios en los que se representa AFM.
La nube de individuos en RK
La nube de variables en el espacio RI
La nube de grupos de variables RI2
Elementos complementarios.
Estimación de los parámetros del modelo INDSCAL
Caso de variables cualitativas.
Complementos sobre la puesta en práctica
DATOS Y NOTACIONES
Datos constituidos por un conjunto de individuos descritos por varios grupos de variables = Tabla
estructurada
Cada grupo de variables corresponde una tabla
Todos los grupos de variables se definen sobre el mismo conjunto de individuos (Yuxtaposición)
Yuxtaposición = única tabla que cruza individuos y variables.
Tabla estructurada en subtablas
X = Tabla completa
I = Conjunto de individuos
K = Conjunto de variables (incluye todos los grupos)
J = Conjunto de subtablas
Kj = Conjunto de variables del grupo j
Xj = Tabla asociada al grupo j
Consideraciones de análisis de información
ANÁLISIS SEPARADO:
o Generalmente el peso de las variables numéricas son aprox 1,
o También pueden ser asignados con un peso igual a la I (Inercia).
o En el espacio Rk contiene representación de individuos.
o Cada variable se asocia a una dimensión
Objetivos:
Gráficas
Nube de individuos caracterizados por conjunto de variables usando ACP
Gráficas superpuestas de J nubes de individuos caracterizadas cada una por un
grupo de variables
AFM EN Rk : LOS INDIVIDUOS
Influencia de la ponderación de los grupos sobre las J nubes
A cada grupo de variables j corresponde una nube de individuos ( ) situada en el espacio
de Kj dimensiones (RKj), con inercia máxima de 1 donde:
o El primer eje del ACP, de la nube , está asociado a un valor propio 1
o Los valores propios de los de la nube se obtienen de la división de
ponderación de cada grupo de variables entre la varianza del individuo 1
en la en el grupo de variables j (peso/ )
Influencia de la ponderación de los grupos sobre la nube N I asociada a todas las variables
NI = Nube de todas las variables
i y l = dos puntos en la nube
ij = punto que representa a i en la nube individuo i en la nube de individuos I en el
grupo de variables j
mk = peso del grupo de variables
En la distancia de i y l, la influencia de los grupos j no está equilibrada, por lo que es
necesario multiplicar a los pesos iniciales de las variables del grupo j, por un coeficiente αj
que equilibra dicha influencia.
Con αj =1/ ningún grupo sobresale en importancia en la primera dirección de la nube
media. 8
Representación de las J nubes en Rk y la nube media
Rk se descompone en la suma directa de espacios ortogonales dos a dos e isomorfos a los
espacios RKj
Rk = ƟRKj
La métrica de cada una de los grupos de variables Mj, representa las coordenadas de los
puntos , contenidas en la tabla Xj; dichas coordenadas en el espacio R k, están recogidas
en la tabla de dimensiones I por K en la que Xj es completada con ceros
Representación base para representación simultánea de las nubes en los subespacios
Rk.
Si es la nube de centros de gravedad, denotados por i*. Entonces es una nube media
para los
Representación de la nube media
Se realiza un ACP de la tabla X, con la particularidad de que las variables son ponderadas
para equilibrar el papel de los grupos de variables.
Representación superpuesta de las J nubes definidas por cada grupo de variables
Comparación de posición de un mismo individuo en diferentes nubes
Todas las nubes situadas en RK.
Representación simultánea por proyección sobre un mismo subespacio.
El sub espacio elegido debe cumplir dos condiciones C1 Y C2
C1 = Cada nube debe estar bien representada (proyección ortogonal, representación en
función de la inercia)
Maximizar la inercia de la unión de las
C2 = Las representaciones de las nubes deben “parecerse entre si”
o Individuos homólogos son próximos uno al otro
o La nube es particionada en J nubes => representa conjunto de individuos vistos
a través de un grupo de variables
o Nueva partición de en I nubes => representa a un mismo individuo visto a través
de un grupo de variables
o Centro de gravedad i*
o Inercia total de = Inercia intra ( alrededor de i*) + Inercia inter (inercia de los
)
La inercia inter máxima se concentra en los primeros ejes propios, del total de ejes que
conforman el plano factorial. Esta información se obtiene por análisis con ACP
Las coordenadas de los puntos nube de factores , también se pueden obtener por
análisis con ACP.
AFM EN RI: LAS VARIABLES
Las variables se encuentran representadas en el espacio RI de los individuos.
Las componentes principales obtenidas por ACP de cada uno de los grupos pueden ser
situadas en dicho espacio.
Ponderación de los grupos sobre las nubes de variables
Se pueden establecer los vectores vk que representan cada variable k
es el conjunto de vectores vk que pertenecen al grupo de variables j
Ej es un espacio generado por las variables del grupo j
Igual que en el estudio desde los individuos es necesario dividir el peso de cada variable j
entre , igualando de esta forma la inercia a 1 de la primera componente en la nube ,
esto permite distribuir mejor la inercia entre el grupo de variables y determinar
claramente su relación.
Representación de las variables
Se obtiene desde el ACP de la tabla total.
Representación de la nube de individuos y su interpretación
Representación optima de la correlación entre variables
En la representación de tabla múltiple se puede obtener correlaciones inter e intra grupos
como en el gráfico.
Las componentes principales maximizan la inercia de las proyecciones de todas las
variables.
Cada grupo contribuye con un porcentaje de inercia al total de inercia. Además, con la
contribución de cada grupo se limita a un valor de 1 en la construcción de un eje.
Ningún grupo por si solo determina la construcción del primer eje.
Un grupo puede influir a muchos ejes dependiendo de su dimensión.
Representación de las componentes principales de cada grupo
Cada grupo de variables genera sus propias componentes principales y estas a su vez están
correlacionadas con la primera componente principal del total de variables.
Además, cada componente principal por grupo puede ser comparada con las demás y es
posible encontrar la contribución de cada componente principal por grupo en la
construcción del primer eje.
La búsqueda de factores comunes entre los grupos de variables se recurre al concepto de
análisis canónico.
Este método hace referencia a la búsqueda de un coeficiente que permita establecer el
tipo de relación entre las combinaciones lineales de dos grupos de variables y a partir de
este concepto se amplía al estudio de la búsqueda de correlaciones entre un mayor
número de grupos de variables (Análisis multicanónico)
Buscar variables correlacionadas con el conjunto de los grupos = tendencia general de los
grupos = variables generales.
Búsqueda en cada grupo de una combinación lineal de las variables ligadas a la variable
general (Pj) (variables canónicas). Permitiendo encontrar una relación entre una variable y
un grupo, la medida empleada para ello es el cos 2 Ɵ (coeficiente de correlación al
cuadrado).
Pj(z)
Ɵj
En resumen, la aplicación de un ACP y ACM. Donde se realiza un análisis multicanónico de
grupos de variables reducidos a un elemento. Donde las componentes principales son las
variables generales, confundiendo las variables canónicas con el resto de variables.
La inercia de la proyección (nube de variables j) sobre una variable z, está entre 0 y 1.
El valor que asume hace referencia al nivel de correlación de la entre la variable z y la
componente principal del espacio . Pero esta inercia también está influenciada por el
coeficiente de correlación múltiple (Pj(z).
Es la relación entre una variable y el grupo de variables
Sea us eje de inercia de doren s de la nube de individuos
Fs la componente principal en la que se encuentra us individuos
Fsj la componente principal de las variables
El análisis canónico sugiere evaluar un grado de semejanza entre F s y Fsj por medio de un
coeficiente de correlación, dicho coeficiente puede tomar un valor elevado para el
conjunto de grupos, algunos de ellos o incluso para uno solo
ANÁLISIS DEL CONJUNTO.
Objetivos:
Gráficas
Gráficas superpuestas de J nubes de individuos caracterizadas cada una por un
grupo de variables