ANÁLISIS DE CORRESPONDENCIAS SIMPLE
Estudio de tablas de contingencia, para juzgar objetos según un cierto
número de criterios.
Matriz de datos de orden (n*p):Tabla de doble entrada.
Filas: n modalidades de la variable A-
Columnas: p modalidades de la variable B.
Intersección kij: frecuencia conjunta entre las modalidades i y j.
Método:
Simétrico con relación a líneas y columnas.
Deberá permitir comparar las distribuciones de frecuencias.
Transformaciones en la matriz de datos
F Perfil de líneas en Rp
1.............j..............p
1
.
i Kij
fij fij/fi
.
n
Perfil de líneas en Rn
fij/fj
ANÁLISIS DE CORRESPONDENCIAS SIMPLE
Nube de puntos
Transformaciones a realizar: Iguales en ambos subespacios, llevando
a transformaciones analíticas diferentes.
Perfil de líneas en Rp
f ij k ij k i.
siendo f i. j 1,2,.....p
f i. k i. k
Perfil de líneas en Rn
f ij k ij k .j
siendo f.j i 1,2,....n
f.j k .j k
p y n puntos de las nubes, situados en subespacios de p-1 y n-1
dimensiones.
Centro de gravedad: media de perfiles de frecuencias afectados por
sus masas n f ij
i. f.j
f
i 1 f i.
ANÁLISIS DE CORRESPONDENCIAS SIMPLE
Distancia Chi-cuadrado
1 f ij f i j 2 1 f ij f ij 2
d (i,i ) = ( )(
2
- ) d (j, j ) = ( )(
2
- )
f j fi f i fi f j f j
Propiedades:
Equivalencia distribucional
Permite agregar dos modalidades de idénticas frecuencias de una
variable, en una nueva modalidad afectada por la suma de sus masas,
sin cambiar nada, ni en las distancias entre modalidades de esta
variable o de la otra.
Relaciones de transición
Ligan gráficamente las dos variables representadas en líneas y
columnas.
ANÁLISIS DE CORRESPONDENCIAS SIMPLE
Obtención de los ejes factoriales
Se toma como columnas la dimensión más pequeña.
Dos transformaciones: en el perfil de líneas y de las columnas.
Maximizar la suma ponderada de los cuadrados de las proyecciones
sobre el eje:
2
Max fi.d (i, O)
u i
Matriz a diagonalizar
n f ijf ij´
s jj
i 1 f i f .j´
Después de descartar el valor propio trivial igual a 1 y su vector propio
asociado, retenemos los p-1 valores propios no nulos y sus vectores
propios asociados. Obtendremos como máximo p-1 ejes factoriales.
ANÁLISIS DE CORRESPONDENCIAS SIMPLE
Normalización
Canónica: Si se desea examinar conjuntamente las diferencias
o similitudes entre dos variables.
Principal: Si se desea examinar las diferencias o similitudes
entre categorías de variables, pero por separado.
Principal por filas: Si se desea averiguar cómo difieren entre sí
las distintas categorías de la variable fila.
Principal por columnas: Si se desea averiguar cómo difieren
entre sí las distintas categorías de la variable columna.
ANÁLISIS DE CORRESPONDENCIAS SIMPLE
Análisis
Valores propios. Inercia total
p 1 2 χ2
I λα χ k I Contraste de independencia I
α 1 k
Coordenadas: Proyecciones de los puntos filas en los ejes factoriales
Contribuciones a la inercia de puntos a varianza explicada en cada eje
f i.ψ αi2
Crα (i)
λα
Correlaciones: Contribución de dimensiones a la inercia de cada punto
d α2 (i, G) ψ αi2
Cos α2 (i) 2
d (i, G) d 2 (i, G)
ANÁLISIS DE CORRESPONDENCIAS SIMPLE
Interpretación de representación simultánea
Filas (columnas) con estructura similar, situación próxima en el plano.
Cercanía punto fila i y columna j: interpretar si están alejados del origen.
Línea con perfil próximo al medio, se encontrará próxima al origen.
Buscar los puntos de mayor Contribución absoluta de las inercias. Se
separa los que se proyectan del lado positivo de los del lado negativo.
Estudiar la calidad de representación (correlación) de los puntos.
Correlación pequeña: tiene un papel importante sobre otro eje.
Se buscan aquellos puntos i(j) que si bien no contribuyen a la formación
del factor, sí se encuentran bien representados (correlación alta).
ANÁLISIS DE CORRESPONDENCIAS SIMPLE
Caso: Forma jurídica de las empresas exportadoras
canarias y su propensión a exportar
Estudio sobre la relación entre formas jurídicas de las empresas exportadoras canarias y su propensión a exportar (volumen de exportaciones/volumen de
negocios).
Datos: Base de Datos de CAMERDATA en 1990. Información sobre 36020 empresas exportadoras españolas. 693 son de la C. A. de Canarias. Depurada la
Base de Datos, el nº de empresas canarias se redujo a 394 realizándose transformaciones sobre las variables.
Las siete formas jurídicas de las empresas, se redujeron a cuatro mediante agregación :
Sociedades Anónimas
Sociedades Limitadas
Autónomos
Otros
La propensión a exportar presentara tres modalidades:
Propensión a exportar baja: entre 0 y 10%.
Propensión a exportar media: entre 10 y 50%
Propensión a exportar alta: entre 50 y 100%.
Tabla de correspondencias
Propensión exportar
Forma jurídica baja media alta Margen activo
Sociedad Anónima 151 51 34 236
Sociedad Limitada 42 30 22 94
Otras 3 9 10 22
Autónomo 3 12 27 42
Margen activo 199 102 93 394
PROPENSIÓN EXPORTAR
Frecuencias relativas fj
BAJA MEDIA ALTA
Soc. Anónima 0,383 0,129 0,086 0,599
FORMA Soc. Limitada 0,107 0,076 0,056 0,239
JURÍDICA Otras 0,008 0,023 0,025 0,056
Autónomo 0,008 0,030 0,069 0,107
fi 0,505 0,259 0,236 1,000
Solución: Análisis de correspodencias simple.
Objetivo:
Conocer la forma jurídica que se asocia con la propensión a la
exportación en mayor proporción que las demás.
Detectar las características que más destacan en cada forma jurídica.
Reducir nº de caracteres relacionados a dimensiones independientes.
Método:
Obtener ejes factoriales que reducen la información original mediante
nuevas variables estudiando la asociación entre modalidades fila y
columna. Se parte de frecuencias relativas para comparar.
En el espacio de las columnas: nube de n puntos i con coordenadas
kij/ki. para j = 1, 2, .....p
En el espacio de las filas: nube de p puntos j con coordenadas kij/k.j
para i = 1, 2, ......n
SPSS: Introducir los datos
Poner en las dos primeras columnas los pares de rangos posibles para
las columnas (1 a 3) y las filas (1 a 4) y, en la tercera, la frecuencia de
cada par de rangos. Se puede poner etiquetas al valor de cada rango.
Utilizar como variable de ponderación las frecuencias mediante los
comandos del menú: Datos, Ponderar casos
Ventanas Análisis de Correspondencias Simple
Ventana Modelo
Las soluciones con los cuatro procedimientos son equivalentes en términos de ajuste (valores singulares),
inercia y contribuciones, pero las puntuaciones por filas y columnas son diferentes.
Para examinar diferencias o similitudes entre dos variables: Canónica.
Para examinar diferencias o similitudes entre categorías de variables por separado: Principal.
Para averiguar cómo difieren entre sí las distintas categorías de la variable fila o columna, de modo que
maximice las distancias existentes entre las distintas categorías o modalidades de las filas o columnas de la
tabla: Principal por filas o columnas.
Ventana Estadísticos
Dependiendo de la opción elegida en la normalización se podrá
demandar el gráfico conjunto o no.
Si se ha elegido la normalización canónica: Gráfico conjunto.
Si se ha elegido la principal: Gráficos por separado de filas y columnas.
Resultados
Valor Chi- Proporción de Confianza para
Inercia Sig.
propio cuadrado inercia el Valor propio
Explicada Acumulada S (*) Correlación
Dimensión 2
1 ,434 ,189 ,952 ,952 ,043 ,195
2 ,098 ,010 ,048 1,000 ,056
Total ,198 78,055 ,000 1,000 1,000
Inercia: Valor propio o varianza explicada
Valores singulares: Raíz cuadrada de la inercia.
Inercia global
p 1
I λα
α 1
Chi cuadrado: Prueba de independencia.
2 χ2
χ kI I
k
2 = 394*0,19811 = 78,055. Se rechaza la hipótesis de independencia entre las modalidades.
Analisis en Rp: Examen de los puntos fila
Contribución
Masa Puntuación Inercia
De
De puntos
dimensión
1 2 a inercia
a inercia
dimensión Total
del punto
F. jurídica 1 2 1 2
S.A. ,599 -,278 ,041 ,047 ,245 ,106 ,979 ,021 1,000
S.L. ,239 ,070 -,126 ,005 ,006 ,396 ,239 ,761 1,000
Otras ,056 ,721 -,198 ,031 ,154 ,230 ,930 ,070 1,000
Autónomo ,107 1,026 ,155 ,115 ,595 ,268 ,978 ,022 1,000
Total 1,000 ,198 1,000 1,000
COORDENADAS :Puntos fila
Proyecciones de los puntos filas en los ejes factoriales. Mientras más alejados del origen sean los valores, mejor representadas estarán las filas
en cada uno de los ejes.
CONTRIBUCIÓN A LA INERCIA O ABSOLUTAS:
Las de cada uno de los puntos filas a la inercia explicada en cada eje. Se busca conocer los elementos responsables de la construcción de cada
eje.
CORRELACIÓN O CONTRIBUCIÓN RELATIVA:
La contribución de las dimensiones a la inercia de cada punto fila es la correlación existente entre cada uno de los caracteres y los nuevos ejes.
2 al punto i.
Coseno del ángulo entre el eje y el vector uniendo el centro de gravedad de la nube
fi.ψαi
Crα (i)
λα
d2α (i, G) ψ2αi
Cos2α (i) 2
d (i, G) d2 (i, G)
Analisis en Rn: Examen de los puntos columna
Contribución
Puntuación en la
Propensión De puntos a inercia De dimensión a la
Masa dimensión Inercia
exportar de la dimensión inercia del punto
1 2 1 2 1 2 Total
baja ,505 -,391 ,040 ,078 ,408 ,086 ,989 ,011 1,000
media ,259 ,152 -,161 ,013 ,032 ,709 ,471 ,529 1,000
alta ,236 ,669 ,091 ,108 ,560 ,204 ,982 ,018 1,000
Total activo 1,000 ,198 1,000 1,000
INTERPRETACIÓN:
• Eje 1
Lado positivo: Autónomo y Otras y propensiones a exportar alta y media. Lado negativo: Sociedades
Anónimas y propensión a exportar baja.
Contribución a la inercia: Sociedad Anónima y Autónomos, y propensiones a exportar baja y alta.
Correlaciones: Altas en Sociedad Anónima, Otras y Autónomos y propensiones a exportar baja y
alta.
• Eje 2
Los puntos fila están muy cercanos al origen, por lo que será difícil su interpretación. Los puntos
columnas destaca en el lado positivo la propensión a exportar media.
Contribuciones a la inercia: Soc. Limitadas, Otras y Autónomos, y propensión a exportar media.
Correlación: las Sociedades Limitadas y la propensión a exportar media.
GRÁFICO
Diagrama de dispersión puntuaciones
Forma jurídica-Propensión a exportar
,2
Autónomo
alta
,1
Sociedad
baja Anónima
-,0
Eje 2
-,1 Sociedad Limitada
media
Otras
-,2
-,3
-,6 -,4 -,2 -,0 ,2 ,4 ,6 ,8 1,0 1,2
Eje 1