Problemas Tema 2
Análisis de Componentes Principales
1. A partir de la siguiente tabla de datos cuantitativos:
2 3 6
3 2 6
4 5 5
3 3 4
2 6 6
4 5 3
a) Obtén una representación euclídea en dos dimensiones utilizando V.
b) Calcula la calidad de representación de los individuos sobre la primera
dimensión.
Nota: para realizar el apartado a), indica a partir de qué matriz obtendrías
los vectores propios y obtén la solución teniendo en cuenta que los vectores
propios unitarios son:
(-0.2938, -0.8139, 0.5012)t
(-0.4414, 0.5807, 0.6841)t
(0.8478, 0.0202, 0.5299)t
2. A partir de la siguiente matriz de covarianzas:
1+d 1
V =
1 1+d
Obtén la relación existente entre las variables originales y las componentes
principales que se obtendrían al operar directamente con esta matriz. Si se
proyecta en una dimensión, decidir qué componente escogerías e indica en
función de d la proporción de variabilidad explicada por esta.
3. Dados n individuos a los que se les mide p variables, demuestra que la inercia
n individuos: IT = ni=1 pi kxi k2 coincide con la suma
P
total de la nube de estos
de las p varianzas de las variables, que coincidirá con p en el caso de disponer
de variables estandarizadas.
1
2 Problemas Tema 2
4. A partir de la siguiente matriz de correlaciones, sabiendo que a > 0,
1 0 0
0 1 a
0 a 1
a) Obtén la expresión de las dos primeras componentes principales en fun-
ción de las variables originales.
b) Obtén el valor de a si se sabe que la inercia explicada con 2 ejes es 0.8.
c) Calcula la matriz de correlaciones entre las variables originales y las com-
ponentes principales. Comenta brevemente el resultado.
d) Calcula la calidad de representación de las variables. ¾Qué variable está
mejor representada?
5. Al aplicar un Análisis de Componentes Principales con M = D1/σ2 a un con-
junto de datos con p=3 y q=1 para los que se tiene:
j x̄j σj √
1/ 2
1 3 4
v1 = 0√
2 4 3
1/ 2
3 5 2
Calcula la calidad de representación del individuo i con xi = (4, 5, 5)t en el
primer eje.
6. Al aplicar un Análisis de Componentes Principales con M = D1/σ2 y:
4
V = 0.6 1
0 0.4 1
Se se toma sólo 1 eje, calcula:
a) La inercia explicada.
b) La proyección de un individuo cuyos valores centrados son: (5, 1, 0)t .
c) La calidad de representación del individuo del apartado anterior.
d) La matriz de correlaciones entre las variables originales y las componentes
principales.
e) La calidad de representación de las variables.
Análisis de Componentes Principales 3
7. Al aplicar un Análisis de Componentes Principales con q = 2 usando M = I ,
a un conjunto de datos con 3 variables para los que σ22 = 2, σ12 = σ32 = 3,
obtenemos que los dos mayores valores propios son 4 y 3 asociados a:
√ √
v1 = (0, 1/ 2, 1/ 2)t
v2 = (1, 0, 0)t
¾Podemos decir que la inercia explicada con este análisis es muy alta y que
todas las variables están muy bien representadas?