0% ont trouvé ce document utile (0 vote)
43 vues152 pages

Représentation des groupes et applications

Le document traite de la représentation des groupes et de leur application en physique, en commençant par des notions élémentaires sur les groupes finis, leur classification et leurs propriétés. Il aborde également les groupes cristallographiques, les représentations des groupes finis, ainsi que les algèbres de Lie et leur classification. Enfin, il explore des concepts avancés comme le théorème de Wigner-Eckart et les interactions fortes en relation avec la symétrie SU(3).

Transféré par

kouakoue243
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
43 vues152 pages

Représentation des groupes et applications

Le document traite de la représentation des groupes et de leur application en physique, en commençant par des notions élémentaires sur les groupes finis, leur classification et leurs propriétés. Il aborde également les groupes cristallographiques, les représentations des groupes finis, ainsi que les algèbres de Lie et leur classification. Enfin, il explore des concepts avancés comme le théorème de Wigner-Eckart et les interactions fortes en relation avec la symétrie SU(3).

Transféré par

kouakoue243
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

COMPÈRE M AT H - F 4 1 0

R E P R É S E N TAT I O N
DES GROUPES ET
A P P L I C AT I O N
À LA PHYSIQUE
Table des matières

1 Groupes finis 9
1.1 Notions élémentaires 9
1.2 Groupes finis d’ordre ≤ 4 11
1.3 Théorème de Cayley 12
1.4 Permutations Sn 14
1.5 Sous-groupe normal et groupe quotient 15
1.6 Groupe alterné An 18
1.7 Groupes simples et résolubles 19

2 Groupes cristallographiques ponctuels 23


2.1 Groupes cristallographiques ponctuels à deux dimensions 23
2.2 Groupes cristallographiques ponctuels à trois dimensions 25

3 Représentation des groupes finis 33


3.1 Notions élémentaires 33
3.2 Représentation régulière 35
3.3 Equivalence aux représentations unitaires et réducibilité 37
3.4 Relations d’orthogonalité 39
3.5 Théorèmes de Peter-Weyl et Burnside 41
3.6 Caractères des représentations irréductibles 44
3.7 Projecteurs sur sous-espace invariants 47
3.8 Décomposition d’une représentation quelconque en représentations irréductibles 49
4

4 Système à trois ressorts et S3 55


4.1 Représentations de S3 55
4.2 Modes d’oscillation d’un système de 3 ressorts identiques 60

5 Groupes et algèbres de Lie 65


5.1 Groupes de Lie matriciels 65
5.2 Algèbres de Lie 68

6 Unitarité des représentations des groupes compacts 75


6.1 Translations sur un groupe 75
6.2 Intégration invariante sur un groupe de Lie matriciel 77
6.3 Unitarité des représentations des groupes de Lie compacts et des groupes finis 82

7 Classification et représentations des algèbres de Lie compactes 85


7.1 Algèbres de Lie compactes 85
7.2 Sous-algèbres de Cartan – Poids d’une représentation 87
7.3 Représentation adjointe - Racines 88
7.4 Exemple : su(3) 91
7.5 Chaînes de poids et chaînes de racines 94
7.6 Racines simples 96
7.7 Matrice de Cartan - Diagrammes de Dynkin 99
7.8 Construction de l’algèbre à partir des racines simples 101
7.9 Poids fondamentaux 103
7.10 Classification des algèbres de Lie simples compactes 107

8 Représentations de su(3) 113


8.1 Les représentations (m, n) 113
8.2 Méthodes tensorielles 116
8.3 Les poids de la représentation (m, n) 121
5

9 Théorème de Wigner-Eckart 125


9.1 Opérateurs d’entrelacement et représentations complètement réductibles 125
9.2 Coefficients de Clebsch-Gordan 128
9.3 Opérateurs tensoriels irréductibles : définition 130
9.4 Théorème de Wigner-Eckart 131
9.5 Théorème de Wigner-Eckart pour SU (3) 132

10 Interactions fortes et symétrie SU (3) 135


10.1 L’approche de Gell-Mann 135
10.2 “The eight-fold way" 136
10.3 La formule de masse de Gell-Mann Okubo 139

11 Sous-algèbres des algèbres simples compactes 143


11.1 Sous-algèbres maximales 143
11.2 Sous-algèbres maximales des algèbres de Lie simples compactes 145
7

Je remercie vivement Marc Henneaux et Andrès

Collinucci pour avoir partagé leurs notes de cours

données aux années précédentes, ce qui a servi

comme base pour ces notes de cours.


1
Groupes finis

Dans ce chapitre, quelques éléments de la théorie des groupes


finis sera présenté. Il est impossible de présenter une classification
succincte. Il a en effet fallu le travail d’une centaine de mathémati-
ciens professionnels pour arriver à une telle classification seulement
récemment (dans les années 1980). Nous nous contenterons donc une
présentation d’éléments de théorie relevante pour tous les groupes, et
de cas particuliers intéressants pour les applications en physique.

1.1 Notions élémentaires

Groupe Un groupe est un ensemble d’éléments muni d’une opé-


ration associative ? : G × G → G avec un neutre et un inverse
pour chaque élément. Plus précisément, (1) ∃e ∈ G tel que ∀ g ∈ G,
g ? e = e ? g = g ; (2) ∀ g ∈ G, ∃ g−1 ∈ G tel que g ? g−1 = e = g−1 ? g ;
(3) ∀ g1 , g2 ∈ G, g1 ? g2 ∈ G.

Groupe abélien Un groupe G est abélien si pour tout g1 , g2 ∈ G,


g1 ? g2 = g2 ? g1 .

Groupe fini Un groupe fini est un groupe avec un nombre fini d’élé-
ments. L’ordre d’un groupe fini G est le nombre d’élements du
groupe. Il est dénoté | G |.

Remarques
— Le neutre est unique. En effet, si il existait deux neutres e1 et e2 ,
on aurait e1 ? g = g = e2 ? g donc en multipliant par g−1 à droite,
e1 = e2 .
— L’inverse est unique. En effet, soit deux inverses i1 et i2 de g :
g ? i1 = e = g ? i2 . En multipliant par i1 à gauche on trouve i1 = i2 .
Nous omettrons l’opérateur ? par la
suite pour simplifier la notation.
10 représentation des groupes et application à la physique

Exemples
— L’espace R muni de l’addition, (R, +) est un groupe infini-
dimensionel. De même pour (Z, +).
— L’espace R muni de la multiplication n’est pas un groupe car 0
n’a pas d’inverse, mais (R∗ ≡ R \ {0}, ·) est un groupe.
— L’ensemble Zn ≡ {e, a, a2 , . . . , an−1 } muni de la multiplication
telle que an = e est un groupe fini appelé le groupe cyclique Zn . Il
est abélien.
— Sn est le groupe symétrique de degré n. C’est le groupe fini de
permutations de n objets. Il a n! éléments.
— Dn (n ≥ 3) est le groupe diédral. Il s’agit du groupe fini de
symétries d’un n-gone régulier. Il a 2n éléments : l’identité, les n
réflections sur les axes de symétrie et n − 1 rotations autour du
centre de k × 360◦ /n degrés, k = 1, . . . n − 1.
Soit r une rotation de 360◦ /n degrés. On a r n = 1. Soit s une des
réflections. On a s2 = 1. Toute réflection peut être obtenue par
rotations successives de s, r k s, 0 ≤ k ≤ n − 1. On note la propriété
non-triviale : rsr = s ou srs−1 = r −1 . Le groupe diédral admet
donc la présentation

Dn = {r, s|r n = e, s2 = e, srs−1 = r −1 }. (1.1)

Homomorphisme Soient G1 , G2 deux groupes. Un homomorphisme


φ de G1 à G2 est une application sur les ensembles φ : G1 7→ G2 qui
respecte les multiplications,

∀ g, h ∈ G1 φ ( g ) ?2 φ ( h ) = φ ( g ?1 h ). (1.2)

Exemples
— Le déterminant det : GL(n, C) 7→ C∗ défini par Mn×n 7→
det( Mn×n ) satisfait à

∀ M1 , M2 ∈ GL(n, C) det( M1 M2 ) = det( M1 )det( M2 ). (1.3)

C’est donc un homomorphisme entre GL(n, C) et (C∗ , ·).

Isomorphisme Deux groupes sont isomorphes (ou dans la litérature


mathématique : automorphes) quand il existe un homomorphisme
entre ces groupes qui est bijectif. On notera deux groupes G1 , G2
isomorphes par G1 ' G2 . Puisque le groupe est fini, l’ordre d’un
élément existe toujours et est ≤ | G |.
En effet, soit a ∈ G. On considère la
Ordre d’un élément L’ordre d’un élément a d’un groupe fini G est le séquence a, a2 , a3 , . . . . Puisque le groupe
plus petit entier n tel que an = e. est fini, il existe un k > l tel que ak = al
ou ak−l = e. L’ordre est le plus petit tel
k − l.
groupes finis 11

Sous-groupe Un sous-groupe H du groupe G est un sous-ensemble


H ⊆ G tel que ∀ h1 , h2 ∈ H, h1 h2 ∈ H. Un sous-groupe strict est
défini similairement par un sous-ensemble strict H ⊂ G. Par exemple, (Z, +) ⊂ (R, +) ⊂ (C, +).

Théorème 1.1 (Lagrange). Pour tout sous-groupe H d’un groupe G, | H |


divise | G |.

Démonstration. voir exercices ou Théorème 1.4.

Produit direct Soient G, K deux groupes dont les éléments sont


respectivement { ga }, a = 1, . . . , | G | et {k i }, i = 1, . . . , |K |. Le groupe
produit direct G × K d’ordre | G ||K | est défini par les éléments ( ga , k i )
et l’opération de groupe

( g a , k i ) ? ( gb , k j ) = ( g a ? gb , k i ? k j ). (1.4)

1.2 Groupes finis d’ordre ≤ 4

Le groupe d’ordre 2
Le premier élément est l’identité e et l’autre élément est a. La
seule possibilité est la table de multiplication (aussi appelée table de
Cayley) :

Z2 e a
e e a (1.5)
a a e

C’est le groupe Z2 . En physique, l’opération a peut être une transfor-


mation de parité, de renversement du temps, de rotation sur un axe,
de conjugaison de charge électrique, etc.

Le groupe d’ordre 3
Le premier élément est l’identité e, le second élément est a1 . Le
troisiéme élément du groupe doit être a1 ? a1 . Sinon a1 ? a1 = a1
mène à a1 = e, ou a1 ? a1 = e ferme le groupe à deux éléments. Donc
a2 ≡ a1 ? a1 est le troisiéme élément. On a a1 ? a2 = a2 ? a1 . La seule
possibilité est a1 ? a2 = e. On trouve le groupe cyclique Z3 défini par
sa table de multiplication

Z3 e a1 a2
e e a1 a2
(1.6)
a1 a1 a2 e
a2 a2 e a1

L’opération a1 est par exemple une rotation du plan de 120◦ . Le


groupe Z3 est abélien.
12 représentation des groupes et application à la physique

Les deux groupes d’ordre 4 (Exercice)


Il existe seulement deux groupes distincts d’ordre 4. Le premier
est le groupe cyclique Z4 = {e, a1 , a2 , a3 } = {e, a, a2 , a3 }. On peut
définir l’opération a par une rotation du plan de 90◦ . Sa table de Alternativement, le groupe Z4 est défini
multiplication est par l’opération
a: z 7→ z0 = iz
Z4 e a1 a2 a3
où z ∈ C.
e e a1 a2 a3
a1 a1 a2 a3 e (1.7)
a2 a2 a3 e a1
a3 a3 e a1 a2
Le second groupe est le groupe V, Vierergruppe ou groupe de Klein.
C’est un cas dégénéré D2 du groupe dihédral Dn , n ≥ 3. Il possède la
table de multiplication suivante

V e a1 a2 a3
e e a1 a2 a3
a1 a1 e a3 a2 (1.8)
a2 a2 a3 e a1
a3 a3 a2 a1 e
Il est abélien puisque sa table de multiplication est symétrique par
rapport à sa diagonale. Le groupe est distinct de Z4 puisque que Z4
possède un élément d’ordre 4 tandis que V n’en possède pas. On
peut réaliser ce groupe par les matrices
! ! ! !
1 0 1 0 −1 0 −1 0
, , , . (1.9)
0 1 0 −1 0 1 0 −1
Le groupe V contient trois sous-groupes isomorphes à Z2 qui sont
générés respectivement par (e, a1 ), (e, a2 ) et (e, a3 ). Puisque a1 ? a2 =
a2 ? a1 , les éléments des deux premiers Z2 commutent. De plus,
a1 ? a2 = a2 ? a1 = a3 . On peut donc exprimer V comme le produit
direct
V = Z2 × Z2 . (1.10)
En physique, ce groupe apparait par exemple comme la symétrie
sous P et T (renversement du temps et, indépendament, parité).

1.3 Théorème de Cayley

Translations à gauche
Le groupe G agit naturellement sur lui-même. A chaque élément
h ∈ G, on peut associer la transformation inversible
Lh : G → G g 7→ Lh ( g) = hg
groupes finis 13

appelée translation à gauche par h. De Lh1 h2 ( g) = h1 h2 g = Lh1 ( Lh2 ( g)),


Le = transformation identique et ( Lh )−1 = Lh−1 , on déduit que
l’ensemble { Lh } est un groupe et que l’application h → Lh est un
homomorphisme. Cet homomorphisme est évidemment surjectif et
injectif (si Lh = transformation identique, alors hg = g ∀ g c-à-d h = e).
Par conséquent, la correspondance h → Lh est un isomorphisme. On
a démontré :
Théorème 1.2. Tout groupe G est isomorphe au groupe des translations à
gauche sur G.
L’espace G est évidemment homogène pour les translations à
gauche et le groupe G agit sur lui même de manière simplement
transitive :

∀ g1 , g2 ∈ G ∃ h ∈ G : L h g1 = g2 (transitivité)
(h est donné par g2 g1−1 ) et

Lh g = g ⇒ hg = g ⇒ h = e

ce qui montre que le groupe de stabilité de n’importe quel point =


{ e }.

Translations à droite
On définit également les translations à droite de G comme

Rh ( g) = gh−1 .

On a Rh1 h2 ( g) = g(h1 h2 )−1 = ( gh2−1 )h1−1 = Rh1 ( Rh2 ( g)) et donc

R h1 h2 = R h1 R h2

et par conséquent, l’application h 7→ Rh définit un homomorphisme Notez que si on définissait Rh ( g) = gh,


de G dans le groupe des translations à droite, qui est en fait un la propriété d’homomorphisme (1.2) ne
serait pas vérifiée.
isomorphisme. Il en résulte que G agit aussi à droite sur lui-même.
Une application directe des considérations précédentes conduit au
théorème de Cayley.

Théorème 1.3 (Théorème de Cayley). Tout groupe fini G d’ordre n est


isomorphe à un sous-groupe du groupe symétrique Sn .
En effet, G est isomorphe au groupe des translations à gauche de
G par G. Or, toute translation à gauche est une permutation des n
éléments de G, donc G est isomorphe à un sous-groupe de Sn .
Le groupe symétrique Sn joue donc un rôle tout particulier dans
l’étude des groupes finis. On voit également que le nombre de
groupes finis d’ordre n distincts (à un isomorphisme près) est fini
puisque le nombre de sous-ensembles à n éléments de l’ensemble fini
Sn est fini.
14 représentation des groupes et application à la physique

1.4 Permutations Sn

Une permutation de n objets 1, 2, . . . , n les mélange dans un ordre


différent a1 , a2 , . . . an . La transformation k 7→ ak , k = 1, . . . , n peut être
représentée par le symbole
!
1 2 ··· n
. (1.11)
a1 a2 · · · a n

Chaque permutation a un inverse et la permutation identique laisse


tous les objets invariants. Les n! permutations forment le groupe Sn .
Il existe une notation plus compacte et plus utile. On note ( a1 a2 . . . ak )
avec k ≤ n la permutation cylique ou cycle qui envoie a1 7→ a2 ,
a2 7→ a3 , . . . ak 7→ a1 et laisse les autres objets inchangés,
!
a1 a2 · · · a k
( a1 a2 . . . a k ) = . (1.12)
a2 a3 · · · a1

Par définition, une transposition est un cycle de longueur 2.


Par exemple, on a
!
1 2 3 4
∼ (1 2 3 4). (1.13)
2 3 4 1
Notez que les permutations
(1 2 3 4) ∼ (2 3 4 1) sont identiques.
Proposition 1.3.1. Tout élément de Sn peut s’écrire comme un produit de Par convention, on dénote toujours la
permutation avec l’élément le plus petit
cycles disjoints.
en premier ; dans ce cas (1 2 3 4).
Démonstration. Soit l’orbite sous permutation σ d’un objet a, Oa ≡
{ a, σ( a), σ2 ( a), . . .}. L’élément a a un ordre fini k donc l’orbite Oa
est de longueur k. La permutation agit sur Oa comme un cycle de
longueur k. On peut alors choisir un autre objet qui n’appartient pas
à Oa et répéter la procédure plusieurs fois jusqu’à couvrir tous les
objets par des orbites disjointes. Sur chaque orbite la permutation
agit comme un cycle. La permutation se réduit donc a un produit de
cycles disjoints. Chaque objet n’appartient qu’a un cycle.

Proposition 1.3.2. Deux cycles disjoints de Sn commutent.

Démonstration. Immédiat. Par définition, un cycle laisse le complé-


ment des objets permutés inchangé.

Par exemple, Par commodité, on ne note par les


! cycles triviaux d’un objet. On note donc
1 2 3 4 (1 2)(3)(4) ∼ (1 2).
∼ (1 2)(3)(4) ∼ (1 2). (1.14)
2 1 3 4

!
1 2 3 4
∼ (1 2)(3 4). (1.15)
2 1 4 3
groupes finis 15

Le groupe des permutations à trois éléments peut donc être noté

S3 = {e, (1 2), (1 3), (2 3), (1 2 3), (1 3 2)} (1.16)

Les produits et inverses sont donnés par Nous utiliserons la convention selon
laquelle les permutations agissent sur
(1 2)2 = (1 3)2 = (2 3)2 = e, (1 2 3)2 = (1 3 2), (1.17) les objets par la droite :
2
(1 3 2) = (1 2 3), 3 3
(1 2 3) = (1 3 2) = e, (1.18) (1 2)(1 2 3)1 = (1 2)2 = 1,
(1 2)(1 2 3)2 = (1 2)3 = 3,
(1 2 3 ) −1 = (1 3 2 ), (1 2)(1 2 3) = (2 3), . . . (1.19)
(1 2)(1 2 3)3 = (1 2)1 = 2.
Donc (1 2)(1 2 3) = (2 3). [C’est la
1.5 Sous-groupe normal et groupe quotient convention utilisée par Humphreys
mais opposée à celle de Ramond]
Afin de déterminer plus en détail le contenu du groupe des per-
mutations et ses sous-groupes, introduisons quelques notions utiles.

Classe latérale à gauche Soit G un groupe, H ⊆ G un sous-groupe et


g ∈ G. On appelle classe latérale à gauche de g suivant H l’ensemble

gH ≡ { gh|h ∈ H } ⊆ G. (1.20)

La classe latérale à droite de g suivant H est définie similairement


comme

Hg ≡ { hg|h ∈ H } ⊆ G. (1.21)

Par exemple, soit G = (Z, +) et le sous-groupe

H ≡ nZ = {np| p ∈ Z} (muni de l’addition).

On définit pour tout r ∈ Z les classes latérales à gauche Explicitement, si


H = 2Z = {. . . , −4, −2, 0, 2, 4, . . .}.
rH ≡ {np + r | p ∈ Z}. Alors
1H = {. . . , −3, −1, 1, 3, . . .}.

Remarques
— Tout élément g ∈ G appartient à une classe latérale à gauche et
une classe latérale à droite. En effet, g ∈ gH et g ∈ Hg puisque
e ∈ H.
— Si g ∈ G appartient à deux classes latérales à droite (ou similaire-
ment à gauche) g ∈ Hg1 et g ∈ Hg2 alors Hg1 = Hg2 .

Démonstration. ∃h1 , h2 tels que g = h1 g1 = h2 g2 . Donc g1 =


h1−1 h2 g2 ∈ Hg2 et, de même, g2 ∈ Hg1 . Donc ∀l ∈ Hg1 , ∃h tel que
l = hg1 = hh1−1 h2 g2 . Donc l ∈ Hg2 et on a Hg1 ⊆ Hg2 . De même,
Hg2 ⊆ Hg1 .

— Il en découle que les classes latérales Hg (ou gH) forment une


partition de G : il existe un ensemble d’éléments g1 , . . . g N (qui ne
sont pas uniques) tels que G = ∪1≤i≤ N Hgi .
16 représentation des groupes et application à la physique

Indice de H en G Soit G un groupe et H un sous-groupe de G. L’in-


dice ( G : H ) de H en G est le nombre de classes latérales à gauche
distinctes d’eléments de G suivant H. On a ( G : 1) = | G |.

Théorème 1.4 (Lagrange). On a | G | = ( G : H )| H |. De plus, pour tout


sous-groupes K ⊆ H de G, on a ( G : K ) = ( G : H )( H : K ).

Démonstration. C’est une conséquence immédiate de l’existence d’une


partition de G en classes latérales à gauche.
Par exemple,
Sous-groupe normal Un sous-groupe H ⊆ G est dit normal si ses H = {e, (1 2 3), (1 3 2)} ' Z3
classes latérales à gauche et à droite coincident, ∀ g ∈ G, gH = Hg.
est un sous-groupe de S3 . La classe
Dans ce cas, les classes latérales Hg définissent le groupe quotient latérale à gauche et à droite de e suivant
G/H avec produit ( Hg1 )( Hg2 ) ≡ H ( g1 g2 ). Le produit est bien défini H est H lui-même. La classe latérale à
gauche et à droite de (1 2) suivant H
car ( Hg1 )( Hg2 ) = ( H )( g1 H ) g2 = H ( Hg1 ) g2 = Hg1 g2 . L’indice est
du sous-groupe normal dans G est le nombre de classes latérales
(1 2) H = H (1 2) ≡ {(1 2), (1 3), (2 3)}.
| G | / | H |.
(Notez que (1 2) H ne forme pas un
Une seconde définition de sous-groupe normal peut être effectué sous-groupe.) Le sous-groupe Z3 est
donc normal, et le groupe quotient est
en utilisant la notion de conjugation suivante.
S3 /Z3 = Z2 ' {e, (1 2)}.

Conjugaison Soit ga un élément d’un groupe G. On définit le conju-


gué de ga par rapport à un autre élément g ∈ G comme

g̃a = gga g−1 . (1.22)

Autre exemple. Le groupe nZ muni de


l’addition est un sous-groupe normal
Proposition 1.4.1. L’opération de conjugation d’un élément de G est un de Z. Le groupe quotient Z/nZ est
isomorphe au groupe cyclique Zn .
isomorphisme de G dans G.

Démonstration. Tout d’abord, il s’agit d’un homomorphisme puisque


la table de multiplication est preservée : ga gb = gc implique g̃a g̃b = g̃c .
En effet,

g̃a g̃b = gga g−1 ggb g−1 = gga gb g−1 = ggc g−1 = g̃c .

L’homomorphisme admet un inverse puisque ga = g−1 g̃a g. Il est


donc bijectif.

La conjugaison admet un rôle particulier pour le groupe Sn : elle


préserve la structure de cycle comme montré dans la proposition
suivante.

Proposition 1.4.2. Pour tout cycle (i1 , . . . , ik ) de Sn et toute permutation


σ ∈ Sn , on a

π ≡ σ(i1 , . . . , ik )σ−1 = (σ (i1 ), σ (i2 ), . . . , σ (ik )). (1.23)


groupes finis 17

Démonstration. Par évaluation directe, on vérifie que la permutation


π envoie σ (i1 ) 7→ σ (i2 ), σ (i2 ) 7→ σ (i3 ), . . . et σ (ik ) 7→ σ (i1 ). On vérifie
ensuite que π ne déplace pas les objets a autres que σ (i1 ), . . ., σ (ik ).
En effet, σ−1 ( a) ∈
/ {i1 , . . . , ik } donc (i1 , . . . , ik )σ−1 ( a) = σ−1 ( a) et
finalement π ( a) = σ · σ−1 ( a) = a.

Éléments conjugués On dit que deux éléments g1 , g2 ∈ G d’un groupe


sont conjugués s’il existe un h ∈ G tel que g1 = hg2 h−1 . On dénote
alors g1 ∼ g2 .

Proposition 1.4.3. La conjugaison ∼ est une relation d’équivalence

Démonstration. On prouve successivement les trois définitions d’une


relation d’équivalence :
— g ∼ g. Évident. Il suffit de choisir h = e.
— Si g1 ∼ g2 alors g2 ∼ g1 . Soit h tel que g1 = hg2 h−1 alors
g2 = h − 1 g1 h = ( h − 1 ) g1 ( h − 1 ) − 1 .
— Si g1 ∼ g2 et g2 ∼ g3 alors g1 ∼ g3 . Soit g1 = h1 g2 h1−1 et
g2 = h2 g3 h2−1 . Alors g1 = h1 h2 g3 h2−1 h1−1 = h1 h2 g3 (h1 h2 )−1 .

Proposition 1.4.4. Les cycles de même longueur de Sn sont conjugués

Démonstration. Soient deux cycles de longueur k : ( a1 . . . ak ) et


(b1 . . . bk ). Définissons la permutation σ telle que σ( ai ) = bi , 1 ≤
i ≤ k et telle que σ est une bijection quelconque du complément de
{ a1 . . . ak } sur le complément de {b1 . . . bk }. Alors σ( a1 , . . . , ak )σ−1 =
(b1 , . . . , bk ) par la proposition 1.4.2.
Pour S3 , on a les relations de conjugai-
On peut utiliser la conjugaison pour partitionner les éléments d’un son
(1 2) ∼ (1 3) ∼ (2 3).
groupe en sous-ensembles disjoints. Choisissons un élément g1 et
En effet,
conjuguons-le par rapport à tous les éléments de G. On obtient la
(2 3) = (1 2)(1 3)(1 2),
classe de conjugaison C1 de g1 ,
(2 3) = (1 3)(1 2)(1 3)
C1 : g̃1 = gg1 g−1 , ∀ g ∈ G. (1.24) et
(1 2) = (2 3)(1 3)(2 3).
On peut ensuite choisir un nouvel élément g2 qui n’est pas dans C1 et Aussi, on a
former une nouvelle classe de conjugaison (1 2) = (1 2 3)(1 2)(1 2 3)

C2 : g̃2 = gg2 g−1 , ∀ g ∈ G. (1.25) et


(1 3 2) = (1 2)(1 2 3)(1 2).

Les éléments de C1 et C2 ne sont pas conjugués par construction. On On peut donc partitionner S3 comme

peut continuer la procédure et puisque le groupe est fini, la procé- S3 = {[e], [ a1 a2 ]3 fois , [ a1 a2 a3 ]2 fois }.
dure s’arrête après avoir trouvé k classes distinctes. La construction Le nombre de classes de conjugaison de
ne dépend pas du choix d’éléments g1 , g2 , . . . et le nombre de classes S3 est donc 3.

de conjugaison k est donc une caractéristique du groupe.


18 représentation des groupes et application à la physique

Remarques L’élément neutre détermine toujours sa propre classe


de conjugaison. Tout groupe abélien d’ordre n possède n classes
distinctes.
Revenons encore sur le sous-groupe de
Proposition 1.4.5. Soit H ⊆ G un sous-groupe de G. Si le conjugué de S3 ,
Z3 = {e, (1 2 3), (1 3 2)}
chaque élément h ∈ H par chaque élément g ∈ G reste dans H, c’est-à-dire
qui est l’union des deux classes de
−1 conjugaisons [e] = {e} et [123] =
∀h ∈ H, ∀ g ∈ G, ghg ∈H {(1 2 3), (1 3 2)}. On a

alors H est un sous-groupe normal. (1 2)(1 2 3)(1 2) = (1 3 2)


ainsi que les relations similaires ob-
Démonstration. Soient g ∈ G et h ∈ H quelconques. On dénote tenues par permutations des indices.
h2 = ghg−1 ∈ H. On a donc gh = h2 g et hg−1 = g−1 h2 . La première La conjugaison d’éléments de Z3
par S3 préserve Z3 et donc Z3 est un
relation implique gH ⊆ Hg et la deuxième implique Hg−1 ⊆ g−1 H.
sous-groupe normal.
Puisque ces relations sont vraies pour tout g, on a aussi Hg ⊆ gH.
Donc les classes latérales à gauche et à droite coincident.

Si une union de classes de conjugaison forme un sous-groupe, ce


sous-groupe forme donc automatiquement un sous-groupe normal.

1.6 Groupe alterné An

Proposition 1.4.6. Tout cycle peut être décomposé en un produit de transpo-


sitions,

( a1 . . . ak ) = ( a1 ak )( a1 ak−1 ) · · · ( a1 a2 ). (1.26)

Démonstration. On vérifie que les deux membres de l’équation per-


mutent tous les objets de manière identique.

Corollaire 1.4.1. Toute permutation peut s’écrire comme un produit de


transpositions.

Démonstration. C’est une conséquence des propositions 1.3.1 et


1.4.6.
Sans perte de généralité, une trans-
A chaque permutation de Sn on peut associer une matrice n × n position des deux premiers objets est
associée à
inversible (composées de zéros et de n 1) qui agit sur un vecteur  
0 1 0 ... 0
d’objets de longueur n. Cette isomorphisme réalise Sn comme un  1 0 0 ... 0 
sous-groupe de GL(n, R). Sn peut être défini comme le groupe de
 
 0 0 1 ... 0 
 .
 . .. .. . . .. 
telles matrices. Une transposition est associée à une matrice de dé-  .
 . . . . . 

terminant −1. Comme le déterminant est un homomorphisme et par 0 0 0 ... 1
le corollaire 1.4.1, le déterminant d’une matrice quelconque de Sn
est soit 1, soit −1. Ce nombre est appelé le signe de la permutation
σ et est dénoté sgn(σ ). Une manière simple d’obtenir le signe d’une
permutation consiste à la décomposer en produits de transpositions
et compter le nombre de transpositions modulo 2. Ce nombre est
unique pour toute décomposition en transpositions car le détermi-
nant d’une matrice comme produit de matrices est unique.
groupes finis 19

Par exemple,
Groupe alterné Le groupe alterné An est défini comme S2 = {e, (1 2)} ⊃ A2 = {e}.

An = {σ ∈ Sn |sgn(σ) = 1}. (1.27) Aussi,


A3 = {e, (1 2 3), (1 3 2)} ' Z3 .

Propriétés
— Son ordre est | An | = 12 n! pour tout n ≥ 2. En effet, soit τ =
(1 2) ∈/ An . Si σ ∈
/ An alors στ ∈ An . Donc σ fait partie de la
classe latérale à droite σ ∈ An τ. On déduit Sn = An ∪ An τ avec
An ∩ An τ = ∅.
— An est non-abélien pour n ≥ 4. En effet, il contient les 3-cycles. Or
(1 2 3)(1 2 4) envoie 4 7→ 2 tandis que (1 2 4)(1 2 3) envoie 4 7→ 1.

1.7 Groupes simples et résolubles

Les concepts de groupe simple et de groupe résoluble ont été


introduit par Galois, le père fondateur de la théorie des groupes.

Groupe simple Un groupe est simple s’il ne possède pas de sous-


groupe normal non-trivial (c’est-à-dire l’identité ou lui-même). Par contre le groupe Z4 = {e, a, a2 , a3 }
Un exemple de groupe simple est le groupe cyclique Z p où p est est n’est pas simple. Il admet Z2 =
{e, a2 } comme groupe normal. En effet,
un nombre premier. aZ2 = Z2 a = { a, a3 } et Z4 = Z2 ∪ aZ2 .

Groupe résoluble Un groupe G est résoluble s’il existe une série de


sous-groupes normaux Gi

G = G0 ⊇ G1 ⊇ · · · ⊇ Gr = {e} (1.28)

tels que tous les groupes quotients G0 /G1 , G1 /G2 , . . ., Gr−1 /Gr sont
abéliens.
Galois a montré que la solution d’un polynôme général de degré
n en radiaux était possible seulement si le groupe Sn qui agit sur les
racines était résoluble. Pour n = 3 on a

S3 ⊃ A 3 ⊃ { e } (1.29)

avec S3 /A3 ' Z2 et A3 ' Z3 . Pour n = 4 on a Notez que l’on a aussi S3 ⊃ S2 ⊃ {e}
mais S2 n’est pas un sous-groupe
normal de S3 car (123)(12)(132) = (23)
S4 ⊃ A 4 ⊃ V ⊃ { e } (1.30)
et pas (12).

avec S4 /A4 = Z2 , A4 /V = Z3 et V ' Z2 × Z2 . Donc S3 et S4 sont


résolubles et un polynôme d’ordre 3 ou 4 admet une solution en
radicaux.
Par contre, Galois a montré que A5 est un groupe simple. Comme
c’est un groupe non-abélien, il est non-résoluble. Cela implique qu’il
20 représentation des groupes et application à la physique

n’y a pas de solution en radiaux d’un polynôme d’ordre 5 en général


(mais il peut y en avoir pour des cas particuliers).
Tous les groupes finis peuvent être construits à partir des groupes
simples. La classification des groupes simples a requis le travail
d’une centaine de mathématiciens et la classification s’est achevée
seulement au début des années 1980. Les groupes simples peuvent
être catégorisés en 18 familles infinies et une liste de 26 cas particu-
liers :
— Les groupes cycliques Z p d’ordre p premier
— Les groupes alternés An , n ≥ 5
— Les 16 familles de groupes finis de type Lie (pas définis dans ce
cours)
— Les 26 groupes finis sporadiques (pas définis dans ce cours)
Pour le plaisir, on note que le plus grand des groupes sporadiques est
connu sous le nom Groupe monstre M et admet

246 · 320 · 59 · 76 · 112 · 132 · 17 · 19 · 23 · 29 · 31 · 41 · 47 · 59 · 71 ≈ 8 × 1053

éléments.
Pour illustrer l’étendue et la complexité de la classification des
groupes finis, les deux tables 1.1 et 1.2 sont données, tirées du livre
de P. Ramond “Group theory”.

Figure 1.1: Liste des groupes finis


d’ordre 12 ou moins. Les groupes
non-abéliens sont indiqués avec une
astérisque.
groupes finis 21

Figure 1.2: Nombre de groupes d’ordre


200 ou moins. Le nombre de groupes
abéliens sont indiqués entre crochets.
2
Groupes cristallographiques ponctuels

Groupe cristallographique On dit qu’un groupe est cristallographique


s’il préserve un réseau. Un réseau R de l’espace Rn est par définition
l’ensemble de tous les vecteurs combinaisons linéaires à coefficients
entiers de n vecteurs linéairement indépendants ai (i = 1, · · · , n),

n
x∈R ⇔ x= ∑ zi ai , zi ∈ Z. (2.1)
i =1

Il existe 17 groupes cristallographiques du plan et 230 groupes


cristallographiques de l’espace Euclidien à 3 dimensions. Nous ne le Note historique : en 1891, Fedorov
prouverons pas ici. et indépendament Schönflies ont
classifié ces groupes avec quelques
omissions et duplications. Après une
correspondence, ils sont arrivés à la liste
Groupe cristallographique ponctuel On appelle groupe cristallogra- finale des 230 groupes en 1892.
phique ponctuel à n dimensions tout sous-groupe cristallographique
fini de O(n). Il existe deux notations pour les 32
groupes cristallographiques ponctuels
Nous allons établir la classification des groupes cristallographiques
à 3d : celle de Schönflies utilisée en
ponctuels à 2 dimensions et dériver une partie de la classification spectroscopie moléculaire, et celle
à 3 dimensions. Il existe 10 groupes cristallographiques ponctuels de Hermann-Mauguin utilisée en
cristallographie.
du plan et 32 groupes cristallographiques ponctuels de l’espace
Euclidien à 3 dimensions.

2.1 Groupes cristallographiques ponctuels à deux dimensions

Sous-groupes finis de SO(2)

Les éléments de SO(2) sont les rotations du plan autour de


l’origine. Nous aurons besoin du lemme suivant de la théorie des
nombres : Démonstration du Lemme 2.1 : consi-
dérons les entiers positifs de la forme
aw + bz, w, z ∈ Z. Soit e le plus petit
Lemme 2.1 (Bézout). Soient a et b deux entiers de plus grand diviseur
de ces nombres, e = xa + yb > 0. La
commun d. Alors il existe x, y ∈ Z tels que ax + by = d. En particulier, si a division de a par e donne a = qe + r,
et b sont premiers entre eux, il existe x, y ∈ Z tels que ax + by = 1. où le reste r est compris entre 0 et e,
0 ≤ r < e. Substituant e = xa + yb, on
trouve r = a(1 − qx ) − bqy et donc r est
de la forme aw + bz, w, z ∈ Z. Comme
r < e, ceci implique r = 0 car e est le
plus petit nombre positif de cette forme.
Par conséquent, e divise a. De même, e
divise b. Enfin, soit c un diviseur com-
mun de a et b. Alors c divise e = xa + yb.
Il en résulte que e = d est le plus grand
diviseur commun de a et de b.
24 représentation des groupes et application à la physique

Proposition 2.1.1. Tout sous-groupe fini de SO(2) est isomorphe à un des Le groupe cyclique Z p est habituel-
groupes cycliques C p , p ∈ Z0 . Ces groupes sont les groupes des rotations lement noté C p lorsqu’il réfère aux
rotations discrètes du plan.
préservant un polygone régulier à p côtés.

Démonstration. Si G est un sous-groupe non trivial de SO(2), alors


G contient une rotation non triviale d’angle minimum, soit R( ϕ). Si
G est fini, on a R p = I pour un certain entier p et donc ϕ est égal à
k
p (2π ) où k et p sont des entiers que l’on peut supposer positifs et
premiers entre eux. On prétend que k = 1. En effet, par le lemme
de Bézout, il existe z, z0 ∈ Z tels que kz − pz0 = 1. Autrement dit,
il existe (au moins) un multiple de kp qui diffère de 1p par un entier.
Ceci montre que G contient la rotation d’angle 1p (2π ), et comme
k
p (2π )
est le plus petit angle de rotation dans G, on a k = 1.
Soit R( ϕ0 ) un élément de G. L’angle ϕ0 est nécessairement un
multiple de 1p (2π ) ; dans le cas contraire, il y aurait une rotation
d’angle plus petit que 1p (2π ) dans G, contrairement aux hypothèses.
Donc, G est le groupe cyclique C p contenant les rotations d’angle Figure 2.1: Les premiers polygones
k réguliers.
p (2π ), k = 0, 1, · · · , p − 1. Il y a une infinité de sous-groupes finis de
SO(2), caractérisés par un entier positif p.

Sous-groupes finis de O(2)


On obtient les sous-groupes finis de O(2) en ajoutant des ré-
flexions aux groupes C p . Le produit de la réflexion par rapport à
la droite D passant par l’origine et de la rotation d’angle ϕ est la
réflexion par rapport à la droite D 0 faisant un angle ϕ/2 avec D (et
passant aussi par l’origine).
D’autre part, le produit des réflexions par rapport aux droites F et
F 0 faisant un angle α est la rotation d’angle 2α. Il en découle que les
sous-groupes finis de O(2) contenant des réflexions s’obtiennent en
ajoutant à C p p réflexions par rapport à p droites faisant un angle πp .
Les groupes correspondants sont appelés groupes diédraux d’ordre
2p et notés D p . Ce sont les groupes de symétries complets des poly-
gones réguliers.
Remarque 2.2. Le plan Π sur lequel agit O(2) peut être plongé dans
l’espace à trois dimensions. Les groupes C p et D p peuvent alors être vus
comme sous-groupes finis de SO(3). C’est évident pour C p dont les éléments
peuvent être vus comme des rotations autour de l’axe perpendiculaire
au plan Π passant par l’origine ; on dit que cet axe est un axe d’ordre p.
C’est aussi vrai pour D p si on voit les réflexions planaires par rapport à
la droite D de Π comme une rotation d’espace d’angle π autour de D. Le
groupe diédral D p contient donc un axe d’ordre p et p axes d’ordre deux.
A noter que vus comme sous-groupes de SO(3), les groupes C2 et D1 sont
équivalents (un seul axe d’ordre 2 dans les deux cas).
groupes cristallographiques ponctuels 25

Groupes cristallographiques ponctuels à deux dimensions


Soit un réseau R comme défini en 2.1 Les seuls axes permis pour
un groupe cristallographique sont d’ordre p = 1, 2, 3, 4, 6. En effet,
une condition nécessaire pour que la rotation d’angle 2π p préserve
1
R est que sa trace soit un entier . La trace de la matrice de rotation 1. La trace de la matrice d’une transfor-
R( ϕ) est égale à 2 cos ϕ. Il faut donc mation ne dépend pas de la base. Dans
une base adaptée au réseau, où les
vecteurs de base sont {an }, la matrice

2 cos( ) ∈ Z. d’une transformation qui préserve le
p réseau est à coefficients entiers, donc sa
trace est entière.
Ceci donne comme possibilités


2 cos( ) = ±2, ±1, 0
p

correspondant aux cas p = 1, 2, 6, 3, 4 annoncés. La condition né-


cessaire est aussi suffisante (à deux dimensions). Nous avons donc
prouvé qu’il y a dix groupes cristallographiques ponctuels à deux
dimensions : C p , D p (p = 1, 2, 3, 4, 6).
Par exemple, C1 ≡ { I } préserve un réseau arbitraire, D1 ' Z2 , C2 ,
D2 ' Z2 × Z2 , C4 et D4 préservent les réseaux carrés (vecteurs de
base a1 et a2 de même norme et orthogonaux), tandis que C3 , D3 , C6
et D6 préservent les réseaux hexagonaux (vecteurs de base a1 et a2 de
même norme et formant un angle de 120◦ ).

2.2 Groupes cristallographiques ponctuels à trois dimensions

On appelle groupe cristallographique ponctuel à trois dimensions


tout sous-groupe cristallographique fini de O(3).

Polyèdres réguliers
Classification Plusieurs groupes cristallographiques sont liés aux
polyèdres réguliers (ou “solides de Platon"). Nous allons d’abord
décrire ces polyèdres et leur groupe de symétrie.
Un polyèdre régulier est un polyèdre dont toutes les faces sont
des polygones réguliers identiques et dont tous les sommets sont
entourés par le même nombre de faces. Si p est le nombre de côtés
du polygone régulier qui intervient dans le polyèdre et q le nombre
de faces qui entourent un sommet, on note le polyèdre { p, q}. Bien
entendu, p > 2 et q > 2. Dans le plan, il existe une infinité de
polygones réguliers. Les polyèdres réguliers sont par contre en
nombre fini.
L’angle formé par les côtés adjacents d’un polygone régulier à p
côtés est égal à π (1 − 2p ). A un sommet du polyèdre régulier { p, q} se
rencontrent q tels polygones et la somme des angles des faces qui se
26 représentation des groupes et application à la physique

rejoignent est strictement inférieure à 2π. Donc, on a qπ (1 − 2p ) < 2π


ou encore
1 1 1
+ > (2.2)
q p 2
Les seules solutions sont

{3, 3}
{3, 4} , {4, 3}
{3, 5} , {5, 3}

Le premier cas correspond au tétraèdre régulier. Les deuxième et


troisième cas correspondent à l’octaèdre et au cube. Les quatrième et
cinquième cas correspondent à l’icosaèdre et au dodécaèdre.
Ces polyèdres réguliers ont des nombres de faces (N2 ), arêtes (N1 )
et sommets (N0 ) donnés par Figure 2.2: Les polyèdres réguliers
(tétraèdre, cube, octaèdre, dodécaèdre
Tétraèdre {3, 3} N0 = 4 N1 = 6 N2 = 4 (2.3) et icosaèdre)
Octaèdre {3, 4} N0 = 6 N1 = 12 N2 = 8 (2.4)
Cube {4, 3} N0 = 8 N1 = 12 N2 = 6 (2.5)
Icosaèdre {3, 5} N0 = 12 N1 = 30 N2 = 20 (2.6)
Dodécaèdre {5, 3} N0 = 20 N1 = 30 N2 = 12 (2.7)

On obtient ces nombres par inspection. A noter que

N2 − N1 + N0 = 2 (formule d’Euler). (2.8)

On a également pour tout polyèdre régulier { p, q},

qN0 = 2N1 = pN2 (2.9)

En effet, le nombre N1 d’arêtes est égal au nombre N0 de sommets


fois q (car de tout sommet part q arêtes) divisé par 2 (car ce faisant,
on compte chaque arête deux fois). De même, N1 est aussi égal au
nombre N2 de faces fois p (car chaque face contient p arêtes) divisé
par 2 (car chaque arête appartient à deux faces).

Groupes des polyèdres On appelle groupe du polyèdre { p, q} le sous-


groupe (fini) R{ p,q} de SO(3) qui laisse le polyèdre { p, q} invariant. Si
un axe de rotation de R{ p,q} (passant par le centre du polyèdre) passe
par l’intérieur d’une face, il doit nécessairement passer par le centre
de celle-ci et il doit être d’ordre p. De même, si un axe de rotation
passe par l’intérieur d’une arête, il doit nécessairement passer par
le milieu de celle-ci il doit être d’ordre 2. Enfin, un axe de rotation
passant par un sommet doit être d’ordre q. Il y a donc N0 /2 axes
d’ordre q, N1 /2 axes d’ordre 2 et N2 /2 axes d’ordre p. En fait,

R{ p,q} = R{q,p} (2.10)


groupes cristallographiques ponctuels 27

puisque l’on peut placer un cube dans l’octaèdre en inversant les axes
de symétrie des faces et des sommets. La même relation est vraie
entre l’icosaèdre et le dodécaèdre.
Comptons maintenant l’ordre du groupe. Pour chaque sommet, on
a q − 1 rotations ; pour chaque arête, on a une rotation ; et pour chaque
face, on a p − 1 rotations (en excluant chaque fois l’identité). Mais
sommets, arêtes et faces viennent par paires antipodales, sauf pour le
tétraèdre, où chaque sommet est opposé à une face. Dans tous les cas,
le nombre total de rotations (excluant l’identité) est égal à

1 1
[ N0 (q − 1) + N1 + N2 ( p − 1)] = ( N0 q − 2 + N2 p) = 2N1 − 1
2 2
par (2.8) et (2.9). Par conséquent, l’ordre de R{ p,q} = R{q,p} est 2N1 .
Le groupe R{3,3} du tétraèdre est d’ordre 12, celui de l’octaèdre
(ou du cube) est d’ordre 24 et celui de l’icosaèdre (ou du dodécaèdre)
est d’ordre 60. On note souvent Les groupes complets de symétrie des
polyèdres réguliers s’obtiennent en
T ≡ R{3,3} , (2.11) ajoutant les réflexions.

O ≡ R{3,4} = R{4,3} , (2.12)


Y ≡ R{3,5} = R{5,3} . (2.13)

Les seuls axes permis pour un groupe cristallographique sont


d’ordre p = 1, 2, 3, 4, 6 (même argument qu’à 2 dimensions). Donc,
seuls T et O sont cristallographiques.

IO(n) et réflexions
On appelle groupe euclidien inhomogène IO(n) le groupe des iso-
métries de l’espace euclidien Rn . Ce groupe contient les translations,
les rotations et les réflexions par rapport à un hyperplan quelconque,
ainsi que leurs produits. Le sous-groupe ISO(n) des déplacements
ne contient que les isométries préservant l’orientation et est engendré
par les translations et les rotations. Une réflection autour de l’origine est
donnée par
Théorème 2.3. Toute transformation de IO(n) peut s’écrire comme un x → x − 2( x · n ) n
produit fini de réflexions. Celles-ci engendrent donc tout IO(n).
où n est le vecteur de norme 1 or-
thogonal à l’hyperplan de réflexion
Démonstration. La translation par a est égale au produit de la ré- (l’ambiguité de signe de n ne joue pas).
flexion par rapport à l’hyperplan perpendiculaire à a passant par
l’origine et de la réflexion par rapport à l’hyperplan parallèle passant
par a/2. Ceci ramène le problème à écrire un élément quelconque de
O(n) comme produit de réflexions. On raisonne par récurrence sur
la dimension : la propriété est vraie pour n = 2 car toute rotation du
plan d’angle ϕ est égale au produit de deux réflexions par rapport à
des droites faisant un angle ϕ/2. D’autre part, si la propriété est vraie
en dimension n, elle est aussi vraie en dimension n + 1 : soit A un
28 représentation des groupes et application à la physique

élément de O(n + 1). On a En+1 = En ⊕ Ren+1 . Si Aen+1 = en+1 , A


est en fait un élément de O(n) et il n’y a rien à montrer par l’hypo-
thèse de récurrence. Sinon, les deux vecteurs en+1 et Aen+1 forment
un plan et sont reliés par un élément de SO(2). Il sont donc reliés
entre eux par un produit de deux réflections S ≡ R1 R2 que l’on peut
choisir orthogonaux au plan, en+1 = SAen+1 . La transformation
SA laisse en+1 fixe et définit donc un élément de O(n). Par l’hypo-
thèse de récurrence, on peut écrire cet élément comme un produit
de k réflexions Si de En , que l’on peut étendre à En+1 en posant
Si en+1 = en+1 (ce qui revient à prendre pour hyperplan de réflexion
dans En+1 l’hyperplan Hi ⊕ Ren+1 où Hi est l’hyperplan (à n − 1
dimensions) de la réflexion Si dans En ). On a ainsi SA = S1 S2 · · · Sk
et donc puisque S2 = I, A = SS1 S2 · · · Sk .

En particulier, tout élément de SO(3) peut s’écrire comme le


produit de deux réflexions. Tout élément R de SO(3) est la matrice
d’une rotation d’angle ϕ et d’axe n, R = r ( ϕ, n). En fait, le produit
de deux réflexions dans des plans se coupant le long de l’axe de la
rotation et formant un angle ϕ/2 est égal à R.

Sous-groupes finis de SO(3)


Soit G un sous-groupe fini de SO(3). Comme l’origine est inva-
riante par G, il est commode de considérer G comme un groupe
agissant sur la sphère. Chaque rotation peut être ainsi vue comme
une rotation autour d’un point de la sphère (une rotation d’angle ϕ
autour de P étant la même chose qu’une rotation d’angle − ϕ autour
du point antipodal).
On appelle triangle sphérique tout triangle sur la sphère dont les
côtés sont des segments de grands cercles.

Théorème 2.4. Si les sommets d’un triangle sphérique PQR sont ordonnés
dans le sens horlogique et que p, q, r sont les angles respectifs à ces sommets,
alors le produit des rotations d’angles 2p, 2q et 2r autour de P, Q et R est
égal à l’identité.

Démonstration : On exprime chacune des rotations comme produit


de réflexions dans les grands cercles : RP, PQ pour la première ; PQ,
QR pour la deuxième ; et QR, RP pour la troisième. 2
Par conséquent, le produit des rotations d’angles 2p et 2q autour
de P et Q est la rotation d’angle −2r autour de R.

Sous-groupes finis de SO(3) ne possédant que des axes d’ordre 2 Le


produit de deux demi-tours autour de P et Q est une rotation autour
d’un des pôles du grand cercle passant par P et Q d’un angle −2r
groupes cristallographiques ponctuels 29

(ou de 2r autour de l’autre pôle). On voit cela facilement en plaçant


P et Q sur l’équateur, ce que l’on peut faire sans nuire à la généralité.
Que vaut r ? Comme le sommet R du triangle sphérique est un
des pôles, l’angle r en R est égal à l’angle POQ formé par les demi-
droites OP et OQ passant par le centre O de la sphère. Cette rotation
ne sera un demi-tour que si les axes OP et OQ sont perpendiculaires.
On peut donc uniquement considérer les groupes avec 1 axe
d’ordre 2 ou 3 axes d’ordre 2 perpendiculaires.
Figure 2.3: C2 ' Z2
On trouve donc que les seuls sous-groupes finis de SO(3) ne
possédant que des axes d’ordre 2 sont C2 (groupe cyclique d’ordre
2 avec un seul axe d’ordre 2) et D2 (groupe dihédral d’ordre 4 avec
trois axes d’ordre 2 perpendiculaires).

Sous-groupes finis de SO(3) possédant des axes d’ordre 2 mais ne possédant


qu’un seul axe d’ordre p strictement plus grand que 2, p > 2 S’il y a
un seul axe d’ordre p, celui-ci doit être perpendiculaire à tout axe Figure 2.4: D2 ' Z2 × Z2

d’ordre 2 qui serait présent. En effet, le pole de l’axe d’ordre p est en-
voyé sur un autre pole d’un axe d’ordre p sous une rotation de 180◦
autour de l’axe d’ordre 2. Comme cet axe est unique, il faut que le
nouveau pole soit le pole antipodal de l’axe de départ. L’axe d’ordre
2 est donc perpendiculaire à celui d’ordre p. Les seules possibilités
sont les groupes cycliques C p d’ordre p et les groupes dihédraux D p
d’ordre 2p (avec p = 3, 4, 6 si le groupe est cristallographique).

Sous-groupes finis de SO(3) possédant plusieurs axes d’ordre strictement


plus grand que 2 Soit OP un axe d’ordre p. Considérons tous les
points sur la sphère correspondant à des axes d’ordre strictement
plus grand que 2 et leur distance (sur la sphère) à P. Comme le sous-
groupe est fini, il existe une plus petite distance parmi ces distances
et donc un point Q1 à distance minimum de P définissant un axe
d’ordre q strictement plus grand que 2. Des rotations successives
d’angle 2π
p autour de P amène Q1 sur les points Q2 , · · · , Q p qui
sont tous des centres d’ordre q. Ces points sont sur un petit cercle
de centre P et de rayon PQ1 , qui ne posséde aucun centre d’ordre
strictement plus grand que 2 en son intérieur.
Considérons le produit de la rotation d’angle 2π p autour de P

par la rotation d’angle q autour de Q1 . C’est une rotation d’angle
− 2π
r autour du point R tel que le triangle sphérique PQ1 R a pour
angles πp , πq et πr . Le point R est donc sur la bissectrice de Q p PQ1 .
A ce stade, on ne peut dire que r est un entier (on peut avoir 2π
r =
k 2π
s ) mais comme la somme des angles d’un triangle sphérique est
strictement plus grande que π, on sait que
1 1 1
+ + > 1.
p q r
30 représentation des groupes et application à la physique

Mais p ≥ 3 et q ≥ 3. Donc r < 3 et l’angle πq en Q1 du triangle PQ1 R


est plus petit que son angle πr en R. Il en résulte que R est à l’inté-
rieur du petit cercle 2 autour de P contenant les Qi . Comme il n’y a 2. Les angles sont égaux quand R est sur
pas d’axe d’ordre strictement plus grand que 2 dans cet intérieur, R le petit cercle et que le triangle PQ1 R
est isocèle.
est nécessairement un centre d’ordre 2. La rotation d’angle − 2π r est
un demi-tour. Comme elle amène Q p en Q1 (c’est le produit de la
rotation d’angle 2π 2π
p autour de P par la rotation d’angle q autour de
Q1 ), R est sur le grand cercle joignant Q p à Q1 . C’est donc le milieu
du côté Q p Q1 du polygone sphérique Q1 Q2 · · · Q p .
Des rotations successives d’angle 2π q autour de Q1 transforme ce
polygone régulier (d’angle 2π p et possédant p côtés) en un ensemble
de q p-gones réguliers entourant Q1 , dont chaque sommet est un
centre d’ordre q. Continuant de la sorte en effectuant des rotations
d’angle 2πq autour des autres centres d’ordre q, on recouvre toute la
sphère par des p-gones réguliers.
Les transformés de Q1 sont donc les sommets d’un polyèdre
régulier { p, q}, les transformés de P étant les centres des faces et les
transformés de R les milieux des arêtes (projetés radialement sur la
sphère). Le groupe G est un des groupes des polyèdres { p, q}.

Résumé La liste complète des sous-groupes finis de SO(3) est don-


née par les groupes :
C p , D p , T, O, Y . (2.14)

Parmi ceux-ci, il y a 11 groupes cristallographiques,

C1 = {e}, C2 , C3 , C4 , C6 , D2 , D3 , D4 , D6 , T, O . (2.15)

Les 32 groupes cristallographiques ponctuels


Les groupes cristallographiques ponctuels sont par définition
les sous-groupes finis cristallographiques de O(3). Le sous-groupe
d’un groupe cristallographique ponctuel qui contient les transforma-
tions de déterminant +1 est un sous-groupe fini cristallographique
de SO(3) et donc un des onze groupes donnés ci-dessus. Ce sous-
groupe est un sous-groupe normal d’indice 2.
On obtient le groupe cristallographique ponctuel le plus général
en ajoutant de manière cohérente des “réflexion-rotations" (éléments
de O(3) de déterminant −1). Ce problème a été étudié systématique-
ment et conduit à 32 possibilités. La liste des 32 possibilités est don-
née dans la littérature à laquelle nous renvoyons le lecteur intéressé.
On y trouvera aussi, pour chacun des groupes cristallographiques
ponctuels, la table des représentations irréductibles.
Les sous-groupes finis de O(3) apparaissent comme groupes de
symétries de molécules. Les groupes cristallographiques ponctuels
groupes cristallographiques ponctuels 31

apparaissent aussi dans l’études des groupes cristallographiques,


c’-à-d., des sous-groupes du groupe euclidien IO(3) qui préserve un
réseau (“réseau cristallin"). Ces groupes contiennent des translations
et sont donc infinis (pas de point fixe). Il y a 230 groupes cristallogra-
phiques distincts. Soit G∞ un groupe cristallographique. Les éléments
de G∞ sont de la forme (S, − →
τ ) où S ∈ O(3) et − →
τ est une translation

→ −→ 0 −
→ −

( x → x = S x + τ ). Les S apparaissant dans G∞ forment un
sous-groupe fini cristallographique de O(3) qu’on appelle groupe
ponctuel du réseau et qui doit être l’un des 32 groupes mentionnés
ci-dessus. Les réseaux ayant le même groupe ponctuel appartiennent
“à la même classe cristalline". Il y a donc 32 classes cristallines.
Chaque réseau est caractérisé par une cellule minimale, un paral-
lélipipède de volume minimal délimité par trois vecteurs ~a,~b, ~c qui
sont des translations minimales de G∞ . On peut regrouper les 32
classes cristallines en 7 systèmes cristallographiques qui possèdent
une forme commune de la cellule minimale. On dénote la longueur
de ~a,~b, ~c par a, b, c et leurs angles par α, β, γ (~b ·~c = bc cos α, etc). On a

Nom Nombre de classes Caractéristiques Exemples physiques


cristallines
A Triclinique 2 a 6= b 6= c, α 6= β 6= γ Sulfate de Cuivre
B Monoclinique 3 a 6= b 6= c, α = γ = 90◦ 6= β Gypse
C Orthorhombique 3 a 6= b 6= c, α = β = γ = 90◦ Plutonium
D Rhombohédral 5 a = b = c, α = β = γ 6= 90◦ Quartz
E Tétragonal 7 a = b 6= c, α = β = γ = 90◦ Etain
F Hexagonal 7 a = b 6= c, α = β = 90◦ ; γ = 120◦ Zinc
G Cubique 5 a = b = c, α = β = γ = 90◦ Cuivre, Or, Diamant, Fer
3
Représentation des groupes finis

Alors que la classification des groupes finis est une tache ardue,
la théorie des représentations des groupes finis peut être exposée
en toute généralité en quelques dizaines de pages. Nous le ferons
donc ici. Tous les outils présentés ici peuvent être appliqués pour un
groupe fini quelconque.

3.1 Notions élémentaires

On considère dans ce cours uniquement les représentations li-


néaires que nous les appelerons simplement représentations.

Représentation (Définition 1) Soit G un groupe et V un espace vecto-


riel. On appelle représentation du groupe G dans l’espace V toute
application T qui fait correspondre à chaque élément g ∈ G un
opérateur linéaire T ( g) de l’espace V, telle que
— T (e) = I où e est le neutre de G et I l’application identité de V
— T ( g1 ? g2 ) = T ( g1 ) T ( g2 ) , ∀ g1 , g2 ∈ G
L’espace V est appelé espace de la représentation T, la dimension de
V est la dimension de la représentation et les opérateurs T ( g) sont
les opérateurs de la représentation.
En physique, l’espace vectoriel V a le rôle d’un espace d’états
physiques du système sous considération ou espace de configura-
tion. Le groupe de symétrie du système peut agit sur cet espace de
configurations.

Représentation (Définition 2) De manière équivalente, une représen-


tation de G dans l’espace V est un homomorphisme T de G dans le
groupe GL(V ) des opérateurs linéaires bijectifs de V.
Soit ea une base de V. On utilisera par la suite la convention que
ea sont des covecteurs. Les matrices de représentation agissent donc
comme une multiplication par la droite Ici, les indices peuvent être placés en
haut ou en bas en utilisant la métrique
Euclidienne δ ab et δab définie sur
l’espace vectoriel V. Nous garderons
tous les indices en bas par convention.
34 représentation des groupes et application à la physique

T ( g)ea = eb ( T ( g))ba (3.1)

Ainsi, si v = v a ea ∈ V, les composantes v a dans la base se trans-


forment sous multiplication matricielle comme un vecteur colonne,

( T ( g)v) a = ( T ( g)) ab vb . (3.2)

Représentation fidèle Une représentation est fidèle si l’homomor-


phisme T : G 7→ GL(V ) est injectif (Ker( T ) = e), de telle sorte que G
est isomorphe à Im( T ).

Représentation triviale Une représentation de G est triviale si elle


associe à tout g ∈ G l’opérateur identité. Dans ce cas, Ker( T ) = G.

Remarques
— Ker( T ) est un sous-groupe normal de G. Comme un groupe
simple n’a pas de sous-groupe normal non-trivial, Ker( T ) = e ou
Ker( T ) = G. Donc, les représentations d’un groupe simple dans
un espace V sont toutes fidèles, à l’exception de la représentation
triviale.
— Si G est lui-même un groupe d’opérateurs linéaires, alors l’ap-
plication identique de G sur G est elle-même une représentation
T ( g) = g.
— Soit H un sous-groupe de G. Toute représentation de G dans
l’espace vectoriel V définit une représentation de H dans V, par
restriction aux éléments de H.

Entrelacement, Isomorphisme et Equivalence Un opérateur d’entrela-


cement ou G-morphisme S : V1 7→ V2 entre deux représentations
( T1 , V1 ) et ( T2 , V2 ) de G est une application linéaire telle que

ST1 ( g) = T2 ( g)S, ∀ g ∈ G. (3.3)

Un isomorphisme est un opérateur d’entrelacement inversible. Deux


représentations T 1 et T 2 sont dites équivalentes T 1 ∼ T 2 si elles sont
isomorphes. Rappel : Un sous-espace M ⊂ V est
invariant pour la représentation T s’il
Lemme 3.1 (Schur). Soient T 1 et T 2 deux représentations irréducibles de est invariant relativement à tous les
opérateurs T ( g), T ( g) M ⊂ M, ∀ g ∈ G.
G et S un opérateur d’entrelacement entre T 1 et T 2 . Alors il y a deux cas Les sous-espaces triviaux {0} et V
possibles : soit S est un isomorphisme, T 1 ∼ T 2 et S = λI, λ ∈ C ou soit sont invariants. Une représentation est
T 1  T 2 et S = 0. irréductible si elle ne possède pas de
sous-espace invariant non-trivial. Une
représentation qui n’est pas irréductible
Démonstration. Soient V1 et V2 les espaces des représentations T 1 et
est appellée réductible.
T 2 . Ker(S) et Im(S) sont des sous-espaces invariants respectivement
de V1 et V2 . L’irréducibilitié implique que soit Ker(S) = V1 et donc
Im(S) = ∅ c’est-à-dire S = 0, soit Ker(S) = ∅ et donc Im(S) =
représentation des groupes finis 35

V2 c’est-à-dire S est un isomorphisme. Dans le cas T 1 ∼ T 2 , le


polynôme en λ det(S − λI ) = 0 a au moins une solution λ = λ0 .
Alors Ker(S − λ0 I ) 6= 0. Le G-morphisme S − λ0 I alors admet
Ker(S − λ0 I ) = V1 c’est-à-dire S = λ0 I.
En mécanique quantique, les éléments
On considère dans ce cours uniquement les espaces vectoriels V de V sont dénotés avec une notation ket
|vi, v ∈ V tandis que les éléments de
muni d’un produit scalaire hermitien (w|v) avec v, w ∈ V, c’est-à-dire l’espace conjugué V ∗ sont dénotés avec
satisfaisant (w|v)∗ = (v|w). un bra hw|, w ∈ V ∗ . Le produit scalaire
est dans cette notation hw|vi = hw · vi.

Représentation unitaire Une représentation ( T, V ) de G est unitaire si


V est muni d’un produit scalaire hermitien invariant sous l’action de
G, c’est-à-dire

( T ( g)w| T ( g)v) = (w, v), ∀ g ∈ G. (3.4)

Caractère d’une représentation Soit ( T, V ) une représentation du


groupe G. Le caractère d’un élément g ∈ G est défini comme

χV ( g) = trV T ( g). (3.5)

On notera aussi souvent χ T en référence à la représentation T.

Propriétés
— Le caractère d’un élément du groupe dans une représentation
donnée dépend uniquement de sa classe de conjugaison. En effet,

χV (hgh−1 ) = χV ( g), ∀ g, h ∈ G.

— Autres propriétés :
χV (e) = dim(V ),

χV1 ⊕V2 = χV1 + χV2 ,

χV1 ⊗V2 = χV1 · χV2 ,



χV ∗ = χV .

3.2 Représentation régulière


Pour Z3 = {e, a, a2 }, on associe
Représentation régulière (Définition 1) Soit G = {e, g1 , . . . , gn−1 } un
e 7 → e e ≡ (1 0 0),
groupe fini d’ordre n. Soit l’espace de représentation VR ≡ Cn muni
a 7 → e a ≡ (0 1 0),
du produit scalaire hermitien usuel (v|w) = v∗ · w, ∀v, w ∈ VR . On
a 2 = a −1 7 → e a2 ≡ (0 0 1 ).
associe à chaque élément gi de G un élément e gi de VR tel que {e gi }
Alors
soit une base orthonormée de VR . La représentation régulière (à  
1 0 0
droite) TR : G 7→ GL(Cn ) est définie comme TR (e) =  0 1 0 ,
0 0 1
TR ( g)eh = eh? g−1 , ∀ g, h ∈ G. (3.6)  
0 0 1
TR ( a) =  1 0 0 ,
0 1 0
 
0 1 0
2
TR ( a ) =  0 0 1  .
1 0 0
36 représentation des groupes et application à la physique

Par définition, la représentation régulière consiste en n matrices de


permutation des éléments de la base Cn .
Pour les groupes finis, la représentation régulière a une impor-
tance capitale. On montrera plus tard qu’elle contient toutes les
On vérifie
représentations irréducibles de G. Elle permettra de démontrer le  
théorème de Peter-Weyl. Dans ce but, nous allons donner une défini- 0 1 0
2
TR ( a )ea2 = (0 0 1) ·  0 0 1  = ee .
tion plus formelle de la représentation régulière. 1 0 0
On dénote  
0 1 0
L2 ( G ) 2
TR ( a )ea = (0 1 0) ·  0 0 1  = ea2 .
1 0 0
l’espace de fonctions sur G à valeurs complexes. L’ensemble L2 ( G ) Par exemple, le caractère χV d’une
est un espace vectoriel puisque (α f + βh)( g) = α f ( g) + βh( g), représentation ( T, V ) est un élément de
L2 ( G ).
∀ f ∈ L2 ( G ) et ∀α, β ∈ C. La dimension de L2 ( G ) est n, l’ordre du
groupe puisque toute fonction f est complètement déterminée par
les valeurs ( f ( g1 ), . . . f ( gn )) qu’elle prend sur les n éléments gi du
groupe. On a donc en tant qu’espace vectoriel L2 ( G ) ' Cn . Une
base est donnée par les fonctions {e gi } telles que e gi ( g j ) = δij . Tout
f ∈ L2 ( G ) peut être écrit dans cette base comme

f = ∑ f ( gi ) e gi . (3.7)
gi ∈ G
On vérifie qu’il s’agit d’une représenta-
tion :
Représentation régulière (Définition 2) A tout élément g ∈ G du TR ( g1 ? g2 ) f (h) = f ( h ? g1 ? g2 )
groupe G on associe un opérateur linéaire TR ( g) agissant sur les = ( TR ( g2 ) f )(h ? g1 )
fonctions f de L2 ( G ) par la relation = ( TR ( g1 )( TR ( g2 ) f ))(h)
d’où TR ( g1 ? g2 ) = TR ( g1 ) TR ( g2 ).
TR ( g) f = f g (3.8) On vérifie quélle est linéaire :
TR ( g)(α1 f 1 + α2 f 2 )(h) = (α1 f 1 + α2 f 2 )(h ? g)
où la fonction f g ∈ L2 ( G ) est définie par
= α1 f 1 ( h ? g ) + α2 f 2 ( h ? g )
= α1 TR ( g) f 1 (h) + α2 TR ( g) f 2 (h).
f g ( h ) = f ( h ? g ). (3.9)

On vérifie l’équivalence des définitions. Suivant la définition (3.8),

( TR ( gi )(e gj ))( gm ) = e gj ( gm gi )
= e g j ( gn )
= δj,n

où gn = gm gi . Le membre de droite est non nul ssi g j = gm gi ou de


manière équivalente g j gi−1 = gm . On a donc

TR ( gi )(e g j ) = e g g−1 (3.10)


j i

ce qui est la définition 3.6.


L2 ( G ) est équipé du produit hermitien moyen sur G qui est un
produit scalaire hermitien On omettra en séances d’exercices
le sous-indice M pour simplifier la
notation. Dans ce syllabus, on gardera
le sous-indice M vu qu’on définit
d’autres produits scalaires.
représentation des groupes finis 37

1
( f1 | f2 ) M =
n ∑ f 1∗ ( g) f 2 ( g). (3.11)
g∈ G

1
En particulier ( f | f ) M = n ∑ g∈G | f ( g)|2 ≥ 0 et ( f | f ) M = 0 ssi
f ( g) = 0 ∀ g ∈ G.

Proposition 3.1.1. La représentation régulière est unitaire pour le produit


hermitien moyen.

Démonstration.
1
( TR ( g) f 1 | TR ( g) f 2 ) M =
n ∑ (TR ( g) f1 )∗ (h)(TR ( g) f2 )(h)
h∈ G
1
=
n ∑ f 1∗ (hg) f 2 (hg)
h∈ G
1
=
n ∑
0
f 1∗ (h0 ) f 2 (h0 )
h ∈G
= ( f1 | f2 ) M

avec h0 = hg (h0 parcours le groupe une et une seule fois comme


h).

3.3 Equivalence aux représentations unitaires et réducibilité

Théorème 3.2. Toute représentation d’un groupe fini est équivalente à une
représentation unitaire.

Démonstration. Soit G un groupe fini d’ordre n, V son espace de la


représentation et ( | ) le produit hermitien sur V. Soient T ( g) les
opérateurs de la représentation. On n’a pas a priori ( T ( g) x | T ( g)y) =
( x, y), mais on va montrer qu’il existe un isomorphisme S tel que
( T 0 ( g) x | T 0 ( g)y) = ( x |y) où T 0 ( g) = ST ( g)S−1 . A cette fin, on intro-
duit le produit hermitien auxiliaire En fait, la preuve s’applique également
aux groupes infini-dimensionnels
1 compacts et à leurs représentations
( x |y)G =
n ∑ ( T ( g) x | T ( g)y) finies. Il faut alors définir
g∈ G Z
( x |y)G = dτ ( T ( g) x | T ( g)y) .
qui est bien défini puisque la somme est finie. G

On a Pour un groupe compact et une repré-


sentation finie, l’intégrale est finie.
1. ( x |y)G = ((y| x )G )∗
2. ( x |α1 y1 + α2 y2 )G = α1 ( x, y1 )G + α2 ( x, y2 )G
3. ( x | x )G ≥ 0
avec ( x | x )G = 0 ssi chacun des termes non négatifs ( T ( g) x | T ( g) x ) est
nul et donc en particulier ( T (e) x | T (e) x ) = ( x | x ) = 0 ce qui implique
x = 0. Le produit ( | )G est donc bien hermitien.
38 représentation des groupes et application à la physique

Les opérateurs T ( g) sont unitaires pour le produit scalaire auxi-


liaire ( | )G . En effet,

1
( T ( g) x | T ( g)y)G =
n ∑
0
( T ( g0 ) T ( g) x | T ( g0 ) T ( g)y)
g ∈G
1
=
n ∑
0
( T ( g0 g) x | T ( g0 g)y)
g ∈G

Mais lorsque g0 parcourt le groupe une et une seule fois, le produit


g0 g parcourt aussi le groupe une et une seule fois. Donc

1
( T ( g) x | T ( g)y)G =
n ∑ ( T (h) x | T (h)y) = ( x |y)G .
h∈ G

La représentation T est donc bien unitaire pour ( | )G .


Soit {ēk } une base orthonormée pour le produit scalaire hermitien
auxiliaire et {ek } une base orthonormée pour le produit de départ.
On a ek = Sēk pour un certain opérateur inversible S (opérateur de
changement de base). Comme (ēk |ēl )G = δkl = (ek |el ) = (Sēk |Sēl )
pour tous k, l, on a aussi

( x |y)G = (Sx |Sy), ( x | y ) = ( S −1 x | S −1 y ) G

pour tous vecteurs x, y ∈ V.


Soit T 0 ( g) = S T ( g) S−1 . Démontrons que les opérateurs T 0 ( g) sont
unitaires pour le produit scalaire hermitien de départ. On a :

( T 0 ( g) x | T 0 ( g)y) = (ST ( g)S−1 x |ST ( g)S−1 y)


= ( T ( g ) S −1 x | T ( g ) S −1 y ) G
= ( S −1 x | S −1 y ) G
= ( x |y)

ce qui démontre l’assertion.

Lemme 3.3. Soit ( T, V ) une représentation unitaire et W ⊆ V un sous-


espace invariant. Alors le complément W ⊥ est aussi invariant.

Démonstration. Si v ∈ W ⊥ alors (v|w) = 0, ∀w ∈ W. Soit w ∈ W, alors


T ( g)−1 w ∈ W par hypothèse. On a 0 = (v| T ( g)−1 w) = ( T ( g)v|w).
Donc T ( g)v ∈ W ⊥ , ∀ g ∈ G, ∀v ∈ W ⊥ et W ⊥ est invariant.

Proposition 3.3.1. Toute représentation unitaire est complètement réduc-


tible.

Démonstration. Soit V l’espace de représentation. Si la représentation


est irréductible, il n’y a rien à démontrer. Supposons qu’elle est
réductible. Soit W1 un sous-espace invariant. On a V = W1 ⊕ W1⊥
en tant qu’espace vectoriel. De plus par le lemme précédent, la
représentation des groupes finis 39

somme est directe en tant qu’espace de représentation du groupe. On


procède ensuite par itérations successives en décomposant W1 et W1⊥ ,
avec W1 = W2 ⊕ W2⊥ , etc. La procédure se termine car V est fini.

Corollaire 3.3.1. Toute représentation d’un groupe fini se décompose comme


une somme directe C’est aussi vrai pour toute représenta-
tion finie d’un groupe compact.
T = m1 T1 ⊕ m2 T2 ⊕ · · · ⊕ mk Tk

de représentations irréductibles. Pour décrire la représentation la plus


générale, il faut connaître toutes les représentations irréductibles.

3.4 Relations d’orthogonalité

Soient T 1 , T 2 , · · · des représentations irréductibles de G dans les


espaces V 1 , V 2 , · · · qui peuvent être de dimensions distinctes. On
suppose qu’elles sont unitaires pour le produit scalaire usuel dans
dim(V i )
V i , ( w | v ) = ∑ k =1 wk∗ vk . On dénote par (t1 ( g)) ab , (t2 ( g))ij , · · · les
éléments de matrice des matrices T 1 ( g), T 2 ( g), . . . associées à g avec
a, b, · · · = 1, . . . , dim(V 1 ), i, j, · · · = 1, . . . , dim(V 2 ), . . . Ils obéissent à
la condition
 †
(t1 ( g−1 )) ab = (t1 ( g)) ab = t1 ( g)∗ba , . . .

Les éléments de matrice (t1 ) ab sont des fonctions sur G à valeurs


complexes et appartiennent donc à l’espace vectoriel L2 ( G ) défini
précédemment dans le cadre de la représentation régulière. On
rappelle que L2 ( G ) est équipé du produit scalaire moyen (3.11).

Théorème 3.4 (Relations d’orthogonalité). Soient T 1 et T 2 deux repré-


sentations irréductibles d’un groupe fini G et (t1 ) ab , (t2 )ij les fonctions de
L2 ( G ) correspondantes. Alors :
— Si T 1 et T 2 sont inéquivalentes,

T1  T2 ⇒ ((t1 ) ab |(t2 )ij ) M = 0, ∀ a, b, i, j

— Si T 1 et T 2 sont équivalentes, les indices i, j, . . . prennent les mêmes


valeurs que a, b, . . . et

1
T1 ∼ T2 ⇒ ((t1 ) ab |(t1 )cd ) M = δac δbd ∀ a, b, c, d
n1

où n1 est la dimension de la représentation T 1 .

Démonstration. Soit B un opérateur linéaire quelconque de V 2 dans


V 1 . Posons
1
C = ∑ T 1 ( g ) B T 2 ( g −1 ).
n g
40 représentation des groupes et application à la physique

On a :
1
T 1 (h) C = T 1 (h)
n ∑ T 1 ( g ) B T 2 ( g −1 )
g
1
=
n ∑ T 1 ( h ) T 1 ( g ) B T 2 ( g −1 )
g
1
=
n ∑ T1 (hg) B T2 ( g−1 )
g
1
=
n ∑0 T1 ( g0 ) B T2 ( g0−1 h)
g
1
=
n ∑0 T1 ( g0 ) B T2 ( g0−1 )T2 (h)
g
!
1
=
n ∑T 1 2
( g) B T ( g −1
) T 2 (h)
g

= C T 2 (h)

où on a posé g0 = hg et donc g−1 = g0−1 h, et utilisé le fait que si g


parcourt le groupe une et une seule fois, il en est de même de g0 (h
est fixé). L’opérateur C est donc un opérateur d’entrelacement.
Par conséquent, si les représentations irréductibles T 1 et T 2 sont
inéquivalentes, T 1  T 2 , on a C = 0 par le lemme de Schur (∀ B) ou
encore, de manière explicite,
n1 n2
1
n ∑ ∑ ∑ (t1 ( g−1 ))ac Bck (t2 ( g))kj = 0
g ∈ G c =1 k =1

où on a remplacé g par g−1 dans la somme sur le groupe. Comme la


représentation T 1 est unitaire, on peut récrire cette équation comme
suit,
n1 n2
1
n g∈G c=1 k∑
∑ ∑ (t1 ( g))∗ca Bck (t2 ( g))kj = 0
=1

Prenons Bck = δcb δki (tous les éléments de matrice de B sont nuls,
sauf l’élément en position (b,i) qui est égal à 1). La relation devient

1
n ∑(t1 ( g))∗ba (t2 ( g))ij = 0
g

c’-à-d
((t1 ) ab |(t2 )ij ) M = 0 ( T 1  T 2 ).
Supposons à présent T 1 ∼ T 2 . Par le lemme de Schur, on sait que
C = λ B I où λ B est une constante qui peut dépendre de B. Donc on a
n1 n1
1
n ∑ ∑ ∑ (t1 ( g))∗ea Be f (t1 ( g)) f c = λB δac .
g ∈ G e =1 f =1
représentation des groupes finis 41

Que vaut λ B ? En prenant la trace de C, on obtient tr C = n1 λ B . Mais


d’autre part, d’après la définition de C,

1   1
tr C =
n ∑ tr T 1 ( g ) B T 1 ( g −1 ) =
n ∑ tr B = tr B
g g

d’où l’on tire n1 λ B = tr B. Prenant Be f = δeb δ f d (tous les éléments de


matrice de B sont nuls, sauf l’élément en position (b,d) qui est égal à
1), on obtient
1 1
n∑
((t1 ( g))∗ba (t1 )dc ( g) = δac δbd
g n 1

(la trace de B vaut δbd ), c’-à-d

1
((t1 ) ab |(t1 )cd ) M = δac δbd
n1

après avoir réarrangé les indices et ignoré les transposées irrelevantes


ici.
Rappel : l’ensemble à valeurs dans R
f 1 , . . . , f m est libre si ∑im=1 αi f i = 0 ⇒
Corollaire 3.4.1. Les éléments de matrice (ti ) ab des différentes représenta- α1 = · · · = αm = 0.
tions irréductibles forment un système orthogonal et en particulier libre 1 de 1. En effet, si m fonctions f 1 , f 2 , . . . , f m ∈
L2 ( G ). Comme L2 ( G ) est fini-dimensionnel, les (ti ) ab sont en nombre fini L2 ( G ) sont orthogonales deux à deux

et leur nombre ne peut dépasser l’ordre n du groupe (= dim L2 ( G )). Il en ré- ( f i | f j ) = 0, i 6= j


sulte qu’il n’existe qu’un nombre fini (≤ n) de représentations irréductibles et sont non-nulles
deux à deux inéquivalentes d’un groupe fini. ( f i | f i ) 6= 0, ∀i
alors les fonctions sont linéairement
indépendantes, c’est-à-dire forment un
3.5 Théorèmes de Peter-Weyl et Burnside système libre. (Preuve par l’absurde)

Système complet de représentations irréductibles On dit qu’une famille


T 1 , . . . T m de représentations irréductibles d’un groupe G forme un
système complet ssi
— les représentations T 1 , · · · , T m sont irréductibles et deux à deux
inéquivalentes ;
— toute représentation irréductible de G est équivalente à une des
représentations T i .

Théorème 3.5 (Peter-Weyl). L’espace L2 ( G ) des fonctions complexes


sur le groupe G admet une base orthonormée d’un système complet de
représentations irréductibles T 1 , · · · , T m de G. Cette base est donnée par

les éléments de matrice normés nk (ti ) ab (i = 1, · · · , m et a, b, · · · =
1, · · · , ni = dim(V i )).

Démonstration. Soit un système complet de représentations irré-


ductibles T 1 , · · · , T m de G. On a déjà prouvé que leurs éléments de
matrice sont linéairement indépendants (système libre) et orthogo-

naux. Ils sont orthonormés après les avoir normés comme nk (ti ) ab .
42 représentation des groupes et application à la physique

Il suffit donc de prouver que c’est un système complet, c-à-d que


toute fonction f ∈ L2 ( G ) peut s’écrire comme combinaison linéraire
des (ti ) ab .
Considérons la représentation régulière T de G,

T ( g) f (h) = f (hg).

Comme elle est unitaire, elle est complètement réductible et peut


s’écrire comme somme directe de représentations irréductibles,

L2 ( G ) = V1 ⊕ V2 ⊕ · · · ⊕ Vp

où les Vi sont des sous-espaces invariants tels que la restriction de T


à Vi est irréductible et donc équivalente à une des représentations du
système complet, soit T `(i) pour une certaine fonction `.
En choisissant bien la base de Vi , on peut s’arranger pour que les
éléments de matrice de T ( g) restreints à Vi soient égaux à (t`(i) ) ab .
`(i )
Si { f a } est cette base (a = 1, · · · , n`(i) ), on a explicitement
n`(i)
`(i ) `(i )
T ( g) f a = ∑ fb (t`(i) )ba ( g),
b =1
`(i )
ou encore, puisque fa ∈ L2 ( G )
  n`(i)
`(i ) `(i )
T ( g) f a (h) = ∑ fb (h)(t`(i) )ba ( g).
b =1
 
`(i ) `(i )
Mais par définition, T ( g) f a (h) = f a (hg). Donc,
n`(i)
`(i ) `(i )
fa (hg) = ∑ fb (h)(t`(i) )ba ( g).
b =1
`(i ) `(i )
Prenons h = e et posons f a (e) = c a . On obtient ainsi :
n`(i)
`(i ) `(i )
fa ( g) = ∑ cb (t`(i) )ba ( g).
b =1
`(i )
Ceci montre que les fonctions f a sont combinaisons linéaires des
fonctions (t`(i) )ba . Comme la propriété est vraie pour chacun des
sous-espaces invariants Vi , on en tire que toutes les fonctions de la
base considérée de L2 ( G ) sont des combinaisons linéaires des (ti )ba ,
ce qui démontre bien que les {(ti ) ab } forment un ensemble complet
de fonctions de L2 ( G ).

Théorème 3.6 (Burnside). L’ordre n d’un groupe fini est égal à la somme
des carrés des dimensions des représentations irréductibles d’un système
complet de représentations de ce groupe,
m
n= ∑ ( n i )2 ,
i =1
représentation des groupes finis 43

où m est le nombre de représentations irréductibles non-équivalentes.

Démonstration. Les {(ti ) ab } forment une base de L2 ( G ). Pour chaque


i, on a (ni )2 fonctions. Donc on a au total ∑im=1 (ni )2 éléments dans la
base {(ti ) ab }. Mais d’autre part, dimL2 ( G ) = n, ce qui implique le
théorème.
Premier exemples :
1 = 12
Remarque Parmi les ni , il y a toujours au moins 1 car la représenta- 2 = 12 + 12 Z2
2 2 2
tion triviale à une dimension est irréductible. 3 = 1 +1 +1 Z3
4 = 12 + 12 + 12 + 12 Z4 , Z2 × Z2

Décomposition de la représentation régulière d’un groupe fini


Théorème 3.7. La représentation régulière TR contient chaque représenta-
tion irréductible avec une multiplicité égale à sa dimension,

TR = n1 T 1 ⊕ n2 T 2 ⊕ · · · ⊕ nm T m .

Démonstration. Soit Mia le sous-espace à ni dimensions de L2 ( G )


engendré par les fonctions (tia )b ≡ (ti ) ab (b = 1, · · · , ni ) où i et a sont
fixés,
ni
f ∈ Mia ⇔ f ( g) = ∑ f b (ti ) ab ( g).
b =1
0
Par les relations d’orthogonalité, on a Mia ⊥ Mia0 pour i 6= i0 ou
a 6= a0 . En outre, comme les (ti ) ab forment une base, on a en tant
qu’espaces vectoriels
L2 ( G ) = ⊕i,a Mia .

Les sous-espaces Mia sont invariants pour la représentation régu-


lière. Pour démontrer cette propriété, examinons l’action de T ( g) sur
la fonction (ti ) ab de base de Mia ,
 
T ( g)(ti ) ab (h) = (ti ) ab (hg).

Mais les T i sont des représentations, T i (hg) = T i (h) T i ( g), c’-à-d., en


termes des éléments de matrice,
ni
(ti ) ab (hg) = ∑ (ti )ac (h)(ti )cb ( g),
c =1

ce qui montre que


  ni
T ( g)(tia )b (h) = ∑ (tia )c (h)(ti )cb ( g),
c =1

ou encore
ni
T ( g)(tia )b = ∑ (ti )cb ( g)(tia )c ∈ Mia .
c =1
44 représentation des groupes et application à la physique

On voit également que les éléments de matrice de T | Mi dans


a
la base {(tia )b } (b = 1, · · · , ni ) ne sont autres que les (ti ) ab ( g). La
représentation T | Mi induite dans le sous-espace Mia est donc T i .
a
Comme a va de 1 à ni , celle-ci apparaît ni fois.

Une autre démonstration sera donnée plus bas.

3.6 Caractères des représentations irréductibles

Relations d’orthogonalité des caractères


Théorème 3.8. Soient T i (i = 1, · · · , m) un système complet de représen-
tations irréductibles d’un groupe fini G et χi (i = 1, · · · , m) les caractères
correspondants. Alors,
(χi |χ j ) M = δij
où le produit hermitien moyen sur G est défini en (3.11).
i n
Démonstration. On a χi = ∑ a=
i
1 ( t ) aa . Calculons ( χi | χ j ) M :

ni nj
( χi | χ j ) M = ∑ ∑ ((ti )aa |(t j )αα ) M
a =1 α =1
1
= ∑ ni δij δaα δaα
a,α
ni
1
= ∑ n
δij δaa
a =1 i
= δij .

Corollaire 3.8.1. Les caractères χi sont linéairement indépendants.

Caractères et classes d’équivalences


Les caractères ne dépendent que des classes d’équivalence d’élé-
ments conjugués, χ( g) = χ(h−1 gh). Considérons le sous-espace M
de L2 ( G ) ne contenant que les fonctions constantes sur les classes
d’éléments conjugués ou fonctions des classes,

f ∈M ⇔ f ( g) = f (h−1 gh) ∀ g, h ∈ G.

Si q est le nombre de classes d’équivalence d’éléments conjugués, M


est un sous-espace vectoriel de dimension q.

Théorème 3.9. Les caractères χ1 , · · · , χm d’un système complet de repré-


sentations irréductibles d’un groupe fini G forment une base orthonormée de
M.
représentation des groupes finis 45

Démonstration. Il suffit de montrer la complétude, c-à-d. que toute


fonction f ∈ M peut s’écrire comme combinaison linéaire des
caractères χ1 , · · · , χm . Comme les {(ti ) ab } forment une base de L2 ( G ),
on a, pour toute fonction f ∈ M ⊂ L2 ( G ),

m nk
f ( g) = ∑ ∑ i
Cab (ti ) ab ( g)
i =1 a,b=1

Utilisons à présent le fait que f ( g) = f (h−1 gh) ∀h ∈ G. Ceci


implique
m nk
f ( g) = ∑ ∑ i
Cab (ti ) ab (h−1 gh).
i =1 a,b=1

Prenons la moyenne sur h de cette équation. Comme f ( g) ne dépend


pas de h, cela donne

m nk
1
f ( g) = ∑ ∑ i
Cab
n ∑ (ti )ab (h−1 gh).
i =1 a,b=1 h∈ G

Mais T i est une représentation unitaire,

ni
(ti ) ab (h−1 gh) = ∑ (ti )∗ca (h)(ti )cd ( g)(ti )db (h)
c,d=1

et donc,

ni
1
n ∑ (ti )ab (h−1 gh) = ∑ (ti )cd ( g) (tica |tidb ) M
h∈ G c,d=1
ni
1
= ∑ (ti )cd ( g) δ δ
ni cd ab
(relations d’orthogonalité)
c,d=1
1
= χ ( g)δab
ni i

De là, il vient

m nk
1
f ( g) = ∑ ni ∑ i
Cab χi ( g)δab
i =1 a,b=1
m
= ∑ ci χi ( g )
i =1

n 1 i
avec ci = ∑ a=
i
1 ni Caa .

Corollaire 3.9.1. Le nombre de représentations irréductibles inéquivalentes


d’un groupe fini G est égal au nombre de classes d’éléments conjugués de G.
46 représentation des groupes et application à la physique

Caractères et équivalence des représentations d’un groupe fini


Soit T une représentation quelconque de dimension finie du
groupe G. On sait que T est complètement réductible et donc

T = m1 T 1 ⊕ m2 T 2 ⊕ · · · ⊕ m m T m

où mi est la multiplicité de T i dans T. On a donc, pour les caractères,

χ T = m1 χ1 + m2 χ2 + · · · + m m χ m .

Par conséquent,

Proposition 3.9.1. Le coefficient de χi dans la décomposition du caractère


χ T de la représentation T dans la base des caractères {χi } est égal à la
multiplicité de T i dans T.

Si on connaît les caractères d’un système complet, on peut donc


dire quelles représentations, et avec quelles multiplicités, appa-
raissent dans la représentation T.
En utilisant les relations d’orthogonalité, on tire ensuite

(χ T |χ T ) M = m21 + m22 + · · · + m2m .

En particulier, on obtient

Proposition 3.9.2. Soit T une représentation,

(χ T |χ T ) M = 1

ssi T est irréductible.

Enfin, on a :

Théorème 3.10. Deux représentations T et T 0 sont équivalentes ssi elles ont


mêmes caractères.

Démonstration. On sait la condition nécessaire. Elle est aussi suffi-


sante. En effet, supposons χ T = χ T 0 . On a

T = m1 T 1 ⊕ m2 T 2 ⊕ · · · ⊕ m m T m

et
T 0 = m10 T 1 ⊕ m20 T 2 ⊕ · · · ⊕ m0m T m
ce qui implique

χ T = m1 χ1 + m2 χ2 + · · · + m m χ m

et
χ T 0 = m10 χ1 + m20 χ2 + · · · + m0m χm .
L’égalité χ T = χ T 0 implique dès lors que toutes les multiplicités sont
égales, mi = mi0 , car les χi forment une base. On en tire T ∼ T 0 .
représentation des groupes finis 47

3.7 Projecteurs sur sous-espace invariants

Étant donné une représentation T dans un espace V et une table


des caractères {χi }im=1 d’un système de représentations irréductibles
{ T i }im=1 , nous pouvons connaître quelles représentations apparaîssent
dans T et quelles sont leurs multiplicités. Une question restante
consiste à identifier le sous-espace invariant de V associé à une
représentation irréductible T i donnée (i fixé). On note Vi l’espace
vectoriel de la représentation T i .
Supposons que T contienne mi fois T i , T = mi T i ⊕ · · · . Soit

V = Y ⊕ Y⊥

— Y est le sous-espace invariant associé à la représentation T i , c’-à-


d., Y = Y1 ⊕ Y2 ⊕ · · · ⊕ Ymi où Y1 ' Y2 ' · · · ' Ymi est isomorphe
à l’espace Vi de la représentation T i et T |Yj ∼ T i de sorte que
T |Y ∼ m i T i ;

— Y ⊥ est le sous-espace invariant complémentaire tel que T |Y ⊥ ne


contient pas T i .

On veut déterminer Y et Y ⊥ .
Pour ce faire, on va construire le projecteur sur Y, c’-à-d. l’opé-
i i i
rateur linéaire π T tel que π T |Y = I, π T |Y ⊥ = 0 ce qui implique
 i 2 i i
πT = π T . Connaissant π T , on trouve Y et Y ⊥ par les relations

i i
Y = Im π T , Y ⊥ = Ker π T .

Nous avons
i
Théorème 3.11. Le projecteur π T est donné par l’expression :

i dimT i
πT =
n ∑ χi∗ ( g) T ( g).
g

On dénote aussi dimT i = ni .

Démonstration. Posons

dimT i
ψ≡
n ∑ χi∗ ( g) T ( g).
g

ψ est un opérateur d’entrelacement de T avec elle-même :

ψT (h) = T (h)ψ ∀h ∈ G.
48 représentation des groupes et application à la physique

En effet,
dimT i
ψT (h) =
n ∑ χi∗ ( g) T ( g) T (h)
g

dimT i
=
n ∑ χi∗ ( g) T ( gh)
g

dimT i
=
n ∑ χi∗ ( g) T (hg0 ) avec g0 = h−1 gh
g

dimT i
=
n ∑0 χi∗ (hg0 h−1 ) T (hg0 )
g

dimT i
=
n ∑0 χi∗ ( g0 ) T (hg0 ) car χi∗ (hg0 h−1 ) = χi∗ ( g0 )
g

dimT i
=
n ∑0 χi∗ ( g0 ) T (h) T ( g0 )
g

dimT i
= T (h)
n ∑0 χi∗ ( g0 ) T ( g0 )
g
= T (h) ψ.

Soit R un sous-espace invariant, T ( g) R ⊂ R. Comme ψ est une


combinaison linéaire des opérateurs de la représentation, il est clair
que l’image par ψ de R est incluse dans R, ψ( R) ⊂ R et ψ| R T (h)| R =
T (h)| R ψ| R . Supposons R irréductible. Par le lemme de Schur 3.1, il
vient ψ| R = λIR . Pour déterminer λ, on calcule Tr ψ| R . On a
dimT i
Tr ψ| R =
n ∑ χi∗ ( g) χT|R ( g)
g
i
= dimT (χi |χ T |R ) M
(
dimT i si T | R ∼ T i
=
0 si T | R  T i

D’autre part, Tr(λ IR ) = λ dimR = λ dimT | R . On en conclut que


i
ψ = IR si T | R ∼ T i et ψ = 0 dans le cas contraire, c-à-d. ψ = π T .

Notons que la multiplicité mi de T i dans T est donnée par


i
Tr(π T )
mi = ( χi | χ T ) M = . (3.12)
dimT i

Représentation régulière On rappelle que les opérateurs de la repré-


sentation régulière sont des matrices n × n de permutations. Le neutre
est l’identité TR (e) = In×n et les autres matrices dans la base cano-
nique ont des zéros sur la diagonale (c’est une conséquence directe
de (3.10)). On a donc

Tr TR (e) = n, Tr TR ( gi ) = 0, ∀ gi 6= e. (3.13)
représentation des groupes finis 49

On en redérive le Théorème 3.7 : chaque représentation irréduc-


tible de G apparaît dans la représentation régulière un nombre de
fois égal à sa dimension. En effet, dans la représentation régulière,

i dimT i
Tr π T =
n ∑ χi∗ ( g) Tr TR ( g)
g

dimT i
= χi∗ (e) Tr TR (e)
n
= (dimT i )2

car χi (e) = dimT i . De là et de (3.12), il vient que la multiplicité mi de


T i dans T est égale à
i
Tr π T
mi = = dimT i .
dimT i

3.8 Décomposition d’une représentation quelconque en représen-


tations irréductibles

Si on connaît les éléments de matrice {(ti ) ab ( g)} d’un système


complet de représentations irréductibles, on peut pousser la décom-
position de la représentation T (quelconque) jusqu’au bout.
On a
T = ⊕m k =1 m k T
k

et
V = ⊕m
k =1 Y
k

avec
m
Y k = ⊕α=k 1 Yαk
où T |Y k ' T k et donc T |Y k ' mk T k . Les Y k sont les sous-espaces inva-
α
riants de la section précédente, obtenus par action des projecteurs
k nk
πT =
n ∑ χ∗k ( g) T ( g)
g

(dim T k = nk ). Le problème est de trouver les sous-espaces invariants


irréductibles Yαk .
Lorsque la multiciplité mk est > 1, la décomposition de Y k en
sous-espaces invariants n’est pas unique : alors que Y k est bien défini,
on verra que plusieurs choix sont possibles pour les sous-espaces
invariants irréductibles Yαk .
Pour arriver à la décomposition cherchée, on introduit pour tout
i = 1, · · · , m, les n2i opérateurs :

ni
i
Pab =
n ∑ (ti )∗ab ( g) T ( g) ∀ a, b = 1, · · · , ni . (3.14)
g∈ G
50 représentation des groupes et application à la physique

Lemme 3.12. Les opérateurs (3.14) obéissent aux propriétés suivantes :


n i T i
1. ∑ a=
i
1 Paa = π
i = n
i i i i i n
2. T (h) Pab ∑c=
i
1 ( t )ca ( h ) Pcb et Pab T ( h ) = ∑c=1 ( t )bc ( h ) Pac
i

j
i P = δ δ Pi
3. Pab cd ij bc ad
i
† i .
4. Pab = Pba
Démonstration. Ces propriétés se démontrent de la manière suivante :
1. Evident
2. On a :
ni
i
T (h) Pab =
n ∑ (ti )∗ab ( g) T (h)T ( g)
g∈ G
ni
=
n ∑ (ti )∗ab ( g) T (hg)
g∈ G
ni
=
n ∑ (ti )∗ab (h−1 g0 ) T ( g0 ) (hg = g0 )
g∈ G
nk
ni
=
n ∑
0
∑ (ti )∗ac (h−1 ) (ti )∗cb ( g0 ) T ( g0 )
g ∈ G c =1
ni
= ∑ (ti )ca (h) Pcbi
c =1

car (ti )∗ac (h−1 ) = ( ti ) ca ( h ) (les représentations sont unitaires). De


même,
ni
i
Pab T (h) =
n ∑ (ti )∗ab ( g) T ( g)T (h)
g∈ G
ni
=
n ∑ (ti )∗ab ( g) T ( gh)
g∈ G
ni
=
n ∑ (ti )∗ab ( g0 h−1 ) T ( g0 ) ( gh = g0 )
g0 ∈ G
ni
ni
=
n ∑
0
∑ (ti )∗ac ( g0 ) (ti )∗cb (h−1 ) T ( g0 )
g ∈ G c =1
ni
= ∑ (ti )bc (h) Paci .
c =1

3. Un calcul direct donne


ni
n g∑
j j
i
Pab Pcd = (ti )∗ab ( g) T ( g) Pcd
∈G
nj
ni
∑ ∑ (t j )ec ( g) Ped
j
= (ti )∗ab ( g) (par 2 ci-dessus)
n g∈ G e =1
nj

∑ ((ti )ab |(t j )ec ) M Ped


j
= ni
e =1
i
= δij δbc Pad (par les relations d’orthogonalité)
représentation des groupes finis 51

4. Enfin,
 † ni
i
Pab =
n ∑ (ti )ab ( g) T ( g)†
g∈ G
ni
=
n ∑ (ti )ab ( g) T ( g−1 )
g∈ G
ni
=
n ∑ (ti )ab ( g0−1 ) T ( g0 )
g0 ∈ G
ni
=
n ∑
0
(ti )∗ba ( g) T ( g0 )
g ∈G
i
= Pba

Il résulte en particulier des propriétés démontrées ci-dessus que


i j i
Paa Pbb = δij δab Paa

et  †
i i
Paa = Paa .
i forment un système de projecteurs orthogonaux. On définit
Les Pab
Vai = Paa
i V. Si v ∈ V i , alors, v = Pi v. Les sous-espaces V i sont
a aa a
orthogonaux pour différentes valeurs de i ou a,
j
Vai ⊥ Vb si i 6= j ou a 6= b.
Nous n’avons pas encore trouvé les Yαi
n mais on s’en rapproche...
Proposition 3.12.1. V = ⊕im=1 ⊕ a= i
i

1 Va .
ni
Démonstration. Soit W = ⊕im=1 ⊕ a= i

1 Va . Soit v0 ∈ V orthogonal à W,
(v0 |w) = 0 pour tout w ∈ W. On aurait alors (v0 | Paa i v ) = 0 pour tout
j
i v ) = ( v | Pi P v ) = 0 pour tout v ∈ V. Mais ce
v ∈ V et donc (v0 | Pab 0 aa ab
dernier produit scalaire dans V peut se réécrire
i
0 = (v0 | Pab v)
!
n
= v0 | i
n ∑ (ti )∗ab ( g) T ( g)v
g∈ G
ni
=
n ∑ (ti )∗ab ( g) f ( g) où on a posé f ( g) = (v0 | T ( g)v)
g∈ G

= ni ((ti ) ab | f ).

Mais les {tiab } forment une base de L2 ( G ), donc la fonction f ∈ L2 ( G )


est nulle pour tout v ∈ V, c-à-d.,

f ( g ) = ( v0 | T ( g ) v ) = 0

pour tout g ∈ G et v ∈ V. Prenons v = v0 et g = e dans cette équation.


On obtient (v0 |v0 ) = 0 et donc v0 = 0. Le seul vecteur orthogonal à V
est le vecteur nul et par conséquent, W = V.
52 représentation des groupes et application à la physique

i applique isométriquement (et donc bijectivement)


Proposition 3.12.2. Pab
j
Vbi sur Va ,

i
Pab Vbi = Vai , i
( Pab i
v| Pab w) = (v, w) ∀v, w ∈ Vbi .

Démonstration. Si v ∈ Vbi ≡ Pbb i V, alors Pi v = Pi Pi v = Pi Pi v ∈ V i .


ab ab bb aa ab a
Donc Pab i V i ⊂ V i . Mais d’autre part, V i = Pi V i = Pi Pi V i ⊂ Pi V i ,
b a a aa a ab ba a ab b
ce qui implique Pab i V i = V i . En fait, l’application Pi : V i → V i est
b a ab b a
non seulement bijective mais aussi isométrique car si v, w ∈ Vbi , alors,
i v | P i w ) = ( v | P i P i w ) = ( v | P i w ) = ( v | w ).
( Pab ab ba ab bb

On peut à présent effectuer la décomposition complète de V.


ni
On note que Y i = ⊕ a= i
1 Va . Soit mi la dimension commune des
m
Vai . Comme on cherche Y i = ⊕α=i 1 Yαi , on en déduit qu’il faut que
l’espace Yα recherché soit de dimension ni . Considérons d’abord V1i .
i

Choisissons une base orthonormée {eα1 } (α = 1, · · · , mi ) de V1i ,

(eα1 |e β1 ) = δαβ .

Cette base est définie à une transformation unitaire de V1i près. On


définit ensuite eiαa = Pa1
i ei . Les { ei } (α = 1, · · · , m ) forment une
α1 αa i
base orthonormée de Vai ,

(eαa |e βa ) = δαβ

et de manière plus générale, on a

(eαa |e βb ) = δαβ δab .

Soit Yαi le sous-espace correspondant à une valeur de α donnée,


c’-à-d. le sous-espace à ni dimensions engendré par les eαa (α fixé,
a = 1, · · · , ni ).

Proposition 3.12.3. Les sous-espaces Yαi sont invariants et T |Yi ' T i .


α

Démonstration. On a

T ( g)eiαa i i
= T ( g) Pa1 eα1
ni
= ∑ (ti )ba ( g) Pb1i eiα1
b =1
ni
= ∑ (ti )ba ( g)eiαb ,
b =1

ce qui démontre l’assertion.


A noter que pour les groupes de Lie
La décomposition cherchée de Y i est donc compacts, tout le raisonnement est
analogue ; il faut dans ce cas remplacer
m les sommes sur les éléments du groupe
Y i = ⊕α=i 1 Yαi par l’intégrale invariante sur le groupe.
représentation des groupes finis 53

n i
(= ⊕ a =
i
1 Va ). Elle n’est pas unique car il y a plusieurs manières de
choisir la base de V1i . Une fois la base de V1i choisie, les sous-espaces
invariants sont complètement déterminés par l’action du groupe. On
peut voir Yαi comme le sous-espace invariant contenant le vecteur eα1 .
Les vecteurs eα1 “constituent mi copies du premier vecteur de base"
de la représentation T i (dégénérée mi fois), et chacun engendre un
sous-espace invariant.
4
Système à trois ressorts et S3

Comme application concrète de la théorie des représentations,


nous exposerons le cas d’un système mécanique qui admet la sy-
métrie S3 . Nous commencerons par détailler les représentations de
S3 .

4.1 Représentations de S3

Le groupe des permutations de 3 objets est généré par

S3 = {e, (123), (132), (12), (13), (23)}


g1 , g2 , g3 , g4 , g5 , g6

Il y a trois classes d’éléments conjugués

C1 = { e },
C2 = {(12), (13), (23)},
C3 = {(123), (132)}

Il y a donc 3 représentations inéquivalentes. La dimension des repré-


sentations est 1, 1 et 2 car 6 = 12 + 12 + 22 est la seule possibilité.

Les 2 représentations de dimension 1


— La représentation triviale T 1 : g 7→ 1. Les caractères sont tous
χ1 ( g) = 1.
— La représentation alternée T 2 où les permutations paires sont
envoyées sur 1 et les impaires sont envoyées sur −1.

T 2 (e) = T 2 ((123)) = T 2 ((132)) = 1,


T 2 ((12)) = T 2 ((13)) = T 2 ((23)) = −1.

La table des caractères est


T2 g1 g2 g3 g4 g5 g6
χ2 1 1 1 −1 −1 −1
56 représentation des groupes et application à la physique

La représentation T 3 de dimension 2 On peut déduire les caractères à


partir des relations d’orthogonalité. On a

e (123), (132) (12), (13), (32)


χ1 1 1 1
χ2 1 1 −1
χ3 2 a b
Les contraintes (χ1 |χ3 ) = 0 et (χ1 |χ3 ) = 0 sont 2 + 2a + 3b = 0 et
2 + 2a − 3b = 0 ce qui donne b = 0 et a = −1. On vérifie (χ3 |χ3 ) = 1.
On peut construire la représentation de plusieurs manières. On
peut partir de la représentation T à trois dimensions donnée par les
matrices de permutation ~ei 7→ ~e p(i) . On calcule les caractères : On prend la convention selon laquelle
    les matrices de permutation agissent
0 1 0 0 1 0 à droite sur un vecteur ligne d’objets,
comme (3.1).
e 7→ I3×3 , (12) 7→  1 0 0  , (123) 7→  0 0 1  ,
   
0 0 1 1 0 0
χ T (e) = 3, χ T ((12)) = 1, χ T ((123)) = 0.

On trouve la décomposition

χ T = χ1 + χ3 .

On peut donc trouver la représentation T 3 en décomposant la repré-


sentation T comme la somme directe de la représentation triviale et
de T 3 .
Une manière plus directe de procéder consiste à observer que S3
est isomorphe au groupe de symétrie du triangle équilatéral.
Vérifions que le produit (13)(12) =
(123) soit correctement représenté.
Notons que l’on applique d’abord (12)
e 7→ I2×2 , et ensuite (13). Comme on agit sur
√ ! des vecteurs lignes à gauche, on doit
◦ −
√2
1
− 23 calculer
(123) 7→ Rotation de − 120 = 3 √ ! √
2 − 12 
1 0

−√21 − 23 − 1
− 23
!
√ ! = √2
3 0 −1 − 2 3 1 3
− 12
−√12 2 2
(132) 7→ Rotation de 120◦ = 2
− 23 − 21 ce qui donne bien le bon produit.
!
1 0
(12) 7→ Réflection selon Ox = (4.1)
0 −1
√ !
3
−√21 −
(13) 7→ Réflection selon un axe de −60◦ = 2
− 23 1
2
√ !
1 3

(23) 7→ Réflection selon un axe de 60◦ = √2
3
2
1
2 2

Représentation régulière Dans la base des fonctions ei , ei ( g j ) = δij . La


définition de la représentation régulière

TR ( g)eh = ehg−1
système à trois ressorts et s 3 57

donne
ei TR ( g) = e gi g−1
ce qui se lit comme la ligne ei fois une matrice TR ( g) donne la ligne e j
où g j = gi g−1 . Cela permet de construire la matrice TR ( g) ligne par Par exemple, ei TR ( g2 ) = e gi g3 .
ligne. Pour la ligne 1 de TR ( g2 ) on calcule
g1 g3 = g3 . On a donc ( TR ( g2 ))1a =
On trouve ( e3 ) a .
Pour la ligne 2 de TR ( g2 ) on calcule
 
0 0 1 0 0 0 g2 g3 = e. On a donc ( TR ( g2 ))2a = (e1 ) a .
 1 0 0 0 0 0 
 
Pour la ligne 3 de TR ( g2 ) on calcule
g3 g3 = g2 . On a donc ( TR ( g2 ))3a =
 
 0 1 0 0 0 0 
TR (e) = I6×6 , TR ( g2 ) = 
 0 0 0 0 1 0 
 (e2 ) a , etc.
 
 0 0 0 0 0 1 
 
0 0 0 1 0 0
   
0 1 0 0 0 0 0 0 0 1 0 0
 0 0 1 0 0 0   0 0 0 0 1 0 
   
   
 1 0 0 0 0 0 
 , TR ( g4 ) =  0 0 0 0 0 1 
 
TR ( g3 ) = 
 0 0 0 0 0 1   1 0 0 0 0 0 
   
 0 0 0 1 0 0   0 1 0 0 0 0 
   
0 0 0 0 1 0 0 0 1 0 0 0
   
0 0 0 0 1 0 0 0 0 0 0 1
 0 0 0 0 0 1   0 0 0 1 0 0 
   
   
 0 0 0 1 0 0   0 0 0 0 1 0 
TR ( g5 ) = 

 , TR ( g6 ) =  0 1 0 0 0 0  .
  
 0 0 1 0 0 0   
1 0 0 0 0 0 0 0 1 0 0 0
   
   
0 1 0 0 0 0 1 0 0 0 0 0
La représentation régulière contient toutes les représentations irréduc-
tibles. Plus précisément,

TR = T 1 ⊕ T 2 ⊕ 2T 3 (4.2)

On rappelle la table des caractères


e (123), (132) (12), (13), (32)
χ1 1 1 1
χ2 1 1 −1
χ3 2 −1 0
On trouve les sous-espaces invariants à partir des projecteurs.

Sous-espace invariant associé à T 1 Le projecteur vaut


 
1 1 1 1 1 1
 1 1 1 1 1 1
 

 
1 1 1 1 1 1 1 1
= ∑ χ1∗ ( g) TR ( g) = 
1
πT


6 g∈ G 6
 1 1 1 1 1 1 

 1 1 1 1 1 1
 

1 1 1 1 1 1
58 représentation des groupes et application à la physique

Il projette sur le sous-espace V1 = λx,

1
x= √ ( 1 1 1 1 1 1 )
6

des covecteurs ayant toutes les composantes égales. Nous avons


normé x · x = 1. On vérifie la propriété d’invariance : TR ( g ) V1 ⊂ V1
∀ g ∈ G. De plus, on a exactement TR ( g ) x = x. La représentation
TR | V1 est donc bien la représentation triviale T 1 .

Sous-espace invariant associé à T 2 Le projecteur vaut


 
1 1 1 −1 −1 −1
 1 1 1 −1 −1 −1
 

 
1 1 1 1 1 −1 −1 −1
6 g∑
2
πT = χ 2∗ ( g ) TR ( g ) = 
 

6  −1 −1 −1 1 1 1 
∈G  
 −1 −1 −1 1 1 1
 

−1 −1 −1 1 1 1

Il projette sur le sous-espace V2 = λy,

1
y= √ ( 1 1 1 −1 −1 −1 ).
6

On a TR ( g ) y = ± y avec le signe + si g est paire et − si g est


impaire. La représentation TR | V2 est donc bien la représentation
alternée T 2 . Aussi, les deux vecteurs propres x, y de TR ( g ) sont
orthogonaux, x · y = 0.

Sous-espace invariant associé à T 3 Le projecteur vaut


 
2 −1 −1 0 0 0
 −1 2 −1 0 0 0
 

 
2 1 − 1 − 1 2 0 0 0
6 g∑
3
πT = χ 3∗ ( g ) TR ( g ) = 
 

∈G
3  0
 0 0 2 −1 −1 

 0 0 0 −1 2 −1
 

0 0 0 −1 −1 2
3
On cherche les covecteurs v tels que vπ T = λv. Après un peu
d’algèbre on trouve que les composantes v i de v obéissent à v 1 +
v 2 + v 3 = 0 et v 4 + v 5 + v 6 = 0. De tels covecteurs forment
un espace vectoriel V3 à 4 dimensions. La représentation est donc
réductible, et on a TR | V3 = 2T 3 . Pour mettre en évidence les deux
représentations T 3 on décompose V3 comme V3 = V31 ⊕ V32 où
V31 h V32 est bidimensionel.
La base de V31 dans laquelle la représentation de S 3 est donnée par
les matrices 2 × 2 données en (4.1) est caractérisée par la propriété
système à trois ressorts et s 3 59

que les covecteurs de base sont les vecteurs propres de T 3 (( 12 )) =


T 3 ( g 4 ) pour les valeurs propres − 1 et 1.
Cherchons donc dans V3 les vecteurs propres de TR ( g 4 ) pour la
valeur propre 1 :
 
0 0 0 1 0 0
 0 0 0 0 1 0 
 
 
 0 0 0 0 0 1 
( v1 v2 v3 v4 v5 v6 )    = ( v1 v2 v3 v4 v5 v6 )
 1 0 0 0 0 0 

 0 1 0 0 0 0 
 
0 0 1 0 0 0

On a v 4 = v 1 , v 5 = v 2 , v 6 = v 3 . Les vecteurs doivent aussi appar-


tenir à V3 . On a deux solutions linéairement indépendantes. Il est
intéressant de choisir une base orthonormée. Par exemple :
1
v ≡ ( 1 −1 0 1 −1 0 ),
2
1
v0 ≡ √ ( 1 1 −2 1 1 −2 ).
2 3
On peut définir le sous-espace V31 comme le sous-espace invariant
qui contient v, et le sous-espace V32 comme le sous-espace invariant
qui contient v 0 .
On trouve V31 en agissant avec un autre élément de la représenta-
tion, par exemple TR ( g 2 ) . On trouve TR ( g 2 ) v = 21 (− 1 0 1 0 1 − 1 ) .
Comme
√ ! √
1 3
3 − 2 − 2 1 3
T ( g 2 )( 1 0 ) = ( 1 0 ) √
3
= (− − ),
2 −1 2
2 2

il est plus naturel de choisir comme deuxième covecteur de base dans


V31
 
2 1 1
w ≡ −√ TR ( g 2 ) + TR ( g 4 ) v = √ ( 1 1 − 2 − 1 − 1 2 )
3 2 2 3
Le covecteur w est clairement dans V31 et est vecteur propre de
TR ( g 4 ) pour la valeur propre − 1. Il est aussi orthogonal à v, w · v =
0, et normé w · w = 1. Le sous-espace V31 généré par v et w est
invariant car il est invariant sous TR ( e ) , TR (( 12 ) et TR (( 123 )) qui
génèrent tout le groupe. Dans ce sous-espace, TR se réduit à T 3 et les
vecteurs sont représentés par v = ( 1 0 ) , w = ( 0 1 ) .
On définit similairement le second covecteur de base w 0 de V32
comme
 
2 1 1
w0 ≡ − √ TR ( g 2 ) + TR ( g 4 ) v 0 = ( 1 − 1 0 − 1 1 0 ) .
3 2 2

qui obéit à w 0 · v 0 = 0, w 0 · w 0 = 1.
60 représentation des groupes et application à la physique

Base bloc diagonale En prenant les 6 covecteurs de base x, y, v, w, v 0 , w 0


comme nouvelle base, on ramène toutes les matrices TR ( g ) à une
forme diagonale par blocs. Plus précisément, on construit la matrice
O orthogonale, O T O = I, comme
 
x
 y 
 
 
 v 
O=   (4.3)
 w 

 0 
 v 
w0

et on vérifie l’égalité
 
1
 T2 (g) 
OTR ( g ) O − 1 =  .
 
 T3 (g) 
T̃ 3 ( g )

où la représentation T̃ 3 est équivalente à la représentation T 3 , T̃ 3 ∼


T 3 . Ses matrices de représentation sont données explicitement par
! !
3 1 0 3 1 0
T̃ ( g ) = T (g) .
0 −1 0 −1

On peut absorber cette transformation de similitude en changeant


l’orientation de w 0 , w 0 7 → − w 0 . Appelons O 0 la matrice
 
x
 y 
 
 
 v 
O0 =  w 
 (4.4)
 
 v0 
 
−w0

Elle est toujours orthogonale et on a


 
1
0
 T2 (g) 
O 0 TR ( g ) O − 1 =  .
 
 T3 (g) 
T3 (g)

4.2 Modes d’oscillation d’un système de 3 ressorts identiques

On considère trois masses ponctuelles égales attachées par des


ressorts identiques. Les masses sont libres de se déplacer sans frotte-
ment sur une surface plane. Les seules forces en jeu sont les forces de
rappel des ressorts.
système à trois ressorts et s 3 61

Les positions 1,2,3 forment un triangle équilatéral de longueur `


où ` est la longueur des ressorts à l’équilibre. Soient ( x̄ 1 , ȳ 1 ; x̄ 2 , ȳ 2 , x̄ 3 , ȳ 3 )
les coordonnées d’une position d’équilibre. On pose

xi = x̄ i + u i (4.5)
yi = ȳ i + v i (4.6)

pour tout i = 1, 2, 3. Les q a ≡ ( u 1 , v 1 , u 2 , v 2 , u 3 , v 3 ) , a = 1, . . . 6


mesurent le déplacement du système par rapport à la configuration
d’équilibre.
L’énergie potentielle d’un ressort est donnée par 2k ∆ ` où ∆ ` est
l’élongation du ressort par rapport à sa position d’équilibre et k sa
raideur. Dans l’approximation des petits déplacements, l’Hamiltonien
est donné par
1 k
H = m ∑ ( u̇ 2i + v̇ 2i ) + Vab q a q b (4.7)
2 i = 1,2,3 2
6
m k
=
2 ∑ ( q̇ a ) 2 + 2 Vab q a q b (4.8)
a=1

pour une matrice Vab symétrique que l’on peut calculer à partir de la
géométrie du problème. Les équations du mouvement sont
On aimerait trouver les modes propres du système, c’.à.d. diagona- mq̈ a = −kVab qb . Les modes propres
correspondent aux solutions q a =
liser la matrice 6 × 6 Vab . eiωt ζ a telles que Vab ζ b = mω
2 a
k ζ . Les
fréquences propres ωa sont donc
Invariance sous S3 La recherche des modes propres est grandement données en termes des q valeurs propres
kλ a
simplifiée si l’on tient compte des symétries. Le système est en effet λ a de Vab comme ωa = m .

invariant sous les transformations de symétrie du triangle équilatéral,


c’.à.d. S3 .
Les q a forment une représentation T à 6 dimensions. Sous la trans-
formation q a0 = Tab qb , l’invariance du système requiert l’invariance
du terme cinétique et potentiel. Le terme cinétique est préservé ssi
Tab est une matrice orthogonale, Tab ∈ O(6). Le terme potentiel est
préservé sous la condition

Vab q a0 qb0 = Vab Tac Tbd qc qd = Vcd qc qd

ce qui se lit en forme matricielle comme T T VT = V ou encore

VT ( g) = T ( g)V

après avoir utilisé T T = T −1 . Les matrices V et T ( g) sont donc


entrelacées.
On remarque que chaque action de S3 peut être décomposée
en une permutation p(i ) des masses i et une action ponctuelle sur
chaque masse :
! ! !
ui0 · · u p (i )
= (4.9)
vi0 · · v p (i )
62 représentation des groupes et application à la physique

La représentation T est donc un produit direct

T = T̃ ⊗ S

où T̃ est la représentation de dimension 2 ponctuelle et S est la


représentation de dimension 3 qui permute les masses. Il n’y a
qu’une représentation de dimension 2, la représentation irréductible
T 3 donc T̃ ' T 3 . Nous avons vu que la représentation des matrices
de permutations 3 × 3 est réductible et se décompose comme

S = T1 ⊕ T3.

Nous avons donc

T = T 3 ⊗ ( T 1 ⊕ T 3 ) = ( T 3 ⊗ T 1 ) ⊕ ( T 3 ⊗ T 3 ).

Il est clair que T 3 ⊗ T 1 = T 3 1 . Pour identifier T 3 ⊗ T 3 on calcule 1. On le vérifie en utilisant les carac-
χ3 (e)χ3 (e) = 4, χ3 ((123))χ3 ((123)) = 1, χ3 ((12))χ3 ((12)) = 0. On tères : χ3 ( g)χ1 ( g) = χ3 ( g), ∀ g ∈ S3 .

trouve la décomposition χ3 χ3 = χ1 + χ2 + χ3 et par conséquent

T3 ⊗ T3 = T1 ⊕ T2 ⊕ T3 .

En conclusion
T = T 1 ⊕ T 2 ⊕ 2T 3 ' TR
ce qui est en fait équivalent à la représentation régulière. Bien en-
tendu, la base utilisée pour q a est celle basée sur la géométrie du
problème alors que la base utilisée dans les sections précédentes est
la base canonique de la représentation régulière.
Comme on l’a vu, il existe une base dans laquelle T prend la
forme  
1
 T 2 ( g) 
T ( g) = 
 
T 3 ( g)

 
T 3 ( g)
Comme la matrice V est une matrice d’entrelacement et est orthogo-
nale, elle doit prendre la forme
 
λ1
 λ2 
V= (4.10)
 

 αI2×2 βI2×2 
βI2×2 γI2×2

La méthode directe pour obtenir les modes de vibration consiste


à calculer la matrice Vab à partir de sa définition, trouver la base
dans laquelle elle prend la forme (4.10) en utilisant les projecteurs et
obtenir les valeurs et vecteurs propres.
Ici, nous donnons simplement les quatres modes de vibrations
résultants :
système à trois ressorts et s 3 63

Figure 4.1: Mode de respiration. Repré-


sentation T 1 . Le vecteur correspondant
est
√ √
3 1 3 1
ζ a = (− , ; , ; 0, −1).
2 2 2 2
Le triangle garde sa forme mais croît ou
décroît. Il est clair que ce vecteur est in-
variant sous toutes les transformations
de S3 . La valeur propre est non-nulle
car elle change l’énergie potentielle.

Figure 4.2: Mode de rotation. Repré-


sentation T 2 . Le vecteur correspondant
est
√ √
1 3 1 3
ζ a = (− , − ;− ; ; 1, 0).
2 2 2 2
Le triangle reste identique. Il est clair
que ce vecteur est invariant sous A3
mais change de signe sous réflections.
La valeur propre est 0.

Figure 4.3: Mode de translation.


Représentation T 3 . Les deux vecteurs
correspondants sont les translations
selon x et selon y :
(1, 0; 1, 0; 1, 0)
(0, 1; 0, 1; 0, 1)
Ce sont des vecteurs propres de valeur
propre 0.

Figure 4.4: Mode de déformation.


Représentation T 3 . Ce sont les modes
intrinsèques à la géométrie du systéme.
5
Groupes et algèbres de Lie

La théorie des groupes est l’étude de la symétrie. Quand un


système physique admet une symétrie, les observables forment
un représentation du groupe concerné. Le groupe des rotations,
celui de Lorentz et de Poincaré, qui sont tous les groupes de Lie,
en sont des exemples très importants. Aussi, les groupes de Lie
sont omniprésents en physique des particules. En effet, le modèle
standard des particules élémentaires est basé sur la théorie de jauge
de Yang-Mills dont le groupe de jauge est le groupe de Lie compact

SU ( 3 ) × SU ( 2 ) × U ( 1 ) . (5.1)

Nous verrons également vers la fin du cours un autre exemple dans


le domaine des particules élémentaires où le groupe SU ( 3 ) est re-
levant. Le groupe des rotations ainsi que SU ( 2 ) et SU ( 3 ) tombent
dans la catégorie des groupes de Lie matriciels compacts pour les-
quels il existe une classification complète et élégante. Nous nous
attacherons dans ce cours à développer la caractérisation générale
des groupes de Lie matriciels compacts et de leur représentations
en introduisant tous les outils nécessaires. Nous décrirons en détail
les représentations de l’algèbre SU ( 3 ) ce qui permettra d’illustrer
l’importance et la puissance contraignante des symétries en physique.

5.1 Groupes de Lie matriciels

Groupe Un groupe est un ensemble d’éléments muni d’une opéra-


tion associative ? : G × G → G avec un neutre et un inverse pour
chaque élément. Plus précisément, (1) ∃ e ∈ G tel que ∀ g ∈ G, g ? e =
e ? g = g ; (2) ∀ g ∈ G, ∃ g − 1 ∈ G tel que g ? g − 1 = e = g − 1 ? g. Nous omettrons l’opérateur ? par la
suite pour simplifier la notation.

Groupe fini Un groupe fini est un groupe avec un nombre fini d’élé-
ments. L’ordre d’un groupe fini est le nombre d’élements du groupe
et sera usuellement dénoté n.
66 représentation des groupes et application à la physique

Variété analytique Une variété M de dimension n est analytique si Le concept de variété analytique
elle possède un atlas analytique, c’est-à-dire une collection de cartes date de B. Riemann et F. Klein mais a
seulement été formulé précisément par
qui couvrent la variété et qui sont reliés par des transformations H. Weyl en 1955. Il formalise la notion
analytiques. Dans ce cours nous considérerons des variétés dont les d’un espace continu et lisse.
cartes sont à valeur dans Rn ou Cn . On parle dans ce cas de variétés
analytiques réelles ou complexes.

Groupe de Lie Un groupe de Lie est un ensemble qui est en même


temps un groupe et une variété analytique telle que l’application Les groupes de Lie ont été introduits
µ : ( g1 , g2 ) → g1 g2−1 du produit direct G × G dans G est analytique. en mathématiques par Sophus Lie dans
les années 1870 dans le contexte de
Cette dernière contrainte est équivalente à demander que les deux la problématique de la résolution des
opérations de groupe : ( g1 , g2 ) → g1 g2 et g1 → g1−1 soient des équations différentielles et dans la re-
cherche des groupes de transformation
applications analytiques. Un groupe de Lie est réel ou complexe continus.
dépendant du champ sur lequel la variété analytique est considérée.
Dans ses travaux , S. Lie prouva que l’on pouvait substituer la
requête de l’analyticité en faveur de la continuité et deux fois diffé-
rentiabilité (non-démontré ici) :

Seconde définition d’un groupe de Lie Soit un groupe G qui est aussi
une variété deux fois continue différentiable et telle que l’application
µ : ( g1 , g2 ) → g1 g2−1 du produit direct G × G dans G est deux fois
continue différentiable, alors G est un groupe de Lie.
Par exemple, le groupe des transformations linéaires sur les réels
ou les complexes GL(n, R) ou GL(n, C) ou leur sous-groupes sont
des groupes de Lie. Le groupe de Lorentz SO(3, 1), le groupe de
Poincaré, le groupe des transformations unitaires U (n) ou encore
unitaires de déterminant unité SU (n) sont des exemples importants
en physique. En fait tous ces groupes de Lie peuvent être formulés en
termes de matrices. Nous introduisons donc la définition suivante :

Groupes de Lie matriciels L’espace des matrices n × n réelles est iso-


2
morphe à Rn ; l’espace des matrices n × n complexes est isomorphe à Soient z A (A = 1, · · · , q) des coordon-
2
R2n . On appelle groupe de Lie matriciel tout groupe de matrices qui nées sur Rq . Une surface régulière
2 2 de dimension p de Rq est un sous-
est aussi une surface régulière de Rn ou R2n . ensemble Σ de Rq défini par des
Soit G un groupe de Lie matriciel de dimension n. On introduit équations Fi (z A ) = 0 (i = 1, · · · , q − p)
où les fonctions Fi sont différentiables
des coordonnées ak (k = 1, · · · , n) sur G. Par exemple, pour le groupe et telles que la matrice (q − p) × q des
des rotations SO(3), les ak peuvent être les angles d’Euler, ou les ∂F
dérivées partielles ∂z
i
A est de rang maxi-
coordonnées cartésiennes d’une boule fermée de rayon π, obéissant mum q − p partout sur Σ. Une surface
régulière est fermée et est une variété
donc à ( a1 )2 + ( a2 )2 + ( a3 )2 ≤ π (avec identification des points différentiable. Le produit matriciel et
antipodaux du bord de la boule, ce qui implique des conditions l’opération de prendre l’inverse sont
de périodicité sur les fonctions continues mais n’a pas d’incidence des opérations différentiables.

sur l’intégration, l’identification concernant un sous-ensemble de


mesure nulle). On notera par D ⊂ Rn le domaine de variation des
groupes et algèbres de lie 67

coordonnées ak correspondant à G (modulo éventuellement un sous-


ensemble de mesure nulle).
Le produit sur G définit une fonction Φ : D × D → D de la
manière suivante. Si g( ak ) est l’élément du groupe de coordonnées ak
et g(bk ) celui de coordonnées bk , alors le produit g( ak ) g(bm ) a pour
coordonnées Φk ( am ; b p ). Dans la suite, nous omettrons les indices sur
les coordonnées quand elles sont arguments de fonctions et écrirons
donc g( a), g(b), Φk ( a; b) etc.
Si ak = 0 sont les coordonnées du neutre, on a évidemment :

Φk (0; b) = bk ; Φk ( a; 0) = ak .

L’associativité impose en outre la relation :

Φk (Φ( a; b); c) = Φk ( a; Φ(b; c)) .

Exemples simples Le groupe des translations de l’espace Rn peut


être paramétrisé par Rn lui-même, l’action d’une translation de
coordonnées ak sur un point x k de Rn étant :

x k 7→ x k + ak .

Le neutre est ak = 0 et la fonction Φ( a; b) est donnée par

Φk ( a; b) = ak + bk .

Un autre exemple est donné par le groupe des matrices 2 × 2 de la


forme !
a1 a2
,
0 1

a1 > 0, −∞ < a2 < ∞. Le produit de deux telles matrices est


! ! !
a1 a2 b1 b2 a1 b1 a1 b2 + a2
=
0 1 0 1 0 1

et donc les coordonnées du produit sont données par :

Φ1 ( a; b) = a1 b1
Φ2 ( a; b) = a1 b2 + a2

Le neutre a pour coordonnées a1 = 1, a2 = 0. En translatant a1 ,


a1 = a01 + 1, on peut supposer que le neutre a pour coordonnées
ai = 0.
Nous supposerons par la suite que les coordonnées sur le groupe
ont été choisies de manière telle que le neutre correspond à ai = 0.
68 représentation des groupes et application à la physique

Groupes de Lie matriciels compacts Un groupe de Lie matriciel est


2 2
compact si il décrit une surface bornée de Rn ou R2n . Par exemple, Contre-exemple : le groupe de Lorentz
U (n), SU (n), O(n) et SO(n) sont des groupes compacts. En effet, SO(3, 1) est non-compact. Une transfor-
mation de Lorentz propre de rapidité γ
∗ =δ
pour U (n) et SU (n) : la condition UU † = I implique ∑i Uji Umi jm contient des éléments de matrice de la
2
et donc ∑i |Uji | = 1, ce qui montre que les Uji restent dans un forme cosh γ et sinh γ qui ne sont pas
bornés.
ensemble borné. Il en est de même pour O(n) et SO(n).

5.2 Algèbres de Lie

Définition Une algèbre de Lie (réelle ou complexe) est un espace


vectoriel L à valeurs dans R ou C muni d’une opération “crochet de
Lie" [ , ] : L × L → L qui jouit des propriétés suivantes :

1. [ ax + by, z] = a[ x, z] + b[y, z] pour tous x, y, z ∈ L et a, b ∈ R ou C ;

2. [ x, y] = −[y, x ] pour tous x, y ∈ L ; et

3. [ x, [y, z]] + [y, [z, x ]] + [z, [ x, y]] = 0 pour tous x, y, z ∈ L (“identité


de Jacobi").

Les algèbres de Lie considérées ici sont des algèbres de Lie de


matrices, pour lesquelles le crochet de Lie est le commutateur, Nous ne considérons dans ce cours
que les algèbres de dimension finie.
Le théorème d’Ado (non-démontré
[ x, y] = xy − yx (5.2) ici) énonce que toute algèbre de Lie de
dimension finie à valeurs dans R ou
Il est toujours possible de complexifier une algèbre de Lie réelle C est isomorphe à une algèbre de Lie
matricielle.
en une algèbre de Lie complexe en considérant des combinaisons
linéaires à coefficients complexes des éléments de l’algèbre ; la struc-
ture de crochet s’étend par linéarité.

Constantes de structure Soit { Xa } une base de L. On a

[ Xa , Xb ] = C c ab Xc . (5.3)

Les nombres C c ab = −C c ba sont appelés “constantes de structure" et On peut réécrire cette equation en
satisfont à utilisant la convention des indices
antisymétrisés comme
C e ab C dce + C e bc C dae + C e ca C dbe = 0 (5.4) C e [ab C dc]e = 0.

en vertu de l’identité de Jacobi.

Représentations Une représentation de L est une application linéaire


s de L dans 1 gl ( X ) qui préserve le commutateur, 1. Rappelons que gl ( X ) est l’ensemble
des opérateurs linéaires X → X ;
X est ici un espace vectoriel que nous
s( ax + by) = as( x ) + bs(y) ∀ x, y ∈ L , ∀ a, b ∈ R (5.5) supposerons toujours de dimension
s ([ x, y]) = [s( x ), s(y)] ∀ x, y ∈ L (5.6) finie. On adopte la convention
O( Xb ) = (O)c b Xc

pour tout O ∈ gl ( X ).
groupes et algèbres de lie 69

Quelques exemples

u( n ) = { x ∈ gl(n, C)| x + x † = 0}
su(n) = { x ∈ gl(n, C)| x + x † = 0 et Tr( x ) = 0}
Les algèbres so(n) et sl(n, R) sont
so(n) = { x ∈ gl(n, R)| x + x t = 0} réelles et l’algèbre sl(n, C) est complexe.
sl(n, R) = { x ∈ gl(n, R)|Tr( x ) = 0} Qu’en est-il de u(n) et su(n) ? Une
combinaison complexe ax, a ∈ C
sl(n, C) = { x ∈ gl(n, C)|Tr( x ) = 0} d’une matrice unitaire x = − x † est
elle-même unitaire seulement si a ∈ R.
Il s’agit donc d’algèbres de Lie réelles
Algèbre de Lie définie par un groupe de Lie même si leur éléments de matrice sont
complexes !
Une première relation entre algèbres et groupes de Lie peut être
dérivée de la manière suivante. Soit l’ensemble des courbes (différen- Un exemple pour SO(3)

est la courbe

tiables) c(t) d’un groupe de Lie G qui passent par l’identité 1. On fixe cos t sin t 0
c(t) =  − sin t cos t 0 
la paramétrisation t ∈ R des courbes telle que c(0) = 1. On définit 0 0 1
g( G ) comme l’espace tangent à l’identité : dont l’espace tangent à l’identité est
 
0 1 0
0
g( G ) = c0 (0)|c : R → G courbe telle que c(0) = 1 décrit par c (0) = −1 0 0 .

(5.7) 
0 0 0

On notera g( G ) = g par simplicité. Soit deux courbes c1 (k1 t) et


c2 (k2 t) avec k1 , k2 ∈ R et c1 (0) = c2 (0) = 1. On a

d
[c (k t)c2 (k2 t)]|t=0 = k1 c10 (0)c2 (0) + k2 c1 (0)c20 (0) = k1 c10 (0) + k2 c20 (0).
dt 1 1
Donc l’espace g est un espace vectoriel fermé sous addition et multi-
plication scalaire.
Le groupe G est fermé sous l’action adjointe h → Ad g (h) = g h g−1 .
Donc pour tout g ∈ G et pour toute courbe c(t) ∈ G on a aussi
gc(t) g−1 ∈ G. En supposant c(0) = 1 et en différenciant en t = 0 on
obtient gc0 (0) g−1 ∈ g puisque gc(0) g−1 = 1. Dénotons x = c0 (0) ∈ g.
On a donc montré que g est fermé sous l’action adjointe du groupe

Ad( g) x ≡ gxg−1 ∈ g. (5.8)

Prenons maintenant g = c(t) ∈ G une autre courbe passant par


l’identité et calculons la transformation de x sous l’action adjointe du
groupe, aussi proche de l’identité. On a c(t) = 1 + ty + O(t2 ) avec
y ∈ g. L’inverse de c(t) a la forme c(t)−1 = 1 − ty + O(t2 ). On a

d   1
c(t) xc(t)−1 = lim (c(t) xc(t)−1 − x )
dt t =0 t →0 t
1
= lim ((1 + ty) x (1 − ty) − x )
t →0 t
= yx − xy = [y, x ].

L’espace vectoriel g est donc une algèbre de Lie. On a donc démontré


70 représentation des groupes et application à la physique

Théorème 5.1. L’espace tangent de toutes les courbes autour de l’identité de


tout groupe de Lie définit une algèbre de Lie.

Par exemple, les groupes de Lie

U (n) = { X ∈ GL(n, C)| XX † = 1}


SU (n) = { X ∈ GL(n, C)| XX † = 1 et Det( X ) = 1}
SO(n) = { X ∈ GL(n, R)| XX t = 1 et Det( X ) = 1}
SL(n, R) = { X ∈ GL(n, R)|Det( X ) = 1}
SL(n, C) = { X ∈ GL(n, C)|Det( X ) = 1}

donne des algèbres g qui sont respectivement contenues dans les Une algèbre de Lie est dite compacte
différentes algèbres de Lie données en exemple plus haut. On peut si elle est l’algèbre d’un groupe de Lie
compact.
simplement poser X = 1 + tx + O(t2 ) ∈ G et en déduire les propriétés
de x ∈ g( G ). Ainsi on trouve

g(U (n)) ⊆ u(n),


g(SU (n)) ⊆ su(n),
g(SO(n)) ⊆ so(n), (5.9)
g(SL(n, R)) ⊆ sl(n, R),
g(SL(n, C)) ⊆ sl(n, C)

Pour prouver l’égalité il faut introduire la notation d’exponentiation


vers laquelle nous nous tournons.

Composante connexe d’un groupe de Lie matriciel à partir d’une algèbre


de Lie
Il est possible de retourner la logique et de partir d’une algèbre de
Lie de matrices pour définir un groupe de Lie matriciel. On utilise
pour cela l’exponentielle matricielle e x = ∑∞ 1 N
N =0 N! x d’une matrice x
à coefficients réels ou complexes. Elle vérifie les propriétés suivantes
(à prouver en exercice) :
(i) e x ey = e x+y si [ x, y] = 0 ;
(ii) (e x )−1 = e− x ;
(iii) t → etx est une courbe différentiable de GL(n, R) dans le cas réel
(et GL(n, C) dans le cas complexe) qui est l’identité à t = 0 ;
d tx tx
(vi) dt ( e ) = xe ;
(v) Det e x = eTr x ;
(vi) la transformation x → e x est infiniment différentiable.
Il est alors possible de montrer que l’exponentiation d’une combi-
naison arbitraire d’éléments de l’algèbre de Lie génère un groupe de
groupes et algèbres de lie 71

Lie qui est connexe (car décrit par des courbes continues passant par
l’identité). Par exemple, si x ∈ u(n), on a

etx (etx )† = etx etx = etx e−tx = 1 (5.10)

et donc etx ∈ U ( N ). Comme etx = 1 + tx + O(t2 ), on a aussi x ∈


g(U ( N )) donc on a prouvé u(n) ⊆ g(U (n)). Il en va de même pour
les quatre autres exemples cités plus haut (exercice). En combinant
avec (5.9) on obtient

g(U (n)) = u(n),


g(SU (n)) = su(n),
g(SO(n)) = so(n), (5.11)
g(SL(n, R)) = sl(n, R),
g(SL(n, C)) = sl(n, C)

En toute généralité, on peut prouver (non démontré ici) :

Théorème 5.2. Soit G un groupe de Lie matriciel et g son algèbre alors


exp g génère la composante connexe de G.

Rappelons comme vu en BAC3 que deux algèbres de Lie iso-


morphes ne donnent pas nécessairement des groupes de Lie iso- Par exemple, on a l’isomorphisme
morphes par exponentiation car l’application exp n’est pas nécessaire- entre algèbres su(2) ' so (3) mais pas
entre groupes, SO(3) ' SU (2)/Z2 ,
ment injective et son noyau peut dépendre de la représentation. principalement
  exp(2πiσ3 ) = I où
car
1 0
σ3 = ∈ su(2) .
0 −1
Représentation adjointe La représentation adjointe agit dans l’espace
vectoriel L lui-même selon la loi

ady ( x ) = [y, x ] (5.12)

Les matrices de la représentation adjointe ont pour éléments de


matrice les constantes de structure,

( ad Xa )c b = C c ab (5.13)

La représentation adjointe ad de l’algèbre est la représentation asso-


ciée à la représentation adjointe Ad du groupe de Lie correspondant,
Ad g ( x ) = g x g−1 , ady ( x ) = dt
d

exp(yt) x exp(−yt) |t=0 .

Idéal
Soit K un sous-espace vectoriel de L. On dit que K est un idéal de
L ssi [K, L] ⊆ K. Dans ce cas, l’espace vectoriel quotient L/K hérite
d’une structure d’algèbre de Lie bien définie.
Les sous-espaces {0} et L sont des idéaux. On les appelle “idéaux
triviaux". Une algèbre de Lie est simple ssi elle n’est pas abélienne
72 représentation des groupes et application à la physique

et ne possède pas d’idéal non trivial 2 . Une algèbre de Lie est semi- 2. L’algèbre abélienne à une dimension
simple ssi elle n’est pas égale à u(1) et ne possède pas d’idéal abélien u(1) n’est donc pas une algèbre de Lie
simple.
non trivial. Toute algèbre simple est semi-simple. 3 . 3. L’opposé n’est pas vrai. Par exemple,
l’algèbre su(3) ⊕ su(2) n’est pas simple
Théorème 5.3. La représentation adjointe d’une algèbre de Lie simple L est mais elle est semi-simple.
irréductible et fidèle.
Une représentation est irréductible
Démonstration. (i) La représentation adjointe est irréductible. En si elle n’admet pas un sous-espace
invariant non-trivial (càd l’ensemble
effet, soit M un sous-espace invariant. La condition d’invariance vide ou tout l’espace).
est équivalente pour la représentation adjointe à ady x ∈ M ∀ x ∈
M, ∀y ∈ L, c’-à-d., [y, x ] ∈ M ∀ x ∈ M, ∀y ∈ L, ce qui montre que M
est un idéal, qui doit nécessairement être trivial car L est simple.
(ii) La représentation adjointe est fidèle. En effet, supposons ad x =
0 pour x ∈ L. Alors, [ x, y] = 0 ∀y ∈ L, ce qui montre que Rx est un
idéal abélien. On en déduit que x = 0 ou Rx = L, mais ce second cas
n’est pas possible car L est simple.

A noter qu’inversément, si la représentation adjointe d’une algèbre


de Lie est irréductible, il n’y a pas d’idéal non trivial (car ceux-ci
définissent des sous-espaces invariants). L’algèbre est donc simple si
elle est de dimension > 1 (en dimension 1, la seule algèbre de Lie est
l’algèbre abélienne u(1)).

Forme bilinéaire symétrique invariante


On appelle forme bilinéaire symétrique invariante sur L toute
forme bilinéaire symétrique β : L × L → C qui est invariante sous
l’action adjointe du groupe

β( Ad g ( x ), Ad g (z)) = β( x, z). (5.14)

Cette propriété implique

β([ x, y], z) = β( x, [y, z]). (5.15)

pour x, y, z ∈ L puisque pour g = 1 + ty + O(t2 ) ∈ G on a

0 = β( Ad g ( x ), Ad g (z)) − β( x, z) = t ( β([y, x ], z) + β( x, [y, z])) + O(t2 ).

Un exemple est donné par la forme de Killing (exercice : prouver


qu’elle est invariante),

k( x, y) = tr ( ad x ady ) = tr ( ady ad x ). (5.16)

De manière générale, si s est une représentation de L, la forme Pour une algèbre de Lie réelle quel-
bilinéaire symétrique conque et une représentation quel-
conque, la forme bilinéaire symétrique
β s n’est pas nécessairement réelle.
β s ( x, y) = tr (s( x ) s(y)) (5.17) Par exemple, la représentation à
une dimension s : λx → λ(1 + i )x
(opérateur de multiplication par
λ(1 + i ), λ ∈ R) de l’algèbre abélienne
réelle à une dimension R conduit à
β s ( x, x ) = tr (s( x ) s( x )) = 2iλ2 . La
forme de Killing (zero ici) est cependant
toujours réelle.
groupes et algèbres de lie 73

est invariante car


    
tr s[ x, y] s(z) = tr [s( x ), s(y)] s(z) = tr s( x )s(y) − s(y)s( x ) s(z)
 
= tr s( x )[s(y), s(z)] = tr s( x )s([y, z])

en vertu de la propriété cyclique de la trace. En particulier, si L est


une algèbre de Lie de matrices (ce que nous supposons toujours), la
forme bilinéaire symétrique

α( x, y) = tr ( x y) (5.18)

existe et est invariante.


On appele radical R β de la forme bilinéaire symétrique invariante
β l’ensemble des éléments x de L tels que β( x, y) = 0 ∀y ∈ L. La
forme bilinéaire symétrique invariante β est non-dégénérée si et
seulement si R β = 0. Le radical R β est un idéal car si x ∈ R β , y, z ∈ L,
on a β([ x, y], z) = β( x, [y, z]) = 0 et donc [ x, y] ∈ R β .
La forme de Killing d’une algèbre simple est donc non-dégénérée. On peut montrer (non démontré ici)
qu’une algèbre est semi-simple ssi sa
forme de Killing est non-dégénérée.
6
Unitarité des représentations des groupes compacts

L’objectif principal de ce chapitre est de prouver que toute re-


présentation d’un groupe de Lie compact et d’un groupe fini est
équivalente à une représentation unitaire.
Dans une première partie, on dérivera les concepts de translations
à gauche et à droite d’un groupe quelconque. Cela permettra en
passant de prouver un joli théorème dû à Cayley sur les groupes
finis. On utilisera ces concepts pour introduire deux mesures dites
de Haar sur les groupes : l’intégrale invariante à gauche et l’intégrale
invariante à droite. Le concept de groupe unimodulaire pour lequel
ces mesures sont égales sera introduit. En particulier les groupes de
Lie compacts et les groupes finis sont unimodulaires. On pourra alors
prouver que toute représentation d’un groupe de Lie compact ou
d’un groupe fini est équivalente à une représentation unitaire.
Vu le théorème vu en BAC3 qui stipule que toute représenta-
tion unitaire est complétement réductible, on prouvera que toute
représentation d’un groupe de Lie compact ou d’un groupe fini est
complétement réductible. Le fait les représentations d’algèbres de Lie
compactes (et en particulier la représentation adjointe) peuvent être
choisies unitaires sera crucial dans la classification des algèbres de
Lie compactes décrite au prochain chapitre.

6.1 Translations sur un groupe

Pour la suite, il est important de définir les translations sur un


groupe G que nous pouvons prendre quelconque (fini, de Lie, etc).
Nous en profiterons pour donner un théorème utile sur les groupes
finis avant de se concentrer à la section suivante sur les groupes
matriciels compacts.
76 représentation des groupes et application à la physique

Translations à gauche
Le groupe G agit naturellement sur lui-même. A chaque élément
h ∈ G, on peut associer la transformation inversible

Lh : G → G g 7→ Lh ( g) = hg

appelée translation à gauche par h. De Lh1 h2 ( g) = h1 h2 g = Lh1 ( Lh2 ( g)),


Le = transformation identique et ( Lh )−1 = Lh−1 , on déduit que
l’ensemble { Lh } est un groupe et que l’application h → Lh est un
homomorphisme. Cet homomorphisme est évidemment surjectif et
injectif (si Lh = transformation identique, alors hg = g ∀ g c-à-d h = e).
Par conséquent, la correspondance h → Lh est un isomorphisme. On
a démontré :

Théorème 6.1. Tout groupe G est isomorphe au groupe des translations à


gauche sur G.

L’espace G est évidemment homogène pour les translations à


gauche et le groupe G agit sur lui même de manière simplement
transitive :

∀ g1 , g2 ∈ G ∃ h ∈ G : L h g1 = g2 (transitivité)

(h est donné par g2 g1−1 ) et

Lh g = g ⇒ hg = g ⇒ h = e

ce qui montre que le groupe de stabilité de n’importe quel point =


{ e }.

Translations à droite
On définit également les translations à droite de G par la formule :

Rh ( g) = gh.

On a Rh1 h2 ( g) = g(h1 h2 ) = ( gh1 )h2 = Rh2 ( Rh1 ( g)) et donc Rh1 h2 =


Rh2 Rh1 . Soit
R̄h ≡ Rh−1 .

On a R̄h1 h2 = R(h1 h2 )−1 = R(h2 )−1 (h1 )−1 = R(h1 )−1 R(h2 )−1 = R̄h1 R̄h2 et
par conséquent, l’application h 7→ R̄h définit un homomorphisme de
G dans le groupe des translations à droite “barres", qui est en fait un
isomorphisme.
Il en résulte que G agit aussi à droite sur lui-même. Comme les
translations à gauche commutent avec les translations à droite,

L h1 R h2 = R h2 L h1
unitarité des représentations des groupes compacts 77

(car Lh1 ( Rh2 ( g)) = Lh1 ( gh2 ) = h1 ( gh2 ) = (h1 g)h2 = Rh2 (h1 g) =
Rh2 ( Lh1 ( g))), on a en fait une action de G × G sur G. Le sous-groupe
de stabilité de l’identité est donné par le “sous-groupe diagonal"
{( g, g)} de G × G. En effet

( g1 , g2 )e = e ⇔ g1 eg2−1 = e ⇔ g1 = g2 .

Le sous-groupe diagonal est isomorphe à G.


Une application directe des considérations précédentes conduit au
théorème de Cayley.

Théorème 6.2 (Théorème de Cayley). Tout groupe fini G d’ordre n est Rappel : le groupe symétrique Sn est le
isomorphe à un sous-groupe du groupe symétrique Sn . groupe des permutations de l’ensemble
d’ordre n. Il a n! éléments.
En effet, G est isomorphe au groupe des translations à gauche de
G par G. Or, toute translation à gauche est une permutation des n
éléments de G, donc G est isomorphe à un sous-groupe de Sn .
Le groupe symétrique Sn joue donc un rôle tout particulier dans
l’étude des groupes finis. On voit également que le nombre de
groupes finis d’ordre n distincts (à un isomorphisme près) est fini
puisque le nombre de sous-ensembles à n éléments de l’ensemble fini
Sn est fini. Nous allons prouver dans ce chapitre l’analogue du théo-
rème de Cayley pour les groupes compacts : ils sont tous isomorphes
à des sous-groupes de U (n) !

6.2 Intégration invariante sur un groupe de Lie matriciel

Intégrale invariante à gauche


Pour intégrer sur le groupe, il faut se donner une “fonction de
densité" ρ( a) sur le domaine de variation des coordonnées a ∈ D.
L’intégrale d’une fonction f définie sur le groupe prend alors la
forme Z
f ( a) ρ( a) da
D

où da ≡ da1 da2 · · · dan .


Pour utiliser des notations plus compactes,
et pour insister sur le fait qu’on intègre sur le groupe, on note aussi
cette intégrale sous la forme
Z
dτ f ( g)
On utilisera les conventions anglaises L
G (left), R (right) pour éviter l’ambiguité
G (groupe) ou (gauche).
(dτ ≡ ρ( a)da en termes de coordonnées).
L’intégrale invariante à gauche est définie par la condition Pour information, il s’agit d’un cas
Z Z particulier de mesure de Haar.
d L τ f (hg) = d L τ f ( g)
G G
78 représentation des groupes et application à la physique

pour tout élément h du groupe et toute fonction f sur le groupe (l’in-


tégrale de la translatée par h de la fonction f coïncide avec l’intégrale
de la fonction f ). En terme de coordonnées,
Z Z
f (Φ(b̄; a)) ρ L ( a) da = f ( a) ρ L ( a) da
D D

où b̄k sont les coordonnées de h.

Théorème 6.3. L’intégrale invariante à gauche existe et est unique à un


facteur multiplicatif près.

Démonstration. Soit bk les coordonnées de h−1 . Soit a0k = Φk (b̄; a).


On a ak = Φk (b; a0 ). Effectuons le changement de coordonnées
ak → a0k . Comme a0k parcourt également le domaine D, la condition
d’invariance à gauche de la mesure devient
Z Z
0 0 0 0
f ( a ) ρ L (Φ(b; a )) J (b; a ) da = f ( a) ρ L ( a) da
D D

où J (b; a0 ) est défini par

J (b; a0 ) = |Det M (b; a0 )|.

Ici, M (b; a0 ) est la matrice jacobienne du changement de variables


ak → a0k ,
∂Φk (b; c)
Mkm (b, a0 ) = .
∂cm c= a0

Remplaçons les variables d’intégration a0k par ak (changement de


notations) dans la condition d’invariance. On obtient
Z Z
f ( a) ρ L (Φ(b; a)) J (b; a) da = f ( a) ρ L ( a) da.
D D

Cette égalité doit avoir lieu pour toute fonction f sur le groupe. Par
conséquent, la fonction de densité (mesure) ρ( a) doit satisfaire à la
condition
ρ L ( a) = ρ L (Φ(b; a)) J (b; a)

pour tout choix de bk (c’-à-d. de h).


Cette condition doit être en particulier satisfaite lorqu’on prend
pour ak les coordonnées du neutre, que nous supposons corres-
pondre à ak = 0. Ceci conduit à

ρ L (0) = ρ L ( b ) J ( b )

où on a posé
J (b) = J (b; 0).
unitarité des représentations des groupes compacts 79

Cette équation détermine complètement la fonction de densité ρ(b) à


un facteur multiplicatif près (si elle existe),

ρ L (0)
ρ L ( a) =
J ( a)

Pour achever la démonstration du théorème, il faut vérifier que


la fonction de densité donnée par cette expression obéit bien à la
condition d’être invariante à gauche, ρ L ( a) = ρ L (Φ(b; a)) J (b; a), ou
encore en utilisant l’expression de ρ( a),

J (Φ(b; a)) = J ( a) J (b; a).

Pour démontrer que cette expression est correcte, on observe que

∂Φk (Φ(b; a); c)


Mkm (Φ(b; a); 0) =
∂cm c =0
∂Φ (b; Φ( a; c))
k
= (associativité)
∂cm c =0
k
∂Φ (b; z) ∂zl
=
∂z l z= a ∂cm c =0

où zm = Φm ( a; c) (ce qui implique zm = am pour c = 0). Cette


dernière équation est équivalente à

Mkm (Φ(b; a); 0) = Mkl (b; a) Mlm ( a; 0)

d’où l’on tire la relation cherchée en prenant la valeur absolue du


déterminant.

Intégrale invariante à droite


L’intégrale invariante à droite est définie par la même condition,
mais où on translate cette fois-ci l’argument de la fonction intégrée à
droite, Z Z
d R τ f ( gh) = d R τ f ( g)
G G
pour tout élément h du groupe et toute fonction f sur le groupe. En
terme de coordonnées,
Z Z
f (Φ( a; b̄)) ρ R ( a) da = f ( a) ρ R ( a) da
D D

où b̄k sont les coordonnées de h et où ρ R ( a) est la fonction de densité


associée à la mesure invariante à droite dτR .

Théorème 6.4. L’intégrale invariante à droite existe et est unique à un


facteur multiplicatif près.
80 représentation des groupes et application à la physique

Démonstration. La démonstration procède exactement comme ci-


dessus. On obtient pour expression explicite de la mesure invariante
à droite
ρ (0)
ρ R ( a) = R
J̃ ( a)
avec
∂Φk (c; b)
J̃ (b) = |Det M̃km (0; b)|, M̃km ( a; b) = .
∂cm c= a

Exemples
Groupe des translations On a J ( a) = J̃ ( a) = 1 et donc les mesures
invariantes à gauche et à droite coïncident. L’intégrale invariante sur
le groupe est donnée par Z
f ( a)da
Rn

(ρ L ( a) = ρ R ( a) = 1).

Groupe à deux paramètres étudié ci-dessus On a

Φ1 ( a; b) = a1 b1
Φ2 ( a; b) = a1 b2 + a2

et les coordonnées de l’identité sont a1 = 1, a2 = 0.


La matrice jacobienne Mkm (b; a) est donnée par

∂Φ1 (b; a) ∂Φ1 (b; a)


= a1 , =0
∂b1 ∂b2
∂Φ2 (b; a) ∂Φ2 (b; a)
= 0, = a1
∂b1 ∂b2

De là, il vient J ( a) = ( a1 )2 et donc


constante
ρ L ( a) = .
( a1 )2

L’intégrale invariante à gauche est donnée par

Z∞ Z∞
da1
da2 f ( a1 , a2 ).
( a1 )2
0 −∞

De même, la matrice jacobienne M̃km (b; a) est donnée par

∂Φ1 ( a; b) ∂Φ1 ( a; b)
= b1 , =0
∂a1 ∂a2
∂Φ2 ( a; b) ∂Φ2 ( a; b)
= b2 , =1
∂a1 ∂a2
unitarité des représentations des groupes compacts 81

De là, il vient J̃ (b) = b1 et donc


constante
ρ R (b) = .
b1
L’intégrale invariante à droite est donnée par
Z∞ Z∞
db1
db2 f (b1 , b2 ).
b1
0 −∞

Les mesures invariantes à gauche et invariantes à droite sont


clairement distinctes dans ce cas.

Groupes unimodulaires
On dit qu’un groupe est unimodulaire si toute mesure invariante à
gauche est invariante à droite. On parle alors de “mesure invariante"
(sans préciser).
Une classe importante de groupes unimodulaires est fournie par
les groupes compacts comme nous allons le démontrer :
Théorème 6.5. Les groupes compacts sont unimodulaires.
Démonstration. Soit σ ∈ G un élément quelconque du groupe. On
définit une mesure dν sur G par la formule
Z Z
f ( g) dν = f (σgσ−1 ) d L τ.
G

La fonction de densité ψ( a) associée à dν se tire de la définition


Z Z
f ( a) ψ( a) da = f (Φ(b; Φ( a; b̄)))ρ L ( a) da
D D

par le changement de variables ak → Φk (b; Φ( a; b̄)). Ici, les bk sont les


coordonnées de σ et b̄k celles de σ−1 .
On a :
Z Z
f (hg) dν = f (σhgσ−1 ) d L τ
G G
Z
= f (σhσ−1 σgσ−1 ) d L τ
G
Z
= f (σgσ−1 ) d L τ (car d L τ est invariante à gauche)
G
Z
= f ( g) dν
G

Donc la mesure dν est invariante à gauche et diffère par conséquent


de d L τ par une constante qui peut dépendre de σ,
Z Z
dν = c(σ )d L τ ⇔ f (σgσ−1 ) d L τ = c(σ ) f ( g) d L τ.
G G
82 représentation des groupes et application à la physique

Comme le groupe est compact, la fonction f = 1 (fonction égale à 1


en tout point du groupe) est intégrable. Pour f = 1 , on a f ( g) = 1 =
f (σgσ−1 ). Donc la constante c(σ ) est égale à 1. Il vient donc
Z Z
−1
f (σgσ ) dL τ = f ( g) d L τ.
G G

Comme d L τ est invariante à gauche, cette formule conduit à


Z Z
f ( gσ−1 ) d L τ = f ( g) d L τ, ∀σ,
G G

ce qui montre que d L τ est aussi invariante à droite et coïncide avec


d R τ.

Pour les groupes compacts, il est naturel de normaliser les inté-


grales invariantes à 1,
Z Z Z Z
dL τ = ρ L ( a)da = 1, dR τ = ρ R ( a)da = 1
G D G D

C’est ce que nous ferons systématiquement. La mesure d’un groupe fini G est
1
D’autres exemples de groupes unimodulaires sont les groupes n ∑ g∈ G f ( g ) et est invariante à gauche
et à droite. En effet, la translation à
finis et les groupes de Lie connexes semi-simples qui s’obtiennent par gauche ou à droite par un élément
exponentiation d’une algèbre de Lie semi-simple. h ∈ G est un homomorphisme et
donc en particulier une bijection et
donc ∑ g∈G f (hg) = ∑ g0 ∈G f ( g0 ) =
6.3 Unitarité des représentations des groupes de Lie compacts et ∑ g00 ∈G f ( g00 h)

des groupes finis

Dans cette section, G est un groupe de Lie compact ou un groupe


fini d’ordre n (| G | = n). Comme dans le cours de BAC3, on ne
considère que des représentations de dimension finie.
Théorème 6.6. Toute représentation d’un groupe compact ou d’un groupe
fini est équivalente à une représentation unitaire.
Démonstration. Soit X l’espace de la représentation et ( , ) le produit
hermitien sur X. Soient T ( g) les opérateurs de la représentation. On
n’a pas a priori ( T ( g) x, T ( g)y) = ( x, y), mais on va montrer qu’il
existe S tel que ( T 0 ( g) x, T 0 ( g)y) = ( x, y) où T 0 ( g) = ST ( g)S−1 . A
cette fin, on introduit le produit hermitien auxiliaire
Z
( x, y)1 = dτ ( T ( g) x, T ( g)y) .
G

pour les groupes compacts 1 et 1. ( x, y)1 est bien défini comme inté-
grale sur un compact d’une fonction
1
( x, y)1 =
n ∑ (T ( g)x, T ( g)y) continue.
g∈ G

pour les groupes finis. 2 2. La somme est bien définie puisqu’elle


On a est finie.
unitarité des représentations des groupes compacts 83

1. ( x, y)1 = ((y, x )1 )∗
2. ( x, α1 y1 + α2 y2 )1 = α1 ( x, y1 )1 + α2 ( x, y2 )1
3. ( x, x )1 ≥ 0
avec ( x, x )1 = 0 ssi chacun des termes non négatifs ( T ( g) x, T ( g) x ) est
nul et donc en particulier ( T (e) x, T (e) x ) = ( x, x ) = 0 ce qui implique
x = 0. Le produit ( , )1 est donc bien hermitien.
Les opérateurs T ( g) sont unitaires pour le produit scalaire auxi-
liaire ( , )1 . En effet, (cas des groupes finis, on remplace la somme
par une intégrale pour les groupes compacts)
1
( T ( g) x, T ( g)y)1 =
n ∑
0
( T ( g0 ) T ( g) x, T ( g0 ) T ( g)y)
g ∈G
1
=
n ∑
0
( T ( g0 g) x, T ( g0 g)y)
g ∈G

g0
Mais lorsque parcourt le groupe une et une seule fois, le produit
g0 g parcourt aussi le groupe une et une seule fois. Donc
1
( T ( g) x, T ( g)y)1 =
n ∑ (T (h)x, T (h)y)
h∈ G
= ( x, y)1
La représentation T est donc bien unitaire pour le produit scalaire
hermitien auxiliaire.
Soit {ēk } une base orthonormée pour le produit scalaire hermitien
auxiliaire et {ek } une base orthonormée pour le produit de départ.
On a ek = Sēk pour un certain opérateur inversible S (opérateur de
changement de base). Comme (ēk , ēl )1 = δkl = (ek , el ) = (Sēk , Sēl )
pour tous k, l, on a aussi

( x, y)1 = (Sx, Sy), ( x, y) = (S−1 x, S−1 y)1


pour tous vecteurs x, y ∈ X.
Soit T 0 ( g) = S T ( g) S−1 . Démontrons que les opérateurs T 0 ( g) sont
unitaires pour le produit scalaire hermitien de départ. On a :

( T 0 ( g) x, T 0 ( g)y) = (ST ( g)S−1 x, ST ( g)S−1 y)


= ( T ( g)S−1 x, T ( g)S−1 y)1
= (S−1 x, S−1 y)1
= ( x, y)
ce qui démontre l’assertion.

Corollaire 6.6.1. Comme toute représentation unitaire est complètement


réductible comme prouvé en BAC3, toute représentation d’un groupe de Lie
compact ou d’un groupe fini se décompose comme une somme directe

T = m1 T1 ⊕ m2 T2 ⊕ · · · ⊕ mk Tk
84 représentation des groupes et application à la physique

de représentations irréductibles. Pour décrire la représentation la plus


générale, il faut connaître toutes les représentations irréductibles.

Corollaire 6.6.2. Comme toute représentation fidèle et irréductible d’un


groupe peut être utilisée comme définition du groupe lui-même et que tout
groupe de Lie de dimension finie à valeurs dans R ou C est un groupe de Lie
matriciel (théorème d’Ado), tout groupe de Lie compact est isomorphe à un
groupe de matrices unitaires et est donc un sous-groupe de U (n).
7
Classification et représentations des algèbres de Lie com-
pactes

7.1 Algèbres de Lie compactes

Si un groupe de Lie est compact, on peut supposer que ses repré-


sentations sont unitaires, comme démontré au chapitre précédent.
Tout groupe de Lie compact peut donc être écrit comme un groupe
de matrices qui sont unitaires. Les matrices de l’algèbre de Lie cor-
respondante sont alors antihermitiennes. Dans ce cas, la forme bili-
néaire invariante α( x, y) = tr ( xy) est clairement définie négative car
tr ( xx ) = −tr ( x † x ) = − ∑ij | xij |2 ≤ 0 avec tr ( xx ) = 0 ssi x = 0. De
manière générale, la forme bilinéaire symétrique invariante associée
à une représentation unitaire (par des matrices antihermitiennes) est
réelle et définie semi-négative car
∗
β s ( x, y) = tr (s( x )∗ s(y)∗ ) = tr (s(y)† s( x )† ) = tr (s( x )s(y)) = β s ( x, y)
β s ( x, x ) = tr (s( x )s( x )) = −tr (s( x )† s( x )) ≤ 0

avec égalité ssi s( x ) = 0, ce qui implique x = 0 si s est fidèle. En


particulier, pour une algèbre simple, la forme de Killing est définie
négative.
Vu les résultats précédents, une algèbre de Lie est compacte ssi
c’est une sous-algèbre de u(n). Vu que toute représentation de u(n)
est complètement réductible et en particulier la représentation ad-
jointe qui est isomorphe à l’algèbre, il suit que toute algèbre de Lie
compacte est isomorphe à la somme directe d’algèbres de Lie simples
compactes et d’un certain nombre d’algèbres u(1). D’où l’intérêt de
classer les algèbres de Lie simples compactes.
Dans la suite du cours, on ne considèrera pour la simplicité que
les algèbres de Lie simple compactes. De même, on ne considèrera La théorie des algèbres de Lie a été
que des représentations unitaires de l’algèbre (par des matrices développée avec succès dans un cadre
beaucoup plus général ... mais c’est
antihermitiennes). une étude qui va au-delà des ambitions
du cours. Pour les intéressés, voir
le cours MATH-F417 adressé aux
mathématiciens.
86 représentation des groupes et application à la physique

On a :
Théorème 7.1. La forme bilinéaire symétrique invariante d’une algèbre de
Lie simple compacte est unique à un facteur multiplicatif près.
On rappelle la définition k ( x, y) =
Démonstration : Soit β une forme bilinéaire symétrique invariante tr( ad x ady ).
de l’algèbre de Lie simple compacte L, k sa forme de Killing. On
peut choisir une base de l’algèbre de Lie en tant qu’espace vectoriel
orthonormée par rapport à la forme de Killing (toute métrique
euclidienne peut être diagonalisée). Donc on suppose sans nuire à la
généralité que k = − I. La forme bilinéaire symétrique u = β + λk =
β − λI est invariante pour tout λ ∈ R. Prenons λ(∈ R) valeur propre
de β, Det ( β − λI ) = 0. Alors, la forme bilinéaire invariante u est
dégénérée et donc son radical est nécessairement tout L, u = 0. Ceci
implique β = λk. 2

Conventions des physiciens


En physique, il est de tradition de redéfinir les éléments des
algèbres de Lie compactes en les multipliant par i, ce qui donne des
matrices hermitiennes, dont les valeurs propres sont réelles. Ce sont Soit Xa = iXam les générateurs des phy-
ces générateurs redéfinis qui sont observables. On a ainsi x † = x et siciens et Xam ceux des mathématiciens.
On a
[ Xa , Xb ] = iC c ab Xc (7.1) [ X a , Xb ] = −[ Xam , Xbm ]
= −C c ab Xcm
(après redéfinition) et la forme bilinéaire invariante tr ( x y) est défi-
= iC c ab Xc .
nie positive dans l’espace des combinaisons linéaires à coefficients
réels des Xa , où elle définit donc un produit scalaire (de signature
euclidienne).
Il est commode de normaliser le produit scalaire de manière à ce
que les matrices simples aient des produits scalaires simples. Par
exemple, pour so (3), les générateurs standards Xi = iOi ,
     
0 0 0 0 0 i 0 −i 0
X1 =  0 0 − i  , X2 =  0 0 0  , X3 =  i 0 0 
     
0 i 0 −i 0 0 0 0 0
sont tels que trXi X j = 2δij . On peut absorber le facteur 2 dans une
normalisation du produit scalaire si on le souhaite.
De manière générale, on définit ( x, y) = (λ)−1 tr ( xy) où λ est un
nombre réel positif dont la valeur est choisie selon la commodité.
On étend ce produit scalaire en un produit scalaire hermitien par la
formule
1
( x, y) = tr ( x † y) (7.2)
λ
pour des combinaisons linéaires à coefficients complexes des Xa . On
peut choisir la base de telle sorte que

tr ( Xa Xb ) = λδab (7.3)
classification et représentations des algèbres de lie compactes 87

(i.e., ( Xa , Xb ) = δab ). On vérifie aisément que ad x est un opérateur


hermitien pour x hermitien (( ad x )† = ad x si x = x † ). En effet,
λ( ad x y, z) = tr ([ x, y]† z) = tr ([y† , x ]z) = tr (y† [ x, z]) = λ(y, ad x z). La
représentation adjointe est bien unitaire.
Il résulte du théorème précédent qu’avec le choix (7.3), la forme de
Killing des algèbres simples compactes est donnée par

k ab = tr ( ad Xa ad Xb ) = ρδab (7.4)

où ρ est un nombre strictement positif.


Nous utiliserons par la suite uniquement la convention des physiciens.

7.2 Sous-algèbres de Cartan – Poids d’une représentation

La classification des algèbres de Lie simples compactes ainsi que


l’étude de leurs représentations se font en diagonalisant simultané-
ment un nombre maximum d’éléments de l’algèbre qui commutent.
On appelle sous-algèbre de Cartan H une sous-algèbre abélienne
maximale de L (c’-à-d., non contenue dans une sous-algèbre abé-
lienne plus grande). Soit {hi }, i = 1, · · · , r, une base de H. On a

hi = hi† , [ hi , h j ] = 0 (7.5)
Il est commode de choisir une base orthonormée Pour une base quelconque, gij ≡ (hi , h j )
est appelée la forme de Cartan-Killing.
1 C’est une métrique Euclidienne de
( hi , h j ) = tr (hi h j ) = δij . (7.6)
λ dimension r.

La dimension des sous-algèbres de Cartan notée r est appelée le Les sous-algèbres de Cartan sont
rang de l’algèbre L. uniques à un isomorphisme près
(non-démontré).
Soit s une représentation irréductible de l’algèbre de Lie simple
compacte L. Les “générateurs de Cartan" hi sont diagonalisables
puisqu’hermitiens ; leurs valeurs propres sont réelles. Dans toute Quand un système physique est inva-
représentation s, les opérateurs s(hi ) – que l’on continue à noter hi en riant sous un groupe G, ses observables
forment une représentation du groupe.
laissant tomber le “s" – sont aussi hermitiens et donc diagonalisables. Les opérateurs ehi , i = 1, . . . r dans la
De plus, ils commutent et sont donc diagonalisables simultanément. représentation du groupe forment un
ensemble complet d’opérateurs qui
L’espace de la représentation se décompose en somme directe de commutent (ECOC).
sous-espaces propres. Soit µ = (µ1 , · · · , µr ) un des ensembles de
valeurs propres apparaissant dans la représentation s et f µ,A les
vecteurs propres correspondants,

hi ( f µ,A ) = µi f µ,A (7.7)

(l’indice supplémentaire A est nécessaire si µ est dégénérée). Si


h = ∑ri=1 ai hi est un élément de la sous-algèbre de Cartan, f µ,A est
vecteur propre de h pour la valeur propre µ(h) = ∑i ai µi ,

h( f µ,A ) = µ(h) f µ,A , h ∈ H. (7.8)


88 représentation des groupes et application à la physique

Il est donc commode de voir µ comme un élément du dual H ∗ de la


sous-algèbre de Cartan H. On appelle poids de la représentation s
tout élément µ du dual H ∗ de H, µ ∈ H ∗ , tel qu’il existe (au moins)
un vecteur non-nul de la représentation s pour lequel on a (7.8).
Les poids sont réels car ils sont des valeurs propres de matrices
hermiciennes.

7.3 Représentation adjointe - Racines

Dans le cas de la représentation adjointe, les poids non-nuls


portent le nom de racines. Les éléments de H sont de poids nuls,

adh (hi ) = [h, hi ] = 0, h∈H (7.9)


et il n’y en a pas d’autre vecteur propre correspondant à µ = 0 car
H est maximale. Le poids zéro est dégénéré r fois. Soit eα un vecteur
propre associé à la racine α,

adh (eα ) = [h, eα ] = α(h) eα (7.10)

(on verra que les racines sont non dégénérées, ce qui est anticipé dans
la notation).

Théorème 7.2. Si α ∈ H ∗ est une racine, alors −α est aussi une racine.

En effet, on a
[h, eα ]† = −[h, eα† ] = α(h) eα†
et donc
adh (eα† ) = [h, eα† ] = −α(h) eα† (7.11)

On peut ainsi prendre e−α = eα† . Les vecteurs propres correspon-


dant à des valeurs propres distinctes sont orthogonaux. En effet, soit
α, β ∈ H ∗ et hi tel que (α + β)(hi ) 6= 0, alors

([hi , eα ], e β ) = −([eα , hi ], e β ) = −(eα , [hi , e β ]) (7.12)

donc

(α + β)(hi ) (eα , e β ) = 0 (7.13)

ce qui implique (eα , e β ) = 0. On normalise les eα de manière à avoir


1
( eα , e β ) =
λ
tr (eα† e β ) = δαβ (= ∏ δαi βi ). (7.14)
i

Soit ±α une paire de racines et e±α les vecteurs propres correspon-


dants. L’action des opérateurs e±α sur un vecteur propre f µ,A de la
représentation s est facile à déterminer car
  
h e±α f µ,A = [h, e±α ] + e±α h f µ,A = (µ ± α)(h) e±α f µ,A .
classification et représentations des algèbres de lie compactes 89

Par conséquent, si e±α f µ,A n’est pas nul, c’est un vecteur propre pour
le poids µ ± α. Les opérateurs e±α sont semblables aux opérateurs J +
et J − de su(2), qui font monter ou descendre les valeurs propres de
J 3 de une unité.
Ce résultat est en particulier vrai pour la représentation adjointe.
Il en résulte immédiatement que le commutateur [eα , e−α ] est dans la
sous-algèbre de Cartan car adh ([eα , e−α ]) = (α − α)(h) [eα , e−α ] = 0.
Donc, [eα , e−α ] = ∑i αi hi , où les coefficients αi se calculent aisément,

αi = (hi , [eα , e−α ]) = ([hi , eα ], e−α ) = α(hi )(eα , e−α ) = α(hi ).

On peut par conséquent écrire

[ eα , e−α ] = α · h (7.15)

avec α · h ≡ ∑i αi hi . Cette relation se réduit pour su(2) à [ J + , J − ] = J 3 .


En normalisant bien les générateurs eα , e−α et α · h, on peut en
fait écrire les relations de commutation exactement sous la forme
standard de su(2). Posant

1 1
e± ≡ e ± α , e3 ≡ α·h (7.16)
|α| | α |2

on obtient facilement

[ e3 , e ± ] = ± e ± , [ e + , e − ] = e3 (7.17)

A chaque paire de racines non nulles ±α est donc associée une sous-
algèbre su(2). Toute représentation de L – et en particulier, l’algèbre Nous avons découvert la clé des repré-
de Lie L elle-même, c’-à-d. la représentation adjointe – se décompose sentations des algèbres de Lie simples
et compactes : ces représentations
en représentations (réductibles en général) de chacune de ses sous- sont des représentations simultanées
algèbres su(2), qui sont connues en détail. Le générateur e+ fait de sous-algèbres isomorphes à su(2).
Il reste à comprendre comment ces
monter les poids de +α, le générateur e− fait descendre les poids de sous-algèbres se combinent de ma-
−α. nière consistente ce qui se résume à
comprendre la classification de telles
Théorème 7.3. Les racines (poids non nuls de la représentation adjointe) algèbres. En particulier nous devrons
établir quel est le commutateur [eα , e β ]
sont non dégénérées. avec α, β ∈ H ∗ des racines distinctes.

Démonstration : Supposons qu’il y ait deux vecteurs propres eα ,


eα0 associés à la racine α, [h, eα ] = α(h) eα , [h, eα0 ] = α(h) eα0 . On peut
prendre eα et eα0 orthogonaux, Autrement on redéfini eα0 comme
λeα + (1 − λ)eα0 et on ajuste λ.
1 1
(eα , eα0 ) = tr (eα† eα0 ) = tr (e−α eα0 ) = 0.
λ λ

Les vecteurs e− , e3 , e+ forment un sous-espace invariant sous le su(2)


qu’ils engendrent (et se transforment dans la représentation adjointe -
spin 1 - de ce su(2)).
90 représentation des groupes et application à la physique

D’autre part,

ade3 (eα0 ) = [e3 , eα0 ] = |α|−2 α · [h, eα0 ] = eα0 .

Donc eα0 possède un spin +1. En agissant avec e+ et e− , on engendre


un sous-espace invariant sous le su(2) considéré, qui est l’espace
d’une représentation de spin j de su(2) pour un certain j entier.
Agissons avec e− ≡ |α|−1 e−α sur eα0 . Le vecteur [e− , eα0 ] possède le
poids zéro et est donc dans la sous-algèbre de Cartan. Comme

1 1
(hi , [e− , eα0 ]) = tr (hi† [e− , eα0 ]) = tr (hi [e− , eα0 ])
λ λ
1 1
= tr ([hi , e ]eα ) = αi tr (e− eα0 )
− 0
λ λ
1 0
= α tr (e−α eα ) = 0, (7.18)
λ|α| i

par orthogonalité, on en déduit que ade− (eα0 ) = 0 : eα0 est un vecteur


de spin minimum d’une représentation de la sous-algèbre su(2)
engendrée par e+ , e− , e3 (eα0 est annihilé par e− ). Ceci est une contra-
diction car les valeurs minima du spin dans une représentation de
spin j quelconque sont ≤ 0 (égales à − j). On en déduit qu’il n’y a pas
de vecteur eα0 et que les racines sont par conséquent de multiplicité
égale à 1. 2
Les racines étant non dégénérées, il n’est pas nécessaire d’intro-
duire un indice supplémentaire pour caractériser les vecteurs eα . On a
également :

Théorème 7.4. Les seuls multiples d’une racine α qui sont aussi une racine
sont ±α.

Démonstration : Soient α une racine et e+ , e− , e3 la sous-algèbre


su(2) associée. On a bien sûr ade+ (e+ ) = [e+ , e+ ] = 0 : e+ est un
état de spin maximum, égal à 1. Supposons que kα soit une racine
avec k 6= 0, k 6= ±1. On sait que k est un entier ou un demi-entier.
Imaginons d’abord que k soit un entier. Alors |k| ≥ 2 et le vecteur
ekα ferait partie d’une représentation de spin ≥ 2, qui contiendrait
un autre état de spin 1, c-à-d., un autre vecteur propre associé à la
racine α, ce qui est impossible. Donc k ne peut être qu’un demi-entier.
Mais si k est un demi-entier, il y a dans la représentation un état
de spin 1/2, eᾱ avec ᾱ = α2 . En considérant la sous-algèbre su(2)
correspondante et en répétant l’argument de ci-dessus, on arrive à
une contradiction. 2
Considerons maintenant le commutateur [eα , e β ] où α, β sont des
racines. En utilisant l’identité de Jacobi, on a

[hi , [eα , e β ]] = −[eα , [e β , hi ]] − [e β , [hi , eα ]] = (αi + β i )[eα , e β ]. (7.19)


classification et représentations des algèbres de lie compactes 91

Si α + β est une racine, le commutateur [eα , e β ] peut être dénoté eα+ β .


Si α + β n’est pas une racine, [eα , e β ] = 0. On a donc Il nous faudra développer plus d’outils
pour pouvoir écrire Nα,β explicitement.
[eα , e β ] = Nα,β eα+ β (7.20)

avec Nα,β = 0 si α + β n’est pas une racine. On a immédiatement


Nα,β = − Nβ,α .

Poids positifs - Vecteur de plus haut poids


On rappelle h( f µ,A ) = µ(h) f µ,A .
Il est commode d’introduire une relation d’ordre parmi les poids.
Etant donné une base de H ∗ , on dit que le poids µ est positif si sa
première composante non nulle est > 0. On écrit alors µ > 0. On
dit qu’il est négatif si sa première composante non nulle est < 0, ce
qu’on écrit µ < 0. Un poids µ 6= 0 est positif ou négatif. Si µ > 0,
alors −µ < 0.
On dit que le poids µ est plus grand que le poids ν, µ > ν, si
µ − ν > 0. On dit aussi que ν est plus petit que µ. Si µ 6= ν n’est pas
plus grand que ν, alors ν est plus grand que µ (c’est un ordre total).
Comme le nombre de poids distincts dans toute représentation
de dimension finie est fini, il existe un poids plus grand que tous
les autres. On l’appelle le poids le plus haut. En particulier, il existe
une racine de plus haut poids. Le vecteur propre correspondant au
poids µ le plus haut est annihilé par tout opérateur eα quand α est On verra plus tard que le vecteur de
une racine positive (sinon il y aurait un poids µ + α plus grand que µ). poids le plus haut est non dégénéré.

7.4 Exemple : su(3)

Matrices de Gell-Mann
Une base de matrices 3 × 3 hermitiennes de trace nulle est donnée
par les matrices de Gell-Mann,
       
0 1 0 0 −i 0 1 0 0 0 0 1
λ1 = 1 0 0 λ2 =  i 0 0 λ3 = 0 −1 0 λ4 = 0 0 0
       
0 0 0 0 0 0 0 0 0 1 0 0
       
0 0 −i 0 0 0 0 0 0 1 0 0
1 
λ5 = 0 0 0  λ6 = 0 0 1 λ7 = 0 0 − i  λ8 = √ 0 1 0  .
      
3
i 0 0 0 1 0 0 i 0 0 0 −2

Ce sont des généralisations des matrices de Pauli dans le sens que les
premières trois matrices de Gell-Mann contiennent les matrices de
Pauli agissant sur un sous-espace Cela rend manifeste que λ a , a = 1, 2, 3
forme une sous-algèbre su(2) de su(3)
!
qui mène par exponentiation à un
σa 0
λa = , a = 1, 2, 3. (7.21) sous-groupe SU (2) de SU (3). Dans le
0 0 cas où SU (3) modélise les interactions
fortes, ce sous-groupe est appelé le
sous-groupe d’isospin.
92 représentation des groupes et application à la physique

Traditionnellement, on prend comme générateurs de su(3) les


matrices
1
Ta = λ a (7.22)
2
qui sont telles que
1
tr ( Ta Tb ) = δ . (7.23)
2 ab
Les matrices T3 et T8 sont diagonales et par conséquent com-
mutent. Il n’y a pas d’autre matrice de su(3) qui commutent à la fois
avec T3 et T8 . Ces deux matrices engendrent donc une sous-algèbre
de Cartan de su(3), qui est de rang 2. On note
   
1
2 0 0 1 √ 0 0
3
h1 ≡ T3 =  0 − 12 0 , h2 ≡ T8 = 0 1 0 . (7.24)
  
6
0 0 0 0 0 −2

Poids de la représentation 3 qui définit su(3)

Les poids de la représentation à trois dimensions qui définit


su(3), notée 3, sont faciles à déterminer car les matrices T3 et T8 sont
diagonales. Les vecteurs
     
1 0 0
, ,
0 1 0
     
0 0 1

sont vecteurs propres simultanés de T3 ≡ h1 et T8 ≡ h2 et donnent les


poids suivants :
 
1  √ 
→ 1 3 (7.25)
0
 
2 6
0
 
0  √ 
3
1 → − 21 (7.26)
 
6
0
 
0  √ 
→ 3 (7.27)
0 0 −
 
3 h⇤2
1
1
Ces 3 poids forment, dans H ∗ , les sommets d’un triangle équilatéral
(voir Figure 7.1). h⇤1
1
On normalise le produit scalaire entre vecteurs de la manière
suivante
( x, y) = 2 tr ( x † y) (7.28)
Figure 7.1: Les trois poids de la repré-
sentation 3.
classification et représentations des algèbres de lie compactes 93

Poids de la représentation complexe conjuguée 3̄


Les matrices de la représentation complexe conjuguée sont − Ta∗ . Une autre manière d’arriver à la
même conclusion est d’observer que
En effet, les vrais générateurs de su(3) sont anti-hermitiens et donnés
pour les représentations unitaires, la
par iTa et quand on prend le complexe conjugué s’introduit donc un représentation complexe conjuguée
changement de signe. (x → (s( x ))∗ ) est identique à la
représentation duale (x → −(s( x ))t ) :
Il en résulte que les poids de la représentation 3̄ sont moins les les matrices symétriques changent de
poids de la représentation 3, puisque les hi , étant symétriques, sont signe, les matrices antisymétriques sont
représentés par −hi . Ceci donne les trois poids invariantes.

√   √   √ 
h⇤2

− 12 − 63 , 12 − 63 , 0 33 (7.29)
1
A nouveau, les poids forment les sommets d’un triangle équilatéral
dans H ∗ , voir Figure 7.1. h⇤1
1
On notera que les représentations 3 et 3̄ sont clairement inéquiva-
lentes puisque les poids correspondants sont différents et qu’on ne
peut changer les valeurs propres d’une matrice par changement de
base. Les représentations 3 et 3̄ sont complexes. Ceci contraste avec Figure 7.2: Les trois poids de la repré-
sentation 3̄.
l’équivalence des représentations 2 et 2̄ de su(2) qui sont, comme vu
en BAC3, pseudo-réelles 1 . 1. Une représentation est pseudo-réelle
lorsque la représentation est sa conju-
guée sont équivalentes mais quand il
Racines de su(3) n’existe pas de base où les matrices de
représentation sont réelles.
Les poids de la représentation adjointe, notée aussi 8 car elle est
à huit dimensions, sont également faciles à obtenir. Si D est une
matrice diagonale, D = diag(di ) et N une matrice triangulaire
supérieure (inférieure) avec des zéros partout sauf en position (i, j)
(i 6= j), on a
[ D, N ] = (di − d j ) N.
Cette équation peut être mise en correspondance avec adh ei = α(h)ei .
Les matrices qui diagonalisent l’action adjointe de T3 et T8 sont donc
(en normalisant selon les conventions de la section précédente),

1  
√ ( T1 ± iT2 ) ≡ e±1,0 → ± 1 0 (7.30)
2
1  √ 
√ ( T4 ± iT5 ) ≡ e 1 √3 → ± 12 3 (7.31)
± 2 ,± 2 2
2
1  √ 
√ ( T6 ± iT7 ) ≡ e 1 √3 → ± − 12 3 , (7.32) h⇤2
∓ 2 ,± 2 2
2
1
relations dans lesquelles
 nous
 avons écrit les racines correspondantes.
En outre on a le poids 0 0 doublement dégénéré. h⇤1
1
Les racines de su(3) sont les sommets d’un hexagone régulier, le
centre étant le poids nul doublement dégénéré. On remarque que
les différences des poids des représentations 3 sont des racines, cela
Figure 7.3: Poids de la représentation 8
sera expliqué à la section suivante. Enfin, la représentation 8 est réelle (le poids nul est doublement dégénéré).
94 représentation des groupes et application à la physique

car la base trouvée est réelle et ses poids sont bien invariants sous
µ → −µ.
Les figures ci-dessous indiquent les poids positifs et négatifs
des représentations 3, 3̄ et 8. On voit en particulier que les racines
positives sont
 √   √   
α1 = 12 3 , α = 1 3 , α = 1 0 . (7.33)
2 2 2 − 2 3

La racine α3 est de plus haut poids.

7.5 Chaînes de poids et chaînes de racines

Examinons de plus près la manière dont le su(2) engendré par


e+ , e− et e3 agit dans une représentation s de l’algèbre de Lie (simple,
compacte) L. Soient µ un poids quelconque de cette représentation et
f µ,A le vecteur propre correspondant. On a
α·µ
e3 f µ,A = f µ,A . (7.34)
α2
Comme les seules valeurs propres possibles de e3 sont des entiers
ou des demi-entiers, on en déduit que pour toute racine et pour tout
poids,
2α · µ
∈ Z. (7.35)
α2
Le vecteur f µ,A peut être écrit comme combinaison linéaire de vec-
α·µ
teurs de même spin α2 appartenant chacun à une représentation de
spin bien défini. Supposons que le spin le plus grand qui apparaisse
dans la décomposition soit j. Il existe alors un entier non-négatif p tel
que
(e+ ) p f µ,A 6= 0, (e+ ) p+1 f µ,A = 0. (7.36)
Le vecteur (e+ ) p f µ,A a pour poids µ + p α et, puisque c’est le vecteur
de plus haut poids de la représentation de spin j du su(2) considéré,
on a
α · (µ + p α) α·µ
= 2 + p = j. (7.37)
α2 α
Le vecteur de plus bas poids de la représentation de spin j du
su(2) considéré se trouve en agissant avec e− un certain nombre q de
fois,
(e− )q f µ,A 6= 0, (e− )q+1 f µ,A = 0. (7.38)
Le vecteur (e− )q f µ,A a pour poids µ − q α et, puisque c’est le vecteur
de plus bas poids de la représentation de spin j du su(2) considéré,
on a
α · (µ − q α) α·µ
= 2 − q = − j. (7.39)
α2 α
On a ainsi une chaîne de poids µ − q α, µ − (q − 1) α, · · · , µ, · · · , µ +
( p − 1) α, µ + p α qui apparaissent dans la représentation. Soustrayant
classification et représentations des algèbres de lie compactes 95

p+q
(7.37) à (7.39) on trouve bien que le spin j = 2 . Dans le cas de la
représentation adjointe, on parle de chaîne de racines.
Ajoutant (7.37) à (7.39), on obtient
2α·µ
+p−q = 0
α2
ou encore Cette formule jouera un rôle clé par
α·µ 1 la suite. Il est utile de la mémoriser.
2
= − ( p − q ). (7.40) Encore une fois : pour chaque sous-
α 2 groupe su(2) de l’algèbre généré par
Appliquons (7.40) à la représentation adjointe, avec µ ≡ β une la racine α et pour chaque poids µ
de la représentation, il existe deux
racine. On a entiers p ≥ 0 et q ≥ 0 tels que la plus
α·β 1
2
= − ( p − q ). (7.41) grande chaine de poids passant par µ
α 2 est décrite par µ − qα, . . . , µ + pα et ces
Si on considère le su(2) associé à β, on obtient de la même façon quantités obéissent à la relation (7.40).
Figure 7.4: Voyons quelques exemples
β·α 1 de chaînes de poids pour la représenta-
2
= − ( p 0 − q 0 ). (7.42) tion 3 de su(3). Comme vu précédem-
β 2
ment, les racines positives sont données
Si p0 − q0 6= 0 alors p − q 6= 0 et en divisant (7.41) par (7.42) on obtient graphiquement par
h⇤2
1
β2 p−q ↵1
= 0 . (7.43)
α2 p − q0 ↵3
h⇤1
Donc p − q et p0 − q0 ont le même signe. Cette relation permet de 1
↵2
contraindre les ratios des longueurs des racines.
Multipliant ces deux équations donne une formule pour l’angle
θαβ entre les racines α et β, Figure 7.5: Pour les chaînes de poids
de 3 associées à la racine α1 , on trouve
( α · β )2 ( p − q)( p0 − q0 ) une chaîne de spin 0 (p = q = 0) et une
cos2 θαβ = 2 2
= . (7.44) chaîne de spin 12 (p + q = 1)
α β 4
h⇤2
Comme ( p − q)( p0 − q0 ) est un entier (non négatif) et que 0 ≤
1
cos2 θαβ ≤ 1 , il n’existe que cinq possibilités pour ( p − q)( p0 − q0 ) :
0, 1, 2, 3, 4. Le dernier cas donne θαβ = 0 ou π, ou encore β = kα et les
h⇤1
seules possibilités sont β = ±α. ↵1 1
Les autres cas conduisent à (on prend 0 ≤ θαβ ≤ π) :

( p − q)( p0 − q0 ) θαβ Ratio des longueurs


π Figure 7.6: Il en va de même pour les
0 non fixé chaînes de poids associées aux racines
2 α2 et α3 :
π 2π
1 ou 1 h⇤2
3 3
π 3π √ 1 1
2 ou 2 ou √
4 4 2
π 5π √ 1 h⇤1
3 ou 3 ou √ ↵2 1
6 6 3
Les angles entre les racines et leurs ratios de longueurs sont donc
remarquablement contraints. h⇤2
1
↵3
h⇤1
1
96 représentation des groupes et application à la physique

7.6 Racines simples

On appelle racine simple toute racine positive qui ne peut être


écrite comme la somme de deux racines positives. Par exemple, dans
le cas de su(3), α1 et α2 sont simples tandis que α3 = α1 + α2 n’est pas
simple.

Propriétés des racines simples


1. Si α et β sont des racines simples, alors ni α − β, ni β − α ne sont
des racines. En effet, si ±(α − β) sont des racines, alors l’une des
deux est positive, soit α − β. Mais alors α = (α − β) + β est une
somme de racines positives, contrairement à l’hypothèse.
2. L’angle θαβ entre deux racines simples est obtus,
π
≤ θαβ < π. (7.45)
2
En effet, comme β − α n’est pas une racine, on a par (7.20)

[e−α , e β ] = 0.

et donc la chaîne de racines β + kα passant par β commence par β


(k ≥ 0). On a donc q = 0 dans la formule (7.41),
α·β p
2
=− . (7.46)
α 2
De la même manière, [e− β , eα ] = 0 et donc q0 = 0 dans la formule
(7.42),
α·β p0
= − . (7.47)
β2 2
Il en résulte
pp0 p0
p
α2
cos θαβ = − , = (7.48)
2 β2 p
ce qui implique en particulier le résultat annoncé.
3. Les racines simples sont linéairement indépendantes. Ceci est une
conséquence directe du résultat précédent. Soit

γ= ∑ λα α = 0
α

une combinaison linéaire des racines simples qui est nulle. Seules
les racines avec λα 6= 0 apparaissent, donc on peut supposer
λα 6= 0. Si tous les λα ont le même signe, par exemple λα > 0, alors
γ > 0 et donc γ 6= 0 contrairement à l’hypothèse. Donc il y a des
coefficients positifs et des coefficients négatifs et on peut écrire
γ = µ − ν où µ et ν sont strictement positifs,

µ= ∑ λα α, ν=− ∑ λα α
λ α >0 λ α <0
classification et représentations des algèbres de lie compactes 97

et on sait que µ · ν ≤ 0. Mais on obtient alors une contradiction car

0 = γ2 = µ2 + ν2 − 2µ · ν ≥ µ2 + ν2 > 0. 2

4. Toute racine positive peut s’écrire comme combinaison linéaire à


coefficients entiers non négatifs des racines simples. En effet, soit
φ une racine positive. Si φ est simple, l’assertion est démontrée.
Si φ n’est pas simple, on a φ = φ1 + φ2 avec φ1 et φ2 racines
positives strictement plus petites que φ. Si φ1 et φ2 sont simples,
c’est terminé. Sinon, on continue. Le processus s’arrête car on a
un nombre fini de racines positives. On conclut en particulier que
toutes les racines appartiennent au réseau Zαi engendré par les
racines simples.
5. Les racines simples forment une base de H ∗ . En effet, on sait déjà
qu’elles sont linéairement indépendantes. Il suffit par conséquent
de montrer qu’elles forment un système complet. Si cela n’était pas
vrai, il y aurait un élément ξ de H ∗ orthogonal à toutes les racines
simples et donc aussi à toutes les racines par le point précédent.
Par conséquent, on aurait [ξ · h, eφ ] = φ(ξ · h)eφ = (φ · ξ ) eφ = 0.
Mais on aurait aussi [ξ · h, hi ] = 0, donc ξ · h commuterait avec toute
l’algèbre, qui ne serait pas simple. 2
On en déduit que le nombre de racines simples est égal au rang r
de l’algèbre.

Détermination de toutes les racines à partir des racines simples


Connaissant les racines simples αi , on peut très facilement détermi-
ner toutes les racines. Soit α une racine positive (les racines négatives
s’obtiennent par changement de signe). On appelle hauteur de α la
somme
k = ∑ ki (7.49)
i

où les entiers non négatifs k i sont les coefficients du développement


de α en terme des racines simples,

α= ∑ k i αi . (7.50)
i

Les racines simples αi sont de hauteur 1.

Théorème 7.5. Si α est une racine positive de hauteur ` + 1 (` ≥ 1), alors il


existe une racine β de hauteur ` et une racine simple αk telles que

α = β + αk . (7.51)

Démonstration. On prouve cette proposition par l’absurde en prou-


vant que les deux cas suivants sont absurdes : (i) il n’existe pas de
98 représentation des groupes et application à la physique

racine simple αk telle que α = β + αk mais il existe une racine simple


αl telle que [e−αl , eα ] 6= 0 ; (ii) il n’existe pas de racine simple αk telle
que α = β + αk et pour toute racine αi , on a [e−αi , eα ] = 0.
Dans le cas (i), on construit [eαl , [e−αl , eα ]] qui est proportionnel
à eα par unicité du vecteur propre associé à αl . Dès lors, α − αl est
une racine de hauteur ` telle que α = (α − αl ) + αl ce qui contredit
l’hypothèse. Dans le cas (ii), comme [e−αi , eα ] = 0 pour toutes les
racines simples, eα est état de spin minimum pour tous les su(2)
associés aux racines simples, c-à-d. α · αk ≤ 0 (q = 0), d’où on tirerait la
contradiction
α · α = α · ( ∑ k i αi ) ≤ 0 .
i

Inversément, si on connaît toutes les racines de hauteur `, on peut


déterminer les racines de hauteur ` + 1 en considérant les chaînes
de racines simples passant par les racines de hauteur ` : soit φ une
racine de hauteur `. On a
2αi · φ
= −( pαi − qαi ). (7.52)
α2i
Comme qαi est connu (on connaît toutes les racines de hauteur ≤ `),
on obtient pαi . Si pαi > 0, φ + αi est une racine.

Exemple Les vecteurs α1 et α2 tels que

α1 · α1 = 1, α1 · α2 = −1, α2 · α2 = 2

sont les racines simples d’une algèbre de Lie de rang 2 (voir plus bas).
On a
2α1 · α2 2α2 · α1
= −2, = −1
α21 α22
et par conséquent α1 + α2 est une racine, ainsi que 2α1 + α2 . Il n’y a
pas de racine de hauteur 4 car ni 3α1 + α2 ni 2α1 + 2α2 ne sont des
racines. Pour 3α1 + α2 , c’est évident parce que la chaîne de racines α2 , Figure 7.7: Soit la base Euclidienne
α2 + α1 , α2 + 2α1 s’arrête à α2 + 2α1 car elle a q = 0 (α2 − α1 n’est pas h1∗ = (1, 0), h2∗ = (0, 1). En posant
α1 = h1∗ , α2 = −h1∗ − h2∗ on représente
une racine) et p − q = 2 ⇒ p = 2. Pour 2α1 + 2α2 , c’est également
les racines comme suit :
évident car α1 + α2 est une racine et donc 2(α1 + α2 ) n’en est pas une.
Il est instructif de vérifier que 2(α1 + α2 ) n’est pas une racine en h⇤2
considérant la chaîne de racines 2α1 + α2 + kα2 passant par 2α1 + α2 . 1
On a q = 0 car 2α1 n’est pas une racine. D’autre part, 2↵1 ↵2 ↵1 ↵2
↵2
(2α1 + α2 ) · α2 = 0, ↵1 ↵1
h⇤1
ce qui implique p − q = 0 et donc aussi p = 0, ce que l’on veut 1
démontrer. ↵2 ↵1 + ↵2 2↵1 + ↵2
En résumé, il y a 4 racines positives, 4 racines négatives et 2 poids
nuls. L’algèbre est à 10 dimensions. On verra plus bas que c’est so (5).
classification et représentations des algèbres de lie compactes 99

Groupe de Weyl
Soit α une racine positive quelconque et β une racine. On sait que
le nombre
α·β
2 2
α
est un entier. L’image de β par la réflexion dans l’hyperplan perpen-
diculaire à α,
α·β
β → β0 = β − 2 2 α (7.53)
α
appartient donc au réseau engendré par les racines simples 2 . En fait, 2. A noter que α et −α donnent la
c’est une racine. En effet, la chaîne de racines α passant par β a la même réflexion, c’est pourquoi on peut
supposer la racine α positive.
forme

β − qα, β − (q − 1)α, · · · , β − α, β, β + α, · · · , β + ( p − 1)α, β + pα


(7.54)
avec
α·β
p − q = −2 2 .
α
α· β
Par conséquent l’entier −2 α2
est compris entre −q et p,

α·β
− q ≤ −2 ≤ p.
α2
Il en résulte que
α·β
β−2 α
α2
appartient à la chaîne (7.54) et est donc une racine. Les réflexions
(7.53) laissent donc le système de racines invariant.
On appelle groupe de Weyl le groupe engendré par les réflexions
de Weyl (7.53). C’est un groupe cristallographique fini 3 . On vérifie 3. On rappelle qu’un groupe cristallogra-
facilement que dans le cas de su(3), le groupe de Weyl est le groupe phique est un groupe qui préserve un
réseau.
S3 (≡ groupe dihédral D3 ) de symétrie du triangle équilatéral.
Le groupe de Weyl est fini car il existe un homomorphisme du
groupe de Weyl dans le groupe fini S∆ des permutations des racines.
Cet homomorphisme est injectif car si un élément du groupe de Weyl
fixe toutes les racines, il fixe l’espace linéaire engendré par les racines,
qui est tout H ∗ . C’est donc l’identité. Le groupe de Weyl est ainsi
isomorphe à un sous-groupe de S∆ .

7.7 Matrice de Cartan - Diagrammes de Dynkin

On a vu que les racines simples forment une base de H ∗ . Cette


base n’est pas orthonormée car chaque racine simple est au moins
non-orthogonale à une autre 4 . Les angles entre les racines simples 4. En effet, si une racine simple α était
non-orthogonales sont soit 120◦ , 135◦ ou 150◦ et ratios des longeurs orthogonale à toutes les autres, on
aurait p = q = 0 dans (7.41) (car q = 0
pour les racines simples) et donc le
vecteur correspondant eα commuterait
avec tous les autres vecteurs e β par
(7.20) puisque α + β n’est pas une racine.
Alors {e−α , h1 , eα } formerait un idéal
de l’algèbre et l’algèbre ne serait pas
simple.
100 représentation des groupes et application à la physique

√ √
sont respectivement 1, 2 et 3, comme résumé dans la table présen-
tée en section 7.5. Il est alors naturel de définir la matrice de Cartan
qui encode ces angles et longueurs avec des entiers,
αi · α j
A = ( Aij ), Aij = 2 . (7.55)
α2j

Le fait que les coefficients soient entiers est une propriété fonda-
mentale de la matrice de Cartan. On appelle d’ailleurs ses entrées Il existe deux conventions dans la
les entiers de Cartan. Plus précisément, elle a uniquement des 2 litérature pour la définition de la
matrice de Cartan. L’autre convention
α ·α
sur la diagonales et des entiers 0, −1, −2 ou −3 hors diagonale (vu est la transposée Aij = 2 αi 2 j . Nous
i
les contraintes sur les angles et longueurs). Elle n’est pas toujours suivons ici la convention du livre de
symétrique mais jouit de la propriété que si Aij 6= 0, alors A ji 6= 0. Georgi.

On a vu que les racines positives peuvent être exprimées en termes


de combinaisons linéaires des racines simples, φ = ∑i k i αi . Les
coefficients k i ne rendent pas manifeste la représentation de la racine
φ sous les différentes sous-algèbres su(2) générées par les racines
simples. Plutôt, cette information est explicite dans les coefficients
qαi − pαi associés aux racines simples αi par (7.52). En fait, ces deux
r-tuples d’entiers sont reliés entre eux par le changement de base,

2φ · α j 2αi · α j
qα j − pα j =
αj · αj
= ∑ ki αj · αj
= ∑ ki Aij (7.56)
i i

où Aij est précisément la matrice de Cartan.


La matrice de Cartan encode toute l’algèbre puisque les racines
simples permettent de déduire toutes les racines, et on peut recons-
truire l’algèbre à partir des racines, comme discuté plus bas. La
matrice de Cartan permet d’ailleurs de simplifier la procédure de
reconstruction des racines à partir des racines simples. Quand on
passe de φ à φ + αi en agissant avec le générateur e+ = |α1 | eαi , cela
i
change uniquement k i en k i + 1 et donc qα j − pα j en qα j − pα j + Aij .
Si on pense à qα j − pα j comme un vecteur ligne, c’est équivalent à
simplement ajouter la ième ligne de la matrice de Cartan qui est juste
le vecteur qαi − pαi associé à la racine αi . Le diagramme de Dynkin de so (5) est
On peut représenter graphiquement la matrice de Cartan par un
diagramme de Dynkin. A chaque racine, on associe un noeud du
diagramme de Dynkin correspondant. On trace un nombre d’arêtes La matrice de Cartan est
entre le noeud i et le noeud j égal à max{| Aij |, | A ji |}.
 
2 −1
A= .
−2 2
Si les longueurs entre les racines simples sont distinctes, il y a
deux conventions dans la litérature : soit on met une flèche qui On a | A12 | < | A21 | (racine α1 la plus
courte).
pointe vers i (respectivement j) si | Aij | < | A ji | (respectivement
Le diagramme de Dynkin de su(3) est
| A ji | < | Aij |) - la flèche pointe donc vers la racine la plus courte
lorsque αi et α j ont des longueurs différentes, soit on colorie en
noir les noeuds associés aux racines les plus courtes. Les seules La matrice de Cartan est
possibilités sont 
2 −1

A= .
−1 2
classification et représentations des algèbres de lie compactes 101

— pas d’arête, angle de π/2 entre les racines ;


— une arête, angle de 2π/3 entre les racines qui sont de même
longueur ;
— deux arêtes, angle de 3π/4 entre les racines de ratio de longueur

2;
— trois arêtes, angle de 5π/6 entre les racines de ratio de longueur

3.

7.8 Construction de l’algèbre à partir des racines simples

On peut reconstruire complètement l’algèbre à partir des racines


simples αi comme nous allons le montrer dans cette section. Celles-ci,
les vecteurs ei , f i ≡ ei† correspondants et les éléments de l’algèbre de
Cartan obéissent aux relations

[h, h0 ] = 0, [h, ei ] = αi (h)ei , [h, f i ] = −αi (h) f i , [ei , f j ] = δij αi · h


(7.57)
Ces relations s’appellent les relations de Chevalley. Elles sont
invariantes sous la transformation 5 : 5. On peut récrire cette transformation
sous la forme τ ( x ) = − x † .
τ (h) = −h, τ ( ei ) = − f i , τ ( f i ) = − ei (7.58)

(les nombres αi sont invariants), de carré identité. Il y a d’autres


relations entre les générateurs hi , ei , f i qui viennent des conditions sur
les chaînes de racines, comme les relations de Serre (voir plus bas et
exercices).
Les vecteurs eα associés aux racines positives s’obtiennent à partir
des chaînes de racines passant par les racines simples et prennent
donc la forme de multicommutateurs impliquant les ei seulement.
De même, les vecteurs e−α associés aux racines négatives prennent
la forme de multicommutateurs impliquant les f i seulement. En fait,
tout vecteur de l’algèbre de Lie peut s’écrire comme combinaison
linéaire des hi , des multicommutateurs impliquant les ei et des mul-
ticommutateurs impliquant les f i . L’algèbre de Lie L se décompose
donc comme somme directe d’espaces vectoriels

L = N− ⊕ H ⊕ N+ (7.59)

où les N − , H et N + sont des sous-algèbres (mais attention, c’est


une somme directe de sous-vectoriels, pas une somme directe
de sous-algèbres car ces sous-algèbres ne commutent pas). On a
[ H, N + ] ⊂ N + , [ H, N − ] ⊂ N − . La décomposition (7.59) s’appelle la
décomposition triangulaire de L. On notera également qu’en utilisant
l’identité de Jacobi si nécessaire, on peut ramener tout multicommu-
tateur contenant les ei (respectivement, les f i ) en une combinaison
102 représentation des groupes et application à la physique

linéaire de multicommutateurs “emboités" de la forme

[ei1 , [ei2 , [ei3 , [· · · , [eik−1 , eik ]] · · · ] = adei adei2 · · · adei ei k .


1 k −1

Par exemple,

[[e1 , e2 ], [e3 , e4 ]] = −[[[e1 , e2 ], e3 ], e4 ] − [e3 , [[e1 , e2 ], e4 ]]


= − ade4 ade3 ade1 e2 + ade3 ade4 ade1 e2 .

L’involution de Chevalley τ s’étend à toute l’algèbre comme


automorphisme, τ ([ x, y]) = [τ ( x ), τ (y)]. L’existence de l’involution
de Chevalley permet de déterminer toute l’algèbre quand on connaît
N + . Dans la suite, nous ne nous intéresserons donc qu’aux racines
positives.
A chaque racine positive α est associé un vecteur eα déterminé à
une phase près (car les racines sont non dégénérées, la phase vient
de l’ambiguité de phase des représentations de su(2)). Ce vecteur
se transforme selon une représentation de spin j (qui dépend de i)
pour le su(2) engendré par ei . Rappelons qu’avec le choix de phase
standard, les opérateurs J 3 , J + et J − agissent de la manière suivante : Pour le spin 1
2 on a
1 1 1 1 1
J+ | , − i = √ | , i
2 2 2 2 2
J 3 | j, mi = m| j, mi (7.60) − 1 1 1 1 1
J | , i = √ | ,− i
q 2 2 2 2 2
J + | j, mi = ( j + m + 1)( j − m)/2 | j, m + 1i (7.61)
q
J − | j, mi = ( j + m)( j − m + 1)/2 | j, m − 1i (7.62)

En partant des vecteurs ei associés aux racines simples et en prenant Pour le spin 1 on a
leurs commutateurs en suivant les chaînes de racines, on obtient J + |1, −1i = |1, 0i
toute l’algèbre. Montrons comment cela fonctionne pour l’algèbre J + |1, 0i = |1, 1i
B2 ≡ C2 ≡ so (5) étudiée ci-dessus. Les racines simples sont α1 et α2 J − |1, 1i = |1, 0i
avec J − |1, 0i = |1, −1i
α1 · α1 = 1, α1 · α2 = −1, α2 · α2 = 2. (7.63)

Dans une base orthonormée, on peut prendre α1 = (1, 0) et α2 =


(−1, 1).
Les sous-algèbres su(2) respectivement associées à α1 et α2 sont :

e + = e1 , e− = e1† , e3 = h1 (7.64)
e2 e† − h1 + h2
E+ = √ , E− = √2 , E3 = (7.65)
2 2 2

A la hauteur 1, on a les racines α1 et α2 avec pour vecteurs propres


e1 et e2 . A la hauteur 2, on a la racine α1 + α2 dont le vecteur propre
eα1 +α2 est proportionnel à [e1 , e2 ]. Fixons la phase en suivant les
conventions standards pour le su(2) associé à α1 . La chaîne de racines
α2 , α2 + α1 , α2 + 2α1 décrit une représentation de su(2) de spin 1, dont
classification et représentations des algèbres de lie compactes 103

e2 est le vecteur dont le “moment cinétique selon z" (valeur propre


de e3 ) est minimum (e2 est annihilé par e− , ade− e2 = [e− , e2 ] = 0),
e2 ≡ |1, −1i. Le vecteur |1, 0i dont le “moment cinétique selon z" est
nul s’obtient en agissant une fois avec e+ , avec un facteur égal à 1
d’après les formules ci-dessus :

eα1 +α2 = ade+ (e2 ) = [e1 , e2 ]. (7.66)

On augmente encore le spin de une unité en agissant avec e+ (et un


facteur toujours égal à 1 d’après les formules ci-dessus :

e2α1 +α2 = ade+ ([e1 , e2 ]) = [e1 , [e1 , e2 ]] (7.67)

(vecteur de spin maximum |1, 1i).


Il est intéressant de considérer le vecteur eα1 +α2 du point de vue
du su(2) associé à α2 . Les vecteurs e1 et eα1 +α2 se transforment selon
la représentation de spin 1/2. On a e1 ≡ | 12 , − 12 i puisque ad E− (e1 ) =
0. On obtient le vecteur | 21 , 12 i de spin maximum en agissant avec
√ +
2 E (voir formules ci-dessus), ce qui donne [e2 , e1 ] = −[e1 , e2 ]. En
ayant choisi [e1 , e2 ] comme vecteur propre de spin maximum (associé
à la racine α1 + α2 ), on a donc introduit un signe −1 par rapport aux
conventions standards de ce su(2).
Ayant déterminé les vecteurs propres associés aux racines, on peut
reconstruire tous les commutateurs en utilisant l’identité de Jacobi.

7.9 Poids fondamentaux

On a vu que toute représentation d’une algèbre compacte possède


un plus haut poids µ qui a la propriété d’être plus haut que tous les
autres poids de la représentation et qui est donc unique (la relation
< est une relation d’ordre total). Nous démontrons dans cette section
un certain nombre de propriétés du poids fondamental d’une repré-
sentation irréductible. Cela permettra de classifier les représentations
irréductibles distinctes d’une algèbre de Lie simple compacte. Dans
toute cette section, les représentations sont irréductibles même si cela
n’est pas explicitement répété.

Poids le plus haut et racines positives


Considérons une représentation irréductible s de l’algèbre de Lie L.
Soit V l’espace de la représentation. Les opérateurs s(eα ) ≡ eα , s(h) ≡
h (abus de notation !) sont des opérateurs linéaires agissant dans V.
Soit f µ,A un vecteur du sous-espace propre Vµ associé au plus haut
poids µ. On aimerait montrer que l’espace Vµ est de dimension 1. On
a
eα f µ,A = 0 (7.68)
104 représentation des groupes et application à la physique

pour toute racine positive car µ + α > µ n’est pas un poids. Ceci
implique
ei f µ,A = 0 (7.69)
pour toute racine simple αi (eαi ≡ ei ) et inversément, si (7.69) est vrai,
(7.68) en découle car les vecteurs eα associés aux racines positives
s’expriment comme commutateurs des ei .

Non-dégénérescence du plus haut poids


Les polynômes en les opérateurs eα , h, f α sont également des
opérateurs linéaires agissant dans V. Notons U l’algèbre de ces poly-
nômes. Soit v un vecteur non nul quelconque de la représentation. Le
sous espace vectoriel Uv engendré par toutes les images de v sous les
éléments de U est clairement invariant, a(Uv) ⊂ Uv ∀ a ∈ L, et donc

Uv = V

puisque la représentation ne contient pas de sous-espace invariant


non-trivial (irréducibilité). En utilisant les relations de commutation,
on peut voir que les monômes
q q m p p
f i 1 · · · f i k h1 1 · · · hrmr e j 1 · · · e jmm
1 k 1

forment une base de U (le vérifier par récurrence).


Considérons l’action de U sur un vecteur f µ,A ∈ Vµ . Les ei anni-
hilent f µ,A ; par conséquent seuls les monômes avec p1 = p2 = · · · =
pm = 0,
q q m
f i 1 · · · f i k h1 1 · · · hrmr
1 k

peuvent donner un vecteur non nul quand ils agissent sur f µ,A .
D’autre part, les hi reproduisent f µ,A au coefficient multiplicatif µi
près, et les f i font strictement descendre le poids µ. Les seuls vecteurs
dans U f µ,A qui sont de plus haut poids µ sont donc tous multiples de
f µ,A . Comme U f µ,A = V, il en résulte que le plus haut poids est non
dégénéré (et l’espace Vµ est de dimension 1). L’indice supplémentaire
A est donc superflu pour le plus haut poids.
Il en résulte que tous les vecteurs de la représentation s s’ob-
tiennent à partir du vecteur f µ en agissant avec les opérateurs de
“descente" f i et ont donc la forme Il est donc possible de construire une
représentation quelconque à partir du
q q vecteur de plus haut poids.
f i 1 · · · f i k ( f µ ).
1 k

On en tire que les poids de la représentation s’obtiennent à partir du


plus haut poids comme
r
µ − ∑ ni αi (7.70)
i =1
où les ni sont des entiers non négatifs.
classification et représentations des algèbres de lie compactes 105

On notera aussi que f µ et ses multiples sont les seuls vecteurs


annihilés par tous les opérateurs eα avec α > 0. En effet, s’il y avait
un vecteur non nul f ν avec ν < µ tel que eα f ν = 0, alors le sous-
espace invariant U f ν serait un sous-espace propre non nul de V,
contrairement à l’hypothèse d’irréductibilité.

Chambre fondamentale de Weyl, poids dominant


On appelle chambre fondamentale de Weyl W le domaine convexe
de H ∗ défini par les inégalités

λ ∈ W ⊂ H ∗ ⇔ λ · αi ≥ 0 ∀ αi (7.71)

où les αi sont les racines simples. On dit qu’un poids est dominant
s’il est dans la chambre fondamentale de Weyl.

Théorème 7.6. Les poids les plus hauts sont dominants.

Démonstration. En effet, si µ est le poids le plus haut d’une représen-


tation, alors toutes les chaînes de poids associés à la racine αi passant
par µ ne vont pas plus haut que µ, donc ont un p nul. Ceci implique
µ · αi ≥ 0.

Coefficients de Dynkin - Poids fondamentaux


Pour le poids le plus haut µ d’une représentation quelconque, on a

µ · αi
2 = `i (7.72)
α2i

où les `i sont des entiers non négatifs, caractérisant la longueur de


la chaîne de racines αi passant par µ (`i ≡ qi , pi = 0). On appelle Pour su(2), la représentation fondamen-
les nombres `i les coefficients de Dynkin de la représentation, que tale (1) est la représentation D 1 .
2

l’on note (`1 , `2 , · · · , `r ). Comme les racines simples forment une Pour su(3), on a (1, 0) = 3, (0, 1) = 3̄
et (1, 1) = 8. En effet, le poids le
base et les coefficients de Dynkin sont les projections du poids sur les plus haut
 de lareprésentation 3 est

racines, toute l’information sur le poids le plus haut est équivalente µ1 = 1 3 , tandis que le poids
2 6
aux coefficients de Dynkin. le plus haut de la
 représentation 3̄ est

Introduisons les vecteurs µ j ∈ H ∗ (j = 1, · · · , r) tels que µ2 = 21 − 63 , et ceux-ci obéissent
bien aux relations d’orthogonalité (7.73)
 √
µ j · αi avec les racines simples α1 = 12 3
2 = δij . (7.73) √ 
2
α2i

et α2 = 12 − 23 de norme 1.

On a
r
µ= ∑ `j µj. (7.74)
j =1

On peut montrer (nous ne le ferons pas ici en général mais le


vérifierons dans un certain nombre de cas) que les vecteurs µ j sont
106 représentation des groupes et application à la physique

chacun le poids le plus haut d’une représentation irréductible de l’al-


gèbre de Lie. On les appelle pour cette raison poids fondamentaux et
h⇤2
les représentations correspondantes représentations fondamentales.
On appelle réseau des poids le réseau Zµi . Le réseau des racines 1
Zαi est un sous-réseau du réseau des poids. ↵1
µ1
Représentations quelconques par méthodes tensorielles Rappelons que
h⇤1
µ 1
2
dans le produit tensoriel de deux représentations s1 et s2 de la même ↵2
algèbre de Lie L, l’opérateur a ∈ L est représenté par (s1 ( a) ⊗
I2 ) + ( I1 ⊗ s2 ( a)). Il en résulte que si on connaît les représentations
fondamentales, on peut construire la représentation irréductible Figure 7.8: Les deux poids fondamen-
de plus haut poids µ où µ = ∑rj=1 ` j µ j (` j entiers non négatifs) est taux µ1 et µ2 des représentations 3 et
3̄ de su(3) ainsi que les 2 autres poids
un poids dominant quelconque, en prenant le produit tensoriel de de 3 et les 2 autres poids de 3̄ obtenus
`1 fois la représentation fondamentale (1, 0, 0, · · · , 0), de `2 fois la en soustrayant les racines α1 et α2 des
poids fondamentaux.
représentation fondamentale (0, 1, 0, · · · , 0) etc et en extrayant la
représentation irréductible qui contient l’unique vecteur de poids µ
(donné par le produit tensoriel des vecteurs de plus haut poids de
chacune des représentations apparaissant dans le produit tensoriel).
C’est ce qui a été fait en BAC3 pour su(2). Nous développerons cette
méthode au prochain chapitre pour su(3).

Groupe de Weyl et poids


Soit s une représentation de l’algèbre de Lie simple compacte L.
Ses poids peuvent être dégénérés, sauf le plus haut poids, noté µ.

Théorème 7.7. L’image d’un poids de s par le groupe de Weyl est un poids
de s. En outre, deux poids dans la même orbite du groupe de Weyl ont la
même dégénérescence.

Démonstration. En effet, soit ν un poids de s et α une racine positive


quelconque. Considérons la chaîne de poids

ν − qα, ν − (q − 1)α, · · · , ν, · · · , ν + ( p − 1)α, ν + pα .

Ces poids sont les poids d’une représentation (pas nécessairement


irréductible) du su(2) associé à α. On sait que les représentations de
su(2) sont symétriques par rapport à l’origine (ici ν + 12 ( p − q)α) : les
“spins selon z" +k et −k (ici ν + 12 ( p − q)α + kα et ν + 21 ( p − q)α − kα)
apparaissent avec la même multiplicité. Donc ν et ν + ( p − q)α
apparaissent avec la même multiplicité. Mais ν + ( p − q)α est l’image
de ν par la réflection de Weyl sα ,
ν·α
ν → sα (ν) = ν − 2 α = ν + ( p − q)α.
α2
classification et représentations des algèbres de lie compactes 107

La chambre fondamentale de Weyl possède les propriétés impor-


tantes suivantes.

Théorème 7.8. Soit λ ∈ H ∗ un point quelconque de H ∗ et O son or-


bite sous le groupe de Weyl. Alors O possède un poids dans la chambre
fondamentale de Weyl W .

Démonstration. En effet, l’orbite O étant finie possède un élément ω


plus grand que tous les autres. Si ω n’est pas dans W , alors ω · αi < 0
pour au moins une racine simple αi . Mais alors, si (ω ) = ω − 2 ωα·2αi αi >
i
ω contrairement à l’hypothèse. Donc ω est dans W , ce qui montre
que l’orbite O intersecte W .

En fait, O possède un et un seul point dans la chambre fondamen-


tale de Weyl W qui est donc un domaine fondamental pour l’action
du groupe de Weyl dans H ∗ (non démontré).

7.10 Classification des algèbres de Lie simples compactes

Nous avons maintenant tous les outils en main pour obtenir une
classification compléte des algèbres de Lie compactes simples. Nous
allons suivre la preuve originale de Dynkin qui consiste à classifier
les systèmes de racines simples possibles. Nous avons uniquement
besoin de trois propriétés :
A Les racines simples forment une base de Rr
2α· β
B Si α, β sont deux racines simples distinctes, α2
= 0, −1, −2 ou
−3. 6 6. Rappelons que cela implique que
dans le cas −1 les racines forment un
C Le système de racines simples est indécomposable, c’est-à-dire angle de 120◦ et ont la même longueur,
qu’il ne peut être partitionné en deux sous-systèmes mutuellement dans le cas −2, elles forment un angle
orthogonaux. de 135◦ et une
√ est plus courte par
un facteur 2 et dans le cas −3 elles
Nous avons déjà prouvé les deux premières propriétés. Un algèbre forment un angle de 150◦ et√ une est
plus courte par un facteur 3.
simple ne peut avoir un système de racines décomposable. En effet, il
est facile de voir que pour un système décomposable, les générateurs
associés aux racines simples dans deux sous-systèmes mutuellement
orthogonaux commutent (p et q sont zéro pour chaque paire) et
l’ensemble des générateurs eα , f α se partitionne en deux ensembles
qui commutent. Chaque ensemble accompagné de l’algèbre de
Cartan forme une sous-algèbre invariante, ce qui contredit le fait
que l’algèbre est simple.
Nous avons vu qu’un système de racines est uniquement carac-
térisé par sa matrice de Cartan qui est encodée dans un diagramme
de Dynkin. En termes de diagrammes de Dynkin, B est automatique
parce que le nombre de lignes entre les noeuds détermine les entiers ;
C est la condition que le diagramme est connecté ce qui est immédiat
108 représentation des groupes et application à la physique

à implémenter ; A est équivalent à la condition que le diagramme


contienne r noeuds et que les racines soient linéairement dépen-
dentes. Cette derniére condition est non-triviale et doit être étudiée
plus en détail.
Faisons maintenant de la géométrie Euclidienne à r dimensions.

Lemme 7.9. Les seuls systèmes de 3 racines simples sont


Ici, on ignore les longueur relatives
et des racines. En tenant compte des
longueurs, on a trois systèmes possibles
de 3 racines simples :

C’est une conséquence directe du fait que la somme des angles


entre trois vecteurs linéairement indépendants est moins de 360◦ . Les
seuls angles possibles sont 90◦ , 120◦ , 135◦ et 150◦ et un seul angle
de 90◦ est permis par la condition C d’indécomposabilité. Il y a trois
systèmes importants qui obéissent à B et C mais n’obéissent pas à A :

et

et

Ils n’obéissent pas à A parce que la somme des angles est de


360◦ exactement et donc les 3 vecteurs sont coplanaires et donc
linéairement dépendants.
En fait, le lemme 7.9 est une contrainte très forte car tout sous-
ensemble connecté de noeuds d’un diagramme de Dynkin est lui-
même un diagramme de Dynkin comme on s’en convainc aisément
(les propriétés A, B, C sont vérifiées). Donc tout ensemble connecté
de trois noeuds doit avoir une des deux formes énoncées dans le
lemme 7.9.
Un corollaire très simple est qu’aucune ligne triple ne peut appa-
raître dans un système de 3 racines simples ou plus. Donc, le seul
système de racines simples qui contient une ligne triple est

Ce diagramme correspond à l’algèbre G2 .

Lemme 7.10. Si un diagramme de Dynkin contient deux noeuds connectés


par une ligne simple, le diagramme obtenu par l’effacement de la ligne et
la fusion des deux noeuds à leur extrémité en un seul noeud est encore un
diagramme de Dynkin.

Démonstration. Soit α, β deux racines simples connectées par une


ligne simple (et donc de même longueur) et Γ l’ensemble des autres
classification et représentations des algèbres de lie compactes 109

racines simples. Par le lemme 7.9, Γ ne contient pas de racine connec-


tée à α et β en même temps. Soit γ ∈ Γ une racine connectée à α, on
a alors γ · β = 0 et donc γ · (α + β) = γ · α. De plus la longueur de
α et α + β est la même (car l’angle entre α et β est de 120◦ et donc
α, β, α + β forment les arêtes d’un triangle équilatéral). Le même
raisonnement peut être établi pour γ ∈ Γ racine connectée à β.
Considérons le diagramme dont les racines sont α + β et Γ. C’est
le diagramme obtenu par l’effacement de la ligne entre α et β et la
fusion des deux noeuds. Il est alors immédiat qu’il obéît aux trois
conditions A, B et C.

Une conséquence des lemmes 7.9 et 7.10 est qu’un diagramme


de Dynkin a une ligne double au plus. En effet, un diagramme de Cette conséquence justifie à posteriori la
Dynkin ne peut pas avoir deux lignes doubles en affilée et si elles notation d’indiquer les racines courtes
par un cercle rempli. Il n’y a au maxi-
sont séparées par des lignes simples, on peut les contracter par le mum que deux longueurs différentes de
lemme 7.10 pour arriver à deux lignes doubles en affilée. racines dans un diagramme de Dynkin.

Une autre conséquence est qu’il ne peut y avoir de boucle fermée


dans un diagramme de Dynkin. Sinon après contractions on arrive
aussi à une contradiction avec le lemme 7.9.

Lemme 7.11. Si la configuration

est un diagramme de Dynkin pour un sous-diagramme de Dynkin donné A


alors

est aussi un diagramme de Dynkin.

Démonstration. Choisissons de nommer les racines simples comme :

On a que α · β = 0 et

2α · γ 2α · γ 2β · γ 2β · γ
= = −1 = = . (7.75)
α2 γ2 β2 γ2
110 représentation des groupes et application à la physique

On en déduit (α + β)2 = (α)2 + ( β)2 = 2(γ)2 et donc


2γ · (α + β) 2γ · (α + β)
= −2, = −1. (7.76)
γ2 ( α + β )2
Donc le diagramme suivant est un diagramme de Dynkin :

A ↵+

Un corollaire est que les seules embranchements d’un diagramme


de Dynkin doivent avoir la forme de trois lignes simples venant d’un
noeud central comme

parce que d’autres structures d’embranchement comme

ou

pourraient se réduire par contraction à

ce qui n’est pas autorisé par le lemme 7.9.


Un autre corollaire est qu’aucun diagramme de Dynkin ne
contient deux embranchements distinctes. Sinon, on pourrait de
nouveau le contracter en diagrammes non-autorisés.
Il y a pas d’autres théorèmes généraux utiles pour la classification.
Il reste maintenant à étudier des cas particuliers qui sont reliés à
l’existence des algèbres de Lie exceptionnelles.
classification et représentations des algèbres de lie compactes 111

Lemme 7.12. Les diagrammes suivants ne sont pas des diagrammes de


Dynkin et donc aucun diagramme de Dynkin ne peut les contenir en tant
que sous-diagrammes :

Démonstration. Ces quatre diagrammes contiennent une combinaison


linéaire des racines simples qui est nulle et donc les racines ne sont
pas linéairement indépendantes (condition A non-vérifiée). Il suffit
de trouver une combinaison linéaire des racines ∑ j c j α j telle que
(∑ j c j α j )2 = 0. Les valeurs de c j qui donnent un vecteur nul sont
indiquées dans les noeuds des diagrammes suivants :

1 2 3
2
2

1 1 2 3 4 3 2 1

1 2 3 4 5 6 4 2 1 2 3 2 1

1 2 3 4 2

Les deux derniers graphiques correspondent aux deux choix de


longueur des racines. Si les racines simples sont plus longues à droite
de la double ligne, on utlise le quatrième graphique et si les racines
simples sont plus courtes à droite de la double ligne, on utilise
le dernier graphique. Nous ne ferons pas cette preuve purement
géométrique explicitement ici.

Il est alors possible de complètement classifier les diagrammes


de Dynkin possibles avec un peu de logique. Le résultat est la liste
complète des algèbres simples compactes :
112 représentation des groupes et application à la physique

An = su(n + 1) (n ≥ 1)
Après reconstruction de l’algèbre, on
peut identifier An avec su(n + 1), Bn
Bn = so (2n + 1) (n ≥ 2) avec so (2n + 1), Dn avec so (2n) et Cn
avec l’algèbre des transformations dites
symplectiques sp(2n).
Cn = sp(2n) (n ≥ 3)

Dn = so (2n) (n ≥ 4)

Les noeuds noirs correspondent aux


racines simples plus courtes que les
G2 racines simples associées aux noeuds
blancs.

F4

E6

E7

E8

Les quatres familles An , Bn , Cn , Dn sont appeleés les algèbres


compactes classiques (et leurs groupes correspondants, les groupes
compacts classiques). Les algèbres G2 , F4 , E6 , E7 , E8 sont les 5 al-
gèbres et groupes exceptionnel(le)s. Remarquons que A1 = B1 = C1
sont égales à su(2) et B2 = C2 . On définit donc les familles Bn pour
n ≥ 2 et Cn pour n ≥ 3. On a D3 = A3 donc on définit Dn avec n ≥ 4.
Formellement, on peut écrire D2 mais ce n’est pas un diagramme
connecté donc l’algèbre n’est pas simple. En fait elle est semi-simple,
il n’agit de su(2) ⊗ su(2). Après avoir reconnu D2 = so (4), on trouve
l’isomorphisme so (4) ' su(2) ⊕ su(2) 7 . 7. Si on complexifie l’algèbre on a
Finalement la liste ci-dessus décrit toutes les algèbres de Lie so (4) ' so (3, 1) et il a été vu en BAC3
que so (3, 1) ' sl (2, C). En fait on a
compactes simples indépendantes ! aussi sl (2, C) ' sl (2, R) ⊕ sl (2, R)
et pour une algèbre complexifiée
sl (2, R) ' so (2, 1) ' so (3). Ici, l’isomor-
phisme so (4) ' su(2) ⊕ su(2) est un
isomorphisme entre algèbres dans R ce
qui est plus contraignant.
8
Représentations de su(3)

Nous avons vu que toute représentation irréductible de su(3)


est labellée par ses deux coefficients de Dynkin (m, n) qui sont des
entiers non-négatifs. Nous avons identifié les représentations irré-
ductibles fondamentales (1, 0) et (0, 1) qui sont respectivement les
représentations 3 et 3̄. Nous avons aussi vu que (1, 0)∗ = (0, 1) et que
la représentation adjointe est 8 = (1, 1).
Avant de continuer, rassemblons toutes les formules clés :

1 3
[ h 1 , e1 ] = e1 , [ h 2 , e1 ] = e (8.1)
2 2√ 1
1 3
[ h 1 , e2 ] = e2 , [ h 2 , e2 ] = − e2 (8.2)
2 √ 2
1 3
[e1 , e1† ] = h1 + h2 , [e1 , e2† ] = 0 (8.3)
2 √2
1 3
[e2 , e2† ] = h1 − h2 , [e2 , e1† ] = 0 (8.4)
2 2

 √   √ 
α1 = 1 3 , α2 = 1 3 (8.5)
2 2 2 − 2
1
α1 · α1 = 1 = α2 · α2 , α1 · α2 = − (8.6)
2
 √   √ 
1 1 3 2 1 3
µ = 2 6
, µ = 2 − 6 (8.7)

8.1 Les représentations (m, n)

On peut trouver la représentation irréductible (m, n) de plus haut


poids mµ1 + nµ2 en décomposant le produit tensoriel de m fois la 3
par n fois la 3̄, ou en partant du vecteur de plus haut poids associé
au poids mµ1 + nµ2 et en considérant successivement les chaînes de
racines appropriées. Nous commencerons par illustrer la méthode
constructive à partir du plus haut poids. Dans la section suivante
nous considérerons les méthodes tensorielles.
114 représentation des groupes et application à la physique

Représentation (m, n)∗


On notera que le poids le plus bas de la représentation (m, n) est
−mµ2 − nµ1 car le poids le plus bas de la représentation 3 (respec-
tivement 3̄) est −µ2 (respectivement −µ1 ). Comme les poids de la
représentation complexe conjuguée (m, n)∗ sont moins les poids de la
représentation (m, n), on en déduit que

(m, n)∗ = (n, m). (8.8)

Il en résulte que seules les représentations (m, m) sont réelles.

La représentation (2, 0) = 6
Pour illustrer l’utilisation des chaînes de racines dans la construc-
tion des représentations (m, n), considérons la représentation (2, 0) de
1 1

plus haut poids 2µ = 1 . 3
On part du vecteur de plus haut poids f 2µ1 ≡ |2µ1 i qui est annihilé
par e1 et e2 (et donc aussi [e1 , e2 ]),

e1 |2µ1 i = 0, e2 |2µ1 i = 0.
2φ·α j
On normalise h2µ1 |2µ1 i à 1, On rappelle q j − p j = α j ·α j .

h2µ1 |2µ1 i = 1.

En outre, par définition des poids,



3
h1 |2µ1 i = |2µ1 i, h2 |2µ1 i = |2µ1 i.
3

La chaîne de racines α1 passant par |2µ1 i a p = 0 et q = 2(2µ1 · α1 ) =


2, tandis que la chaîne de racines α2 passant par |2µ1 i a p = 0 et
q = 0. Donc e2† annihile aussi |2µ1 i, mais e1† |2µ1 i 6= 0, (e1† )2 |2µ1 i 6= 0
et (e1† )3 |2µ1 i = 0. Comme c’est une chaîne de spin 1, la normalisation
est donnée par (voir tables plus haut) 1 1. On peut vérifier que ces états sont
normalisés correctement car
h2µ1 |e1 e1† |2µ1 i = h2µ1 |[e1 , e1† ]|2µ1 i

e2† |2µ1 i = 0, e1† |2µ1 i = 1
|2µ − α1 i, (8.9) 1 3
= h2µ1 | h1 + h2 |2µ1 i = h2µ1 |2µ1 i = 1
2 2
(e1† )2 |2µ1 i = |2µ1 − 2α1 i, (e1† )3 |2µ1 i = 0. (8.10)
et

Examinons à présent la chaîne de racines α2 passant par |2µ1 − α1 i. e1 |2µ1 − α1 i = e1 e1† |2µ1 i = [e1 , e1† ]|2µ1 i = |2µ1 i

On a p = 0 car il n’y a pas de poids 2µ1 − α1 + α2 correspondant à de sorte que


l’état inexistant e2 e1† |2µ1 i = e1† e2 |2µ1 i = 0. De h2µ1−α1 |e1 e1† |2µ1−α1 i = h2µ1−α1 |[e1 , e1† ]|2µ1−α1 i + 1
=1
(2µ1 − α1 ) · α2 
1

3

2 =1 car 2 h1 + 2 h2 |2µ1 − α1 i = 0 (l’état
α22 |2µ1 − α1 i possède un spin zéro selon z
pour le su(2) associé à α1 ). De la même
manière, on a aussi
e1 |2µ1 − 2α1 i = e1 e1† |2µ1 − α1 i
= [e1 , e1† ]|2µ1 − α1 i + e1† e1 |2µ1 − α1 i = |2µ1 − α1 i
et
√ !
1 3
h1 + h2 |2µ1 − 2α1 i = −|2µ1 − 2α1 i.
2 2
représentations de su ( 3 ) 115

on tire que q = 1 de telle sorte que l’état e2† |2µ1 − α1 i existe et forme
avec l’état |2µ1 − α1 i une représentation de spin 1/2 du su(2) associé
à α2 . La bonne normalisation est

|2µ1 − α1 − α2 i = 2 e2† |2µ1 − α1 i.

On a aussi
1
e2 |2µ1 − α1 − α2 i = √ |2µ1 − α1 i.
2
Passons à la chaîne de racines α2 passant par |2µ1 − 2α1 i. On a à
nouveau p = 0 car il n’y a pas de poids 2µ1 − 2α1 + α2 correspondant
à l’état inexistant e2 e1† e1† |2µ1 i = (e1† )2 e2 |2µ1 i = 0. De

(2µ1 − 2α1 ) · α2
2 =2
α22

on tire que q = 2 de telle sorte que les états e2† |2µ1 − 2α1 i et (e2† )2 |2µ1 − h⇤2
2α1 i existent et forment avec l’état |2µ1 − 2α1 i une représentation de
1
spin 1 du su(2) associé à α2 . On a 2µ1 ↵1 ↵2 2µ1

|2µ1 − 2α1 − α2 i = e2† |2µ1 − 2α1 i, |2µ1 − 2α1 − 2α2 i = e2† |2µ1 − 2α1 − α2 i.
h⇤1
2µ 1
↵1 1
Il convient à présent d’examiner si de nouveaux états ne peuvent
être créés en considérant les chaînes de racines α1 passant par les
2µ1 2↵1
nouveaux états |2µ1 − α1 − α2 i, |2µ1 − 2α1 − α2 i et |2µ1 − 2α1 − 2α2 i.
On vérifie aisément que ce n’est pas le cas. Considérons en effet
la chaîne de racines α1 passant par |2µ1 − α1 − α2 i ∼ e2† e1† |2µ1 i.
Figure 8.1: Tous les poids de la repré-
On a p = 0 car e1 e2† e1† |2µ1 i ∼ e2† |2µ1 i = 0. D’autre part, q = 1
sentation 6 dans la base de Cartan.
car 2(2µ1 − α1 − α2 ) · α1 = 1. Donc les états |2µ1 − α1 − α2 i et
e1† |2µ1 − α1 − α2 i forment une représentation de spin 1/2 du su(2)
associé à la racine α1 . En fait, l’état

|2µ1 − 2α1 − α2 i0 = 2e1† |2µ1 − α1 − α2 i

coincïde avec l’état |2µ1 − 2α1 − α2 i déjà trouvé : le poids 2µ1 − 2α1 −
α2 n’est pas dégénéré. En effet, un calcul direct montre que la matrice
des produits scalaires des deux états en question,

|2µ1 − 2α1 − α2 i = e2† e1† e1† |2µ1 i, |2µ1 − 2α1 − α2 i0 = 2e1† e2† e1† |2µ1 i

est !
1 1
.
1 1
Dès lors, ces deux vecteurs sont non seulement linéairement indé-
pendants, mais aussi égaux. Le fait que le poids 2µ1 − 2α1 − α2 est
non dégénéré est une conséquence du fait qu’il est dans la même
orbite de Weyl que le poids non-dégénéré |2µ1 − α1 i. La chaîne
116 représentation des groupes et application à la physique

de racines α1 passant par |2µ1 − α1 − α2 i ∼ e2† e1† |2µ1 i ne donne


2 0
donc rien de neuf. Reste à examiner la chaîne de racines α1 pas-
sant par |2µ1 − 2α1 − 2α2 i. On a p = 0 car e1 |2µ1 − 2α1 − 2α2 i ∼
e1 e2† e2† e1† e1† |2µi ∼ e2† e2† e1 e1† e1† |2µi ∼ e2† e2† e1† |2µi = 0 et q = 0 car 0 1

q = 2(2µ1 − 2α1 − 2α2 ) · α1 = 0


1 -1 -2 2
et donc aucun état nouveau n’appararaît ici non plus.
On a trouvé tous les états de la représentation (2, 0), qui est six-
-1 0
dimensionnelle et également notée 6.
La représentation complexe conjuguée (0, 2) ≡ 6̄ a pour poids (non
dégénérés) : 0 -2

2µ2 , 2µ2 − α2 , 2µ2 − 2α2 , 2µ2 − α1 − α2 ,


Figure 8.2: Tous les poids de la re-
2µ2 − α1 − 2α2 , 2µ2 − 2α1 − 2α2 . présentation 6. Chaque boîte est un
poids labellé par ses valeurs qα1 − pα1
et qα2 − pα2 . Le poids le plus haut
La représentation 10 est en haut du graphique (qα1 = 2,
pα1 = qα2 = pα2 = 0). Cette notation
La représentation (3, 0) est de dimension 10 (voir plus bas) et est rend manifeste les représentations des
donc aussi notée 10. Le poids le plus haut est 3µ1 . L’état correspon- deux su(2) engendrés par les deux
racines simples qui sont contenues
dant |3µ1 i est annihilé par e1 et e2 . Il est aussi annihilé par e2† tandis
dans 6. Sous le su(2)α1 , la représenta-
que e1† , (e1† )2 , (e1† )3 produisent des états non nuls de poids respectifs tion 6 de su(3) se décompose comme
3µ1 − α1 , 3µ1 − 2α1 et 3µ1 − 3α1 . Les autres poids de la représentation 3 ⊕ 2 ⊕ 1 = D1 ⊕ D 1 ⊕ D0 de su(2)α1 . Il
2
en va de même pour su(2)α2 .
sont 3µ1 − α1 − α2 , 3µ1 − 2α1 − α2 , 3µ1 − 2α1 − 2α2 , 3µ1 − 3α1 − α2 ,
3µ1 − 3α1 − 2α2 , 3µ1 − 3α1 − 3α2 et ils sont tous non dégénérés (exer-
cice).

8.2 Méthodes tensorielles

Produit tensoriel
La méthode suivie ci-dessus pour construire les représentations
de su(3) à partir du vecteur de plus haut poids est très explicite
mais aussi très lourde. Les méthodes tensorielles que nous allons
développer sont beaucoup plus simples.
Un tenseur de type (m m+n composantes vi1 ···im
n ) est un objet v à 3 j1 ··· jn
(ik , jk = 1, 2, 3) qui se transforme comme suit sous le groupe SU (3),
  `1   `n
0i1 ···im
v → v0 , v j1 ··· jn = U ik1 · · · U ikmm vk1`······`
km
n
U −1 · · · U −1 (8.11)
1 1 j1 jn

où U ∈ SU (3). Pour les transformation de l’algèbre u ∈ su(3),


U = I + iu,
m n
ip i ···k p ···im `q
∑ u k p v 1j1 ··· jn ∑ v 1j1 ···`m q ··· jn u jq
i ···im i ···i
v → v0 = v + iδv, δv 1j = −
1 ··· jn
p =1 q =1
(8.12)
représentations de su ( 3 ) 117

1

Un tenseur de type 0 est un vecteur et se transforme selon la repré-
sentation 3,
v0 = Uv, δv = uv.
0

Un tenseur de type 1 est un covecteur et se transforme selon la
t
représentation 3 (car U −1 = U ∗ ),

v0 = vU −1 = vU † , δv = −vu.

Un tenseur de type (m
n ) se transforme donc selon

3⊗···⊗3⊗3⊗···⊗3.
| {z } | {z }
m fois n fois

En particulier, un tenseur de type 11 se transforme comme



Attention qu’un tenseur de type 11 ne


forme pas l’espace de la représentation


v0 = UvU † , δv = uv − vu = [u, v]. adjointe car il est réductible (en effet,
la matrice identité est un sous-espace
On notera qu’un tenseur symétrique (antisymétrique) en des in- invariant). Comme nous allons le voir,
il nous faudra d’abord prendre un
dices d’un même type garde cette propriété sous les transformations sous-espace irréductible.
de SU (3).

Produit scalaire hermitien Soient u et v deux tenseurs du même type


(m
n ). Le tenseur ū de composantes
∗
j ··· j

i ···i
ū 1i ···nim = u 1j ···mjn
1 1

est un tenseur de type (nm ) et le produit scalaire hermitien


1 j1 ··· jn i1 ···im
(u, v) = ū v (8.13)
λ i1 ···im j1 ··· jn
où λ > 0 est donc préservé par les transformations de SU (3) qui agit
ainsi unitairement dans l’espace des tenseurs de type (m
n ) (quels que
soient m et n).

Tenseurs invariants
Il y a trois tenseurs invariants indépendants pour SU (3) : δij
(type 11 ) qui est invariant car [u, I ] = 0 ∀u) ; eijk (type 30 ) et eijk
 

(type 03 ). Ces deux derniers tenseurs sont invariant car U est de




déterminant unité (u de trace nulle). Comme les e sont complètement


antisymmétriques, il suffit de vérifier δe123 = 0 et δe123 = 0. Faisons-
le explicitement pour δe123 ,

δe123 = u1i ei23 + u2i e1i3 + u3i e12i = u11 + u22 + u33 = 0.

Il en résulte en particulier que le produit tensoriel antisymétrique


de la 3 avec la 3 est équivalent à la 3 (à trois dimensions, un tenseur
antisymétrique à 2 indices se transforme comme un covecteur, Aij =
eijk θk ).
118 représentation des groupes et application à la physique

Représentations tensorielles irréductibles


Vecteurs de plus haut poids de la 3 et de la 3 Vu les définitions (7.31),
les générateurs ea (a = 1, 2, 3) associés aux racines positives sont

représentés (à un facteur conventionnel 2 près)
     
0 0 1 0 0 0 0 1 0
e1 = 0 0 0 , e2 = 0 0 0 , e3 = 0 0 0 .
     
0 0 0 0 1 0 0 0 0

Les vecteurs w de plus haut poids de la représentation 3, annihilés


par e a ,
ea w = 0
sont les multiples du vecteur
 
1
0 ,
 
0

c’-à-d. les vecteurs ne possédant que la composante 1 différente


de 0, w 2 = w 3 = 0. Les (co)vecteurs θ de plus haut poids de la
représentation 3, annihilés par e a agissant à droite,

θ ea = 0

sont les multiples du covecteur On rappelle que les générateurs de


  Cartan de su(3) sont dans la base de
Gell-Mann donnés par
0 1 0 ,
1 
2 0 0
c’-à-d. les covecteurs ne possédant que la composante 2 différente de h1 =  0 − 12 0 ,
0 0 0
0, θ1 = θ3 = 0. On a bien
√ 1 0 0

3
h2 = 0 1 0 .
h w = µ1 ( h ) w 6
0 0 −2

et
−θ h = µ2 (h) θ.

Tenseurs irréductibles L’espace vectoriel des tenseurs d’un type


(m
n ) donné n’est pas irréductible. Pour obtenir des sous-espaces
irréductibles, il faut imposer des conditions de symétrie et de trace.

Théorème 8.1. Le sous-espace invariant (m, n) des tenseurs de type


(m
n ) complètement symétriques en leurs indices supérieurs, complètement
symétriques en leurs indices inférieurs et de trace nulle,
i ···im (i1 ···im )
v 1j
1 ··· jn
=v j1 ··· jn = vi1(···j i···m j ) , i i ···im
v 1i 2j
1 2 ··· jn
=0
1 n

est l’espace de la représentation irréductible de coefficients de Dynkin (m, n).


représentations de su ( 3 ) 119

Démonstration. On va montrer qu’il existe un et un seul vecteur


de plus haut poids dans cet espace (à un multiple près). Soient
i ···i
v 1j ···mjn les composantes d’un tenseur de type (m
n ) de plus haut poids
1
obéissant aux conditions de symétrie et de trace. Montrons d’abord
que les composantes avec un indice (1, 2 ou 3) répété en haut et en
bas sont nulles,
v1 1i2j······imjn = v2 2i2j······imjn = v3 3i2j······imjn = 0.
2 2 2

A cet effet, considérons δ2 v3 2i2j······imjn sous e2 . On obtient


2

δ2 v3 2i2j······imjn = m3 v2 2i2j··· im
− n2 v3 3i2j··· im
=0
2 2 ··· jn 2 ··· jn

où m3 ≥ 1 et n2 ≥ 1 sont respectivement les nombres d’indices


supérieurs 3 et d’indices inférieurs 2 dans v3 2i2j······imjn . De même, sous e3 ,
2

δ3 v1 2i2j······imjn = m1 v2 2i2j······imjn − n2 v1 1i2j··· im


= 0.
2 2 2 ··· jn

avec m1 ≥ 1, n2 ≥ 1. Si on ajoute la somme de ces deux équations à


n2 fois la condition de trace
v1 1i2j······imjn + v2 2i2j······imjn + v3 3i2j······imjn = 0,
2 2 2

on arrive directement à v2 2i2j······imjn


= 0 ce qui implique en réutilisant les
2
équations au résultat annoncé.
Montrons à présent que tout tenseur de plus haut poids ne peut
avoir de composante non nulle lorsque un (ou plus) des indices ik
ou jk est égal à 3. On a en effet, si l’indice 3 apparaît comme indice
supérieur (et donc pas en position inférieure),
δ1 v1 ji2 ··· im 3 i2 ···im
j ··· jn = m1 v j j ··· jn = 0.
1 2 1 2

De même,
i i ···i i i ···i
δ2 v 12 2j ···mjn = −n2 v 13 2j ···mjn = 0.
2 2

On montre de la même manière que l’indice 2 ne peut apparaître en


position supérieure et que l’indice 1 ne peut apparaître en position
inférieure, ce qui montre que la seule composante non nulle d’un
tenseur de plus haut poids est
v1122······1122 .
Le sous-vectoriel des tenseurs de plus haut poids est donc de dimen-
sion un. En outre, on vérifie aisément que le poids correspondant
est
µ = mµ1 + nµ2
(le nombre de 1 est m, le nombre de 2 est n). Ceci achève la démons-
tration du théorème.

On trouve en particulier que la représentation 6 est donnée par les


tenseurs 20 symétriques, qui est bien à 6 dimensions, tandis que la 8


est donnée par les tenseurs mixtes de type 11 de trace nulle.



120 représentation des groupes et application à la physique

Dimensions des représentations (m, n) Quelques propriétés combina-


toires sont rappellées en marge 2 . 2. Tenseurs complètement symétriques
i ···i
Le nombre de composantes indépendantes d’un tenseur v 1j ···mjn Le nombre Adm de composantes indé-
1 pendantes d’un tenseur complètement
complètement symétrique en ses indices supérieurs et en ses indices symétrique à m indices dans un espace
inférieurs est égal, sans la condition de trace, à de dimensions d, égal au nombre de
m-suites (i1 , i2 , · · · , im ) non décrois-
santes (i1 ≤ i2 ≤ · · · ≤ im ) comportant
3 · 4 · · · (2 + m ) 3 · 4 · · · (2 + n ) (m + 2)(m + 1)(n + 2)(n + 1)
= . les nombres {1, 2, · · · , d}, obéit à la
m! n! 4 relation :

i i ···im Adm+1 = Adm + Adm−1 + Adm−2 + · · · + A1m


La condition de trace v 1i 2j = 0 enlève
1 2 ··· jn
(examinez les différentes manières de
commencer la (m + 1)-suite), d’où on
3 · 4 · · · (1 + m ) 3 · 4 · · · (1 + n ) ( m + 1) m ( n + 1) n
= tire
m! n! 4 Adm+1 = Adm + Adm−+11 .
La formule
composantes indépendantes, ce qui implique que la dimension de la
( m + d − 1) !
représentation (m, n), égale à la différence de ces deux nombres, est Adm =
m!(d − 1)!
donnée par
est vérifiée pour le cas d = 1 et tout m
(m + 1)(n + 1)(m + n + 2) (A1m = 1) ainsi que pour tout d et pour
d(m,n) = . (8.14)
2 m = 1 (A1d = d). Par récurrence, on en
déduit que cette formule est vraie pour
En particulier, la (3, 0) est bien de dimension 10. toute paire (d, m).

Décomposition de Clebsch-Gordan
Tenseurs complètement antisymé-
L’utilisation des tenseurs permet très facilement d’effectuer la triques On vérifie aisément que le
nombre Cm d de composantes indépen-
décomposition d’un produit tensoriel. Par exemple, on a 3 ⊗ 3 = 6 ⊕ 3 dantes d’un tenseur complètement
(ce qu’on peut encore écrire (1, 0) ⊗ (1, 0) = (2, 0) ⊕ (0, 1)). En effet, on antisymétrique à m indices dans un es-
pace de dimensions d, égal au nombre
a
1 i j  1   de m-suites (i1 , i2 , · · · , im ) croissantes
vi u j = v u + v j ui + eijk ekpq v p uq . (i1 < i2 < · · · < im ) comportant les
2 2 nombres {1, 2, · · · , d}, est donné par
Un autre exemple est 3 ⊗ 3 = 8 ⊕ 1 (ou encore (1, 0) ⊗ (0, 1) = d d ( d − 1) · · · ( d − m + 1)
Cm = .
(1, 1) ⊕ (0, 0)), résultat que l’on tire de m!

 
1 1
vi u j = vi u j − δji (vk uk ) + δji (vk uk ).
3 3

Comme dernier exemple, considérons le produit 3 ⊗ 8. On a

j 1 ij 1 1 i j j

vi u k = M k + eijp Npk + 3δ k P − δ k Pi
2 4 8
où on a posé

ij j 1 j 1 j
M k = vi u k + v j uik − δik v p u p − δ k v p ui p ,
4 4

Npk = e pqr vq urk + ekqr vq urp ,


j
et P j = vk u k . Ceci implique 3 ⊗ 8 = 15 ⊕ 6 ⊕ 3 ou encore (1, 0) ⊗
(1, 1) = (2, 1) ⊕ (0, 2) ⊕ (1, 0).
représentations de su ( 3 ) 121

Trialité Soit la décomposition du produit tensoriel (m1 , n1 ) ⊗ (m2 , n2 ).


On définit m = m1 + m2 et n = n1 + n2 . On notera que dans toute
ces décompositions, m − n est conservé modulo 3. Ceci est une consé-
quence du fait que m − n vaut zéro modulo 3 pour les tenseurs inva-
riants utilisés pour effectuer la réduction. Cette propriété s’appelle la
trialité des représentations de su(3).

8.3 Les poids de la représentation (m, n)

Considérons la représentation irréductible (m, n) de su(3). Il est


i ···i
facile de voir qu’un tenseur v = (v 1j ···mjn ) diagonalise l’action des
1
générateurs de Cartan s’il ne possède qu’une seule composante non
nulle. Soit v un tel tenseur. Il a la forme
m1 f ois m f ois m f ois
z }| { z 2}| { z 3}| {
v11· ·· ·· ·1122· ·· ·· ·2233· ·· ·· ·33 (8.15)
| {z } | {z } | {z }
n1 f ois n2 f ois n3 f ois

où mi est le nombre de fois que l’indice i apparaît en haut, tandis


que ni est le nombre de fois que l’indice i apparaît en bas. On a
m = m1 + m2 + m3 et n = n1 + n2 + n3 . Le poids correspondant est 3 3. En effet, on rappelle de nouveau
1 
2 0 0
ν = [(m1 − n1 ) − (m3 − n3 )] µ1 + [(n2 − m2 ) − (n3 − m3 )] µ2 (8.16) h1 =  0 − 12 0 ,
0 0 0
Utilisant les relations α1 = 2µ1 − µ2 and α2 = 2µ2 − µ1 , on peut √ 1 0 
0
3
réécrire le poids ν en terme du plus haut poids µ p.h. = mµ1 + nµ2 h2 = 0 1 0 .
6
0 0 −2
comme
On trouve alors le poids ν = (ν1 , ν2 )
avec ν1 = 12 (m1 − m2 − n1 + n2 ) et ν2 =
ν = µ p.h. − m2 (α1 + α2 ) − m3 α1 − n1 (α1 + α2 ) − n3 α2 . (8.17) √
3
6 ( m1+ m2 − 2m3 − n1 − n2 + 2n3 ). On
rappelle
Les tenseurs de plus haut poids n’ont qu’une seule composante  √   √ 
···11 µ1 = 12 3 , µ2 = 12 − 63
non nulle, v11 22···22 . Quand on remplace un indice 1 supérieur par
6

un indice 3, on soustrait la racine α1 au poids. Quand on remplace ce qui mène au poids ν = m1 µ1 − m2 µ2


un indice 1 supérieur par un indice 2, on soustrait la racine α1 + α2 . − m3 ( µ1 − µ2 ) − n1 µ1 + n2 µ2 + n3 ( µ1 −
µ2 ) que l’on peut réécrire comme (8.16).
Quand on remplace un indice 2 inférieur par un indice 3, on soustrait
la racine α2 . Et quand on remplace un indice 2 inférieur par un indice
1, on soustrait à nouveau la racine α1 + α2 . Le poids le plus bas est
obtenu en soustrayant (m + n)(α1 + α2 ) à mµ1 + nµ2 et est égal à
−mµ2 − nµ1 puisque α1 + α2 = µ1 + µ2 . Il correspond à v22 ···22
11···11 .
Les poids se répartissent sur des hexagones (en général non ré-
guliers) emboîtés, invariants par le groupe de Weyl. Ces hexagones
peuvent dégénérer en triangles équilatéraux quand trois côtés se
réduisent à un point. Les poids de la représentation (4, 2) = 60 sont
représentés ci-dessous. Il y a 36 poids distincts, mais certains de
ceux-ci sont dégénérés.
122 représentation des groupes et application à la physique

v2222
33 v1111
33

v1111
23

ij11
v2222
11 v ij vi111
i2 v1111
22

v1113
22

v1133
22

v1333
22

v3333
11 v3333
22

La représentation (4, 2) ≡ 60

On a également représenté les axes des symétries engendrant le


groupe de Weyl. Le plus haut poids est à droite. La ligne de poids en
partant vers le bas est générée par l’action de e 1† tandis que la ligne
de poids en partant vers le haut est générée par e 2† . A noter que dans
v i111
i2 , l’indice i peut prendre deux valeurs distinctes (i = 1, 2), ce qui
i j11
donne v 1111 2111
12 et v 22 . De même, dans v i j , la paire symétrique ( i j )
peut prendre trois valeurs distinctes, ( i j ) = ( 11 ) , ( 12 ) , ( 22 ) , ce qui
donne v 1111 1211 2211
11 , v 12 et v 22 (voir discussion plus bas).

Hexagone extérieur Pour comprendre la répartition des poids, par-


tons du poids le plus haut v 11 ··· 11
22 ··· 22 . On suppose d’abord m > 0, n >
0. En remplaçant un à un les indices 1 du haut par 3, on soustrait
successivement α 1 , 2α 1 , · · · , mα 1 . Les poids correspondant se placent
sur un segment de droite contenant m + 1 poids, se terminant par
v 33 ··· 33
22 ··· 22 . Tous les tenseurs propres associés aux poids sur ce segment
de droite ont tous leurs indices inférieurs égaux à 2. De même, en
remplaçant un à un les indices 2 du bas par 3, on soustrait successi-
vement α 2 , 2α 2 , · · · , mα 2 . Les poids correspondant se placent sur un
segment de droite contenant n + 1 poids, se terminant par v 11 ··· 11
33 ··· 33 .
Tous les tenseurs propres associés aux poids sur ce segment de droite
ont tous leurs indices supérieurs égaux à 1. En utilisant le groupe
de Weyl on engendre les 4 autres côtés de l’hexagone extérieur, qui
contient ainsi 3 ( m + n ) poids. Les tenseurs correspondant n’ont aucun
indice répété en haut et en bas. Tous leurs indices supérieurs (ou in-
férieurs) sont égaux et distincts des indices inférieurs (ou supérieurs).
Les poids de la couche extérieure sont non dégénérés. Le groupe
de Weyl agit par permutation des indices 1, 2, 3. Dans le cas de la
représentation 60, on a 18 poids.
Si m ou n est égal à zéro, l’hexagone extérieur dégénère en un
représentations de su ( 3 ) 123

triangle équilatéral avec 3m (ou 3n) poids distincts. Ceux-ci sont


également non dégénérés. Les poids de la représentation (3, 0) = 10
v222 v122 v112
sont représentés en marge. Il y au total 10 poids, dont 9 sont sur le
v111
triangle extérieur. Apparaissent également les axes de symétrie.
v123
v223 v113
“Couches intérieures" Continuons l’analyse en supposant à nouveau
m > 0, n > 0. Passons à la première couche intérieure, pour laquelle v233 v133
on a une seule répétition d’un indice du haut et d’un indice du
v333
bas. Cette répétition peut être celle de l’indice 1, de l’indice 2 ou
de l’indice 3, mais ces trois possibilités ne sont pas indépendantes
La représentation (3, 0) ≡ 10
en raison de la condition de trace. Seules deux répétitions sont
indépendantes, que l’on peut prendre 11 et 22 . Partant du vecteur de
plus haut poids v11 ···11
22···22 , on passe à la première couche intérieure
en remplaçant soit un indice inférieur 2 par 1, ce qui donne v11 ···11
12···22 ,
soit un indice supérieur 1 par 2, ce qui donne v21 ···11
22···22 . Ces deux
vecteurs ont même poids car, comme le montre explicitement la
formule (8.16), les poids ne dépendent que des différences mi − ni . La
troisième possibilité v31 ···11
32···22 possède aussi le même poids mais n’est
pas linéairement indépendante car
···11 11···11 21···11
v31
32···22 = − v 12···22 − v 22···22 .

Le poids associé aux tenseurs v11 ···11 21···11


12···22 et v 22···22 , égal à µ − α1 − α2 , est
donc dégénéré deux fois.
En partant du tenseur v11 ···11
12···22 , on peut engendrer tous les tenseurs
à une seule répétition 11 en remplaçant d’abord un à un les indices
1 “libres" du haut (non liés à la paire 11 ) par 3, puis par 2. De même,
on remplace un à un les indices 2 du bas par 3 et puis par 1. On
engendre ainsi un hexagone comme si v11 ···11
12···22 était le vecteur de plus
haut poids de la représentation (m − 1, n − 1). On obtient exactement
le même hexagone associé aux tenseurs à une seule répétition 22
en partant de v21 ···11
22···22 . Le premier hexagone intérieur possède par
conséquent 3(m + n − 2) poids, tous dégénérés deux fois. Dans
le cas de la représentation 60, on a ainsi 12 poids sur l’hexagone
intermédiaire, dégénérés deux fois.
On peut progresser de la même manière vers les couches inté-
rieures plus profondes, qui contiennent de plus en plus de répétitions
haut-bas. La k-ième couche intérieure contient k répétitions et est
dégénérée k + 1 fois (on compte la couche extérieure comme la couche
numéro zéro). Elle est dégénérée k + 1 fois car il y a k + 1 manières de
choisir k répétitions haut-bas : on peut répéter k 1’s et 0 2’s, 111 ···111
111···111 ;
k − 1 1’s et un 2, 211 ···111 221···111
211···111 ; k − 2 1’s et 2 2’s, 221···111 etc.
Si m = n, les hexagones sont réguliers et le processus s’arrête après
m pas vers l’intérieur à l’origine, correspondant aux tenseurs à m
répétitions, dégénérés m + 1 fois. Si m 6= n, on arrive à un triangle
124 représentation des groupes et application à la physique

après n pas vers l’intérieur (n < m) ou m pas vers l’intérieur (m < n),
possédant 3(m − n) poids, dégénérés n + 1 fois (n < m) (ou 3(n − m)
poids, dégénérés m + 1 fois (m < n)). Dans le cas de la représentation
60, on a ainsi 6 poids sur le triangle intérieur, dégénérés trois fois. Un autre exemple :
Supposons m > n (si m < n, on considère la représentation com-
plexe conjuguée qui a les mêmes propriétés). Pour comprendre ce qui
se passe quand on passe d’un triangle au triangle intérieur suivant vi111 v1111
i 2
(s’il y en a un), oublions les répétitions ii éventuelles, qui jouent un
vi123
rôle passif, et ne considérons que les indices libres (supérieurs) et ap- i

pelons le premier triangle rencontré le triangle extérieur. Le tenseur


de plus haut poids du triangle extérieur est v11···1 avec m − n indices 1.
La première arête est obtenue en changeant un à un les indices 1 en
2. La deuxième arête est obtenue en changeant un à un les indices 1
en 3. La troisième et dernière arête relie alors v22···2 et v33···3 en chan-
geant un à un les indices 2 en 3. Les tenseurs du triangle extérieur ne La représentation (4, 1) ≡ 35
contiennent pas le triple 123. On passe d’un triangle au suivant en
A noter qu’ici, ii =11 ou 22 (vi111 = v1111
ajoutant un triple 123, ce qui se fait, partant de 111, en soustrayant i
i123 = v1123 ou v2123 ).
1
ou v2111
2 et v i 1 2
la racine α1 (1 → 3) et puis la racine α1 + α2 (1 → 2). Le tenseur de
plus haut poids du triangle suivant est alors v1231·1 avec m − n − 3
indices 1 additionnels. Ceci est illustré sur les figures donnant les
poids des représentations 10 et 35. Comme ce tenseur est unique,
il n’introduit pas de nouvelle dégénérescence. Si on se rappelle les
indices à répétitions ii , il est donc aussi dégénéré que les tenseurs du
dernier hexagone intérieur.
On vérifie aisément que le diagramme des poids épuise toutes les
i ···i
composantes du tenseur v 1j ···mjn .
1

Règle de dégénérescence On a démontré la règle de dégénérescence


simple suivante : quand on passe d’une couche à la couche intérieure
suivante, la dégénérescence des poids augmente d’une unité, jus- A titre de vérification, notons qu’on
qu’au moment où on atteint une couche triangulaire, à partir de retrouve les bonnes dimensions pour les
représentations
laquelle la dégénérescence reste constante. Le premier hexagone (qui (4, 2) ≡ 60 (60 = 18 + 2 × 12 + 3 × 6),
peut être dégénéré en triangle si m = 0 ou n = 0) possède 3(m + n) (4, 1) ≡ 35 (35 = 15 + 2 × 9 + 2 × 1) et
(3, 0) ≡ 10 (10 = 9 + 1).
poids distincts.
9
Théorème de Wigner-Eckart

Dans ce chapitre nous introduirons le concept d’opérateur ten-


soriel O irréductible. Un cas particulier est un opérateur d’entre-
lacement que nous définirons en premier. Nous prouverons alors
le théorème de Wigner-Eckart qui permet d’écrire les éléments de
matrice h x |O|yi (le produit hermitien du vecteur | x i et de l’opéra-
teur O appliqué à un vecteur |yi) en termes d’un nombre restreint
d’éléments de matrices réduits. Les coefficients qui déterminent les
éléments de matrice originaux en termes des éléments de matrice
réduits sont fixés par la théorie des groupes en termes des coeffi-
cients de Clebsch-Gordan comme nous allons le démontrer. Nous
appliqueront le théorème de Wigner-Eckart dans le cas de SU (3).

9.1 Opérateurs d’entrelacement et représentations complètement


réductibles

Soit T une représentation complètement réductible du groupe G, Rappelons que dans le cas des groupes
de Lie compacts ou finis, toute re-
présentation est équivalente à une
représentation complètement réduc-
T = m1 T 1 ⊕ m2 T2 ⊕ · · · ⊕ mk T k . (9.1) tible.

On cherche dans cette section la forme la plus générale d’un opé-


rateur d’entrelacement A, c’-à-d. la solution générale de l’équation

T ( g) A = AT ( g) . (9.2)

Dans une base bien choisie, les opérateurs T ( g) de la représenta-


126 représentation des groupes et application à la physique

tion sont diagonaux par blocs,

T 1 ( g)
 
0 ··· ··· ··· ··· ··· ··· ··· ···
 0
 ··· ··· ··· ··· ··· ··· ··· ··· ···  
··· · · · T 1 ( g) ··· ··· ··· ··· ··· 
 
 0 0
 
 0
 ··· ··· 0 T 2 ( g) 0 ··· ··· ··· ···  
 ··· ··· ··· ··· ··· ··· ··· ··· ··· ··· 
T ( g) =  ,
 
 0

··· ··· ··· ··· · · · T 2 ( g) ··· ··· ···  
 ··· ··· ··· ··· ··· ··· ··· ··· ··· ··· 
 
 0
 ··· ··· ··· ··· ··· ··· T k ( g) ··· ···  
 ··· ··· ··· ··· ··· ··· ··· ··· ··· ··· 
 

0 ··· ··· ··· ··· ··· ··· ··· · · · T k ( g)

Regroupons les représentations irréductibles équivalentes, La représentation irréductible T i ( g)


apparaît mi fois et est de taille ni × ni où
T̃ 1 ( g) ni est la dimension de la représentation
 
0 ··· ···
Ti .
 0 T̃ 2 ( g) ··· ··· 
T ( g) =  , (9.3)
 
 ··· ··· ··· ··· 
0 0 · · · T̃ k ( g)

où T̃ i ( g) contient mi fois T i ( g),

T i ( g)
 
0 ··· ···
 0 i
T ( g) ··· ···  T̃ i ( g) est une matrice de taille mi ni ×
T̃ i ( g) =  (9.4) mi ni .
 
 ··· ··· ··· ··· 

0 0 · · · T i ( g)

Examinons d’abord ce qu’implique la condition (9.2) sur les blocs


non diagonaux de A en supposant pour simplifier l’écriture que T ( g)
se réduit à !
T̃ 1 ( g) 0
T ( g) = , (9.5)
0 T̃ 2 ( g)
le cas général étant une généralisation immédiate. Posant
! Ici, α est une matrice m1 n1 × m1 n1 ,
α β β est une matrice m1 n1 × m2 n2 , γ est
A= . (9.6) une matrice m2 n2 × m1 n1 et δ est une
γ δ
matrice m2 n2 × m2 n2 .

On trouve

T̃ 1 ( g)α = α T̃ 1 ( g), (9.7)


1 2
T̃ ( g) β = β T̃ ( g), (9.8)
2 1
T̃ ( g)γ = γ T̃ ( g), (9.9)
2 2
T̃ ( g)δ = δ T̃ ( g). (9.10)

Les opérateurs β et γ sont des opérateurs d’entrelacement entre


T̃ 1 ( g)
et T̃ 2 ( g) et sont donc nuls par le lemme de Schur. Par exemple,
théorème de wigner-eckart 127

en écrivant explitement l’équation pour β, avec


   
T 1 ( g) · · · ··· T 2 ( g) ··· ···
1 2
T̃ ( g) =  · · · ··· · · ·  , T̃ ( g) =  · · · ··· ··· ,
   
··· · · · T 1 ( g) ··· · · · T 2 ( g)
(9.11)
 
β 11 ··· β 1m2
β =  ··· ··· ···  (9.12)
 
β m1 1 ··· β m1 m2
(chaque bloc β iα où i = 1, · · · , m1 et α = 1, · · · , m2 est de taille
n1 × n2 ), on obtient les conditions d’entrelacement

T 1 ( g) β iα = β iα T 2 ( g) (9.13)

qui impliquent β iα = 0 par le lemme de Schur car T 1 et T 2 sont des


représentations irréductibles inéquivalentes. On arrive à la même
conclusion pour γ. Donc, A prend la forme
!
α 0
A= . (9.14)
0 δ

Examinons à présent la condition (9.7) pour α. A cet effet, on


observe que T̃ 1 ( g) = T 1 ( g) ⊗ Im1 ×m1 , i.e., ( T̃ 1 )iA,jB = ( T 1 )ij δAB (i, j =
1, · · · , n1 , A, B = 1, · · · , m1 ). Soit B AB (A, B = 1, · · · , m1 ) une base des
matrices m1 × m1 . On peut prendre par exemple ( B AB )CD = δAC δBD .
La matrice α peut s’écrire α = ∑ A,B µ AB ⊗ B AB où les matrices n1 × n1
µ AB sont données par

(µCD )ij = (α)iC,jD ⇔ (α)iC,jD = ∑ (µ AB ⊗ BAB )iC,jD .


A,B

La condition de commutation [α, T̃ 1 ( g)] = 0 donne ∑ A,B [µ AB , T 1 ( g)] ⊗


B AB = 0 et donc [µ AB , T 1 ( g)] = 0. Ceci implique, par le lemme de
Schur, µ AB = λ AB In1 ×n1 pour certains nombres λ AB . Injectant ce
résultat dans α, on obtient

α = In1 ×n1 ⊗ B (9.15)

où la matrice m1 × m1 B est donnée par B = ∑ A,B λ AB B AB . La symétrie


implique que pour connaître les (m1 n1 )2 éléments de matrice de α, il
suffit de connaître les (m1 )2 éléments de matrice de B.
Revenant à T ( g) écrit sous la forme (9.3), on en conclut, en utili-
sant les résultats précédents, que A est diagonale par blocs,
 
A1 0 · · · · · ·
 0 A · · · · · ·
2
A= , (9.16)
 
· · · · · · · · · · · ·
0 0 · · · Ak
128 représentation des groupes et application à la physique


Ai = Ini ×ni ⊗ Bi (9.17)

Par conséquent, pour connaître les (∑i ni mi )2 éléments de matrice de


A, il suffit de connaître les ∑i (mi )2 éléments de matrice des Bi car A
se réduit à (9.16) avec (9.17). C’est la conséquence de la symétrie.
En résumé, dans le cas des opérateurs d’entrelacement, la théorie
des groupes ne contraint pas comment les représentations dégénérées
(de même dimension mais de multiplicité plus grande que 1) se mé-
langent entre elles mais elle empêche les représentations différentes
de se mélanger essentiellement par le lemme de Schur.

9.2 Coefficients de Clebsch-Gordan

Soient T p et T q deux représentations irréductibles unitaires d’un


groupe G. Le produit tensoriel T ≡ T p ⊗ T q se décompose en représen-
tations irréductibles unitaires,
pq
T p ⊗ T q = ⊕r m rT
r
(9.18)
pq
où les m r sont les multiplicités.
p q
Soient {φj } (j = 1, · · · , n p ), {ψk } (k = 1, · · · , nq ) et {θlr,α } (l =
pq
1, · · · , nr ; α = 1, · · · , m r ) des bases orthonormées (= unitaires) des
sous-espaces invariants X p , X q et X r,α associés aux représentations
pq
irréductibles T p , T q et T r , respectivement (comme T r apparaît m r
pq
fois, il y a m r copies de X r paramétrisées par l’indice α). On a
np
∑ (T p ( g))ij φi ,
p p
T ( g)φj = (9.19)
i =1
nq
∑ (T q ( g))mk φm ,
q q
T ( g)ψk = (9.20)
m =1
nr
T ( g)θlr,α = ∑ (Tr ( g))ul θur,α . (9.21)
u =1

p q p q
Les vecteurs φj ⊗ ψk ≡ φj ψk forment une base de l’espace X p ⊗ X q
à n p nq dimensions. Les θlr,α aussi puisque
 pq 
X p ⊗ X q = ⊕r ⊕ m
α =1
r r,α
X .

On a donc
n p nq  
∑∑
p q p q
θlr,α = j k | r,l α
φj ψk (9.22)
j =1 k =1
 
p q
Les coefficients j k | r,l α sont appelés coefficients de Clebsch-
Gordan et forment les composantes d’une matrice inversible n p nq ×
théorème de wigner-eckart 129

n p nq . Les formules du changement de base inverse sont


pq
m r nr  
=∑ ∑∑
p q r, α p q
φj ψk l | j k θlr,α (9.23)
r α =1 l =1
 
p q
où les r,l α | j k sont les composantes de la matrice n p nq × n p nq in-
verse de celle définie par les coefficients de Clebsch-Gordan. Comme
les bases sont unitaires, on a
   ∗
r, α p q p q
l | j k = j k | r,l α . (9.24)

Supposons que G est un groupe de Lie compact. Soit Pul r l’opéra-

teur défini par l’intégrale invariante (voir premier chapitre pour la


définition de l’intégrale invariante)
Z
r
Pul = nr dν( T r ( g))∗ul T ( g). (9.25)
G
r projettent sur l’espace de la représenta-
Théorème 9.1. Les opérateurs Pul
tion T r ,
nr
r
T (h)Pul = ∑ (Tr (h)) pu P plr (9.26)
p =1
nr
r
Pul T (h) = ∑ (Tr (h))l p Pup
r
(9.27)
p =1

et obéissent à
r s,α
Pul θv = δlv δrs θur,α . (9.28)

Nous ne prouverons pas ce théorème car une version très similaire


a été vu pour les groupes finis dans le cadre de la preuve du théo-
rème de Peter-Weyl. Dans le cas des groupes finis d’ordre n on a la
définition analogue où on remplaçe l’intégrale invariante sur G par la
somme sur G :
1
Z
dν →
n ∑. (9.29)
G g∈ G

Théorème 9.2. Les coefficients de Clebsch-Gordan satisfont à la relation


pq
m r   ∗ Z

p q p q
s t | r,u α
j k | r,l α
= nr dν ( T p ( g))sj ( T q ( g))tk ( T r ( g))∗ul .
α =1 G
(9.30)
pour G un groupe de Lie compact et
pq
m r ∗
  nr
∑ ∑ (T p ( g))sj (T q ( g))tk (Tr ( g))∗ul
p q p q
s t | r,u α
j k | r,l α
=
α =1
n g∈ G
(9.31)
pour G un groupe fini d’ordre n.
130 représentation des groupes et application à la physique

Démonstration. Supposons G un groupe de Lie compact (la preuve est


r à (9.23). On obtient
similaire pour les groupes finis). On applique Pul
pq
  m r  

r p q r, α p q
Pul φj ψk = l | j k θur,α .
α =1

Injectant ensuite (9.22), on tire

  n p nq m pq r   
∑∑ ∑
r p q r, α p q p q p q
Pul φj ψk = l | j k s t | r,u α
φs ψt (9.32)
s =1 t =1 α =1

r et du produit tensoriel,
Mais d’autre part, par définition (9.25) de Pul
on a :
  n p nq Z
∑∑
p q p q
r
Pul φj ψk = nr dν ( T p ( g))sj ( T q ( g))tk ( T r ( g)∗ )ul φs ψt
s =1 t =1 G
(9.33)
Le théorème découle de la comparaison de (9.32) avec (9.33), en
p q
utilisant l’unitarité (9.24) et l’indépendance linéaire des φs ψt .

9.3 Opérateurs tensoriels irréductibles : définition

Soient G un groupe et T une représentation de G dans l’espace


q
vectoriel X. On dit les opérateurs Ok ∈ GL( X ) (q fixé, k = 1, · · · , nq )
q
forment un opérateur tensoriel irréductible ssi les Ok se trans-
forment selon la représentation irréductible T q de G. Plus précisé-
ment
nq
T ( g) Ok ( T ( g))−1 = ∑ (T q ( g))mk Om
q q
(9.34)
m =1

où les ( T q ( g))mk sont les éléments de matrice des opérateurs de la


représentation T q .
Si G est un groupe de Lie d’algèbre de Lie G , s( x ) la représenta-
tion de G correspondant à T et sq celle correspondant à T q , alors la
relation (9.34) implique
nq
∑ (sq (x))mk Om
q q
[ s ( x ) , Ok ] = (9.35)
m =1

q
Example 1 : si T q est la représentation triviale à une dimension, Ok ≡
O et les équations ci-dessus se réduisent à

T ( g)O( T ( g))−1 = O ⇐⇒ [ T ( g ), O ] = 0 (9.36)


[ s ( x ), O ] = 0 (9.37)

O est un opérateur qui entrelace T avec T.


théorème de wigner-eckart 131

Les opérateurs tensoriels irréductibles sont donc des généralisa-


tions des opérateurs d’entrelacement.
Example 2 : l’opérateur de position r est un opérateur tensoriel qui
se transforme dans la représentation vectorielle (D1 ) de SO(3). Les
matrices de représentation de SO(3) sont les opérateurs hermiciens
Ja = eabc rb pc . Ils agissent comme

[ Ja , rb ] = eacd [rc pd , rb ] = −ieacb rc , (9.38)

et donc r a se transforme bien comme un vecteur car ieabc sont les


constantes de structure de so (3) (dans les conventions des physi-
ciens).

9.4 Théorème de Wigner-Eckart

Le théorème de Wigner-Eckart généralise aux opérateurs tensoriels


irréductibles ce que nous avons vu pour les opérateurs d’entrelace-
ment : les conditions de symétrie permettent d’exprimer les éléments
de matrice d’un opérateur tensoriel irréductible en terme d’un petit
nombre "d’éléments de matrice réduits".

Théorème 9.3. [Théorème de Wigner-Eckart] Soient G un groupe fini


ou un groupe de Lie compact et T une représentation unitaire de G dans
l’espace vectoriel X. Soit (·, ·) le produit hermicien X × X → R.
Supposons que T contienne les représentations irréductibles T p et T r de
dimensions n p et nr (avec une multiplicité qui peut être plus grande que 1).
Soient X p et X r des sous-espaces invariants irréductibles associés à T p et T r
p
et {φj } (j = 1, · · · , n p ) et {ψlr } (l = 1, · · · , nr ) des bases orthonormées des
espaces X p et X r .
q
Soit Ok un opérateur tensoriel irréductible se transformant dans la
pq
représentation T q (voir (9.34)). On note comme précédemment m r la
multiplicité de T r dans T p ⊗ T q . On a
pq
  m r  ∗

q p p q
ψlr , Ok φj = j k | r,l α
(r |Oq | p)α (9.39)
α =1
pq
où les (r |Oq | p)α sont m r “éléments de matrice réduits" qui ne dépendent
pas de j, k et l. La dépendance en j, k, l est entièrement donnée par les
coefficients de Clebsch-Gordan.
Démonstration. Comme les opérateurs T ( g) sont unitaires, on a
   
q p q p
ψlr , Ok φj = T ( g)ψlr , T ( g)Ok φj
 
q p
= T ( g)ψlr , T ( g)Ok ( T ( g))−1 T ( g)φj
n p nq nr  
∑∑ ∑ p q r ∗ r q p
= ( T ( g )) sj ( T ( g )) tk ( T ( g )) ul ψu , O φ
t s
s =1 t =1 u =1
132 représentation des groupes et application à la physique

Supposons G groupe de Lie compact. Intégrant sur g ∈ G, on obtient,

  n p nq nr Z  
∑∑∑
q p q p
ψlr , Ok φj = dν ( T p ( g))sj ( T q ( g))tk ( T r ( g))∗ul ψur , Ot φs
s =1 t =1 u =1 G
(9.40)
d’où on tire, grâce à (9.30), la relation cherchée,
pq
  m r  ∗

q p p q
ψlr , Ok φj = j k | r,l α
(r |Oq | p)α (9.41)
α =1

où les (r |Oq | p)α sont donnés par


n p nq nr
1   
∑∑∑
p q q p
(r |Oq | p)α = s t | r,u α
ψur , Ot φs (9.42)
nr s =1 t =1 u =1

On obtient le même résultat dans le cas des groupes finis.


 
q p
On observe en particulier que l’élément de matrice ψlr , Ok φj
n’est non nul que si le produit tensoriel T p ⊗ T q contient la repré-
pq
sentation T r dans sa décomposition (m r 6= 0). Aussi, le nombre
de
 constantes
 non déterminées par la théorie des groupes dans
q p
ψlr , Ok φj , c’est-à-dire le nombre d’éléments de matrice réduits, est
égal à la multiplicité de T r dans T p ⊗ T q .

9.5 Théorème de Wigner-Eckart pour SU (3)

On considère le groupe SU (3). Le théorème de Wigner-Eckart


prend
 une forme particulièrement simple en termes de tenseurs. Soit
i ···i 0
  
i ···im
u = u 1j un tenseur de la représentation (m, n), v = v 1j ···mj 0
1 ··· jn 1 n
i ···i 00
 
un tenseur de la représentation (m0 , n0 ) et Θ = Θ 1j ···mj 00 un opé-
1 n
rateur tensoriel irréductible se transformant dans la représentation
(m00 , n00 ). On sait que l’élément de matrice (u, Θv) est non nul si et
seulement si le produit tensoriel (m0 , n0 ) ⊗ (m00 , n00 ) contient (m, n). On
sait aussi que le nombre de constantes non fixées par la théorie des
groupes est égal à la multiplicité de (m, n) dans (m0 , n0 ) ⊗ (m00 , n00 ).
i ···im00 k1 ···k m0
Il faut donc décomposer le produit Θ 1j v ` ···` 0 en composantes
1 ··· jn00 1 n
irréductibles et déterminer s’il contient des tenseurs de type (m
n ) dans
sa décomposition. On extrait ces composantes irréductibles (m, n) en
prenant le produit scalaire avec u.
Illustrons le théorème dans le cas où u, v et Θ se transforment tous
les trois dans la 8. Le produit 8 ⊗ 8 à 64 dimensions se décompose en :
— la (2, 2) ≡ 27, obtenue en enlevant les traces de
(i k)
Θ ( j v `) ;
théorème de wigner-eckart 133

— la (1, 1) ≡ 8 qui apparaît en prenant une trace ; elle apparaît deux


fois car il y a deux manières de prendre une trace,
j
Θi j vki et Θi j v ` ;

— la (0, 0) ≡ 1 qui apparaît en prenant la double trace,


j
Θi j v i ;

k)
— la (3, 0) ≡ 10 et la (0, 3) ≡ 10, obtenues à partir de e j`(m Θi j v ` et
eik(m Θi j vk`) .

Ceci donne bien 27 + 2 × 8 + 1 + 2 × 10 = 64 dimensions. On a par le


théorème de Wigner-Eckart
   
j 1 p q j 1 p q
(u, Θv) = λ1 u k Θi j vki − δkj Θ q v p + λ2 u`i Θi j v ` − δi` Θ q v p
3 3

Observant que les termes de trace s’en vont car ui j est sans trace et
utilisant des notations matricielles, on obtient

(u, Θv) = λ1 Tr (uvΘ) + λ2 Tr (uΘv). (9.43)

Les 8 × 8 × 8 = 512 éléments de matrice (u, Θv) ne dépendent que de


deux paramètres.
De la même manière, si u et v se transforment dans la 10 et Θ dans
la 8, on obtient

(u, Θv) = λ uijk Θi` v` jk (9.44)

car le produit tensoriel 8 ⊗ 10 ne contient la 10 qu’une fois, déterminée


(i
par Θ ` v jk)` . Les 800 éléments de matrice (u, Θv) ne dépendent que
d’un paramètre.
10
Interactions fortes et symétrie SU (3)

Retournons dans les années 50 au moment de la découverte des


particules étranges. Déjà dans les années 1940 les mésons π avaient
été découverts après une prédiction par Yukawa. Ils s’appellent
mésons car leur masse est intermédiaire entre celle de l’électron et
celles des nucléons. Ils forment un triplet de particules qui ont la
même masse mais ont des charges électriques −1, 0, 1 dans les unités
de la charge de l’électron. En 1947, de nouvelles particules instables
“étranges”, nommées kaons ou mésons K, avaient été observées par
Rochester et Butler dans des chambres à bulles frappées par des
rayons cosmiques. Au début des années 50 après des expériences
plus précises il fut réalisé qu’il y avait 4 kaons différents et qu’il était
utile de classifier ces nouvelles particules avec un nouveau nombre
quantique : l’étrangeté S. Les particules qui ont un nombre S non-
zéro sont des particules étranges par définition. Il fut aussi vite été
réalisé qu’il plus commode d’introduire l’hypercharge Y qui est la
somme du nombre baryonique B 1 et de l’étrangeté, 1. Le nombre baryonique a été introduit
comme +1 pour les nucléons (protons
et neutrons) et 0 pour les mésons. En
Y = B + S. (10.1)
fait, après la découverte de la structure
des quarks, on peut le définir comme
1
B = 3 ( nq − nq̄ ) où nq et nq̄ sont le
10.1 L’approche de Gell-Mann nombre de quarks et d’anti-quarks qui
composent la particule.
En 1961, Gell-Mann proposa le modèle “the eight-fold way” basé
sur le groupe SU (3) pour classifier les propriétés des hadrons (ba-
ryons et mésons) connus de l’époque. En fait, les hadrons connus en
1961 sont composés des trois quarks légers u, d et s (“up", “down" et
“strange", “haut", “bas" et “étrange") de la théorie de la chromodyna-
mique quantique qui décrit les interactions fortes découverte par la
suite. Ces trois quarks possèdent des masses proches par rapport à
l’échelle de masse de la chromodynamique quantique ΛQCD ≈ 200
MeV (u : de 1, 5 à 3, 3 Mev ; d : de 3, 5 à 6 Mev ; s : de 80 à 130 Mev ;
en comparaison : c : de 1, 15 à 1, 35 Gev ; b : de 4, 1 à 4, 4 Gev et t :
173 ± 3 Gev). Donc la théorie des interactions fortes possède une
136 représentation des groupes et application à la physique

symétrie globale SU (3) approchée pour ces trois quarks légers 2 . Le 2. Le lagrangien de la chromodyna-
sous-groupe SU (2) qui agit sur les quarks u et d est presque exact et mique quantique possède aussi un
groupe de jauge SU (3) (le SU (3) des
appelé le sous-groupe d’isospin. Il est engendré par les générateurs couleurs de quarks) qui n’a strictement
T1 , T2 et T3 par convention avec la valeur de T3 donnant l’isospin. Le rien à voir avec cette symétrie globale
approchée SU (3) qui est dite “des
générateur T8 commute avec l’isospin. saveurs” (flavor symmetry en anglais).
Gell-Mann a imaginé que l’on pouvait diviser les interactions
fortes en deux parties :

— les interactions très fortes (“very strong interactions"), qui sont


invariantes sous SU (3) ;

— les interactions moyennement fortes (“medium strong interac-


tions") qui brisent SU (3) mais préservent l’isospin et le générateur
T8 .

L’isospin lui-même est brisé par l’interaction électrofaible.


Il a montré que la symétrie SU (3) permettait de comprendre de
nombreuses propriétés des hadrons comme nous allons le détailler.
Nous prendrons cependant une approche moderne en donnant
d’abord les propriétés des quarks sous la symétrie approchée.

10.2 “The eight-fold way"

Les deux générateurs de Cartan de SU (3) permettent d’associer


deux nombres quantiques aux hadrons, à savoir l’isospin T3 et l’hy-

percharge Y ≡ 2T8 / 3. Physiquement, on relie la charge électrique à
l’isospin et à l’hypercharge par

Y
Q = T3 + (10.2)
2 Figure 10.1: La représentation (1, 0) ≡
3:
On postule que les quarks u, s et d se transforment selon la 3 de
SU (3). Les nombres quantiques de l’isospin et de l’hypercharge sont
donc entièrement fixés par les poids de la représentation 3 illustrés
en marge.
Ceci conduit aux nombres quantiques des quarks u,d,s :

Quark Isospin Hypercharge Nombre Etrangeté Charge


baryonique électrique
1 1 1 2
u 2 3 3 0 3
d − 21 1
3
1
3 0 − 13
s 0 − 23 1
3 -1 − 13

¯ dans la 3̄ :
et des anti-quarks ū,d,s̄
interactions fortes et symétrie su ( 3 ) 137

Anti- Isospin Hypercharge Nombre Etrangeté Charge


Quark baryonique électrique
ū − 12 − 13 − 31 0 − 23
d¯ 1
2 − 13 − 31 0 1
3
2
s̄ 0 3 − 31 1 1
3

Les mésons sont des états liés quark-antiquark ; les baryons sont
des états liés de trois quarks. Regardons tout d’abord les mésons. On
a 3 ⊗ 3̄ = 8 ⊕ 1. Les mésons s’organisent donc dans un octet et un
singlet. Après analyse, les 7 particules connues en 1961 (les mésons
0
π : π − , π 0 , π − et les mésons K : K0 , K + , K − , K s’organisent comme
suit :

T8
K0 K+

⇡ ⇡0 ⌘ ⇡+
T3
0
K K

L’isospin et l’hypercharge se déduisent de la représentation et


l’étrangeté et la charge électrique peuvent en être déduits en posant
que le nombre baryonique B = 0 pour les mésons. Vu que l’octet doit
contenir un autre méson η avec les mêmes nombres quantiques que
le méson π 0 , Gell-Mann a pu prédire l’existence de cette particule en
1961 3 . La particule η (de masse plus importante à cause de la brisure 3. En fait, le singlet donne une autre
de symétrie) fut rapidement identifiée ce qui a confirmé la viabilité particule η 0 mais en fait à cause des
interactions moyennement fortes les
de la théorie. particules η et η 0 se mélangent. Note
La puissance de théorie des représentations de SU (3) ne s’arrête historique : quelques mois plus tard,
la même classification fut établie par
pas là. Examinons maintenant les baryons. On a 3 ⊗ 3 = 6 ⊕ 3̄ et Nakano et Nishijima (source : le com-
6 ⊗ 3 = 10 ⊕ 8 (exercice). Donc, muniqué du prix Nobel de Gell-Mann
en 1969).
3⊗3⊗3 = (6 ⊕ 3̄) ⊗ 3
= (6 ⊗ 3) ⊕ (3̄ ⊗ 3)
= 10 ⊕ 8 ⊕ 8 ⊕ 1. (10.3)

Intéressons nous maintenant à l’octet 8 contenant les nucléons stables


(proton P et neutron N d’étrangeté S = 0, de nombre baryonique
B = 1 et de charges électriques Q = +1, 0). Après analyse des
particules connues, Gell-Mann arriva à la classification 4 : 4. Note historique : Quelques mois plus
tard en 1961, Ne’eman arriva à la même
classification.
138 représentation des groupes et application à la physique

p T8 p
1 3 1 3
N =( , ) P =( , )
2 2 2 2

⌃ = ( 1, 0) ⌃0 , ⇤ ⌃+ = (1, 0)
T3

p p
1 3 1
0 3
⌅ =( , ) ⌅ =( , )
2 2 2 2
A côté des nucléons qui forment un doublet pour l’isospin, il y a
les baryons étranges suivants qui ont des masses très proches :
— un isotriplet (représentation D 1 pour l’isospin) de baryons avec
S = − 1,

Σ + ( T3 = 1 ) , Σ 0 ( T3 = 0 ) , Σ − ( T3 = − 1 ) , (10.4)

— un isosinglet (isospin 0) aussi d’étrangeté S = − 1,

Λ ( T3 = 0 ) , (10.5)

— et un isodoublet (isospin 1/2) d’étrangeté S = − 2,

1 1
Ξ 0 ( T3 = ), Ξ − ( T3 = − ) . (10.6)
2 2
Ceci conduit aux nombres quantiques de l’octet des baryons sui-
vants :

Baryon Isospin Hypercharge Nombre Etrangeté Charge


baryonique électrique
1
P 2 1 1 0 1
N − 12 1 1 0 0
Σ+ 1 0 1 −1 1
Σ0 0 0 1 −1 0
Σ− −1 0 1 −1 −1
Λ 0 0 1 −1 0
Ξ0 1
2 −1 1 −2 0
Ξ− − 21 −1 1 −2 −1

La représentation 8 est la représentation adjointe des tenseurs


( 11 ) .
On peut représenter l’état le plus général de cette représentation
interactions fortes et symétrie su ( 3 ) 139

comme une matrice 3 × 3 de trace nulle,

Σ
+ √Λ
 0 
√ Σ+ P
 2 6
− Σ0 Λ
 Σ

B= −√ + √ N  (10.7)
2 6 
Ξ − Ξ0 2Λ
−√
6 Notez que si seule la composante P
est différente de zéro, on a un proton
où Σ 0 , Λ, P etc désignent les composantes (complexes) selon les car alors la matrice est égale à
vecteurs propres de la représentation adjointe. Physiquement, elles 
0 0 1

représentent les fonctions d’onde des particules. A noter que l’on a P 0 0 0 = P( T4 + iT5 ) (10.8)

0 0 0
normalisé les coefficients de telle sorte que
qui est bien vecteur propre de T et T8
√ 3
( B, B) = Tr ( B† B) = | P|2 + | N |2 + |Σ+ |2 + |Σ0 |2 + |Σ− |2 pour les valeurs propres ( 12 , 3
2 ) qui
caractérisent le proton, etc.
+|Λ|2 + |Ξ0 |2 + |Ξ− |2 . (10.9)

10.3 La formule de masse de Gell-Mann Okubo

Si SU (3) était une symétrie exacte, toutes les particules de l’octet


fondamental auraient la même masse. Comme SU (3) est brisé, les
particules ont des masses différentes. Cependant, comme SU (3) est
une symétrie approchée les différences de masse entre les baryons de
l’octet peuvent être comprises en terme de SU (3). Il s’agit de calculer

( B, HF B)

où HF est l’hamiltonien des interactions fortes. Cet Hamiltonien peut


être écrit comme la somme de deux termes,

HF = HTF + H MF (10.10)

où l’hamiltonien HTF des interactions très fortes commute avec


SU (3) (et donc contribue la même constante pour tous les baryons
de l’octet) et où l’hamiltonien H MF des interactions moyennement
fortes brise la symétrie SU (3) et donne une différence de masse petite
par rapport à ( B, HTF B). L’hamiltonien H MF commute avec le SU (2)
d’isospin et l’hypercharge. Gell-Mann a supposé (i) que H MF est
une des composantes d’un opérateur tensoriel Oij se transformant
selon la 8 de SU (3), et donc Oij = µ a ( Ta )i j , a = 1, · · · , 8 ; et (ii)
plus précisément, que H MF se transforme comme T8 , ( H MF )i j =
µ8 ( T8 )i j . Cela implique [ H MF , Ti ] = 0 pour les générateurs de SU (2)
et [ H MF , Y ] = 0 pour l’hypercharge.
Par le théorème de Wigner-Eckart appliqué à 8 ⊗ 8 → 8, voir (9.43)
démontré au chapitre précédent, on sait que les éléments de matrice
( B, HMF B) ne dépendent que de deux paramètres,

( B, HMF B) = xTr ( B† BT8 ) + yTr ( B† T8 B) (10.11)


140 représentation des groupes et application à la physique

(pour la 8, ū = u† ). Comme T8 est diagonal, ceci donne

x  † 1 
( B, HMF B) = √ ( B B) 1 + ( B† B)22 − 2( B† B)33
12
y  
+√ ( BB† )11 + ( BB† )22 − 2( BB† )33 . (10.12)
12

Développant les termes, on obtient

x  
( B, H M F B ) = √ | Σ |2 + | Ξ |2 − | Λ |2 − 2| N |2
12
y  
+√ | Σ | 2 + | N | 2 − | Λ | 2 − 2 | Ξ | 2 (10.13)
12 Par exemple,
2
Dans (10.13), on somme sur les différents types de particules d’une Σ0 Λ
( B† B)11 = √ + √ + |Σ− |2 + |Ξ− |2 etc.
même représentation d’isospin, e.g., | N |2 est la somme sur les nu- 2 6

cléons (proton et neutron). Ceci implique

2x y
M N = M0 − √ + √ ,
12 12
x y
MΣ = M0 + √ + √ ,
12 12
x y
MΛ = M0 − √ − √ ,
12 12
x 2y
MΞ = M0 + √ − √ ,
12 12

où M0 est la contribution commune de HTF . Il y a 4 masses et 3


paramètres. On pet ainsi tirer une relation entre les 4 masses, qui est
une conséquence directe de la symétrie

2( M N + MΞ ) = MΣ + 3MΛ . (10.14)

C’est la formule de Gell-Mann-Okubo.


Elle est remarquablement précise. En effet, on peut la récrire de
manière équivalente

1
MΛ = ( 2 ( M N + MΞ ) − MΣ ) , (10.15)
3

ce qui donne, tenant compte de

M N = 940 Mev, MΣ = 1190 Mev, MΞ = 1320 Mev,

une masse pour la particule Λ égale à

MΛ = 1110 Mev. (10.16)

La valeur expérimentale est de 1115 Mev.


interactions fortes et symétrie su ( 3 ) 141

Résonances hadroniques
A côté de l’octet des hadrons que nous venons de décrire, il existe
un décuplet 10 de résonances hadroniques

∆− ∆0 ∆+ ∆++

Σ∗− Σ ∗0 Σ∗+

Ξ∗− Ξ ∗0

Ω−

La représentation (3, 0) ≡ 10

Quand le groupe SU (3) fut introduit dans l’étude des interac-


tions fortes, le Ω− n’avait pas encore été découvert. Gell-Mann a
prédit l’existence de cette particule et ses nombres quantiques afin
de compléter la représentation 10 (singlet d’isospin, T3 = 0, et hy-
percharge Y = −2, donc S = −3 et Q = −1). Il a pu également
prédire sa masse, en calculant ( B∗ , H MF B∗ ) comme ci-dessus, où B∗
représente le décuplet. Vu le théorème de Wigner-Eckart appliqué à
8 ⊗ 10 → 10, voir (9.44), il n’y a cette fois-ci qu’un seul paramètre. De
plus, comme H MF ∼ T8 ∼ Y, l’isospin n’entre pas ligne en compte
dans cet élément de matrice et l’élément de matrice est proportionnel
à l’hypercharge. Donc, les différences de masses entre les différentes
représentations d’isospin sont égales,

MΣ ∗ − M∆ = MΞ ∗ − MΣ ∗ = MΩ − − MΞ ∗ . (10.17)

On a

M∆ = 1230 Mev, MΣ∗ = 1385 Mev, MΞ∗ = 1530 Mev

(espacement de 145 MeV et 155 MeV) ce qui donne un espacement


moyen de 150 Mev et donc une masse d’environ 1680 Mev pour le
Ω− . La valeur observée de 1672 Mev en est très proche.
Cette prédiction en 1962 par Gell-Mann qui fut vérifiée expéri-
mentalement en 1964 fut un des triomphes de la symétrie approchée
globale SU (3) et lui a valu le prix Nobel en 1969. C’est aussi une
illustration des incroyables contraintes que la théorie des représenta-
tions des groupes de Lie peut apporter à la physique.
11
Sous-algèbres des algèbres simples compactes

11.1 Sous-algèbres maximales

Une sous-algèbre propre g 0 de g, notée g ⊃ g 0 , est une sous-


algèbre non triviale g 0 6 = 0 distincte de g. La sous-algèbre propre
g 0 est une sous-algèbre maximale si il n’existe pas d’algèbre propre
g ∗ telle que g ⊃ g ∗ ⊃ g 0 . Si toutes les sous-algèbres maximales
de toutes les algèbres de Lie compactes simples sont classifiées,
toutes les sous-algèbres pourront alors être trouvée par itérations
successives. Notez qu’une sous-algèbre d’une
Les sous-algèbres maximales des algèbres de Lie compactes algèbre de Lie simple ne doit pas
nécessairement être simple. Exemple :
simples forment deux catégories appelées régulière (R) et spéciale su(2) ⊃ u(1).
(S). Etudions tout d’abord le cas de su(3). On a vu que T1 , T2 , T3 , T8
forment une sous-algèbre su(2) ⊕ u(1) (celle utilisée dans la classifica-
tion “the eight-fold way” des hadrons). Il est facile de se convaincre
qu’elle est maximale. Une caractéristique de cette sous-algèbre est
que les générateurs de Cartan de su(2) ⊕ u(1) sont identiques à ceux
de su(3) ; aussi, les racines de su(2) ⊕ u(1) sont un sous-ensemble
de celles de su(3). Ces caractéristiques définissent une sous-algèbre
régulière. Les autres sous-algèbres maximales sont dites spéciales.
Il existe en fait exactement une autre sous-algèbre su(2) maximale
générée par 2T2 , 2T5 et 2T7 (ou de manière équivalente par 2T3 , 2T4
et 2T5 ). Elle a la caractéristique que la représentation fondamentale 3
de su(3) est projetée sur la représentation 3 (D1 ) de su(2), ce qui est
typique des sous-algèbres spéciales.

Sous-algèbres maximales régulières


Une première manière d’obtenir une sous-algèbre maximale régu-
lière est simplement de considérer le diagramme de Dynkin obtenu
en enlevant un noeud du diagramme de Dynkin de l’algèbre. Le
noeud enlevé correspondra à un générateur de Cartan qui commu-
tera avec toute l’algèbre, donc un facteur u(1). Dès lors, le système
144 représentation des groupes et application à la physique

de racines sera forcément un sous-système de celui de l’algèbre de


départ. Comme le nombre de générateurs de Cartan ne change pas Il est immédiat de dériver su(4) ⊃
il s’agira d’une sous-algèbre maximale. Elle ne sera cependant pas su(2) ⊕ su(2) ⊕ u(1) et su(4) ⊃ su(3) ⊕
u(1) en enlevant respectivement le
semi-simple à cause du facteur u(1). noeud du milieu et le dernier noeud
Les sous-algèbres maximales régulières semi-simples peuvent être du diagramme de Dynkin de l’algèbre
a3 = su(4).
obtenues à partir d’un algorithme simple invoquant le diagramme
des racines. L’algorithme général pour déduire les sous-algèbres
maximales régulières des algèbres de Lie simple compactes est le
suivant. Soit une algèbre de Lie simple compacte de rang n et son
système de racines simples {αi }, i = 1, . . . n. Ajoutons à cette liste la
racine la plus petite α0 qui peut être calculée explicitement. Ce sys-
tème de racines est indécomposable 1 mais il n’est pas linéairement 1. En effet, la racine α0 ne pourrait être
indépendant. Il y a exactement une relation linéaire entre les racines. orthogonale à toutes les racines simples
puisque ces dernières forment une base.
Puisque α0 est la racine la plus petite, α0 − αi n’est pas une racine et
donc

2α0 · αi 2αi · α0
A0i ≡ ≤0 et Ai0 ≡ ≤ 0. (11.1)
α20 α2i

par la formule fondamentale (7.40). D’après la discussion au chapitre


7.5, les quantités A0i , Ai0 peuvent prendre les valeurs 0, −1, −2, −3
mais aussi −4 puisqu’il peut se faire que la racine α0 soit l’opposé
d’une racine simple. Ce cas particulier se produit en fait uniquement
pour l’algèbre A1 = su(2) qui n’admet que u(1) comme sous-algèbre
maximale 2 . 2. Ce résultat peut se déduire par calcul
En posant A00 ≡ 2, on obtient une matrice de Cartan éten- direct à partir de (11.1) après avoir
préalablement calculé la racine la plus
due { Aij }i,j=0,...n avec des 2 en diagonale, des 0, −1, −2, −3 hors- petite.
diagonale et qui obéit à Aij 6= 0 ⇒ A ji 6= 0. Cette matrice de Cartan
étendue définit un diagramme de Dynkin étendu selon les règles
graphiques énoncées au chapitres précédents. Les diagrammes de
Dynkin étendus résultants sont
sous-algèbres des algèbres simples compactes 145

Ici, on rappelle les égalités pour les algèbres B2 = C2 et D3 = A3 .


Les diagrammes étendus génériques de Bn pour n = 2 et de Dn pour
n = 3 ne sont pas définis mais les diagrammes étendus de C2 et A3
existent. Ce sont eux qui sont les diagrammes étendus des algèbres
B2 et D3 .
Si on enlève une racine quelconque du système, on obtient un
système de racines de rang maximal n qui obéit à deux des proprié-
tés fondamentales A et B d’un diagramme de Dynkin énoncées au
chapitre 7.10. Si la propriété C d’indécomposabilité est aussi vérifiée
il s’agira d’une algèbre simple ; sinon elle sera une somme directe
d’algèbres simples.
On voit immédiatement que su(n) n’admet pas de sous-algèbre
semi-simple maximale car enlever un noeud quelconque du dia-
gramme de Dynkin étendu nous ramène à l’algèbre su(n). Dans
le cas Bn = so (2n + 1), enlever le noeud correspondant à la ra-
cine la plus courte à droite du diagramme donne Dn = so (2n) ce
qui correspond bien à so (2n) ⊂ so (2n + 1). Enlever un noeud au
milieu de la chaîne de Bn mène à l’algèbre Dk ⊕ Bn−k . On a donc
so (2k ) ⊕ so (2n − 2k + 1) ⊂ so (2n + 1). Les autres sous-algèbres se
déduisent de manière similaire.

11.2 Sous-algèbres maximales des algèbres de Lie simples compactes

Les sous-algèbres maximales spéciales ne sont pas évidentes à dé-


duire car leur générateurs de Cartan différent de ceux de l’algèbre de
départ. Elles peuvent se déduire de manière indirecte en comparant
les représentations irréductibles de l’algèbre et de ses sous-algèbres
146 représentation des groupes et application à la physique

maximales spéciales. Nous ne le ferons pas ici.


La liste complète des sous-algèbres maximales régulières et spé-
ciales des algébres de Lie simples compactes est donnée ci-dessous
pour toutes les algèbres de rang de 1 à 4 ainsi que pour les 5 algèbres
exceptionnelles.

Rang 1
su(2) ' so (3) ' sp(2) ⊃ u (1) (R)
Rang 2 Rappelons l’identité so (4) ' su(2) ⊕
su(3) ⊃ su(2) ⊕ u(1) (R) su(2).

⊃ su(2) (S)
so (5) ' sp(4) ⊃ su(2) ⊕ su(2) ; su(2) ⊕ u(1) (R)
⊃ su(2) (S)
Rang 3
su(4) ' so (6) ⊃ su(3) ⊕ u(1) ; su(2) ⊕ su(2) ⊕ u(1) (R)
⊃ sp(4) ; su(2) ⊕ su(2) (S)
so (7) ⊃ su(4) ; su(2) ⊕ su(2) ⊕ su(2) ; sp(4) ⊕ u(1) (R)
⊃ g (2) (S)
sp(6) ⊃ su(3) ⊕ u(1) ; su(2) ⊕ sp(4) (R)
⊃ su(2) ; su(2) ⊕ su(2) (S)
Rang 4
su(5) ⊃ su(4) ⊕ u(1) ; su(2) ⊕ su(3) ⊕ u(1) (R)
⊃ sp(4) (S)
so (9) ⊃ so (8) ; su(2) ⊕ su(2) ⊕ sp(4) ; su(2) ⊕ su(4) ; so (7) ⊕ u(1) (R)
⊃ su(2) ; su(2) ⊕ su(2) (S)
sp(8) ⊃ su(4) ⊕ u(1) ; su(2) ⊕ sp(6) ; sp(4) ⊕ sp(4) (R)
⊃ su(2) ; su(2) ⊕ su(2) ⊕ su(2) (S)
so (8) ⊃ su(2) ⊕ su(2) ⊕ su(2) ⊕ su(2) ; su(4) ⊕ u(1) ; (R)
⊃ su(3) ; so (7) ; su(2) ⊕ sp(4) (S)
sous-algèbres des algèbres simples compactes 147

g (2) ⊃ su(3) ; su(2) ⊕ su(2) (R)


⊃ su(2) (S)
f (4) ⊃ so (9) ; su(3) ⊕ su(3) ; su(2) ⊕ sp(6) (R)
⊃ su(2) ; su(2) ⊕ g(2) (S)
e (6) ⊃ so (10) ⊕ u(1) ; su(2) ⊕ su(6) ; su(3) ⊕ su(3) ⊕ su(3) (R)
⊃ su(3) ; g(2) ; sp(8) ; f (4) ; su(3) ⊕ g(2) (S)
e (7) ⊃ e(6) ⊕ u(1) ; su(8) ; su(2) ⊕ so (12) ; su(3) ⊕ su(6) (R)
⊃ su(2) ; su(2) ; su(3) ; su(2) ⊕ su(2) ; su(2) ⊕ g(2) ; su(2) ⊕ f (4) ; g(2) ⊕ sp(6) (S)
e (8) ⊃ so (16) ; su(5) ⊕ su(5) ; su(3) ⊕ e(6) ; su(2) ⊕ e(7) ; su(9) (R)
⊃ su(2) ; su(2) ; su(2) ; g(2) ⊕ f (4) ; su(2) ⊕ su(3) ; sp(4) (S)

Une application physique de ces décompositions en sous-algèbres


est la suivante. On remarque que l’algèbre simple de plus bas rang
qui contient l’algèbre du modèle standard des particules élémentaires
su(3) ⊕ su(2) ⊕ u(1) est su(5). Cela a encouragé Georgi et Glasgow
à proposer en 1974 un modèle dit “de grande unification” des inter-
actions fondamentales à hautes énergies basées sur le groupe SU (5)
qui est spontanément brisé à basse énergie. De tels modèles pré-
disent la désintégration du proton à un taux qui dépend du modèle
exact. A ce jour ces modèles n’ont été ni infirmés ni confirmés par
l’expérience.
Bibliographie pour la partie groupes finis

— James Humphreys, A Course in Group Theory, Oxford University


Press, 1996
— James Humphreys, Reflection Groups and Coxeter Groups, Cam-
bridge Studies in advanced mathematics, 1990
— Pierre Ramond, Group Theory : A Physicist’s Survey, Cambridge
University Press, 2010
— J.F. Cornwell, Group Theory in Physics, Vol 1. et Vol 2., Academic
Press - Elsevier, 1984
— M. Naimark et A. Stern, Théorie des représentations des groupes,
Editions MIR, 1979
— S. Chatterjee, Crystallography and the World of Symmetry, Sprin-
ger, 2008

Outils informatiques : L’Atlas des représentations des groupes finis


contient des informations sur plus de 700 groupes d’ordre élevé.
L’Atlas se trouve sur

http://brauer.maths.qmul.ac.uk/Atlas/v3/
Bibliographie pour la partie groupes de Lie

— Howard Georgi, Lie Algebras in Particle Physics, Second Edition,


Frontiers in Physics, Westview Press, 1999
— James Humphreys, Introduction to Lie Algebras and Representa-
tion Theory, Springer, 1972
— Anthony Knapp, Lie Groups Beyond an Introduction, Second
Edition, Birkhäuser, 2005
— Pierre Ramond, Group Theory : A Physicist’s Survey, Cambridge
University Press, 2010
— J.F. Cornwell, Group Theory in Physics, Vol 1. et Vol 2., Academic
Press - Elsevier, 1984
— M. Naimark et A. Stern, Théorie des représentations des groupes,
Editions MIR, 1979
— R. Slansky, Group theory for unified model building, Phys. Rep.
79 Issue 1, Elsevier, 1981

Outils informatiques : Le package LieART pour Mathematica publié


par Robert Feger et Thomas Kephart en 2014 peut générer la plupart
des quantités d’intérêt pour la théorie des groupes de Lie compacts
et leurs représentations. Le programme peut être téléchargé sur
lieart.hepforge.org et le manuel est disponible sur arxiv.org sous le
numéro d’article arXiv :1206.6379.

Vous aimerez peut-être aussi