0% ont trouvé ce document utile (0 vote)

73 vues201 pages

Invariances et Théorie des Groupes en Physique

Group theory applied to quantum field theory

Transféré par

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

0% ont trouvé ce document utile (0 vote)

73 vues201 pages

Invariances et Théorie des Groupes en Physique

Group theory applied to quantum field theory

Transféré par

Livet

Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.

Formats disponibles

Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

M2/International Centre for Fundamental Physics

Parcours de Physique Théorique

Invariances en physique
et théorie des groupes

Jean-Bernard Zuber

Niels Henrik Abel Elie Cartan Hendrik Casimir Claude Chevalley Rudolf F. A. Clebsch Harold S. M. Coxeter
1802 – 1829 1869 – 1951 1909-‐2000 1909 – 1984 1833 – 1872 1907 – 2003

Eugene B. Dynkin Hans Freudenthal Ferdinand Frobenius Paul Albert Gordan Alfréd Haar Sir William R. Hamilton
1924 -‐ 1905 -‐ 1990 1849 – 1917 1837 – 1912 1885 -‐ 1933 1805 -‐ 1865

Wilhelm K. J. Killing Sophus Lie Dudley E. Littlewood Hendrik A. Lorentz Hermann Minkowski Emmy A. Noether
1847 – 1923 1842 – 1899 1903 -‐ 1979 1853 -‐ 1928 1864 – 1909 1882 -‐ 1935

Henri Poincaré Archibald R. Richardson Olinde Rodrigues Issai Schur Jean-‐Pierre Serre Miguel Virasoro
1854 – 1912 1881 – 1954 1795–1851 1875 – 1941 1926 -‐ 1940-‐

Bartel van der Waerden André Weil Hermann Weyl Eugene P. Wigner Ernst Witt Alfred Young
1903 – 1996 1906 – 1998 1885 – 1955 1902 – 1995 1911 – 1991 1873 – 1940

Quelques contributeurs à la théorie des groupes mentionnés dans la première partie de ce cours

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

Avertissement
Le chapitre 0 couvre essentiellement le cours de “prérentrée”.
Les chapitres 1 à 5 suivent fidèlement le contenu de mon cours proprement dit. Ils contiennent
aussi dans des paragraphes en petits caractères et dans des appendices quelques compléments
non traités en cours.

Bibliographie générale

– [BC] N.N. Bogolioubov et D.V. Chirkov, Introduction à la théorie quantique des champs,
Dunod.
– [BDm] J.D. Bjorken and S. Drell : Relativistic Quantum Mechanics, McGraw Hill.
– [BDf] J.D. Bjorken and S. Drell : Relativistic Quantum Fields, McGraw Hill.
– [Bo] N. Bourbaki, Groupes et Algèbres de Lie, Chap. 1-9, Hermann 1960-1983.
– [Bu] D. Bump, Lie groups, Series “Graduate Texts in Mathematics”, vol. 225, Springer
2004.
– [DFMS] P. Di Francesco, P. Mathieu et D. Sénéchal, Conformal Field Theory, Springer,
– [DNF] B. Doubrovine, S. Novikov et A. Fomenko, Géométrie contemporaine, 3 volumes,
Éditions de Moscou 1982, réédité en anglais par Springer.
– [FH] W. Fulton and J. Harris, Representation Theory, Springer.
– [Gi] R. Gilmore, Lie groups, Lie algebras and some of their applications, Wiley.
– [Ha] M. Hamermesh, Group theory and its applications to physical problems, Addison-
Wesley
– [IZ] C. Itzykson et J.-B. Zuber, Quantum Field Theory, McGraw Hill 1980 ; Dover 2006.
– [Ki] A.A. Kirillov, Elements of the theory of representations, Springer.
– [LL] L. Landau et E. Lifschitz, Théorie du Champ, Editions Mir, Moscou ou The Classical
Theory of Fields, Pergamon Pr.
– [M] A. Messiah, Mécanique Quantique, 2 tomes, Dunod.
– [OR] L. O’ Raifeartaigh, Group structure of gauge theories, Cambridge Univ. Pr. 1986.
– [PS] M. Peskin and D.V. Schroeder, An Introduction to Quantum Field Theory, Addison
Wesley.
– [Po] L.S. Pontryagin, Topological Groups, Gordon and Breach, 1966.
– [St] S. Sternberg, Group theory and physics, Cambridge University Press.
– [W] H. Weyl, Classical groups, Princeton University Press.
– [Wf] S. Weinberg, The Quantum Theory of Fields, vol. 1, 2 and 3, Cambridge University
Press.
– [Wg] S. Weinberg, Gravitation and Cosmology, John Wiley & Sons.
– [Wi] E. Wigner, Group Theory and its Applications to Quantum Mechanics. Academ. Pr.
1959.
– [Z-J] J. Zinn-Justin, Quantum Field Theory and Critical Phenomena, Oxford Univ. Pr.
ii
Table des matières

0 Quelques éléments de base sur les groupes SO(3), SU(2) et SL(2,C) 1

0.1 Rotations de R3 , les groupes SO(3) et SU(2) . . . . . . . . . . . . . . . . . . . . 1
0.1.1 Le groupe SO(3), groupe à trois paramètres . . . . . . . . . . . . . . . . 1
0.1.2 Du groupe SO(3) au groupe SU(2) . . . . . . . . . . . . . . . . . . . . . 3
0.2 Générateurs infinitésimaux. L’algèbre de Lie su(2) . . . . . . . . . . . . . . . . 4
0.2.1 Générateurs infinitésimaux de SO(3) . . . . . . . . . . . . . . . . . . . . 5
0.2.2 Générateurs infinitésimaux de SU(2) . . . . . . . . . . . . . . . . . . . . 7
0.2.3 Algèbre de Lie su(2) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
0.3 Représentations de SU(2) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
0.3.1 Représentations des groupes SO(3) et SU(2) . . . . . . . . . . . . . . . . 9
0.3.2 Représentations de l’algèbre su(2) . . . . . . . . . . . . . . . . . . . . . . 10
0.3.3 Construction explicite . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
0.4 Produit direct de représentations de SU(2) . . . . . . . . . . . . . . . . . . . . . 15
0.4.1 Produit direct de représentations et l’“addition de moments angulaires” . 15
0.4.2 Coefficients de Clebsch-Gordan, symboles 3-j et 6-j . . . . . . . . . . . . . 17
0.5 Une application physique : l’isospin . . . . . . . . . . . . . . . . . . . . . . . . . 19
0.6 Représentations de SO(1,3) et SL(2,C) . . . . . . . . . . . . . . . . . . . . . . . 21
0.6.1 Petit rappel sur le groupe de Lorentz . . . . . . . . . . . . . . . . . . . . 21
0.6.2 Algèbre de Lie des groupes de Lorentz et Poincaré . . . . . . . . . . . . . 22
0.6.3 Groupes de recouvrement de L↑+ et P+↑ . . . . . . . . . . . . . . . . . . . 23
0.6.4 Représentations irréductibles de dimension finie de SL(2, C) . . . . . . . 24
0.6.5 Représentations irréductibles unitaires du groupe de Poincaré. États à
une particule. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26

1 Groupes. Groupes et algèbres de Lie 31

1.1 Généralités sur les groupes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
1.1.1 Définitions de base et premiers exemples . . . . . . . . . . . . . . . . . . 31
1.1.2 Classes de conjugaison d’un groupe . . . . . . . . . . . . . . . . . . . . . 33
1.1.3 Sous-groupes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
1.1.4 Homomorphisme d’un groupe G dans un groupe G0 . . . . . . . . . . . . 34
1.1.5 Classes par rapport à un sous-groupe . . . . . . . . . . . . . . . . . . . . 34
1.1.6 Sous-groupe invariant . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
iv TABLE DES MATIÈRES

1.1.7 Groupe simple, groupe semi-simple . . . . . . . . . . . . . . . . . . . . . 35

1.2 Groupes continus. Propriétés topologiques. Groupes de Lie . . . . . . . . . . . . 36
1.2.1 Connexité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
1.2.2 Simple connexité. Groupe d’homotopie. Recouvrement universel . . . . . 37
1.2.3 Groupes compacts et non compacts . . . . . . . . . . . . . . . . . . . . . 40
1.2.4 Mesure invariante de Haar . . . . . . . . . . . . . . . . . . . . . . . . . . 41
1.2.5 Groupes de Lie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
1.3 Étude locale d’un groupe de Lie. Algèbre de Lie . . . . . . . . . . . . . . . . . . 43
1.3.1 Algèbres et algèbres de Lie. Définitions . . . . . . . . . . . . . . . . . . . 43
1.3.2 Espace tangent d’un groupe de Lie G . . . . . . . . . . . . . . . . . . . . 44
1.3.3 Relations entre l’espace tangent g et le groupe G . . . . . . . . . . . . . 45
1.3.4 L’espace tangent comme algèbre de Lie . . . . . . . . . . . . . . . . . . 46
1.3.5 Un exemple explicite : l’algèbre de Lie so(n) de SO(n) . . . . . . . . . . 47
1.3.6 Un exemple de dimension infinie : l’algèbre de Virasoro . . . . . . . . . . 49
1.4 Relations entre les propriétés de g et de G . . . . . . . . . . . . . . . . . . . . . 49
1.4.1 Simplicité, semi-simplicité . . . . . . . . . . . . . . . . . . . . . . . . . . 49
1.4.2 Compacité. Complexification . . . . . . . . . . . . . . . . . . . . . . . . . 50
1.4.3 Connexité, simple-connexité . . . . . . . . . . . . . . . . . . . . . . . . . 51
1.4.4 Constantes de structure. Forme de Killing. Critères de Cartan . . . . . . 51
1.4.5 Opérateur(s) de Casimir . . . . . . . . . . . . . . . . . . . . . . . . . . . 54

2 Représentations linéaires des groupes 67

2.1 Définitions et propriétés générales. . . . . . . . . . . . . . . . . . . . . . . . . . 67
2.1.1 Définitions de base . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 67
2.1.2 Représentations équivalentes. Caractères . . . . . . . . . . . . . . . . . . 68
2.1.3 Représentations réductibles et irréductibles . . . . . . . . . . . . . . . . . 69
2.1.4 Représentations conjuguée et contragrédiente . . . . . . . . . . . . . . . . 70
2.1.5 Représentations unitaires . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
2.1.6 Lemme de Schur . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
2.1.7 Produit tensoriel de représentations ; décomposition de Clebsch-Gordan . 73
2.1.8 Décomposition d’une représentation d’un groupe en représentations irréductibles
d’un sous-groupe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
2.2 Représentations des groupes et représentations des algèbres de Lie . . . . . . . . 77
2.2.1 Définition. Universalité . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
2.2.2 Représentations d’un groupe de Lie et de son algèbre de Lie . . . . . . . 78
2.3 Représentations des groupes de Lie compacts . . . . . . . . . . . . . . . . . . . . 79
2.3.1 Orthogonalité et complétude . . . . . . . . . . . . . . . . . . . . . . . . . 79
2.3.2 Conséquences . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
2.3.3 Cas des groupes finis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
2.3.4 Récapitulation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
2.4 Représentations projectives. Théorème de Wigner . . . . . . . . . . . . . . . . . 85
TABLE DES MATIÈRES v

2.4.1 Définition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
2.4.2 Théorème de Wigner . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 86
2.4.3 Invariances d’un système quantique . . . . . . . . . . . . . . . . . . . . . 88
2.4.4 Transformations des observables. Théorème de Wigner–Eckart . . . . . . 89
2.4.5 Forme infinitésimale d’une représentation projective. Extension centrale . 91

3 Algèbres de Lie simples, classification et représentations 107

3.1 Sous-algèbre de Cartan. Racines. Forme canonique de l’algèbre. . . . . . . . . . 107
3.1.1 Sous-algèbre de Cartan . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
3.1.2 Base canonique de l’algèbre de Lie . . . . . . . . . . . . . . . . . . . . . 108
3.2 Géométrie des systèmes de racines . . . . . . . . . . . . . . . . . . . . . . . . . . 111
3.2.1 Produits scalaires de racines. La matrice de Cartan . . . . . . . . . . . . 111
3.2.2 Systèmes de racines des algèbres simples. La classification de Cartan . . . 116
3.2.3 Base de Chevalley de l’algèbre . . . . . . . . . . . . . . . . . . . . . . . . 116
3.2.4 Coracines. Plus haute racine. Nombres, exposants de Coxeter . . . . . . . 117
3.3 Représentations des algèbres semi-simples . . . . . . . . . . . . . . . . . . . . . 118
3.3.1 Poids. Réseau des poids . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
3.3.2 Racines et poids de su(n) . . . . . . . . . . . . . . . . . . . . . . . . . . 122
3.4 Produit tensoriel des représentations de su(n) . . . . . . . . . . . . . . . . . . . 125
3.4.1 Règles de Littlewood–Richardson et de Racah–Speiser . . . . . . . . . . . 125
3.4.2 Construction tensorielle explicite des représentations de SU(2) et SU(3) 127
3.5 Tableaux d’Young et représentations de GL(n) et SU(n) . . . . . . . . . . . . . 129

4 Symétries globales en physique des particules 141

4.1 Symétries globales exactes ou brisées. Brisure spontanée . . . . . . . . . . . . . . 141
4.1.1 Panorama. Symétries exactes ou brisées . . . . . . . . . . . . . . . . . . . 141
4.1.2 Brisure de la symétrie chirale . . . . . . . . . . . . . . . . . . . . . . . . 144
4.1.3 Brisures quantiques. Anomalies . . . . . . . . . . . . . . . . . . . . . . . 145
4.2 La symétrie de saveur SU(3) et le modèle des quarks . . . . . . . . . . . . . . . 146
4.2.1 Pourquoi le groupe SU(3) ? . . . . . . . . . . . . . . . . . . . . . . . . . . 146
4.2.2 Conséquences de la symétrie SU(3) . . . . . . . . . . . . . . . . . . . . . 148
4.2.3 Brisures électromagnétiques de la symétrie SU(3) . . . . . . . . . . . . . 150
4.2.4 Écarts de masses “forts”. Formule de masse de Gell-Mann–Okubo . . . . 152
4.2.5 Les quarks . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153
4.2.6 Courants hadroniques et interactions faibles . . . . . . . . . . . . . . . . 154
4.3 De SU(3) à SU(4) et aux six saveurs . . . . . . . . . . . . . . . . . . . . . . . . 155
4.3.1 Nouvelles saveurs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155
4.3.2 Introduction de la couleur . . . . . . . . . . . . . . . . . . . . . . . . . . 156

5 Théories de jauge. Modèle standard 163

5.1 Invariance de jauge. Couplage minimal. Lagrangien de Yang–Mills . . . . . . . . 163
5.1.1 Invariance de jauge de l’électrodynamique . . . . . . . . . . . . . . . . . 163
vi TABLE DES MATIÈRES

5.1.2 Extension non abélienne de Yang–Mills . . . . . . . . . . . . . . . . . . . 164

5.1.3 Géométrie des champs de jauge . . . . . . . . . . . . . . . . . . . . . . . 167
5.1.4 Lagrangien de Yang–Mills . . . . . . . . . . . . . . . . . . . . . . . . . . 168
5.1.5 Quantification. Règles de Feynman. . . . . . . . . . . . . . . . . . . . . . 169
5.2 Champs de jauge massifs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 170
5.2.1 Interactions faibles et bosons intermédiaires . . . . . . . . . . . . . . . . 170
5.2.2 Théorie de jauge à symétrie brisée spontanément. Mécanisme de Brout–
Englert–Higgs . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171
5.3 Le modèle standard . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 172
5.3.1 Le secteur fort . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 172
5.3.2 Le secteur électro-faible, une esquisse. . . . . . . . . . . . . . . . . . . . . 174
5.4 Compléments . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 177
5.4.1 Modèle standard et au delà. . . . . . . . . . . . . . . . . . . . . . . . . . 177
5.4.2 Théories grand-unifiées ou GUTs . . . . . . . . . . . . . . . . . . . . . . 178
5.4.3 Anomalies . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 179
Chapitre 0

Quelques éléments de base sur les

groupes SO(3), SU(2) et SL(2,C)

0.1 Rotations de R3, les groupes SO(3) et SU(2)

0.1.1 Le groupe SO(3), groupe à trois paramètres

On considère l’espace euclidien à trois dimensions et le groupe des rotations. Ces rotations
laissent invariante la norme carrée du rayon vecteur OM2 = x21 + x22 + x23 = x2 + y 2 + z 2 1 et
préservent l’orientation. Elles sont représentées dans une base orthonormée par des matrices
3×3 orthogonales réelles, de déterminant 1 : elles forment le groupe “spécial orthogonal” SO(3).
Formule d’Olinde Rodrigues
Toute rotation de SO(3) est une rotation d’un angle ψ autour d’un axe de vecteur directeur
unitaire n, et les rotations associées à (n, ψ) et à (−n, −ψ) sont identiques. On notera Rn (ψ)
cette rotation. De façon très explicite, on écrit x = xk + x⊥ = (x.n)n + (x − (x.n)n) et
x0 = xk + cos ψ x⊥ + sin ψ n ∧ x⊥ , d’où la formule d’O. Rodrigues

x0 = Rn (ψ)x = cos ψ x + (1 − cos ψ)(x.n) n + sin ψ (n × x) . (0.1)

Comme un vecteur unitaire n dans R3 dépend de deux paramètres, par exemple l’angle θ qu’il
fait avec l’axe Oz et l’angle φ que fait sa projection dans le plan Ox, Oy avec l’axe Ox (voir
Fig. 1) un élément de SO(3) est paramétrisé par 3 variables continues. On prendra ainsi

0 ≤ θ ≤ π, 0 ≤ φ < 2π, 0≤ψ≤π . (0.2)

Mais il demeure une petite redondance d’apparence anodine, Rn (π) = R−n (π), à suivre . . .

1. Dans tout ce chapitre, nous utilisons alternativement les notations (x, y, z) ou (x1 , x2 , x3 ) pour désigner
les coordonnées dans un repère orthonormé.

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

2 Chap.0. Quelques éléments de base sur les groupes SO(3), SU(2) et SL(2,C)

SO(3) est donc une variété de dimension 3. Pour la rotation d’axe n colinéaire à l’axe Oz,
on a la matrice  
cos ψ − sin ψ 0
Rz (ψ) =  sin ψ cos ψ 0 (0.3)
 

0 0 1
tandis qu’autour des axes Ox et Oy
   
1 0 0 cos ψ 0 sin ψ
Rx (ψ) = 0 cos ψ − sin ψ  Ry (ψ) =  0 1 0  . (0.4)
   

0 sin ψ cos ψ − sin ψ 0 cos ψ

Conjugaison de Rn (ψ) par une autre rotation

Une relation que nous allons abondamment utiliser est que

RRn (ψ)R−1 = Rn0 (ψ) (0.5)

où n0 est le transformé de n par la rotation R, n0 = Rn (la vérifier !). Inversement toute rotation
d’angle ψ autour d’un vecteur n0 peut se mettre sous la forme (0.5) : on dira plus tard que les
“classes de conjugaison” du groupe SO(3) sont caractérisées par l’angle ψ.
z
z

n Y=
=RZ( )u
Z=
=Ru( )z

y y

x x
v=R z( ) y
Fig. 1 Fig. 2

Angles d’Euler
Une autre description fait appel aux angles d’Euler : étant donné un repère orthonormé (Ox, Oy, Oz),
toute rotation autour de O qui envoie ce repère sur (OX, OY, OZ) peut être considérée comme
résultant de la composition d’une rotation d’angle α autour de Oz qui amène le repère sur
(Ou, Ov, Oz), suivie d’une rotation d’angle β autour de Ov l’amenant sur (Ou0 , Ov, OZ), et
enfin d’une rotation d’angle γ autour de OZ qui amène le repère sur (OX, OY, OZ), (voir Fig.
2). On prend donc 0 ≤ α < 2π, 0 ≤ β ≤ π, 0 ≤ γ < 2π et on écrit

R(α, β, γ) = RZ (γ)Rv (β)Rz (α) (0.6)

mais selon (0.5)

RZ (γ) = Rv (β)Rz (γ)Rv−1 (β) Rv (β) = Rz (α)Ry (β)Rz−1 (α)

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

0.1. Rotations de R3 , les groupes SO(3) et SU(2) 3

d’où en reportant dans (0.6)

R(α, β, γ) = Rz (α)Ry (β)Rz (γ) . (0.7)

où on a utilisé le fait que Rz (α)Rz (γ)Rz−1 (α) = Rz (γ) car les rotations autour d’un même axe
commutent (elles forment un sous-groupe abélien, isomorphe à SO(2)).
Exercice : En utilisant (0.5), écrire l’expression d’une matrice R qui amène le vecteur unitaire z porté par
Oz sur le vecteur unitaire n, en termes par exemple de Rz (φ) et de Ry (θ), puis l’expression de Rn (ψ) en termes
de Ry et Rz . Écrire l’expression explicite de cette matrice et de (0.7) et en déduire les relations entre θ, φ, ψ et
les angles d’Euler. (Voir aussi plus bas, équ. (0.66).)

0.1.2 Du groupe SO(3) au groupe SU(2)

Considérons une autre paramétrisation des rotations. À la rotation Rn (ψ), nous associons le
vecteur unitaire à quatre dimensions u : (u0 = cos ψ2 , u = n sin ψ2 ) ; on a u2 = u20 + u2 = 1,
et u appartient à la sphère unité S 3 dans l’espace R4 . Le changement de détermination de ψ
par un multiple impair de 2π change u en −u. Il y a donc bijection entre Rn (ψ) et la paire
(u, −u), c’est-à-dire entre SO(3) et S 3 /Z2 , la sphère dans laquelle on identifie les paires de
points opposés. On dira que la sphère S 3 est un “groupe de recouvrement” de SO(3). En quel
sens cette sphère est-elle un groupe ? Pour répondre à cette question, introduisons les matrices
de Pauli σi , i = 1, 2, 3
! ! !
0 1 0 −i 1 0
σ1 = σ2 = σ3 = . (0.8)
1 0 i 0 0 −1

Avec la matrice identité I, elles constituent une base de l’espace des matrices 2 × 2 hermitiques.
Elles satisfont l’identité
σi σj = δij I + iijk σk , (0.9)

avec ijk le tenseur complètement antisymétrique, 123 = +1, ijk = signature de la permutation
(ijk).
Pour u un vecteur unitaire réel à quatre dimensions (c’est-à-dire un point de S 3 ), formons
la matrice
U = u0 I − iu.σ
σ (0.10)

qui est unitaire et de déterminant 1 (le vérifier et montrer aussi la réciproque : toute matrice
unitaire unimodulaire (= de déterminant 1) 2 × 2 est de la forme (0.10), avec u2 = 1). Ces
matrices forment le groupe SU(2) qui est donc isomorphe à S 3 . En développant l’exponentielle
en puissances et en utilisant que (n.σ σ )2 = I, conséquence de (0.9), on peut vérifier (Exercice !)
que
ψ ψ ψ
e−i 2 n.σσ = cos − i sin n.σ σ. (0.11)
2 2
Il est suggéré que la multiplication des matrices
ψ ψ ψ
Un (ψ) = e−i 2 n.σσ = cos − i sin n.σ
σ, 0 ≤ ψ ≤ 2π, n ∈ S2 (0.12)
2 2

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

4 Chap.0. Quelques éléments de base sur les groupes SO(3), SU(2) et SL(2,C)

fournit la loi de groupe cherchée dans S 3 . Montrons qu’en effet à une matrice de SU(2) on
peut associer une rotation de SO(3) et qu’au produit de deux matrices de SU(2) correspond le
produit des rotations de SO(3). Au point x de R3 de coordonnées x1 , x2 , x3 , associons la matrice
hermitique
!
x3 x1 − ix2
X = x.σσ= , (0.13)
x1 + ix2 −x3

avec inversement xi = 21 tr (Xσi ), et agissons sur cette matrice selon

X 7→ X 0 = U XU † , (0.14)

ce qui définit une transformation linéaire x 7→ x0 = T x. On calcule aisément que

det X = −(x21 + x22 + x23 ) (0.15)

et comme det X = det X 0 , la transformation linéaire x 7→ x0 = T x est une isométrie, donc

det T = 1 ou −1. Pour se convaincre qu’il s’agit bien d’une rotation, c’est-à-dire que la trans-
formation a un déterminant 1, il suffit de calculer ce déterminant pour U = I où T = l’identité
donc det T = 1, puis d’utiliser la connexité de la variété SU (2)(∼= S 3 ) pour conclure que la
fonction continue det T (U ) ne peut sauter à la valeur −1. En fait, en utilisant l’identité (0.9),
le calcul explicite de X 0 conduit après un peu d’algèbre à

ψ ψ ψ ψ
X 0 = (cos − in.σ
σ sin )X(cos + in.σ σ sin )
2 2 2 2
= cos ψ x + (1 − cos ψ)(x.n) n + sin ψ (n ∧ x) .σ
σ (0.16)

sur lequel on reconnaı̂t la formule (0.1). On en conclut que la transformation x → x0 ef-

fectuée par les matrices de SU(2) dans (0.14) est bien la rotation d’angle ψ autour de n. Au
produit Un0 (ψ 0 )Un (ψ) dans SU(2) correspond dans SO(3) la composition des deux rotations
Rn0 (ψ 0 )Rn (ψ) de SO(3). Il y a donc un “homomorphisme” du groupe SU(2) dans SO(3). Cet
homomorphisme envoie les deux matrices U et −U sur la même rotation.
Résumons les acquis de ce paragraphe. Nous avons montré que le groupe SU(2) est un groupe
de recouvrement (d’ordre 2) du groupe SO(3) (le sens topologique précis en sera donné par la
suite), et que l’homomorphisme de SU(2) dans SO(3) est fourni par!les équations (0.12)-(0.14).
a −b
Exercice : vérifier que toute matrice de SU(2) peut s’écrire avec |a|2 + |b|2 = 1. Quelle
b∗ a∗
est la relation avec (0.10) ?

0.2 Générateurs infinitésimaux. L’algèbre de Lie su(2)

[La discussion qui suit va illustrer dans le cas présent le fait que les algèbres de Lie d’un groupe et de son
recouvrement universel sont isomorphes. ]

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

0.2. Générateurs infinitésimaux. L’algèbre de Lie su(2) 5

0.2.1 Générateurs infinitésimaux de SO(3)

Les rotations Rn (ψ) autour d’un axe n donné forment un sous-groupe à un paramètre isomorphe
à SO(2). Dans ce chapitre, nous suivons l’usage des physiciens en écrivant les générateurs
infinitésimaux des rotations comme des opérateurs hermitiens J = J † . Ainsi on écrit

Rn (dψ) = (I − idψJn ) (0.17)

où Jn , le “générateur” de ces rotations d’axe n, est une matrice hermitique 3 × 3. Montrons
d’abord que l’on peut reconstruire les rotations finies à partir de ces générateurs infinitésimaux.
Par la propriété de groupe,

Rn (ψ + dψ) = Rn (dψ)Rn (ψ) = (I − idψJn )Rn (ψ) , (0.18)

ou encore
∂Rn (ψ)
= −iJn Rn (ψ) (0.19)
∂ψ
qui, compte tenu de Rn (0) = I, s’intègre en

Rn (ψ) = e−iψJn . (0.20)

Pour être plus explicites, introduisons les trois matrices de base J1 , J2 et J3 décrivant les
rotations infinitésimales autour des axes correspondants 2 . De la version infinitésimale de (0.3)
on tire      
0 0 0 0 0 i 0 −i 0
J1 = 0 0 −i J2 =  0 0 0 J3 =  i 0 0 (0.21)
     

0 i 0 −i 0 0 0 0 0
ce que l’on peut exprimer par une formule unique

(Jk )ij = −iijk (0.22)

à l’aide du tenseur complètement antisymétrique ijk .

Montrons que les trois matrices (0.21) forment une base des générateurs infinitésimaux et
que Jn s’exprime simplement comme
X
Jn = Jk nk (0.23)
k

ce qui permet d’écrire (0.20) sous la forme

P
Rn (ψ) = e−iψ k n k Jk
. (0.24)

L’expression (0.23) découle simplement de la version infinitésimale de la formule d’O. Rodrigues,

Rn (dψ) = (I + dψ n∧) donc −iJn = n∧ ou si on préfère −i(Jn )ij = ikj nk = nk (−iJk )ij , cqfd.
P
(Ici et dans la suite, convention de sommation sur les indices répétés : ikj nk ≡ k ikj nk , etc.)

2. Ne pas confondre Jn indexé par le vecteur n, avec Jk , k ième composante de J. La relation entre les deux
va être donnée plus bas.

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

6 Chap.0. Quelques éléments de base sur les groupes SO(3), SU(2) et SL(2,C)

Un commentaire sur (0.24) : on n’a évidemment pas le droit d’écrire en général Rn (ψ) =
−iψ
P ? Q3 −iψnk Jk
e k nk Jk =
k=1 e . Par ailleurs on voit que par la formule (0.7), on peut écrire toute
rotation de SO(3) sous la forme

R(α, β, γ) = e−iαJ3 e−iβJ2 e−iγJ3 . (0.25)

Les trois matrices Ji , i = 1, 2, 3 satisfont les très importantes relations de commutation

[Ji , Jj ] = iijk Jk (0.26)

qui découlent de l’identité suivante (Jacobi) vérifiée par le tenseur

iab bjc + icb baj + ijb bca = 0 . (0.27)

Exercice : bien comprendre la structure de cette identité et vérifier qu’elle implique (0.26).
Au vu de l’importance des relations (0.23–0.26), il est utile de les retrouver par une autre route. Notons
d’abord que l’équation (0.5) implique que pour tout R
−1
Re−iψJn R−1 = e−iψRJn R = e−iψJn0 (0.28)

avec n0 = Rn, donc

RJn R−1 = Jn0 . (0.29)
Le tenseur ijk est invariant par l’action des rotations

lmn Ril Rjm Rkn = ijk det R = ijk (0.30)

puisque la matrice R est de déterminant 1. Cette matrice étant aussi orthogonale, on peut faire passer un R au
membre de droite
lmn Rjm Rkn = ijk Ril (0.31)
ce qui au vu de (0.22) exprime que
Rjm (Jl )mn R−1
nk = (Ji )jk Ril (0.32)
c’est-à-dire, pour tout R et sa matrice R,
RJl R−1 = Ji Ril . (0.33)
[ce qui exprime que l’opérateur Jl se transforme comme un vecteur. . .] Soit R une rotation qui amène le vecteur
unitaire z porté par Oz sur le vecteur n, on a donc nk = Rk3 et
(0.29) (0.33)
Jn = RJ3 R−1 = Jk Rk3 = Jk nk , (0.34)

qui n’est autre que (0.23). Noter que les équations (0.33) et (0.34) sont bien compatibles avec (0.29)
(0.29) (0.34) (0.33)
Jn0 = RJn R−1 = RJk nk R−1 = Jl Rlk nk = Jl n0l .

[La forme (0.20) nous permet aussi de prouver l’assertion faite plus haut que le groupe SO(3) est engendré
N
ψ
par un voisinage de l’identité. En effet on peut écrire tout R comme R = exp −i N Jn , c’est-à-dire comme
produit d’éléments arbitrairement proches de l’identité pour N assez grand. ]
Comme on le verra de façon plus systématique par la suite, la relation (0.26) de commutation des générateurs
infinitésimaux J code une version infinitésimale de la loi de groupe. Considérons par exemple une rotation d’angle
infinitésimal dψ autour de Oy agissant sur J1
(0.33)
R2 (dψ)J1 R2−1 (dψ) = Jk [R2 (dψ)]k1 (0.35)

mais au premier ordre, R2 (dψ) = I − idψJ2 , donc le membre de gauche de (0.35) est égal à J1 − idψ[J2 , J1 ] et
au membre de droite, [R2 (dψ)]k1 = δk1 − idψ(J2 )k1 = δk1 − dψδk3 d’après (0.22), d’où i[J1 , J2 ] = −J3 , qui est
l’une des relations (0.26).

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

0.2. Générateurs infinitésimaux. L’algèbre de Lie su(2) 7

0.2.2 Générateurs infinitésimaux de SU(2)

Examinons maintenant les choses du point de vue de SU(2). Toute matrice unitaire U (ici 2×2)
peut se diagonaliser dans une base orthonormée U = V exp{i diag (λk )}V † , V unitaire , et donc
s’écrire
∞
X (iH)n
U = exp iH = (0.36)
0
n!

avec H hermitique, H = V diag (λk ) V † . La somme converge (pour la norme ||M ||2 = tr M M † ).
La condition d’unimodularité 1 = det U = exp itr H est garantie si tr H = 0. L’ensemble de ces
matrices hermitiques de trace nulle forme un espace vectoriel V de dimension 3 sur R. Or les
matrices hermitiques 2 × 2 de trace nulle sont des combinaisons linéaires à coefficients réels des
3 matrices de Pauli
3
X σk
H= ηk , (0.37)
k=1
2

ce que l’on peut reporter dans (0.36). On a en fait déjà observé plus haut que toute matrice
unitaire 2 × 2 peut s’écrire sous la forme (0.11). En comparant cette forme avec celle obtenue en
(0.24), ou encore en comparant sa version infinitésimale Un (dψ) = (I−i dψn. σ2 ) avec (0.17-0.34),
on voit que les matrices 12 σj jouent ici dans SU(2) le rôle joué par les générateurs infinitésimaux
Jj dans SO(3). Or ces matrices 12 σ. vérifient les relations de commutation
hσ σ i σk
i j
, = iijk . (0.38)
2 2 2

avec les mêmes constantes de structure ijk que dans (0.26). Autrement dit, nous venons de
découvrir que les générateurs infinitésimaux Ji (éq. (0.21) de SO(3) et 21 σi de SU(2) satisfont
aux mêmes relations de commutation (on dira plus tard qu’ils forment deux représentations
de la même algèbre de Lie su(2) = so(3)). Cela implique que des calculs menés avec les 21 ~σ et
faisant appel uniquement aux règles de commutation des générateurs demeurent valables avec
~ et vice versa. Ainsi, des relations (0.33), par exemple R2 (β)Jk R2−1 (β) = Jl Ry (β)lk , il
les J,
découle sans aucun calcul supplémentaire que pour les matrices de Pauli, on a

β β
e−i 2 σ2 σk ei 2 σ2 = D2 (β)σk D2−1 (β) = σl Ry (β)lk (0.39)

σk
avec Dk (ψ) := e−iψ 2 , où on lit les éléments de matrice Ry en (0.4). On a en effet l’identité
générale eA Be−A = B + ∞ 1
P
n=1 n! [A[A, [· · · , [A, B] · · · ]]], cf Chap. 1, (1.27), et ce calcul ne fait
| {z }
n commutateurs
donc appel qu’à des commutateurs. En revanche, la relation

σi σj = δij + iijk σk

(qui ne fait pas appel qu’aux commutateurs) est spécifique à la représentation de dimension 2
de l’algèbre su(2).

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

8 Chap.0. Quelques éléments de base sur les groupes SO(3), SU(2) et SL(2,C)

0.2.3 Algèbre de Lie su(2)

Récapitulons : nous venons d’introduire l’algèbre de commutation des générateurs infinitésimaux
(ou algèbre de Lie) du groupe SU(2) (ou SO(3)), notée su(2) ou so(3). Elle est définie par les
relations (0.26), que nous récrivons ici

[Ji , Jj ] = iijk Jk . (0.26)

On utilise aussi beaucoup les trois combinaisons

Jz ≡ J3 , J+ = J1 + iJ2 , J− = J1 − iJ2 . (0.40)

Il est alors immédiat de calculer

[J3 , J+ ] = J+
[J3 , J− ] = −J− (0.41)
[J+ , J− ] = 2J3 .

On vérifie aussi que l’opérateur de Casimir défini par

J2 = J12 + J22 + J32 = J32 + J3 + J− J+ (0.42)

commute avec tous les J

[J2 , J. ] = 0 , (0.43)
ce qui signifie qu’il est invariant par rotation.
Anticipant un peu sur la suite, nous nous intéresserons le plus souvent aux “représentations
unitaires”, où les générateurs Ji , i = 1, 2, 3 sont hermitiques, donc

Ji† = Ji , i = 1, 2, 3 J±† = J∓ . (0.44)

[Montrons en outre que dans les représentations de SO(3), les représentations unitaire de SO(3) sont unimo-
dulaires ( = de déterminant 1), et donc que ces générateurs sont a priori de trace nulle. Cela découle de la
simplicité du groupe SO(3). Soit D une représentation unitaires, det D est donc une représentation de dimen-
sion 1 du groupe, homomorphisme du groupe dans le groupe U(1) puisque | det D| = 1. Son noyau est un
sous-groupe invariant, donc trivial ; ce ne peut être la seule identité, car tout “commutateur” R1 R2 R1−1 R2−1
y appartient. C’est donc le groupe tout entier, ce qui établit l’unimodularité. Pour le groupe SU(2), qui n’est
pas simple, le même argument ne peut être appliqué, mais la conclusion demeure, comme on le verra : toutes
les représentations unitaires de SU(2) sont unimodulaires. [Peut-on trouver un argument simple, a priori, à cet
effet ?] ]
Pour terminer, mentionnons l’interprétation des Ji comme opérateurs différentiels agissant sur les fonctions
différentiables des coordonnées de l’espace R3 . Dans l’espace R3 , l’effet d’une rotation infinitésimale sur le
vecteur x est de le changer en
x0 = x + δψn ∧ x
donc une fonction scalaire de x, f (x), est changée en f 0 (x0 ) = f (x) soit

f 0 (x) = f R−1 x = f (x − δψn ∧ x)

= (1 − δψn.x ∧ ∇) f (x) (0.45)

= (1 − iδψn.J)f (x) .

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

0.3. Représentations de SU(2) 9

On identifie donc
∂
J = −ix ∧ ∇, Ji = −iijk xj (0.46)
∂xk
ce qui permet de le calculer dans des coordonnées quelconques, par exemple sphériques (Appendice 0 de
ce chapitre). (Comparer aussi (0.46) avec l’expression du moment angulaire en Mécanique Quantique Li =
~ ∂
i ijk xj ∂xk ). Exercice : vérifier que ces opérateurs différentiels ont bien les relations de commutation (0.26).
Parmi les combinaisons de J que l’on peut construire, l’une doit jouer un rôle particulier, le laplacien sur
la sphère S 2 , opérateur différentiel du second ordre invariant par changement de coordonnées (cf Appendice 0).
Il doit en particulier être invariant par rotation, être de degré 2 dans les J. , ce ne peut être que l’opérateur de
Casimir J2 (à un facteur près). De fait le laplacien dans R3 s’écrit en coordonnées sphériques

1 ∂2 J2
∆3 = r −
r ∂r2 r2
1 ∂2 ∆sphère S 2
= r+ . (0.47)
r ∂r2 r2
Nous nous sommes restreints ici pour plus de simplicité au cas de fonctions scalaires, mais on pourrait aussi
s’intéresser plus généralement à la transformation d’une collection de fonctions des coordonnées de R3 “formant
une représentation” de SO(3), c’est-à-dire se transformant linéairement entre elles sous l’action de ce groupe

A0 (x0 ) = D(R)A(x)

soit encore
A0 (x) = D(R)A R−1 x ,

par exemple un champ vectoriel se transformant par

A0 (x) = RA(R−1 x) .

Le produit scalaire de deux tels champs vectoriels est une fonction scalaire. Que devient la discussion qui précède
sur les générateurs infinitésimaux pour de tels objets ? Montrer qu’ils sont sommes de deux contributions, l’une
donnée par (0.46) et l’autre venant de la forme infinitésimale de R ; en termes physiques, ces deux contributions
correspondent aux moments angulaires orbital et intrinsèque (ou de spin).

0.3 Représentations de SU(2)

0.3.1 Représentations des groupes SO(3) et SU(2)
En géométrie de l’espace R3 , les notions de vecteur ou de tenseur sont familières. Il s’agit
d’objets se transformant de façon linéaire sous l’effet des rotations

Vi 7→ Rii0 Vi0 (V ⊗ W )ij = Vi Wj 7→ Rii0 Rjj 0 (V ⊗ W )i0 j 0 = Rii0 Rjj 0 Vi0 Wj 0 etc.

D’une façon générale, on appelle représentation d’un groupe G dans un espace vectoriel E un
homomorphisme de G dans le groupe des transformations linéaires GL(E) (cf. Chap. 2). Ainsi,
comme on vient de le voir, le groupe SO(3) admet une représentation dans l’espace R3 (les
vecteurs V de l’exemple ci-dessus), une représentation dans l’espace des tenseurs de rang deux,
etc. Nous allons maintenant nous intéresser à la construction des représentations générales de
SO(3) et SU(2). Pour les besoins de la physique, en particulier de la mécanique quantique,
on a surtout besoin de représentations unitaires, dans lesquelles les matrices de représentation
sont unitaires. En fait, comme on le verra, il suffit d’étudier les représentations de SU(2) pour

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

10 Chap.0. Quelques éléments de base sur les groupes SO(3), SU(2) et SL(2,C)

avoir aussi celles de SO(3), et mieux encore, il suffira d’étudier la façon dont sont représentés
les éléments du groupe au voisinage de l’identité, c’est-à-dire d’étudier les représentations des
générateurs infinitésimaux de SU(2) (et SO(3)) (qui respectent les relations de commutation
(0.26)).
[Rappelons le résultat de la discussion du chapitre 4. Toute représentation (différentiable et unitaire ) D du
groupe SU(2) dans un espace E fournit une représentation de son algèbre de Lie su(2), et vice versa puisque
SU(2) est simplement connexe. ]
Il suffit donc pour trouver les représentations unitaires du groupe SU(2) de trouver les
représentations par des matrices hermitiques de son algèbre de Lie su(2).

0.3.2 Représentations de l’algèbre su(2)

Procédons à la construction classique des représentations de l’algèbre su(2). Comme précédem-
ment, J± et Jz désignent les représentants des générateurs infinitésimaux dans une certaine
représentation. Ils satisfont aux relations de commutation (0.41) et d’hermicité (0.44). La com-
mutation des opérateurs Jz et J2 garantit que l’on peut en chercher des vecteurs propres com-
muns. Les valeurs propres de ces opérateurs hermitiques étant réelles et J2 étant semi-défini
positif, on peut toujours écrire ses valeurs propres sous la forme j(j + 1), j réel positif ou nul
et on considère donc un vecteur propre commun |j m i

J2 |j m i = j(j + 1)|j m i
Jz |j m i = m|j m i . (0.48)

avec m un réel a priori arbitraire. Par abus de langage, on dira que |jm i est un “vecteur propre
de valeurs propres (j, m)”.
(i) Agissons avec J+ et J− = J+† sur |j m i. Utilisant la relation J± J∓ = J2 −Jz2 ±Jz (conséquence
de (0.41)), on calcule la norme carrée de J± |j m i :

h j m|J− J+ |j m i = (j(j + 1) − m(m + 1)) h j m|j m i

Ces normes carrées ne peuvent être négatives donc

(j − m)(j + m + 1) ≥ 0 : −j − 1 ≤ m ≤ j
(j + m)(j − m + 1) ≥ 0 : −j ≤ m ≤ j + 1 (0.50)

qui impliquent
−j ≤m≤j . (0.51)
De plus J+ |j m i = 0 si et seulement si m = j et J− |j m i = 0 si et seulement si m = −j

J+ |j j i = 0 J− |j − j i = 0 . (0.52)

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

0.3. Représentations de SU(2) 11

(ii) Si m 6= j, J+ |j m i est non nul, vecteur propre de valeurs propres (j, m + 1). En effet

De même si m 6= −j, J− |j m i est un vecteur propre (non nul) de valeurs propres (j, m − 1).
(iii) Considérons la suite des vecteurs

|j m i, J− |j m i, J−2 |j m i, · · · , J−p |j m i · · ·

S’ils sont non nuls ils constituent des vecteurs propres de Jz de valeurs propres m, m − 1, m − 2,
· · · , m − p · · · Les valeurs propres autorisées de Jz étant bornées par (0.51), cette suite doit
s’arrêter au bout d’un nombre fini d’étapes. Soit p l’entier tel que J−p |j m i =
6 0, J−p+1 |j m i = 0.
En vertu de (0.52), J−p |j m i est un vecteur propre de valeurs propres (j, −j) donc m − p = −j
c’est-à-dire
(j + m) est un entier non négatif . (0.54)
Opérant de même avec J+ , J+2 , · · · sur |j m i, on est mené à la conclusion que

(j − m) est un entier non négatif . (0.55)

et par conséquent j et m sont simultanément entiers ou demi-entiers. Pour chaque valeur de j

1 3
j = 0, , 1, , 2, · · ·
2 2
m peut prendre les 2j + 1 valeurs 3

m = −j, −j + 1, · · · , j − 1, j . (0.56)

Partant du vecteur |j m = j i, (“vecteur de plus haut poids”), choisi de norme 1, on construit

Ces 2j + 1 vecteurs forment la base de la “représentation de spin j” de l’algèbre su(2).

En fait, cette représentation de l’algèbre su(2) s’étend en une représentation du groupe
SU(2), comme on va le voir maintenant.
La discussion précédente a fait jouer un rôle central à l’unitarité de la représentation et donc à l’hermiticité
des générateurs infinitésimaux, donc à la positivité : ||J± |j m i||2 ≥ 0 =⇒ −j ≤ m ≤ j, etc, et a permis de
conclure que la représentation est nécessairement de dimension finie. Inversement on peut insister sur cette
dernière condition, et montrer qu’elle suffit à assurer les conditions précédentes. Partant d’un vecteur propre
p
|ψ i de Jz , la suite J+ |ψ i produit des vecteurs propres de Jz de valeur propre croissante, donc linéairement

3. En fait, on vient de trouver une condition nécessaire sur les j, m. Le fait que tous ces j donnent effective-
ment des représentations va être vérifié au paragraphe suivant.

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

12 Chap.0. Quelques éléments de base sur les groupes SO(3), SU(2) et SL(2,C)

indépendants s’ils sont non nuls. Si par hypothèse la représentation est de dimension finie, cette suite est finie,
et il existe un vecteur noté |j i tel que J+ |j i = 0, Jz |j i = j|j i. Par la relation J2 = J− J+ + Jz (Jz + 1), c’est
aussi un vecteur propre de valeur propre j(j + 1) de J2 . Il s’identifie donc avec le vecteur de plus haut poids
noté précédemment |j j i, notation que nous adoptons donc dans la suite de cette discussion. A partir de ce
p
vecteur, les J− |j j i forment une suite qui doit elle aussi être finie
q−1 q
∃q J− |j j i =
6 0 J− |j j i = 0 . (0.58)

On démontre aisément par récurrence que

q q q−1
J+ J− |j j i = [J+ , J− ]|j j i = q(2j + 1 − q)J− |j j i = 0 (0.59)

donc q = 2j + 1. Le nombre j est donc entier ou demi-entier, les vecteurs de la représentation ainsi construite
sont vecteurs propres de J2 de valeur propre j(j + 1) et de Jz de valeur propre m satisfaisant (0.56). On a
bien retrouvé tous les résultats précédents. Sous cette forme, la construction de ces “représentations de plus
haut poids” se généralise à d’autres algèbres de Lie, (même de dimension infinie, telle l’algèbre de Virasoso, voir
Chap. 1, § 1.3.6).
Les matrices Dj de la représentation de spin j sont telles que sous l’action de la rotation
U ∈ SU (2)
j
|j m i 7→ Dj (U )|j m i = |j m0 iDm 0 m (U ) . (0.60)
j j
Selon la paramétrisation ((n, ψ), angles d’Euler, . . .), on écrira aussi Dm 0 m (n, ψ), Dm0 m (α, β, γ),

etc. Par (0.7), on a donc

j
Dm 0 m (α, β, γ) = h j m0 |D(α, β, γ)|j m i
= h j m0 |e−iαJz e−iβJy e−iγJz |j m i (0.61)
−iαm0
= e djm0 m (β)e−iγm

où la matrice dj est définie par

djm0 m (β) = h j m0 |e−iβJy |j m i . (0.62)

Une formule explicite pour dj sera donnée au paragraphe suivant. On a encore

j
Dm 0 m (z, ψ) = e−iψm δmm0
j
Dm 0 m (y, ψ) = djm0 m (ψ) . (0.63)

Les matrices Dj et dj sont appelées matrices de Wigner.

Exercice : Calculer Dj (x, ψ). (On pourra utiliser (0.5).)
On note que Dj (z, 2π) = (−1)2j I, puisque (−1)2m = (−1)2j , compte tenu de (0.55), et la
propriété est vraie pour tout axe n par conjugaison (0.5)

Dj (n, 2π) = (−1)2j I . (0.64)

Cela montre qu’une rotation de 2π dans SO(3) est représentée par −I dans une représentation
de spin demi-entier de SU(2). Les représentations de spin demi-entier de SU(2) sont des repré-
sentations “projectives”, (c’est-à-dire ici à un signe près), de SO(3) ; on reviendra au chapitre
2 sur la notion de représentation projective.

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

0.3. Représentations de SU(2) 13

On vérifie aussi l’unimodularité des matrices Dj (ou de façon équivalente, le fait que les
représentants des générateurs infinitésimaux sont de trace nulle). Si n = Rz, D(n, ψ) =
D(R)D(z, ψ)D−1 (R), donc

j
Y
−iψJz
det D(n, ψ) = det D(z, ψ) = det e = e−imψ = 1 . (0.65)
m=−j
1
Il peut être utile d’écrire explicitement ces matrices dans les cas j = 2
et j = 1. Le cas de
j = 21 est très simple, puisque
!
1
−i 12 ψn.σ
σ cos ψ2 − i cos θ sin ψ2 −i sin ψ2 sin θ e−iφ
D (U ) = U = e
2 =
−i sin ψ2 sin θ eiφ cos ψ2 + i cos θ sin ψ2
!
β − 2i (α+γ) β − 2i (α−γ)
α β γ cos e − sin e
= e−i 2 σ3 e−i 2 σ2 e−i 2 σ3 = 2
i
2
i (0.66)
sin β2 e 2 (α−γ) cos β2 e 2 (α+γ)
résultat attendu puisque les matrices U du groupe en forment bien évidemment une représenta-
tion. (Au passage, on a obtenu des relations entre les deux paramétrisations, (n, ψ) = (θ, φ, ψ)
et les angles d’Euler (α, β, γ).) Pour j = 1, dans la base |1, 1 i, |1, 0 i et |1, −1 i où Jz est
diagonale (qui n’est pas la base (0.21) !)
     
1 0 0 0 1 0 0 0 0
√  √ 
Jz = 0 0 0  J+ = 2 0 0 1 J− = 2 1 0 0 (0.67)
   

0 0 −1 0 0 0 0 1 0
d’où  1+cos β
− sin
√β 1−cos β

2 2 2
d1 (β) = e−iβJy =
 sin β
√ cos β − sin
√β  (0.68)

 2 2
1−cos β sin
√β 1+cos β
2 2 2

comme le lecteur le vérifiera.

Dans le paragraphe qui suit on écrit plus explicitement ces matrices de représentation du
groupe SU(2), et dans l’Appendice E du Chap. 2, on détaillera les équations différentielles
qu’elles satisfont et leurs relations avec les “fonctions spéciales”, polynômes orthogonaux et
harmoniques sphériques. . .
Irréductibilité
Une notion centrale dans l’étude des représentations est celle d’irréductibilité. Une représenta-
tion est irréductible si elle n’admet aucun sous-espace invariant. Montrons que la représenta-
tion de spin j de SU(2) que nous venons de construire est irréductible. On montrera plus bas
au Chap. 2 que la représentation étant unitaire, elle est soit irréductible soit “complètement
réductible” (il existe un sous-espace invariant et son espace supplémentaire l’est aussi) ; dans
ce dernier cas, il existerait nécessairement des opérateurs diagonaux par blocs, différents de
l’identité et commutant avec les matrices de la représentation, en particulier avec les générateurs
Ji . Or dans la base (0.5) toute matrice M commutant avec Jz est diagonale, Mmm0 = µm δmm0 ,
(le vérifier !), et la commutation avec J+ force tous les µm à être égaux : la matrice M est
multiple de l’identité et la représentation est bien irréductible.

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

14 Chap.0. Quelques éléments de base sur les groupes SO(3), SU(2) et SL(2,C)

On peut aussi se demander pourquoi l’étude des représentations de dimension finie que vous
venons de construire suffit aux besoins du physicien, par exemple en mécanique quantique, où
la scène se passe en général dans un espace de Hilbert de dimension infinie. On démontrera
plus bas (Chap. 2) que
Toute représentation de SU(2) ou SO(3) dans un espace de Hilbert est équivalente à une re-
présentation unitaire, et est complètement réductible en une somme (finie ou infinie) de repré-
sentations irréductibles de dimension finie. [Pour prendre un exemple physique, l’analyse d’un système
quantique sous l’effet des rotations peut s’effectuer en termes de ses composantes de spin donné ; un spin j peut
apparaı̂tre avec une certaine multiplicité. ]

0.3.3 Construction explicite

!
a b
Soient ξ et η deux variables complexes sur lesquelles les matrices U = de SU(2) agissent
c d
selon ξ 0 = aξ + cη, η 0 = bξ + dη. En d’autres termes, ξ et η sont les vecteurs de base! de la
a b
représentation de dimension 2 (représentation de spin 12 ) de SU(2). [(ξ 0 η0 ) = (ξ η) ] Une
c d
construction explicite des représentations précédentes est obtenue en considérant les polynômes
homogènes de degré 2j dans les deux variables ξ et η, dont une base est donnée par les 2j + 1
polynômes
ξ j+m η j−m
Pjm = p m = −j, · · · j . (0.69)
(j + m)!(j − m)!
(En fait, les considérations qui suivent demeurent valables si U est une matrice quelconque du
groupe GL(2,C) et en fournissent une représentation.) Sous l’action de U sur ξ et η, les Pjm (ξ, η)
se transforment en Pjm (ξ 0 , η 0 ), eux aussi homogènes de degré 2j en ξ et η, qui se développent
donc sur les Pjm (ξ, η). Ces derniers portent donc une représentation de dimension 2j + 1 de
SU(2) (ou de GL(2,C)), qui n’est autre que la représentation de spin j précédente. Cela permet
d’écrire des formules très explicites pour les Dj .
X j
Pjm (ξ 0 , η 0 ) = Pjm0 (ξ, η)Dm 0 m (U ) . (0.70)
m0

On obtient

j 0 0
12 X an1 bn2 cn3 dn4
Dm 0 m (U ) = (j + m)!(j − m)!(j + m )!(j − m )! . (0.71)
n1 ,n2 ,n3 ,n4 ≥0
n1 !n2 !n3 !n4 !
n1 +n2 =j+m0 ; n3 +n4 =j−m0
n1 +n3 =j+m; n2 +n4 =j−m

Pour U = −I, on vérifie à nouveau que Dj (−I) = (−1)2j I. Dans le cas particulier de U =
σ2
e−iψ 2 = cos ψ2 I − i sin ψ2 σ2 , on a donc
2k+m+m 2j−2k−m−m 0 0
12 X (−1)k+j−m cos ψ2 sin ψ2
djm0 m (ψ) 0
= (j + m)!(j − m)!(j + m )!(j − m )! 0

k≥0
(m + m0 + k)!(j − m − k)!(j − m0 − k)!k!
(0.72)

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

0.4. Produit direct de représentations de SU(2) 15

où la somme court sur les k ∈ [inf(0, −m−m0 ), sup(j −m, j −m0 )]. L’expression des générateurs
infinitésimaux sur les polynômes Pjm s’obtient en considérant des U proches de l’identité. On
trouve
∂ ∂ 1 ∂ ∂
J+ = ξ J− = η Jz = ξ −η (0.73)
∂η ∂ξ 2 ∂ξ ∂η
dont il est facile de vérifier les relations de commutation ainsi que l’action sur les Pjm en accord
avec (0.57). Cela achève l’identification de (0.69) avec la représentation de spin j.
Remarques et exercices
1. Répéter la preuve de l’irréductibilité de la représentation de spin j dans cette nouvelle forme.
2. Noter que ce que les polynômes homogènes de degré 2j dans les variables ξ et η ont construit n’est autre
que la puissance tensorielle 2j symétrisée de la représentation de dimension 2. (Voir ci-dessous la définition de
ce concept.)  √ 
a2 2ab b2
√ √
3. Écrire la forme explicite de la matrice D1 de spin 1 en utilisant (0.71). (Rép.  2ac bc + ad 2bd )
 
√
c2 2cd d2

0.4 Produit direct de représentations de SU(2)

0.4.1 Produit direct de représentations et l’“addition de moments
angulaires”
Intéressons-nous au produit de deux représentations de spin j1 et j2 et à leur décomposition sur
des vecteurs de spin total donné (“décomposition en représentations irréductibles”). On part
donc de la représentation produit engendrée par les vecteurs

|j1 m1 i ⊗ |j2 m2 i ≡ |j1 m1 ; j2 m2 i abrégé en |m1 m2 i (0.74)

sur lesquels agissent les générateurs infinitésimaux sous la forme

J = J(1) ⊗ I(2) + I(1) ⊗ J(2) . (0.75)

L’indice supérieur indique sur quel espace agissent les opérateurs. Par abus de notation, on
écrit souvent au lieu de (0.75)
J = J(1) + J(2) (0.750 )

et (en Mécanique Quantique), on parle de l’“addition des moments angulaires” J (1) et J (2) .
Il s’agit donc de décomposer les vecteurs (0.74) sur une base de vecteurs propres de J et Jz .
Comme J(1)2 et J(2)2 commutent entre eux et avec J2 et Jz , on peut chercher des vecteurs
propres communs que l’on notera

|(j1 j2 ) J M i ou plus simplement |J M i (0.76)

étant entendu que l’on s’est fixé la valeur de j1 et j2 . La question est donc double : quelles valeurs
J et M peuvent-ils prendre et quelle est la matrice du changement de base |m1 m2 i → |J M i ?

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

16 Chap.0. Quelques éléments de base sur les groupes SO(3), SU(2) et SL(2,C)

En d’autres termes quelle est la décomposition (de Clebsch-Gordan) et quels sont les coefficients
de Clebsch-Gordan ?
(1) (2)
Les valeurs possibles de M , valeur propre de Jz = Jz + Jz sont aisées à trouver

h m1 m2 |Jz |J M i = (m1 + m2 )h m1 m2 |J M i
= M h m1 m2 |J M i (0.77)

et la seule valeur de M telle que h m1 m2 |J M i =

6 0 est donc

M = m1 + m2 . (0.78)

A j1 , j2 et M fixés, il y a autant de vecteurs indépendants ayant cette valeur de M qu’il y a de

couples (m1 , m2 ) satisfaisant (0.78), soit

0


 si |M | > j1 + j2
n(M ) = j1 + j2 + 1 − |M | si |j1 − j2 | ≤ |M | ≤ j1 + j2 (0.79)


2 inf(j1 , j2 ) + 1 si 0 ≤ |M | ≤ |j1 − j2 |


(voir Fig. 3 pour laquelle j1 = 5/2 et j2 = 1). Soit NJ le nombre de fois où la représentation
de spin J apparaı̂t dans la décomposition du produit des représentations de spin j1 et j2 . Les
n(M ) vecteurs de valeur propre M pour Jz peuvent aussi s’interpréter comme provenant des
NJ vecteurs |J M i pour les différentes valeurs de J compatibles avec cette valeur de M
X
n(M ) = NJ (0.80)
J≥|M |

soit en retranchant membre à membre deux telles relations

NJ = n(J) − n(J + 1) (0.81)

= 1 si et seulement si |j1 − j2 | ≤ J ≤ j1 + j2
= 0 sinon.
m2
n(M)

m
1 M
j j j1+ j +1
1 2 2
M=j + j
1 2
M=j j Fig. 3
1 2

En conclusion, nous venons de démontrer que les (2j1 + 1)(2j2 + 1) vecteurs (0.74) (à j1 et
j2 fixés) peuvent se réexprimer en fonction des vecteurs |J M i où

J = |j1 − j2 |, |j1 − j2 | + 1, · · · , j1 + j2
M = −J, −J + 1, · · · , J . (0.82)

Noter qu’en définitive les multiplicités NJ valent 0 ou 1 ; c’est une particularité de SU(2) que
des multiplicités supérieures à 1 n’apparaissent pas dans la décomposition du produit de deux
représentations “irréductibles”, c’est-à-dire ici de spin fixé.

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

0.4. Produit direct de représentations de SU(2) 17

0.4.2 Coefficients de Clebsch-Gordan, symboles 3-j et 6-j . . .

Leur valeur dépend en fait d’un choix de phase relative entre les vecteurs (0.74) et (0.76) ; la
convention habituelle est que pour chaque valeur de J, on choisit

h J M = J | j1 m1 = j1 ; j2 m2 = J − j1 i real . (0.85)

Les autres vecteurs sont alors définis sans ambiguı̈té par (0.57) et on va montrer que tous les C.G.
sont réels. Les C.G. satisfont des relations de récurrence conséquences de (0.57). Appliquant en
effet J± aux deux membres de (0.83), on obtient
p
J(J + 1) − M (M ± 1) h (j1 j2 ) J M |j1 m1 ; j2 m2 i (0.86)
p
= j (j + 1) − m1 (m1 ± 1)h (j1 j2 ) J M ± 1|j1 m1 ± 1; j2 m2 i
p 1 1
+ j2 (j2 + 1) − m2 (m2 ± 1)h (j1 j2 ) J M ± 1|j1 m1 ; j2 m2 ± 1 i

qui permet à l’aide de la normalisation m1 ,m2 |h j1 m1 ; j2 m2 |(j1 j2 ) J M i|2 = 1 et de la conven-

tion (0.85) de déterminer tous les C.G. Comme annoncé, ils sont clairement tous réels.
Les C.G. du groupe SU(2), qui décrivent un changement de base orthonormée, satisfont des
propriétés d’orthogonalité et de complétude
j1
X
h j1 m1 ; j2 m2 |(j1 j2 ) J M ih j1 m1 ; j2 m2 |(j1 j2 ) J 0 M 0 i = δJJ 0 δM M 0 si |j1 − j2 | ≤ J ≤ j1 + j2
m1 =−j1
(0.87)
j1 +j2
X
h j1 m1 ; j2 m2 |(j1 j2 ) J M ih j1 m01 ; j2 m02 |(j1 j2 ) J M i = δm1 m01 δm2 m02 si |m1 | ≤ j1 , |m2 | ≤ j2 .
J=|j1 −j2 |

Noter que dans la première ligne, m2 est fixé par la donnée de m1 , à M donné ; et que dans la
deuxième, M est fixé en termes de m1 et de m2 . Chaque relation n’implique donc qu’une seule
somme.
[Exercice. Montrer que l’intégrale
Z
dΩYlm
1
1
(θ, φ)Ylm
2
2
(θ, φ)Ylm
3
3
(θ, φ)

est proportionnelle au coefficient de Clebsch-Gordan (−1)m3 h l1 , m1 ; l2 , m2 |l3 , −m3 i, avec un coefficient indépendant
des m que l’on déterminera. ]
Plutôt que les coefficients de Clebsch-Gordan, on peut considèrer un ensemble de coefficients équivalents,
dits symboles 3-j. Ils sont définis par
!
j1 j2 J (−1)j1 −j2 +M
= √ h j1 m1 ; j2 m2 |(j1 j2 ) J M i (0.88)
m1 m2 −M 2J + 1

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

18 Chap.0. Quelques éléments de base sur les groupes SO(3), SU(2) et SL(2,C)

et ont l’intérêt de jouir de propriétés de symétrie simples :

!
j1 j2 j3
m1 m2 m3

est invariant par permutation circulaire des trois colonnes et change par le signe (−1)j1 +j2 +j3 quand deux
colonnes sont permutées ou quand on change les signes de m1 , m2 et m3 . Le lecteur trouvera dans la littérature
de nombreuses tables et formules explicites.

Contentons-nous de donner les valeurs pour les spins les plus bas

|( 21 , 12 )1, 1 i = | 21 , 12 ; 12 , 12 i
|( 21 , 12 )1, 0 i √1 | 21 , 21 ; 12 , − 12 i + | 21 , − 12 ; 12 , 12 i

1 1 = 2
⊗ : (0.89)
|( 21 , 12 )0, 0 i √1 | 21 , 21 ; 12 , − 21 i − | 12 , − 21 ; 21 , 12 i

2 2 = 2
|( 12 , 12 )1, −1 i = | 21 , − 12 ; 12 , − 12 i
et
|( 21 , 1) 32 , 32 i = | 21 , 12 ; 1, 1 i
√
|( 12 , 1) 32 , 12 i √1 2| 12 , 21 ; 1, 0 i + | 12 , − 12 ; 1, 1 i

= 3 √
|( 21 , 1) 23 , − 12 i = √1 | 21 , 12 ; 1, −1 i + 2| 12 , − 12 ; 1, 0 i

1 3
⊗1 : (0.90)
2 |( 12 , 1) 23 , − 32 i = | 21 , − 12 ; 1, −1 i
√
|( 12 , 1) 12 , 12 i = √1 −| 21 , 12 ; 1, 0 i + 2| 12 , − 12 ; 1, 1 i

3 √
|( 12 , 1) 21 , − 12 i = √1 − 2| 12 , 21 ; 1, −1 i + | 12 , − 21 ; 1, 0 i

3

On note sur le cas 12 ⊗ 12 la propriété que les vecteurs de spin total j = 1 sont symétriques
dans l’échange des deux spins, celui de spin 0 antisymétrique. La propriété est générale : dans
la composition de deux représentations de spin j1 = j2 , les vecteurs résultants de spin j =
2j1 , 2j1 − 2, · · · sont symétriques, ceux de spin 2j1 − 1, 2j1 − 3, · · · sont antisymétriques.
Cela est apparent sur l’expression (0.88) ci-dessus, compte tenu des propriétés annoncées des symboles 3-j.
Dans le même ordre d’idées, soit le produit complètement antisymétrique de 2j + 1 copies
d’une représentation de spin j. On peut montrer que cette représentation est de spin 0 (exer-
cice suivant). (Cela a une conséquence en physique atomique, dans le remplissage des couches
électroniques : une couche complète a un moment orbital total et un spin total nuls donc aussi
un moment angulaire total nul.)
Exercice. On considère le produit complètement antisymétrique de N = 2j + 1 représentations de spin j. Mon-
trer que cette représentation est engendrée par le vecteur m1 m2 ···mN |j m1 , j m2 , · · · , j mN i, qu’il est invariant
par l’action de SU(2) et donc que la représentation construite est celle de spin J = 0.

On introduit aussi les symboles 6-j qui décrivent les deux recombinaisons possibles de 3 représentations de
spins j1 , j2 et j3
j
2

j J1
1 j
J2 3

Fig. 4

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

0.5. Une application physique : l’isospin 19

selon que l’on compose d’abord j1 et j2 en J1 puis J1 et j3 en J ou d’abord j2 et j3 en J2 puis j1 et J2 en J 0 .

La matrice de changement de base est notée
( )
0 0
p j1 +j2 +j3 +J j1 j2 J1
h j1 (j2 j3 ); J M |(j1 j2 )j3 ; J M i = δJJ 0 δM M 0 (2J1 + 1)(2J2 + 1)(−1) . (0.92)
j3 J J2

et les { } sont les symboles 6-j. On visualise l’opération d’addition des trois spins par un tétraèdre (cf. Fig.
4) dont les arêtes portent j1 , j2 , j3 , J1 , J2 et J et le symbole est tel que deux spins portés par une paire d’arêtes
opposées se trouvent dans la même colonne. Ces symboles sont tabulés dans la littérature.

0.5 Une application physique : l’isospin

Le groupe SU(2) n’intervient pas en Physique qu’en tant que (relié au) groupe de rotation de l’es-
pace euclidien. Illustrons une autre de ses apparitions par la symétrie d’isospin. Il existe dans la
nature des particules élémentaires sujettes aux interactions fortes et de ce fait, appelées hadrons.
Certaines de ces particules présentent des propriétés voisines, mais diffèrent par leur charge
électrique. C’est le cas du proton et du neutron, de masses 938,28 MeV/c2 et 939,57 MeV/c2
respectivement, mais aussi du triplet de mésons pi, π 0 (masse 134,96 MeV/c2 ) et π ± (139,57
MeV/c2 ), des quatre mésons K etc. Selon Heisenberg cela est la manifestation d’une symétrie
brisée par les effets électromagnétiques. En l’absence d’interactions électromagnétiques, le pro-
ton et le neutron d’une part, les trois mésons π de l’autre seraient des particules de même
nature, de même masse, différant seulement par un nombre quantique “interne”, à la façon
de deux électrons dotés de spins différents. En fait le groupe régissant cette symétrie est aussi
SU(2), mais un SU(2) agissant dans un espace abstrait autre que l’espace usuel. On a donné
le nom de spin isotopique ou isospin au nombre quantique correspondant. Pour résumer, la
proposition est donc qu’il existe un groupe SU(2) de symétrie de l’Hamiltonien des interactions
fortes, et que les différentes particules sujettes à ces interactions forment des représentations
de SU(2) : représentation d’isospin I = 21 pour le nucléon (proton Iz = + 12 , neutron Iz = − 21 ),
isospin I = 1 pour les pions (π ± : Iz = ±1, π 0 : Iz = 0), etc. L’isospin est donc un “bon nombre
quantique”, conservé dans ces interactions. Ainsi le processus (virtuel) N → N + π, (N pour
nucléon) important en physique nucléaire, est compatible avec les règles d’addition des isospins
( 12 ⊗ 1 “contient” 12 ). Les différentes réactions N + π → N + π autorisées par la conservation
de la charge électrique
p + π+ → p + π+ Iz = 32
p + π0 → p + π0 Iz = 21
00
→ n + π+
p + π− → p + π− Iz = − 21
00
→ n + π0
n + π− → n + π− Iz = − 23
conservent aussi l’isospin total I et sa composante Iz mais l’hypothèse d’invariance par SU(2)
d’isospin nous apprend d’avantage. Les éléments de matrice de transition des deux réactions

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

20 Chap.0. Quelques éléments de base sur les groupes SO(3), SU(2) et SL(2,C)

dans le canal Iz = 12 , par exemple, doivent être reliés par les règles d’addition de l’isospin. En
inversant les relations (0.90), on obtient
r r
1 3 1 2 1 1
|p, π − i = |I = , Iz = − i − |I = , Iz = − i
r3 2 2 r3 2 2
2 3 1 1 1 1
|n, π 0 i = |I = , Iz = − i + |I = , Iz = − i
3 2 2 3 2 2
tandis que pour Iz = 3/2
3 3
|p, π + i = |I = , Iz = i .
2 2
L’invariance d’isospin implique que h I Iz |T |I 0 Iz0 i = TI δII 0 δIz Iz0 , : non seulement I et Iz sont
conservés, mais l’amplitude ne dépend que de I, pas de Iz (comme on le justifiera plus tard
au chap. 2, par le lemme de Schur ou le théorème de Wigner-Eckart). En calculant alors les
éléments de matrice de l’opérateur de transition T entre ces différents états,

h pπ + |T |pπ + i = T3/2
1
h pπ − |T |pπ − i =

T3/2 + 2T1/2 (0.93)
3
√
2
h nπ 0 |T |pπ − i =

T3/2 − T1/2
3
on trouve que les amplitudes satisfont une relation
√
2h n, π 0 |T |p, π − i + h p, π − |T |p, π − i = h p, π + |T |p, π + i = T3/2

conséquence non triviale de l’invariance d’isospin, qui implique des inégalités triangulaires entre
les modules carrés de ces amplitudes donc entre les sections efficaces de ces réactions
p p
[ σ(π − p → π − p) − 2σ(π − p → π 0 n)]2 ≤ σ(π + p → π + p) ≤
p p
≤ [ σ(π − p → π − p) + 2σ(π − p → π 0 n)]2

qui sont bien vérifiées expérimentalement. Mieux, on constate qu’à une énergie d’environ 180
MeV, les sections efficaces (proportionnelles aux carrés des amplitudes) sont dans les rapports

σ(π + p → π + p) : σ(π − p → π 0 n) : σ(π − p → π − p) = 9 : 2 : 1 ,

qui est ce qu’on obtiendrait à partir de (0.93) si on avait T 1 = 0. Cela indique qu’à cette énergie
2
la diffusion dans le canal d’isospin 3/2 est prédominante et signale en fait l’existence d’un état
intermédiaire, particule très instable ou “résonance”, notée ∆, d’isospin 3/2 donc avec quatre
états de charge
∆++ , ∆+ , ∆0 , ∆−
dont la contribution domine l’amplitude. Cette particule a un spin 3/2 et une masse M (∆) ≈
1230 MeV/c2 .
Dans certains cas on peut parvenir à des prédictions plus précises. C’est le cas par exemple dans l’étude des
réactions
2
H p → 3 He π 0 et 2 H p → 3 H π +

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

0.6. Représentations de SO(1,3) et SL(2,C) 21

impliquant des noyaux de deutérium 2 H, de tritium 3 H et d’hélium 3 He. A ces noyaux aussi on peut attribuer
un isospin, 0 au deutéron qui est formé d’un proton et d’un neutron dans un état antisymétrique de leurs
isospins (pour que la fonction d’onde de ces deux fermions, symétrique d’espace et de spin, soit antisymétrique),
Iz = − 21 à 3 H et Iz = 12 à 3 He qui forment une représentation d’isospin 21 . Noter que dans tous les cas, la
charge électrique est reliée à la composante Iz de l’isospin par la relation Q = 12 B + Iz , avec B la charge
baryonique, égale ici au nombre de nucléons (protons ou neutrons). Montrer que le rapport des sections efficaces
σ(2 H p → 3 He π 0 )/σ(2 H p → 3 H π + ) est 21 .
Remarque : l’invariance par SU(2) d’isospin que nous venons de discuter est une symétrie des interactions
fortes. Il existe aussi dans le cadre du Modèle Standard une notion d’“isospin faible”, symétrie des interactions
électro-faibles, on y reviendra au Chap. 5.

0.6 Représentations de SO(1,3) et SL(2,C)

0.6.1 Petit rappel sur le groupe de Lorentz
L’espace de Minkowski est un espace R4 muni d’une métrique pseudo-euclidienne de signature
(+, −, −, −). Dans une base orthonormale avec des coordonnées (x0 = ct, x1 , x2 , x3 ), la métrique
est diagonale
gµν = diag (1, −1, −1, −1)
et la norme carrée d’un 4-vecteur s’écrit

x.x = xµ gµν xν = (x0 )2 − (x1 )2 − (x2 )2 − (x3 )2 .

Le groupe d’isométrie de cette forme quadratique, appelé O(1,3) ou groupe de Lorentz L, est
tel que
Λ ∈ O(1, 3) x0 = Λx : x0 .x0 = Λµρ xρ gµν Λνσ xσ = xρ gρσ xσ
c’est-à-dire
Λµρ gµν Λνσ = gρσ or ΛT gΛ = g . (0.94)
Ces matrices pseudo-orthogonales satisfont (det Λ)2 = 1 et (en prenant l’élément de matrice 00
de (0.94)) (Λ00 )2 = 1 + 3i=1 (Λ0i )2 ≥ 1 et donc L ≡ O(1,3) a quatre composantes connexes
P

(or “nappes”) selon que det Λ = ±1 et Λ00 ≥ 1 ou ≤ −1. Le sous-groupe des transformations
propres orthochrones satisfaisant det Λ = 1 et Λ00 ≥ 1 est noté L↑+ . Toute transformation de L↑+
peut être écrite comme le produit d’une rotation “ordinaire” de SO(3) et d’une “transformation
spéciale de Lorentz” ou “boost”.
Une différence majeure entre les groupes SO(3) et L↑+ est que le premier est compact (l’en-
semble de ses paramètres est borné et fermé, voir (0.2)), tandis que le second ne l’est pas :
dans un “boost” dans la direction 1, disons, x01 = γ(x1 − vx0 /c), x00 = γ(x0 − vx1 /c), avec
1
γ = (1 − v 2 /c2 )− 2 , la vitesse |v| < c (inégalité stricte !) n’appartient pas à un domaine compact
(ou encore, la variable de “rapidité” β, définie par cosh β = γ peut aller à l’infini). Cette compa-
cité ou non a de très importantes implications sur la nature et les propriétés des représentations,
comme nous allons voir.
Le groupe de Poincaré ou groupe de Lorentz inhomogène est engendré par les transformations de
Lorentz Λ ∈ L et les translations d’espace-temps ; on peut noter (a, Λ) son élément générique

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

22 Chap.0. Quelques éléments de base sur les groupes SO(3), SU(2) et SL(2,C)

avec une action sur un quadrivecteur x de l’espace de Minkowski et une loi de composition
données par

(a, Λ) : x 7→ x0 = Λx + a
(a0 , Λ0 )(a, Λ) = (a0 + Λ0 a, Λ0 Λ) ; (0.95)

l’inverse de (a, Λ) est (−Λ−1 a, Λ−1 ) (le vérifier !).

0.6.2 Algèbre de Lie des groupes de Lorentz et Poincaré

Une transformation infinitésimale de Poincaré s’écrit (αµ , Λµν = δνµ + ω µν ). Prenant la forme
infinitésimale de (0.94), on voit aisément que le tenseur ωρν = ω µν gρµ doit être antisymétrique :
ωνρ + ωρν = 0. Cela laisse 6 paramètres réels : le groupe de Lorentz est un groupe de dimension
6, et le groupe de Poincaré de dimension 10.
Pour déterminer l’algèbre de Lie des générateurs, procédons comme au § 0.2.3 : regardons
l’algèbre de Lie engendrée par des opérateurs différentiels agissant sur les fonctions des co-
ordonnées ; si x0λ = xλ + δxλ = xλ + αλ + ω λν xν , δf (x) = f (xµ − αλ − ω λν xν ) − f (x) =
(I − iαµ Pµ − 2i ω µν−I Jµν )f (x), (cf (0.45), donc

Jµν = i(xµ ∂ν − xν ∂µ ) Pµ = −i∂µ (0.96)

[en accord avec eiP a ψ(x)e−iP a = ψ(x + a)] dont on calcule aisément les commutateurs

[Jµν , Pρ ] = i (gνρ Pµ − gµρ Pν )

[Jµν , Jρσ ] = i (gνρ Jµσ − gµρ Jνσ + gµσ Jνρ − gνσ Jµρ ) (0.97)
[Pµ , Pν ] = 0

Noter la structure de ces relations : antisymétrie en µ ↔ ν de la première, en µ ↔ ν, en ρ ↔ σ et en (µ, ν) ↔

(ρ, σ) de la seconde ; la première montre comment un vecteur (ici Pρ ) se transforme sous la transformation
infinitésimale engendrée par Jµν , et la seconde a cette même forme dans les indices ρ et σ, exprimant que Jρσ
est un 2-tenseur.
Les générateurs qui commutent avec P0 (qui est le générateur des translations de temps,
donc le hamiltonien) sont les Pµ et les Jij mais pas les J0j : i[P0 , J0j ] = Pj .
Posons
Jij = ijk J k K i = J0i . (0.98)
On a alors

[J i , J j ] = iijk J k
[J i , K j ] = iijk K k
[K i , K j ] = −iijk J k (0.99)

et aussi

[J i , P j ] = iijk P k [K i , P j ] = iP 0 δij
[J i , P 0 ] = 0 [K i , P 0 ] = iP i . (0.100)

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

0.6. Représentations de SO(1,3) et SL(2,C) 23

N.B. Les deux premières des relations (0.99) et la première de (0.100) expriment bien, comme
attendu, que J = {J j }, K = {K j } et P = {P j } se transforment comme des vecteurs sous
l’action des rotations de R3 . Formons les combinaisons
1 1
M j = (J j + iK j ) N j = (J j − iK j ) (0.101)
2 2
elles satisfont

[M i , M j ] = iijk M k
[N i , N j ] = iijk N k
[M i , N j ] = 0 . (0.102)

On voit donc que, si on considère les combinaisons complexes M et N de ses générateurs,

l’algèbre de Lie de L = O(1, 3) est isomorphe à su(2) ⊕ su(2). L’introduction du ±i, cependant,
fait que les représentations unitaires de L ne découlent pas simplement de celles de SU(2)×
SU(2). Les représentations de dimension finie, non unitaires , de L sont indexées par une paire
(j1 , j2 ), entiers ou demi-entiers.
Exercice. Montrer que cette algèbre admet deux opérateurs de Casimir quadratiques indé-
pendants, et les exprimer en termes de M et N d’abord, puis de J et K. [Rép : M2 et N2 =
1 2
4 (J − K2 ) ± i(J · K)/2. ]

0.6.3 Groupes de recouvrement de L↑+ et P+↑

De la même façon que de l’étude de SO(3) on a été conduit (pour des raisons qui seront
discutées aux chapitres 1 et 2) à celle de SU(2), son “groupe de recouvrement”, de même dans
le cas du groupe de Lorentz, on est amené à étudier son groupe de recouvrement SL(2,C).
Il existe une manière simple de voir comment SL(2,C) et L↑+ sont reliés, qui est une extension
quadri-dimensionnelle de la méthode suivie au § 0.1.2. On utilise les matrices σµ constituées de
σ0 = I et des trois matrices de Pauli familières. Notons que l’on a

tr σµ σν = 2δµν σµ2 = I sans sommation sur l’indice µ .

À tout vecteur réel x ∈ R4 , associons la matrice hermitique

1
X = xµ σµ xµ = tr (Xσµ ) det X = x2 = (x0 )2 − x2 .
2
Une matrice A ∈ SL(2, C) agit sur X selon

X 7→ X 0 = AXA†

qui est bien hermitique et définit donc x0 µ = 21 tr (X 0 σµ ) réel, avec det X 0 = det X, donc x2 = x02 .
C’est une transformation linéaire de R4 dans R4 qui préserve la norme minkovskienne x2 , c’est
donc une transformation de Lorentz, et on vérifie qu’elle est dans L↑+ et que A → Λ est un
homomorphisme de SL(2, C) dans L↑+ . On notera dans la suite x0 = A.x si X 0 = AXA† .

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

24 Chap.0. Quelques éléments de base sur les groupes SO(3), SU(2) et SL(2,C)

Cependant, les deux transformations A et −A ∈ SL(2, C) donnent la même transformation

de L↑+ : SL(2, C) est un recouvrement d’ordre 2 de L↑+ . Pour le groupe de Poincaré, on raisonne de
même, son recouvrement est le produit (“semi-direct”) du groupe des translations par SL(2, C).
Si on note a := aµ σµ
(a, A)(a0 , A0 ) = (a + Aa0 A† , AA0 )
(on parle aussi du “groupe SL(2, C) inhomogène”, ou ISL(2, C)).

0.6.4 Représentations irréductibles de dimension finie de SL(2, C)

! § 0.3.3 fournit une représentation explicite de GL(2,C) et donc de SL(2,C).

La construction du
a b j
Pour A = ∈ SL(2, C), (0.71) donne l’expression de Dmm 0 (A) :
c d

j 0 0
1 X an1 bn2 cn3 dn4
Dmm 0 (A) = [(j + m)!(j − m)!(j + m )!(j − m )!]
2
(0.71)
n1 ,n2 ,n3 ,n4 ≥0
n1 !n2 !n3 !n4 !
n1 +n2 =j+m ; n3 +n4 =j−m0
n1 +n3 =j+m ; n2 +n4 =j−m

∗
Noter que DT (A) = D(AT ) (car échanger m ↔ m0 équivaut à n2 ↔ n3 , donc à b ↔ c) et (D(A)) = D(A∗ )
(car les coefficients numériques dans (0.71) sont réels) donc D† (A) = D(A† ).
Cette représentation est appelée (j, 0), elle est de dimension 2j + 1. Il en existe une autre
de dimension 2j + 1, non équivalente, notée (0, j), c’est la représentation “contragrédiente
conjuguée” (au sens du chap 2. § 2.1.4) Dj (A† −1 ). Le remplacement de A par A† −1 s’interprète
dans la construction du § 0.6.3 si au lieu d’associer X = xµ σµ = x0 σ0 + x.σ σ à x, on lui associe
Xe = x0 σ0 − x.σ
σ . On note que σ2 (σi )T σ2 = −σi pour i = 1, 2, 3 donc X e = σ2 X T σ2 . Pour la
transformation A : X 7→ X 0 = AXA† , on a
e 0 = σ2 (X 0 )T σ2 = σ2 (AXA† )T σ2 = (σ2 AT σ2 )† X(σ
X e 2 AT σ2 ) .

Toute matrice A de SL(2, C) peut elle-même s’écrire A = aµ σµ , avec (aµ ) ∈ C4 , et comme

det A = (a0 )2 − a2 = 1 (le “S” de SL(2, C)), on vérifie aisément que A−1 = a0 σ0 − a.σ
σ , [En effet
1
(a0 σ0 + a.σ
σ )(a0 σ0 − a.σ
σ ) = (a0 )2 (σ0 )2 − ai aj {σi , σj } = ((a0 )2 − ai aj δij )I = I
2
] donc
σ2 AT σ2 = A−1 . (0.103)
Finalement
X 0 = AXA† ⇐⇒ e 0 = (A−1 )† XA
X e −1 . (0.104)
Remarque. Les deux représentations (j, 0) et (0, j) sont inéquivalentes sur SL(2, C), mais
équivalentes sur SU(2). En effet dans SU(2), A = U = (U † )−1 .
Finalement, on démontre que toute représentation de dimension finie de SL(2, C) est complè-
tement réductible et peut donc s’écrire comme somme directe de représentations irréductibles.
La représentation irréductible de dimension finie la plus générale de SL(2, C) est notée (j1 , j2 ),
avec j1 et j2 entiers ou demi-entiers ≥ 0 ; elle est définie par

(j1 , j2 ) = (j1 , 0) ⊗ (0, j2 ) .

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

0.6. Représentations de SO(1,3) et SL(2,C) 25

Toutes ces représentations peuvent être obtenues à partir des représentations ( 12 , 0) et (0, 21 ).
En effet (j1 , 0) et (0, j2 ) se construisent par produit tensoriel symétrisé des représentations
( 12 , 0) et (0, 21 ), comme on l’a fait pour SU(2). Seules les représentations (j1 , j2 ) ayant j1 et j2
simultanément entiers ou demi-entiers fournissent de vraies représentations de L+ ↑ . Les autres
sont des représentations à un signe près.
Exercice : montrer que la représentation (0, j) est “équivalente” (à un changement de base
près) à la complexe conjuguée de la représentation (j, 0). (On pourra le montrer d’abord pour
j = 21 en se rappelant que (A−1 )† = σ2 A∗ σ2 , puis pour les représentations de j quelconque
obtenues par produit tensoriel d’ordre 2j à partir de j = 21 .) [Si A = a0 σ0 + ~a.σσ, A−1 = a0 σ0 − ~a.σσ =
σ2 AT σ2 , donc (A−1 )† = σ2 A∗ σ2 est équivalente à A∗ , donc la représentation (0, 12 ) est équivalente à ( 12 , 0)∗ ,
puis par produit tensoriel d’ordre 2j, Dj ((A−1 )† ) est équivalente à Dj (A∗ ) .]

Représentations spinorielles

Revenons aux deux représentations spinorielles ( 21 , 0) et (0, 12 ). Ce sont des représentations

de dimension 2 (spineurs à deux composantes). Il est traditionnel de noter les indices des
1
composantes avec des indices “pointés” ! ou non pointés, pour la représentation (0, 2 ) et la
a b
( 12 , 0), respectivement. Pour A = ∈ SL(2, C)
c d
!
1 2
1 aξ + bξ
( , 0) ξ = (ξ α ) 7→ ξ 0 = Aξ =
2 cξ 1 + dξ 2
!
∗ 1̇ ∗ 2̇
1 a ξ + b ξ
(0, ) ξ = (ξ α̇ ) 7→ ξ 0 = A∗ ξ = ∗ 1̇ (0.105)
2 c ξ + d∗ ξ 2̇

On note que la forme alternée (ξ, η) = ξ 1 η 2 − ξ 2 η 1 = ξ T (iσ2 )η est invariante dans ( 21 , 0) (et
aussi dans (0, 12 )), ce qui découle à nouveau de (0.103)

(σ2 AT σ2 )A = A−1 A = I ⇐⇒ AT (iσ2 )A = iσ2 .

On peut donc utiliser cette forme pour abaisser les indices α (ou α̇). Ainsi
1
dans ( , 0) : (ξ, η) = ξα η α ξ2 = ξ 1 ξ1 = −ξ 2
2
1
dans (0, ) : (ξ, η) = ξα̇ η α̇ ξ2̇ = ξ 1̇ ξ1̇ = −ξ 2̇ (0.106)
2

Représentation (j1 , j2 )

Les {ξ α1 α2 ···α2j1 β̇1 β̇2 ···β̇2j2 } symétriques en α1 , α2 , · · · , α2j1 et en β̇1 , β̇2 , · · · , β̇2j2 , forment la repré-
sentation irréductible (j1 , j2 ). (On ne peut pas diminuer le rang en prenant des traces, le seul
tenseur invariant étant la forme précédente alternée). La dimension de cette représentation est
(2j1 + 1)(2j2 + 1). Les représentations les plus usuelles rencontrées en théorie des champs sont
(0, 0), ( 21 , 0) et (0, 12 ), ( 12 , 12 ). Cette dernière correspond aux 4-vecteurs, comme on l’a vu plus
haut :
A∈SL(2,C)
x 7→ X = x0 σ0 + x.σ σ −→ X 0 = AXA†

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

26 Chap.0. Quelques éléments de base sur les groupes SO(3), SU(2) et SL(2,C)

c’est-à-dire
0 0 0 0
X = X αβ̇ → (X 0 )αβ̇ = Aαα (Aβ̇ β̇ )∗ X α β̇ ,
ce qui montre que X se transforme bien selon la représentation ( 12 , 12 ).
Exercice. Montrer que les représentations (1, 0) et (0, 1), de dimension 3, décrivent des
tenseurs F µν de rang 2 self-duaux ou anti-self-duaux, c’est-à-dire satisfaisant
i
F µν = ± µνρσ Fρσ ,
2
où µνρσ est le tenseur complètement antisymétrique à 4 indices, avec la convention que 0123 = 1,
mais attention µνρσ = −µνρσ !

0.6.5 Représentations irréductibles unitaires du groupe de Poincaré.

États à une particule.
Selon le théorème de Wigner qui sera discuté au chapitre 2, pour décrire l’action des transformations propres
orthochrones de Lorentz ou de Poincaré sur les états d’une théorie quantique, nous avons besoin de représenta-
tions unitaires de ces groupes, ou plutôt de leurs “recouvrements universels” SL(2,C) et ISL(2,C). Comme on
le verra plus bas (Chap. 2), les représentations unitaires (de classe L2 ) du groupe non compact SL(2, C) sont
nécessairement de dimension infinie (à l’exception de la représentation triviale (0, 0), qui décrit un état invariant
par rotation et sous l’effet des boosts, c’est-à-dire le vide !). [Le “truc unitaire de Weyl” (Weyl unitary trick)
énonce en effet que les représentations de dimension finie de SL(2,C), SL(2,R) et SU(2) sont en correspondance.
Une représentation unitaire de dim finie de SL(2,R) conduirait à une absurdité dans SU(2). ]
Revenons aux relations de commutation de l’algèbre de Lie (0.97). On cherche un ensemble maximal
d’opérateurs commutants. Les quatre Pµ commutent. Soit (pµ ) une valeur propre pour un vecteur propre des
Pµ , état “à une particule”, et on suppose que le vecteur propre noté |p i n’est indexé que par pµ et par des
indices discrets : c’est en effet le sens de “état à une particule”, au contraire d’un état à deux particules qui
dépendrait d’une impulsion relative, variable continue

Pµ |p i = pµ |p i . (0.107)

On considère aussi le tenseur de Pauli-Lubanski

1 λµνρ
Wλ = Jµν Pρ (0.108)
2
et on vérifie (exercice !) que (0.97) implique

[Wµ , Pν ] = 0
[W µ , W ν ] = −iµνρσ Wρ Pσ
[Jµν , Wλ ] = i(gνλ Wµ − gµλ Wν ) . (0.109)

La dernière relation signifie que W est un 4-vecteur de Lorentz. On note aussi que W.P = 0 en raison de
l’antisymétrie du tenseur . On montre enfin (le vérifier !) que P 2 = Pµ P µ et W 2 = Wµ W µ commutent avec
tous les générateurs P et J : ce sont les opérateurs de Casimir de l’algèbre. Selon le lemme de Schur, (cf plus
bas, chap. 2, § 2.1.6) ils sont dans toute représentation irréductible proportionnels à l’identité, autrement dit,
leurs valeurs propres peuvent être utilisées pour indexer les représentations irréductibles.
En physique, on n’a en principe que deux types de représentations à considérer 4 : les représentations où
P > 0 et celles où P 2 = 0, W 2 = 0. Leur construction détaillée sera effectuée dans le cours d’A. Bilal.
2

4. ce qui ne veut pas dire qu’il n’existe pas d’autres représentations irréductibles ; par exemple les représen-
tations “non physiques” où P 2 = −M 2 < 0

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

0.6. Représentations de SO(1,3) et SL(2,C) 27

[Une remarque sur les relations entre représentations de dimension finie et infinie agissant sur les champs.
On a vu que le théorème de Wigner nous donnait aussi la transformation des observables A 7→ U (g)AU † (g)
(Chap. 4, §4.2). Appliquons cette expression à la transformation sous l’action du groupe de Lorentz d’un champ
ϕ(x), supposé se transformer selon la représentation de spin s :

U (a, A)ϕa (x)U −1 (a, A) = Daa

s
0 (A
−1
)ϕa0 (A.x + a)

où U (a, A) est la transformation unitaire , agissant dans l’espace de Fock, induite par (??). ]
[Irreps de SL(2,C).
– Série principale de représentations unitaires de SL(2,C) dans L2 (C) indexées par (k, iv), k ∈ Z, v ∈ R
!! −k
(k,iv) a b −2−iv −bz + d az − c
D f (z) = | − bz + d| f
c d | − bz + d| −bz + d

unit.
D(k,iv) ∼ D(−k,−iv) sont unitaires irréductibles.
– Série principale de représentations non unitaires (k, w), k ∈ Z, w = u + iv ∈ C. Ibid avec | − bz + d|−2−w ,
sur L2 (C, (1 + |z|2 )<e w dxdy). Cette série contient toutes les irreps de dimension finie.
– Série complémetaire. Pour k = 0, w réel, 0 < w < 2, représentations unitaires pour un autre produit
scalaire Z Z
f (z)g(ζ)dzdζ
h g, f i = 2−w
C C |z − ζ|

À équivalence près, la représentation triviale, la série principale unitaire et la série complémentaire sont les
seules irreps unitaires. ]

Bibliographie
La référence historique pour le physicien est le livre d’E. Wigner [Wi].
Pour une discussion détaillée des propriétés du groupe de Lorentz, voir le livre récent d’Éric
Gourgoulhon, Relativité restreinte. Des particules l’astrophysique, (EDP Sciences / CNRS
Éditions).
Pour une discussion détaillée du groupe des rotations, ainsi que de nombreuses formules et
tables, se reporter à : J.-M. Normand, A Lie group : Rotations in Quantum Mechanics, North-
Holland.
Pour une étude approfondie des représentations physiques des groupes de Lorentz et Poincaré,
voir P. Moussa et R. Stora, Angular analysis of elementary particle reactions, dans Analysis of
scattering and decay, édité par M. Nikolic, Gordon et Breach 1968.

Problème
On considère deux représentations de spin 21 du groupe SU(2) et leur produit direct (ou tensoriel). On note J(1)
et J(2) les générateurs infinitésimaux agissant dans chaque représentation, et J = J(1) + J(2) ceux agissant dans
leur produit direct, cf. (0.75), (0.75’).
1. Que peut-on dire des opérateurs J(1) 2 , J(2) 2 et J2 et de leurs valeurs propres ?
2. Montrer que l’on peut exprimer J(1) .J(2) en termes de ces opérateurs et en déduire que les opérateurs
1 1
(3I + 4J(1) .J(2) ) et (I − 4J(1) .J(2) )
4 4

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

28 Chap.0. Quelques éléments de base sur les groupes SO(3), SU(2) et SL(2,C)

sont des projecteurs sur des espaces que l’on précisera.

3. En prenant en compte les symétries d’échange des vecteurs, que pouvez-vous dire de l’opérateur
1
I + 2J(1) .J(2) ?
2

Appendice 0. Mesure et laplacien sur les sphères S 2 et S 3

On expose ici une méthode générale permettant de construire une mesure d’intégration à partir
d’une géométrie riemannienne.
On considère une variété riemannienne, c’est-à-dire une variété (voir App. B du Chap. 1 pour
quelques rappels) dotée d’une métrique :

ds2 = gαβ dξ α dξ β (0.110)

avec un tenseur métrique gαβ (ξ) dépendant a priori des coordonnées (locales) ξ α , α = 1, · · · , n ;
n est la dimension de la variété. Ce ds2 doit être invariant par des changements (différentiables)
des coordonnées, ξ → ξ 0 , ce qui dicte la transformation du tenseur g

∂ξ α ∂ξ β
ξ 7→ ξ 0 , g 7→ g 0 : gα0 0 β 0 = gαβ , (0.111)
∂ξ 0α0 ∂ξ 0β 0
qui signifie que g est un tenseur de rang 2 covariant. Ce tenseur métrique est supposé non
singulier, c’est-à-dire inversible, et le tenseur inverse est noté avec des indices supérieurs

gαβ g βγ = δαγ . (0.112)

Par ailleurs, son déterminant est traditionnellement noté g

g = det(gαβ ) . (0.113)

Il y a alors une méthode générale pour construire un élément de volume sur la variété
(c’est-à-dire une mesure d’intégration) et un laplacien, tous deux invariants par changement de
coordonnées locales :
n
√ Y α
dµ(ξ) = g dξ
α=1
1 √
∆ = √ ∂α g g αβ ∂β (0.114)
g

où ∂α est une notation abrégée pour l’opérateur différentiel ∂ξ∂α .

Exercice : vérifier que dµ(ξ) et ∆ sont invariants par le changement de coordonnées ξ 7→ ξ 0 .
Cela peut être appliqué dans de nombreux contextes et sera utilisé au Chap. 1 pour définir
une mesure d’intégration sur les groupes de Lie compacts.
Appliquons-le ici à l’espace euclidien Rn . En coordonnées sphériques, on a

ds2 = dr2 + r2 dΩ2

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

App. 0. Mesure et laplacien sur les sphères S 2 et S 3 29

où dΩ est une notation générique qui rassemble!toutes les variables angulaires. Le tenseur
1 0
métrique est donc de la forme générale avec une matrice A (n − 1) × (n − 1) qui
0 r2 A
est indépendante de r et ne dépend que des variables angulaires. Ces dernières donnent lieu au
√ √
laplacien sur la sphère unité S n−1 , noté ∆S n−1 ; g = rn−1 det A ; et (0.114) nous dit que le
laplacien sur Rn a la forme générale
1 ∂ n−1 ∂ 1 ∂2 n−1 ∂ 1
∆Rn = n−1
r + 2
∆S n−1 =
2
+ + 2 ∆S n−1 .
r ∂r ∂r r ∂r r ∂r r
Écrivons les choses plus explicitement pour les sphères unités S 2 et S 3 . Considérons la sphère
S 2 de rayon r fixé à 1 avec les coordonnées sphériques 0 ≤ θ ≤ π, 0 ≤ φ ≤ 2π (Fig. 1). On a

ds2 = dθ2 + sin2 θ dφ2

√
g = sin θ
dµ(x) = sin θ dθ dφ
1 ∂2

1 1 ∂ ∂
∆S 2 = 2 + sin θ . (0.115)
r sin2 θ ∂φ2 sin θ ∂θ ∂θ
Les générateurs Ji s’écrivent
∂
J3 = −i
∂φ

∂ ∂
J1 = −i − cos φ cotg θ − sin φ (0.116)
∂φ ∂θ

∂ ∂
J2 = −i − sin φ cotg θ + cos φ
∂φ ∂θ
et on vérifie que −∆S 2 = J~2 = J12 + J22 + J32 .
Pour la sphère S 3 on a des formules analogues. Dans la paramétrisation (0.12), on prendra
par exemple 2
2 1 † ψ ψ
+ sin2 dθ2 + sin2 θ dφ2

ds = tr dU dU = d (0.117)
2 2 2
invariante par U → U V , U → V U ou U → U −1 d’où la mesure invariante par ces mêmes
transformations 2
1 ψ
dµ(U ) = sin sin θ dψ dθ dφ . (0.118)
2 2
Dans la paramétrisation des angles d’Euler,
σ3 σ2 σ3
U = e−iα 2 e−iβ 2 e−iγ 2 (0.119)

on a
1 1
ds2 = tr dU dU † = dα2 + 2dαdγ cos β + dγ 2 + dβ 2

(0.120)
2 4
√
et avec g = sin β on calcule
1
dµ(U ) = sin β dα dβ dγ (0.121)
8
2 2
∂2

4 ∂ ∂ 4 ∂ ∂
∆sphère S 3 = 2 2
+ 2+ + sin β . (0.122)
sin β ∂α ∂γ ∂α∂γ sin β ∂β ∂ sin β

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

30 Chap.0. Quelques éléments de base sur les groupes SO(3), SU(2) et SL(2,C)

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

Chapitre 1

Groupes. Groupes et algèbres de Lie

1.1 Généralités sur les groupes

1.1.1 Définitions de base et premiers exemples

On considère un groupe G, avec une opération notée selon les cas ., × ou +, un élément
neutre e (ou 1 ou I ou 0), et un inverse g −1 (ou −a). Si l’opération est commutative, le groupe
est dit abélien. Si le groupe est fini, c’est-à-dire a un nombre déléments fini, on appelle ce
nombre l’ordre du groupe. On s’intéressera dans ce cours surtout à des groupes infinis, discrets
ou continus.
Exemples (que le physicien peut rencontrer. . .)
1. Groupes finis
– le groupe cyclique Zp d’ordre p, considéré géométriquement comme le groupe d’inva-
riance de rotation d’un cercle avec p points marqués équidistants, ou comme le groupe
multiplicatif des racines p-ièmes de l’unité, {e2iπq/p }, q = 0, 1, · · · , p − 1, ou comme le
groupe additif des entiers modulo p ;
– les groupes d’invariance de rotation et les groupes d’invariance de rotations et réflexions
des solides réguliers ou des réseaux réguliers, d’une grande importance en physique des
solides et en cristallographie ;
– le groupe de permutation Sn de n objets, appelé aussi groupe symétrique, d’ordre n! ;
etc.
2. Groupes infinis discrets.
L’exemple le plus simple est le groupe additif Z. Citons aussi les groupes de translations
des réseaux réguliers, ou les groupes d’espace en cristallographie qui incluent toutes les
isométries (rotations, translations, réflexions, leurs produits) laissant invariant un cris-
tal. . .

Ou encore les groupes engendrés par les réflexions dans un nombre fini d’hyperplans de Rn , qui sont finis
ou infinis, selon l’arrangement de ces hyperplans, cf. les groupes de Weyl au Chapitre 4.

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

32 Chap.1. Groupes. Groupes et algèbres de Lie

!
a b
Un autre exemple important est le groupe modulaire P SL(2, Z) des matrices A = à coefficients
c d
entiers, de déterminant unité ad − bc = 1, où on identifie les matrices A et −A. Étant donné un réseau
à 2 dimensions engendré dans le plan complexe par deux nombres complexes de rapport non réel ω1 et
ω2 , ce groupe décrit les changements de base (ω1 , ω2 )T → (ω10 , ω20 )T = A(ω1 , ω2 )T laissant invariant l’aire
de la cellule élémentaire (=(ω2 ω1∗ ) = =(ω20 ω10 ∗ )) et agissant sur τ = ω2 /ω1 selon τ → (aτ + b)/(cτ + d).
Ce groupe joue un rôle important en mathématiques dans l’étude des fonctions elliptiques, des formes
modulaires, etc, et en physique dans l’étude des théories conformes et des théories de cordes. . .
Les groupes d’homotopie, que nous allons rencontrer bientôt, sont d’autres exemples de groupes discrets,
finis ou infinis. . .
3. Groupes continus.
Nous n’aurons à faire qu’à des groupes de matrices de dimension finie, c’est-à-dire des
sous-groupes des groupes linéaires GL(n, R) ou GL(n, C), pour un certain n. En particulier
– U(n), groupe des matrices unitaires complexes, U U † = I, qui est le groupe d’invariance
de la forme sesquilinéaire (x, y) = x∗i y i ;
P

– SU(n) son sous-groupe unimodulaire, des matrices unitaires de déterminant det U = 1 ;

– O(n) et SO(n) sont les groupes orthogonaux laissant invariante la forme bilinéaire
Pn
i=1 xi yi . Les matrices de SO(n) sont en outre de déterminant 1 ;
– U(p, q), SU(p, q), resp. O(p, q), SO(p, q), les groupes d’invariance d’une forme sesqui-
linéaire, resp. bilinéaire, de signature ((+)p , (−)q ), (tel le groupe de Lorentz group).
On considère le plus souvent les groupes O(n, R), SO(n, R) de matrices à coefficients réels mais les
groupes O(n, C), SO(n, C) d’invariance de la même forme bilinéaire sur les complexes peuvent aussi
jouer un rôle. !
0 1
– Sp(2n, R) : Soit Z la matrice 2n × 2n faite d’une diagonale de n blocs iσ2 : Z = diag , et
−1 0
considérons la forme bilinéaire antisymétrique
n
X
(X, Y ) = X T ZY = (x2i−1 y2i − y2i−1 x2i ) . (1.1)
i=1

Le groupe symplectique Sp(2n, R) est le groupe de matrices B réelles 2n × 2n préservant cette forme
B T ZB = Z . La forme ci-dessus apparaı̂t naturellement en mécanique hamiltonienne dans la 2-forme
Pn
symplectique ω = i=1 dpi ∧ dqi = 21 Zij dξi ∧ dξj avec les coordonnées ξ = (p1 , q1 , p2 , · · · , qn ) ; ω est
invariante par action de Sp(2n, R) sur ξ. Pour n = 1, vérifier que Sp(2,R)=SL(2,R).
On peut aussi considérer le groupe symplectique complexe Sp(2n, C). Un groupe relié, souvent noté
Sp(n) mais que je noterai USp(n) pour éviter la confusion avec les précédents, est le groupe symplectique
unitaire, groupe d’invariance d’une forme hermitienne quaternionique, USp(n)=U(2n)∩ Sp(2n, C).
Voir Appendice A.
– le groupe de “déplacements” dans R3 , – compositions de transformations de O(3) et de
translations –, et les groupes obtenus en lui ajoutant les dilatations, puis les inversions
par rapport à un point ;
– le groupe de transformations conformes, c’est-à-dire préservant les angles dans Rn , voir
le Problème à la fin de ce chapitre.
– le groupe de Galilée des transformations x0 = Ox + vt + x0 , t0 = t + t0 , O ∈ O(3) ;
– le groupe de Poincaré, dans lequel les translations sont adjointes au groupe de Lorentz
O(1,3),
– etc etc.

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

1.1. Généralités sur les groupes 33

1.1.2 Classes de conjugaison d’un groupe

On définit sur un groupe G la relation d’équivalence suivante :

a ∼ b ssi ∃ g ∈ G : a = g.b.g −1 (1.2)

et on dit alors que les éléments a et b sont conjugués.

Les classes d’équivalence qui en découlent réalisent une partition de G, puisque tout élément
appartient à une classe et une seule. Noter que l’élément neutre constitue à lui seul une classe.
Pour un groupe fini, les différentes classes ont en général des ordres différents. Par exemple, la
classe de l’identité e ne contient que le seul élément e.
On a déjà noté (Chap. 0) que dans le groupe SO(3), une classe de conjugaison est caractérisée
par l’angle de rotation ψ (autour d’un vecteur unitaire n). Mais cette notion est aussi familière
dans le cas du groupe U(n), où une classe est caractérisée par un n-tuple non ordonné de
valeurs propres (eiα1 , . . . , eiαn ). La notion de classe joue un rôle important dans la discussion
des représentations des groupes et sera abondamment illustrée par la suite.
Pour le groupe symétrique Sn , que sont ces classes de conjugaison ? On peut aisément décomposer toute
permutation σ de Sn en un produit de cycles (permutations cycliques) portant sur des éléments disjoints. (Pour
s’en convaincre, on construit le cycle (1, σ(1), σ 2 (1), · · · ), puis une fois revenu en 1, on construit un autre cycle à
partir d’un nombre pas encore atteint, etc.). Au final, si σ est fait de p1 cycles de longueur 1, de p2 de longueur
ipi = n, on écrit σ ∈ [1p1 2p2 · · · ], et on démontre que cette décomposition en cycles caractérise
P
2, etc, avec
les classes de conjugaison : deux permutations sont conjuguées ssi elles ont la même décomposition en cycles.

1.1.3 Sous-groupes
La notion de sous-groupe, sous-ensemble d’un groupe lui-même doté de la structure de groupe,
est familière. Le sous-groupe est propre s’il n’est pas identique à G. Si H est un sous–groupe,
pour tout a ∈ G, l’ensemble a−1 .H.a des éléments de la forme a−1 .h.a, h ∈ H forme aussi un
sous–groupe, dit sous–groupe conjugué de H.
Des exemples de sous-groupes particuliers sont donnés par :
– le centre Z :
Soit G un groupe. On appelle centre de G l’ensemble Z des éléments qui commutent avec
tous les éléments de G :
Z = {a | ∀g ∈ G, a.g = g.a} (1.3)

Z est un sous-groupe de G, propre si G est non-abélien. Exemples : le centre du groupe

GL(2, R) des matrices régulières 2 × 2 est l’ensemble des matrices multiples de I˜ ; le
centre de SU(2) est le groupe Z2 des matrices ±I (le vérifier par le calcul direct). [preuve
par calcul explicite ou par Schur]
– le centralisateur d’un élément a :
Le centralisateur (ou commutant ) d’un élément a fixé de G est l’ensemble des éléments de G qui com-
mutent avec a.
Za = {g ∈ G|a.g = g.a} (1.4)

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

34 Chap.1. Groupes. Groupes et algèbres de Lie

Le commutant Za n’est jamais vide : il contient au moins le sous-groupe engendré par a. Le centre Z est
l’intersection de tous!les commutants. Exemple : dans le groupe GL(2, R), le commutant de la matrice
0 1
de Pauli σ1 = est le groupe abélien des matrices de la forme aI + bσ1 , a2 − b2 6= 0.
1 0
– Plus généralement, étant donnée une partie S d’un groupe G, on définit son centralisateur Z(S) et
son normalisateur N (S) comme les sous-groupes commutant respectivement individuellement avec tout
élément de S ou globalement avec S tout entier

Z(S) = {y : ∀s ∈ S y.s = s.y} (1.5)

N (S) = {x : x−1 .S.x = S} . (1.6)

1.1.4 Homomorphisme d’un groupe G dans un groupe G0

Un homomorphisme d’un groupe G dans un groupe G0 est une application ρ de G dans G0 qui
respecte la loi de composition :

∀g, h ∈ G, ρ(g.h) = ρ(g).ρ(h) (1.7)

En particulier, à l’élément neutre de G correspond par ρ celui de G0 , à l’inverse de g correspond

celui de g 0 = ρ(g) : ρ(g −1 ) = (ρ(g))−1 .
Un exemple d’homomorphisme que nous allons particulièrement étudier est celui d’une re-
présentation linéaire de groupe, dont la définition a été donnée au chapitre 0 et sur laquelle on
va revenir au chap. 2.
Le noyau de l’homomorphisme noté ker ρ (“Kern” en allemand, “kernel” en anglais) est
l’ensemble des antécédents (ou préimages) de l’élément neutre e0 de G0 : ker ρ = {x ∈ G :
ρ(x) = e0 }. C’est un sous-groupe de G.
Par exemple, la parité (ou signature) d’une permutation de Sn définit un homomorphisme
de Sn dans Z2 . Son noyau est constitué des permutations paires : c’est le groupe alterné An
d’ordre n!/2.

1.1.5 Classes par rapport à un sous-groupe

Soit H un sous-groupe d’un groupe G. On définit la relation entre éléments de G :
−1
g ∼ g 0 ⇐⇒ g.g 0 ∈ H, (1.8)

ce qu’on peut encore écrire comme

g ∼ g 0 ⇐⇒ ∃h ∈ H : g = h.g 0 ou encore g ∈ H.g 0 . (1.9)

C’est une relation d’équivalence (le vérifier), dite équivalence à droite. On peut définir de la
même façon une équivalence à gauche par

g ∼L g 0 ⇐⇒ g −1 .g 0 ∈ H ⇔ g ∈ g 0 .H. (1.10)

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

1.1. Généralités sur les groupes 35

La relation (disons à droite) définit des classes d’équivalence qui donnent une partition de G ;
si gj est un représentant de la classe j, on peut noter cette dernière [Link] . (Les anglophones
utilisent le terme “right-coset” pour cette classe). Les éléments de H forment à eux-seuls une
classe. On note G/H l’ensemble quotient, c’est-à-dire l’ensemble des classes d’équivalence. Son
cardinal (le nombre de classes) est appelé l’indice de H dans G et noté |G : H|. Par exemple,
le groupe (additif) H = 2Z des entiers pairs est d’indice fini égal à 2 dans G = Z. En revanche,
Z est d’indice infini dans R.
Si H est d’ordre fini |H|, toutes les classes ont |H| éléments, et si G est lui-même d’ordre fini
|G|, il est partitionné en |G : H| = |G|/|H| classes, et on obtient comme corollaire le théorème
de Lagrange : l’ordre |H| de tout sous-groupe H divise celui de G, et l’indice |G : H| = |G|/|H|
est l’ordre de l’ensemble quotient G/H.
L’équivalence à gauche donne en général une partition différente, mais de même indice. Par
exemple, le groupe S3 possède un sous–groupe Z2 engendré par la permutation des deux
éléments 1 et 2. Exercice : vérifier que les classes à gauche et à droite ne coı̈ncident pas.

1.1.6 Sous-groupe invariant

Soit G un groupe, H un sous-groupe de G. H est un sous-groupe invariant (on dit aussi normal)
si l’une des propriétés équivalentes suivantes est vraie
– ∀g ∈ G, ∀h ∈ H, ghg −1 ∈ H ;
– les classes à gauche et à droite coı̈ncident ;
– H est égal à tous ses conjugués, ∀g ∈ G, gHg −1 = H.
Exercice : vérifier l’équivalence entre ces trois définitions.
La propriété importante à retenir est la suivante :
• Si H est un sous-groupe invariant de G, on peut munir l’ensemble quotient G/H de la
structure de groupe.
Noter qu’en général on ne peut pas considérer le groupe quotient G/H comme un sous-groupe
de G.
Esquissons la démonstration. Si g1 ∼ g10 et g2 ∼ g20 , ∃h1 , h2 ∈ H : g1 = h1 .g10 , g2 = g20 .h2 , donc g1 .g2 =
−1 −1
h1 .(g10 .g20 ).h2 c’est-à-dire g1 .g2 ∼ g10 .g20 et g1−1 = g 0 1 .h−1
1 ∼ g 0 1 . La relation d’équivalence est compatible
avec les opérations de produit et de passage à l’inverse. Si [g1 ] et [g2 ] sont deux classes, on définit leur produit
[g1 ].[g2 ] = [g1 .g2 ] où au membre de droite on peut prendre tout représentant g1 de [g1 ] et g2 de [g2 ] ; de même
pour l’inverse. Donc la structure de groupe passe donc au quotient, ensemble des classes. La classe constituée
de H est l’élément neutre du quotient.
Exemple de sous-groupe invariant : Le noyau d’un homomorphisme ρ d’un groupe G dans
un groupe G0 est un sous–groupe invariant ; montrer que son groupe quotient est un groupe
isomorphe à l’image ρ(G) ⊂ G0 de G par ρ. [En effet g ∼ g0 ⇔ ρ(g.g0−1 ) = e ⇔ ρ(g) = ρ(g0 ).]

1.1.7 Groupe simple, groupe semi-simple

Un groupe est simple s’il n’a pas de sous-groupe invariant non trivial (c’est-à-dire différent
de {e} et de G tout entier). Un groupe est semi-simple s’il n’a pas de sous-groupe invariant
abélien non trivial. Tout groupe simple est évidemment semi-simple.

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

36 Chap.1. Groupes. Groupes et algèbres de Lie

Cette notion est importante dans l’étude des représentations et la classification des groupes.
Exemples : Le groupe des rotations à deux dimensions n’est pas simple, ni même semi-
simple (pourquoi ?). [tout ss-groupe Zp est un sous-groupe invariant abélien ] Le groupe SO(3) est simple
(preuve non triviale, voir plus bas, §1.2.2). Le groupe SU(2) n’est ni simple, ni semi-simple,
il contient en effet le sous-groupe invariant Z2 = {I, −I}. Le groupe Sn n’est pas simple, pour
n > 2 (pourquoi ?). [le sous-groupe alterné, noyau de l’homom. signature, est un ss-gr invt. Il est non trivial
pour n > 2.]
[Action d’un groupe sur un ensemble. Orbites. Petit groupe (stabilisateur) : cf TD]
[le sous-groupe alterné, noyau de l’homom. signature, est un ss-gr invt. Il est non trivial pour n > 2.]

Produits direct, semi-direct

Considérons deux groupes G1 et G2 et leur produit direct G = G1 × G2 : c’est l’ensemble des paires
(g1 , g2 ) doté du produit naturel (g10 , g20 ).(g1 , g2 ) = (g10 .g1 , g20 .g2 ). À l’évidence ses sous-groupes {(g1 , e)} ' G1 et
{(e, g2 )} ' G2 sont des sous-groupes invariants, et G n’est pas simple.
Une construction plus subtile fait appel au groupe d’automorphismes de G1 noté Aut(G1 ) : c’est le groupe
des bijections β de G1 dans lui-même qui respecte le produit de G1 (homomorphisme de groupe) : β(g10 .g1 ) =
β(g10 )β(g1 ). Supposons donné un homomorphisme de groupe ϕ d’un autre groupe G2 dans Aut(G1 ) : ∀g2 ∈
G2 , ϕ(g2 ) ∈ Aut(G1 ). On définit alors sur les paires (g1 , g2 ) le produit suivant

(g10 , g20 ).(g1 , g2 ) = (g10 .ϕ(g20 )g1 , g20 .g2 ) .

Exercice : montrer que ceci une structure de groupe sur l’ensemble de ces paires : c’est le produit semi-direct
de f G1 et G2 (pour un ϕ donné) et il est noté G1 oϕ G2 . Vérifier que le sous-groupe {(g1 , e)} ' G1 est un
sous-groupe invariant de G.
Exemples : le groupe des déplacements préservant l’orientation, engendré par les translations et les rotations
de l’espace euclidien Rn , est le produit semi-direct Rn o SO(n), avec (~a0 , R0 )(~a, R) = (~a0 + R0~a, R0 R). De même
le groupe de Poincaré dans l’espace de Minkowski est le produit semi-direct R4 o L.
[Conversely is any non simple group a semi-direct product ? See my notes of 1992.]
[Action d’un groupe sur un ensemble. Orbites. Petit groupe (stabilisateur)]

1.2 Groupes continus. Propriétés topologiques. Groupes

de Lie
Un groupe continu (ou encore groupe topologique) est un espace topologique (donc doté d’une
base de voisinages permettant de définir les notions de continuité etc 1 ) muni d’une structure
de groupe, telle que les opérations de groupe (g, h) 7→ g.h et g 7→ g −1 soient des fonctions
continues. Autrement dit, si g0 est proche (au sens de la topologie de G) de g et h0 de h, alors g0 .h0 est proche
−1
de g.h et g 0 est proche de g −1 .
Les groupes de matrices présentés plus haut entrent bien dans cette classe de groupes topo-
logiques, mais aussi des groupes “de dimension infinie” comme le groupe des difféomorphismes
invoqué en Relativité Générale, ou les groupes de jauge des théories de jauge.
Commençons par étudier quelques propriétés topologiques de tels groupes continus.

1. Voir l’Appendice B pour quelques rappels de vocabulaire. . .

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

1.2. Groupes continus. Propriétés topologiques. Groupes de Lie 37

x
1
x2
E
x
0

Figure 1.1 – Les lacets x1 et x2 sont homotopes. Mais aucun d’eux n’est homotope au lacet “trivial”
qui reste en x0 . L’espace n’est pas simplement connexe.

1.2.1 Connexité
Un groupe peut être ou non connexe. Si G n’est pas connexe, la composante connexe de l’identité
est un sous-groupe invariant.
On peut s’intéresser à la propriété de connexité au sens topologique général (un espace E est connexe si
ses seuls sous-espaces à la fois ouverts et fermés sont E et ∅), mais c’est surtout la connexité par arcs qui nous
concernera (pour toute paire de points, il existe un chemin continu les joignant). Démontrer que la composante
connexe de l’identité est un sous-groupe invariant dans l’une et l’autre définition. Réf. [K-S, Po]. [Pour la
connectivité par arcs, facile : si h(t) est une trajectoire continue de e à h, pour tout g, g.h(t).g −1 en est une de
e à g.h.g −1 , cqfd. ]
Exemples. O(3) est disconnexe et la composante connexe de l’identité est SO(3) ; pour le
groupe de Lorentz L=O(1,3) on a défini sa composante propre orthochrone L↑+ , les autres
“nappes” s’en déduisant via la parité P , le renversement du temps T et leur produit P T . . .

1.2.2 Simple connexité. Groupe d’homotopie. Recouvrement uni-

versel
La notion de simple connexité ne doit pas être confondue avec la précédente. Discutons-la
d’abord dans le cadre d’un espace topologique arbitraire E avant de nous spécialiser au cas
d’un groupe.
On considère les chemins fermés à extrémité fixée x0 ou lacets tracés dans l’espace E, c’est-
à-dire les applications continues x(t) de [0, 1] dans E telles que x(0) = x(1) = x0 . Étant donnés
deux tels chemins x1 (.) et x2 (.) de x0 à x0 , peut-on les déformer continûment l’un en l’autre ?
Autrement dit, existe-t-il une fonction continue f (t, ξ) de deux variables t, ξ ∈ [0, 1], à valeurs
dans E, telle que

∀ξ ∈ [0, 1] f (0, ξ) = f (1, ξ) = x0 : trajectoires fermées (1.11)

∀t ∈ [0, 1] f (t, 0) = x1 (t) f (t, 1) = x2 (t) : interpolation .

Si c’est le cas, on dit que les lacets x1 et x2 sont homotopes (c’est une relation d’équivalence),
ou encore qu’ils appartiennent à la même classe d’homotopie, voir Fig. 1.1.
On peut aussi composer les chemins : Si x1 (.) et x2 (.) sont deux lacets de x0 à x0 , le
chemin x2 ◦ x1 va aussi de x0 à x0 en parcourant d’abord x1 puis x2 . Le lacet inverse de

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

38 Chap.1. Groupes. Groupes et algèbres de Lie

x1 (.) pour cette composition est le lacet parcouru en sens inverse : x−1 1 (t) := x1 (1 − t). La
composition et le passage à l’inverse sont compatibles avec l’homotopie : si x1 ∼ x01 et x2 ∼ x02 ,
0 −1
alors x2 ◦ x1 ∼ x02 ◦ x01 et x−1
1 ∼ x1 . Ces opérations passent donc aux classes, ce qui munit
l’ensemble des classes d’homotopie d’une structure de groupe pour cette composition, c’est
le groupe d’homotopie π1 (E, x0 ). Ainsi, un représentant de la classe identité est fourni par le
lacet “trivial”, x(t) = x0 , ∀t. On montre enfin que les groupes relatifs à des extrémités x0
différentes sont isomorphes (dans un espace connexe) ; par exemple dans le cas d’un groupe
connexe, on peut se ramener au choix du point de base à l’identité x0 = e. On parle donc du
groupe d’homotopie (ou groupe fondamental) π1 (E). Pour plus de détails, voir par exemple
[Po], [DNF].
Si tous les lacets de x0 à x0 peuvent être contractés en le lacet trivial {x0 }, on dit que E
est simplement connexe. Dans le cas contraire, on démontre, et nous admettrons, que l’on peut
construire un espace E, e dit espace de recouvrement universel de E, tel que E e est simplement
connexe et que localement, E et E e sont homéomorphes. Cela signifie qu’il existe une appli-
cation continue surjective p de E e dans G tel que tout point x de E e ait un voisinage Vx et
que Vx 7→ p(Vx ) soit un homéomorphisme, c’est-à-dire une application bijective et bicontinue 2 .
L’espace Ee de recouvrement universel de x est unique (à un homéomorphisme près).
Dans le cas qui nous occupe où E = G est un groupe topologique, on montre que G e est
lui-même un groupe et que de plus, l’application p est un homomorphisme de G e dans G ([Po],
§ 51). Son noyau qui est un sous-groupe invariant n’est autre que le groupe d’homotopie π1 (G).
Le groupe quotient est isomorphe à G

e 1 (G) ' G ,
G/π (1.12)

(selon une propriété générale du groupe quotient par le noyau d’un homomorphisme, cf. § 1.1.6).
On peut construire le groupe de recouvrement universel G e en considérant les chemins qui joignent l’identité
e à un point g et leurs classes d’équivalence par déformation continue à extrémités fixes. G e est l’ensemble
de ces classes d’équivalence. C’est un groupe pour la multiplication des chemins définie comme suit : si deux
chemins g1 (t) et g2 (t) joignent e à g1 et à g2 respectivement, le chemin g1 (t).g2 (t) joint e à g1 .g2 . Cette loi de
composition est compatible avec l’équivalence et munit G e d’une structure de groupe et on montre que G e est
simplement connexe (cf. [Po] § 51). La projection p de G e dans G associe à toute classe de chemins leur extrémité
commune. On vérifie que c’est bien un homéomorphisme local et un homomorphisme de groupes, et que son
noyau est le groupe d’homotopie π1 (G).

Exemple : Le groupe des phases G =U(1), vu comme le cercle unité S 1 , n’est pas simplement
connexe : un chemin de l’identité 1 à 1 peut faire un nombre arbitraire de fois le tour du cercle et
ce nombre de tours (positif ou négatif) distingue les différentes classes d’homotopie : le groupe
d’homotopie est π1 (U(1)) = Z . Le groupe G e n’est autre que le groupe additif R qu’on peut
visualiser comme une hélice au-dessus du cercle U(1). Le quotient est R/Z ' U(1), ce qu’il faut
rapprocher du fait qu’un point de U(1), c’est-à-dire un angle, est un nombre réel modulo un
multiple entier de 2π. On peut dire encore π1 (S 1 ) = Z. Plus généralement on se convainc que

2. “bicontinue” signifie que l’application et son inverse sont continues.

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

1.2. Groupes continus. Propriétés topologiques. Groupes de Lie 39

g0 !y
x
g
1

g!1 y

(a) (b)

Figure 1.2 – (a) Le groupe U(1), identifié au cercle et son groupe de recouvrement universel R,
identifié à l’hélice. Un élément g ∈ U(1) se relève en des points · · · , g−1 , g0 , g1 , · · · sur l’hélice. (b)
3
Dans la boule B représentant SO(3), les points y et −y de la surface sont identifiés. Un chemin allant
de x à x via y et −y est donc fermé et non contractible : SO(3) est non simplement connexe.

pour les sphères, π1 (S n ) est trivial (tous les lacets sont contractibles) dès que n > 1 3 . [think of
a rubber band on an orange ].
Autre exemple fondamental : Le groupe des rotations SO(3) n’est pas simplement connexe,
comme cela a été pressenti au Chapitre 0. Pour nous en convaincre, visualisons la rotation Rn (ψ)
par le point x = tan ψ4 n d’un espace R3 auxiliaire ; ces points sont tous dans la boule B 3 de
rayon 1, avec la rotation identité au centre et les rotations d’angle π sur la surface de la sphère,
mais en raison de Rn (π) = R−n (π) , il faut identifier les points de la sphère diamétralement
opposés. Il s’ensuit qu’il existe dans SO(3) des courbes fermées non contractibles : une courbe
de x à x passant par deux points diamétralement opposés sur la sphère S 2 doit être considérée
comme fermée mais n’est pas contractible (Fig. 2). Il existe deux classes de chemins fermés
non homotopes et le groupe SO(3) est “doublement connexe” : son groupe d’homotopie est
π1 (SO(3)) = Z2 . En fait, nous connaissons déjà le groupe de recouvrement universel de SO(3) :
c’est le groupe SU(2), dont on a montré qu’il était homéomorphe à la sphère S 3 , donc simplement
connexe, et qu’il existait un homomorphisme l’envoyant dans SO(3), selon ±Un (ψ) = ±(cos ψ2 −
i sin ψ2 σ.n) 7→ Rn (ψ), cf. Chapitre 0, § 1.2.
Cette propriété de SO(3) d’être non simplement connexe peut être illustrée par différentes expériences de
salon, dont l’interprétation précise n’est pas toujours évidente, telles “la ceinture de Dirac” et “l’assiette de
Feynman”, voir [Link]
et [Link] pour des animations, et V. Stojanoska et O. Stoytchev,
Mathematical Magazine, 81, 2008, 345-357, pour une discussion détaillée impliquant le groupe des tresses.
[Quelle est la relation de la paramétrisation de SU(2) comme sphère S 3 avec la paramétrisation précédente
de SO(3) dans la boule de R3 ? Rép : la boule apparaı̂t comme la section équatoriale de la sphère S 3 , avec
projection stéréogr. cf [Link].]
Cette même visualisation des rotations par l’intérieur de la boule unité permet de comprendre l’assertion
faite plus haut que le groupe SO(3) est simple. Supposons qu’il ne le soit pas, et soit R = Rn (ψ) un élément
d’un sous-groupe invariant de SO(3), qui contient aussi tous les conjugués de R (par définition d’un sous-

3. En particulier π1 (S 2 ) = 0 et “you cannot lasso a basketball” selon la formule imagée de S. Coleman !

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

40 Chap.1. Groupes. Groupes et algèbres de Lie

groupe invariant). Ces conjugués sont visualisés par les points de la sphère de rayon tan ψ/4. Le sous-groupe
invariant contenant Rn (ψ) et des points arbitrairement proches de son inverse R−n (ψ) contient des points
arbitrairement proches de l’identité, qui par conjugaison, remplissent une petite boule au voisinage de l’identité.
Il reste à montrer que le produit de tels éléments permet de remplir toute la boule, c’est-à-dire que le sous-groupe
invariant ne peut être que le groupe SO(3) tout entier ; ceci est en fait vrai pour tout groupe de Lie connexe,
comme on le verra plus bas.

Autres exemples : les groupes classiques. On démontre que

• les groupes SU(n) sont tous simplement connexes, pour tout n, tandis que π1 (U(n)) = Z ;
• pour le groupe SO(2)∼= U(1), on a vu que π1 (SO(2))= Z ;
• pour tout n > 2, SO(n) est doublement connexe, π1 (SO(n))= Z2 , et on appelle Spin(n)
son groupe de recouvrement universel. Donc Spin(3)=SU(2).
[On montre π1 (Sp(n))= 0 et π1 (U(n))= Z] La notion d’homotopie, c’est-à-dire de déformation continue,
qu’on vient d’appliquer à des lacets, c’est-à-dire à des applications de S 1 dans une variété V (un groupe G ici),
peut s’étendre à des applications d’une sphère S n dans V. Même si la composition de telles applications est
moins aisée à visualiser, elle peut être définie et est à nouveau compatible avec l’homotopie, ce qui conduit à la
définition du groupe d’homotopie πn (V). Par exemple πn (S n ) = Z. Voir [DNF] pour plus de détails et des calculs
de ces groupes πn . Cette notion est importante pour le physicien pour décrire des défauts topologiques, solitons,
instantons, monopoles, etc. Voir par exemple sur la Fig. 1.3 deux configurations de vortex ou d’anti-vortex de
vecteurs unitaires à deux dimensions, de nombre d’enroulement (ou vorticité) respectif ±1.

Figure 1.3 – Deux configurations de vecteurs unitaires réalisant des applications S 1 → S 1 homoto-
piquement non triviales. Ce sont respectivement les vortex et anti-vortex du modèle XY de mécanique
statistique, voir par exemple [Link] pour plus de détails
et de belles figures.

1.2.3 Groupes compacts et non compacts

Si le domaine D dans lequel vivent les paramètres du groupe G est compact, on dit que G est
un groupe compact.
Rappelons la définition et quelques-unes des nombreuses propriétés d’un espace compact E. Un e.t. séparé
E est compact si, étant donné un recouvrement de E par un ensemble d’ouverts Ui , E peut être recouvert
par un nombre fini d’entre eux. Alors, toute suite infinie y admet un sous-suite convergente (généralisation du
théorème de Bolzano–Weierstrass). Toute fonction réelle continue y est bornée, etc. Pour un domaine D de Rd ,
la propriété de compacité équivaut à la propriété de D d’être fermé et borné. [La propriété BW n’implique la
compacité que dans un espace métrisable, c’est-à-dire dont la topologie émane d’une distance.]
Exemples. Les groupes de matrices unitaires U(n) et leurs sous-groupes SU(n), O(n), SO(n),
USp(n/2) (n pair), sont compacts. Les groupes SL(n, R) ou SL(n, C), Sp(n, R) ou Sp(n, C), le

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

1.2. Groupes continus. Propriétés topologiques. Groupes de Lie 41

groupe de translation dans Rn , le groupe de Galilée, les groupes de Lorentz et Poincaré ne le

sont pas, pourquoi ?

1.2.4 Mesure invariante de Haar

Quand on traite d’un groupe fini, on est souvent amené à considérer des sommes sur tous les
éléments du groupe et à utiliser le “lemme de réarrangement”, qui consiste à écrire
X X X
∀g 0 ∈ G f (g 0 g) = f (g 0 g) = f (g) ,
g∈G h=g 0 g∈G g∈G

(invariance à gauche), la même chose avec g 0 g changé en gg 0 (invariance à droite), et aussi

X X X
f (g −1 ) = f (g −1 ) = f (g) .
g∈G g −1 ∈G g∈G

On aimerait pouvoir effectuer de telles opérations dans le cas d’un groupe continu, la somme
finie étant remplacée par une intégrale, finie et dotée des mêmes invariances. Cela nécessite de
pouvoir disposer d’une mesure d’intégration invariante à gauche et à droite

dµ(g) = dµ(g 0 .g) = dµ(g.g 0 ) = dµ(g −1 )

R
telle que dµ(g)f (g) soit finie pour toute fonction f continue.
On démontre que
• si le groupe est compact, une telle mesure existe et est unique à une normalisation près.
C’est la mesure de Haar.
Par exemple, pour le groupe unitaire U(n), on peut construire la mesure de Haar explici-
tement. On peut utiliser la méthode proposée au chapitre 0, Appendice 0 : on définit d’abord
une métrique sur U(n) en écrivant ds2 = tr [Link] † dans la paramétrisation de son choix ; cette
métrique est bien invariante par U → U U 0 ou U → U 0 U et par U → U −1 = U † ; la mesure
dµ(U ) qu’on en tire a les mêmes propriétés. On trouvera dans l’Appendice C le calcul explicite
de cette mesure pour SU(2) et U(n), et plus de détails en TD.
Inversement si le groupe n’est pas compact, les mesures invariantes à gauche et à droite peuvent exister,
elles peuvent même coı̈ncider (groupes non compacts abéliens ou semi-simples), mais leur intégrale sur le groupe
diverge.
Ainsi, si G est localement compact, (c’est-à-dire tout point a une base de voisinages compacts), on démontre
qu’il existe une mesure invariante à gauche, unique à une constante près. Il existe aussi une mesure invariante
à droite, mais elles peuvent ne pas coı̈ncider. Exemple
( ! )
y x
G= x, y ∈ R, y > 0
0 1

on vérifie aisément que dµL (g) = y −2 dxdy , dµR (g) = y −1 dxdy sont les mesures invariantes à gauche et à
droite, respectivement, et que leurs intégrales divergent. Réf. [Bu]. [La conjugaison étant un automorphisme de
G, la mesure dµL (h−1 gh) = δ(h)dµL (g), avec δ(h) > 0 et on vérifie aisément que δ(g) est un “quasi-caractère” :
R R
δ(g)δ(h) = δ(gh). Or par l’invariance à gauche, ∀f , f (gh)dµL (h) = f (h)dµL (h), donc
Z Z Z
−1
δ(g) f (h)dµL (h) = f (g.g .h.g)dµL (h) = f (hg)dµL (h) =

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

42 Chap.1. Groupes. Groupes et algèbres de Lie

donc en appliquant cette identité à δf et en divisant par δ(g)

Z Z
f (h)δ(h)dµL (h) = f (hg)δ(h)dµL (h)

c’est-à-dire δ(g)dµL (g) est une mesure invariante à droite. Dans l’exemple précédent, δ(x, y) = y, comme il le
faut pour retrouver dµR à partir de dµL . ]

1.2.5 Groupes de Lie

En imposant davantage de structure à un groupe continu, nous sommes amenés à la notion de
groupe de Lie.
Selon la définition la plus usuelle, un groupe de Lie est un espace topologique muni d’une loi de groupe, (un
groupe topologique), qui en outre est une variété différentiable et qui est tel que les lois de composition et de
passage à l’inverse G × G → G et G → G soient des fonctions infiniment différentiables. On impose parfois que
ce soit des fonctions analytiques réelles, c’est-à-dire des fonctions dont le développement de Taylor converge vers
la fonction considérée. Le fait que l’une et l’autre de ces deux propriétés se trouvent dans la littérature laisse
présager que la plus faible (différentiabilité) implique la plus forte (analyticité). En fait, selon un théorème très
puissant de Montgomery et Zippen (1955), des hypothèses beaucoup plus faibles suffisent à assurer la propriété
de groupe de Lie. Un groupe topologique connexe qui est localement homéomorphe à Rd , d fini, est un groupe de
Lie. Autrement dit, l’existence de coordonnées locales (en nombre fini) et les propriétés de groupe topologique
(la continuité des opérations de groupe) suffisent à entraı̂ner les propriétés d’analyticité ! 4 Ceci laisse entrevoir
que la structure de groupe de Lie est très puissante et très rigide. Cela dit, il existe des groupes de Lie de
dimension infinie.
[Hilbert’s 5th problem (Montgomery-Zippen Theorem) proved that for any topological group, there is at
most one differentiable structure on it that endows it with a Lie group structure. Consequently, one may assume
that a Lie group has C1 charts, and it will turn out that they are in fact real-analytic. [Jack Hall thesis]]
Rx
[équation fonct. f continue, f (x)f (y) = f (x + y). Soit F la primitive F (x) = 0 f (x0 )dx0 . On a F (x + y) −
R x+y Ry
F (x) = x f (x0 )dx0 = 0 f (x0 + x)dx0 = f (x)F (y). Donc F (x + y) = F (x) + f (x)F (y) = F (y) + f (y)F (x),
donc (f (y)−1)F (x) = (f (x)−1)F (y), c’est-à-dire (f (x)−1)/F (x) est indépendant de x, donc F 0 (x)−1 = kF (x)
etc. ]
[Pour échapper au théorème de M–Z, il faut aller chercher des exemples non triviaux. Par exemple : [Robert
Coq.] Soit M une variété différentiable de dimension finie et G un groupe de Lie (de dimension finie ou infinie)
et on considère le groupe C ∞ (M, G) des applications infiniment différentiables de M dans G. Lorsque M n’est
pas compacte, ce groupe C ∞ (M, G) n’est pas – en général – de Lie. Voir arXiv :math/0703460v2 [[Link]]]
Pour ne pas rentrer dans une discussion mathématique inutile pour nos besoins, nous nous
restreindrons à des groupes continus de matrices de taille finie. Pour un tel groupe, les éléments
de matrices de g ∈ G dépendent de façon continue de paramètres réels (ξ 1 , ξ 2 , · · · ξ d ) ∈ D ⊂ Rd ,
00
et dans l’opération du groupe g(ξ 00 ) = g(ξ 0 ).g(ξ), ou dans l’inverse g(ξ)−1 = g(ξ 00 ), les ξ i sont
fonctions continues et en fait analytiques des ξ j (et des ξ 0j ). Un tel groupe est appelé groupe de
Lie, et d est appelé sa dimension.
Pour être plus précis, dans l’esprit de la géométrie différentielle, il faut en général introduire plusieurs
domaines Dj , avec des fonctions de recollement continues, et en fait analytiques, etc.

4. Pour un exemple élémentaire d’un tel phénomène, considérer une fonction f d’une variable réelle satis-
faisant f (x)f (y) = f (x + y). Sous la seule hypothèse que f est continue, démontrer que f (x) = exp kx, donc
qu’elle est analytique !

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

1.3. Étude locale d’un groupe de Lie. Algèbre de Lie 43

[Le théorème d’Ado dit que toute alg de Lie admet une représentation fidèle sur une alg de matrices. La
propriété n’est pas vraie pour un groupe. Ainsi soit
     
 1
 a c 
  1
 0 n 

N = 0 1 b  , a, b, c ∈ R et Z = 0 1 0 , n ∈ Z
   
   
0 0 1 0 0 1
   

Z est un sous-groupe invariant de N , mais le groupe de Lie N/Z ne peut être considéré comme un groupe de
matrices. Voir dans Dubrovin et al (vol 2, chap 1, §3.2) un autre exemple de même nature : un groupe a un
sous-groupe à un paramètre qui intersecte un nombre infini de fois le centre sans être contenu dans ce centre.
Ceci est incompatible avec l’existence d’une représentation fidèle de G dans un GL(n). Hilbert’s 5th problem :
Lie’s Concept of a Continuous Group of Transformations without the Assumption of the Differentiability of
the Functions Defining the Group. Definition. Define a Lie group to be a group which has the structure of a
C ∞ differentiable manifold, such that the group operations are smooth. Clearly Lie groups are locally compact
since they are locally Euclidean. 5.1. Theorem (Gleason-Montgomery-Zippen). Let G be a locally Euclidean
topological group which is connected. Then G admits a differentiable manifold structure making it into a Lie
group. Proof. This is difficult. The proof constitutes an affirmative solution to Hilbert’s fifth problem. [MZ55]. ]
Exemples : tous les groupes de matrices présentés plus haut sont des groupes de Lie. Vérifier
que la dimension de U(n) est n2 , celle de SU(n) est n2 −1, celle de O(n) ou SO(n) est n(n−1)/2.
Quelle est celle de Sp(2n, R) ? du groupe de Galilée dans R3 ? des groupes de Lorentz et de
Poincaré ? Montrer que dim(Sp(2n, R))=dim(USp(n))=dim(SO(2n+1)). Nous verrons plus bas
au Chap. 3 que cela n’est pas un accident. [dim = n(2n + 1)]

Dans l’étude d’un groupe de Lie et de ses représentations, on est conduit à se livrer à une
double étude : d’une part une étude locale de son espace tangent au voisinage de l’identité (son
algèbre de Lie), et d’autre part, une étude globale sur la topologie du groupe, information que
ne révèle pas l’étude locale.

1.3 Étude locale d’un groupe de Lie. Algèbre de Lie

1.3.1 Algèbres et algèbres de Lie. Définitions

On rappelle d’abord la définition d’une algèbre.
Une algèbre est un espace vectoriel sur un corps (en pratique, toujours R ou C pour nous), doté
d’un produit noté X ∗ Y , (pas nécessairement associatif), bilinéaire en X et Y

(λ1 X1 + λ2 X2 ) ∗ Y = λ1 X1 ∗ Y + λ2 X2 ∗ Y
X ∗ (µ1 Y1 + µ2 Y2 ) = µ1 X ∗ Y1 + µ2 X ∗ Y2 . (1.13)

Exemples : l’ensemble des matrices n×n à coefficients réels ou complexes, M (n, R) ou M (n, C),
est une algèbre associative pour le produit matriciel usuel ; l’ensemble des vecteurs de R3 est
une algèbre (non associative !) pour le produit vectoriel (noté ∧ dans la littérature française et
× dans l’anglo-saxonne).

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

44 Chap.1. Groupes. Groupes et algèbres de Lie

Une algèbre de Lie est une algèbre dont le produit noté [X, Y ] et appelé crochet de Lie a la
propriété supplémentaire d’être antisymétrique et de satisfaire l’identité de Jacobi

[X, Y ] = −[Y, X]
[X1 , [X2 , X3 ]] + [X2 , [X3 , X1 ]] + [X3 , [X1 , X2 ]] = 0 . (1.14)

[Jacobi donne le défaut d’associativité [X1 , [X2 , X3 ]] − [[X1 , X2 ], X3 ] = −[X2 , [X3 , X1 ]].]
Exemples : Toute algèbre associative pour un produit noté ∗, en particulier toute algèbre
de matrices, est une algèbre de Lie pour le crochet de Lie défini par le commutateur

[X, Y ] = X ∗ Y − Y ∗ X .

Les propriétés de bilinéarité et d’antisymétrie sont évidentes, et l’identité de Jacobi est vérifiée
au prix d’une ligne de calcul. Autre exemple : l’algèbre des vecteurs de R3 pour le produit vec-
toriel mentionné précédemment est en fait une algèbre de Lie, l’identité de Jacobi est aisément
vérifiée compte tenu de la formule connue du “double produit vectoriel”, u ∧ (v ∧ w) =
(u.w)v − (u.v)w. Si on écrit (v ∧ w)i = ijk vj wk en termes du tenseur complètement anti-
symétrique , l’identité de Jacobi est celle rencontrée en (0.27).

1.3.2 Espace tangent d’un groupe de Lie G

Soit G un groupe de Lie. On considère un sous-groupe à un paramètre g(t), où t est un paramètre
réel prenant ses valeurs dans un voisinage de 0, avec g(0) = e ; autrement dit, il s’agit d’une
courbe (supposée différentiable) dans G passant par l’origine, et on suppose que (toujours au
voisinage de 0),
g(t1 )g(t2 ) = g(t1 + t2 ) g −1 (t) = g(−t) . (1.15)
La loi de composition de ce sous-groupe équivaut donc localement à l’addition des paramètres
t ; autrement dit, localement, ce groupe à un paramètre est isomorphe au groupe abélien R. Il
est donc naturel de différencier

g(t + δt) = g(t)g(δt) ⇔ g −1 (t)g(t + δt) = g(δt) . (1.16)

Puisque nous avons choisi de nous restreindre à des groupes de matrices, (avec e ≡ I, la matrice
identité), nous pouvons écrire l’application linéaire tangente sous la forme

g(δt) = I + δtX + · · ·

ce qui définit un vecteur X dans l’espace tangent. On écrit encore

d
X= g(t) , (1.17)
dt t=0

c’est le vecteur vitesse en t = 0 (ou en g = e) le long de la courbe. L’équation (1.16) se récrit

donc
g 0 (t) = g(t)X . (1.18)

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

1.3. Étude locale d’un groupe de Lie. Algèbre de Lie 45

Comme il est habituel en géométrie des variétés, (cf Appendice B.3), l’espace tangent Te G
en e au groupe G, que nous noterons désormais g, est l’espace vectoriel engendré par les vecteurs
X tangents à tous les sous-groupes à un paramètre (=tous les vecteurs vitesse). Si on a choisi
dans G des coordonnées ξ α au voisinage de e, un vecteur tangent est un opérateur différentiel
X = X α ∂ξ∂α . La dimension de g (comme espace vectoriel) égale celle du groupe G, définie
comme le nombre de paramètres (réels), dim g = dim G.
Dans le cas auquel nous nous restreignons d’un groupe G ⊂ GL(n, R), X ∈ g ⊂ M (n, R),
l’ensemble des matrices réelles n × n, et on peut effectuer tous les calculs dans cette algèbre.
En particulier, on peut intégrer (1.18) selon
X tn
g(t) = exp tX = Xn , (1.19)
n=0
n!

une somme toujours convergente. (En fait on peut se passer de l’hypothèse que le groupe est
un groupe matriciel, à condition de donner un sens à l’application exp de g dans G, application
dotée des propriétés usuelles de l’exponentielle, cf Appendice B4.)

1.3.3 Relations entre l’espace tangent g et le groupe G

1. Si G est le groupe linéaire GL(n, R), g est l’ensemble des matrices réelles n×n, noté M (n, R).
Si G est le groupe de matrices unitaires U(n), g est l’ensemble des matrices antihermitiennes
n × n. Elles sont en outre de trace nulle si G = SU(n). De même, pour le groupe orthogonal
O(n), g est constitué des matrices antisymétriques, et donc de trace nulle.
Pour le groupe symplectique G =USp(n), g est engendré par les matrices quaternioniques “antiselfduales”, cf.
Appendice A.
Dans chacun de ces cas, vérifier que la propriété caractéristique (anti-hermiticité, antisymétrie,
trace nulle, . . .) est préservée par le commutateur, ce qui fait bien de g une algèbre de Lie.
2. L’application exponentielle joue un rôle important dans la reconstruction du groupe de Lie
G à partir de son espace tangent g. On démontre, et nous admettrons,
– que l’application X ∈ g 7→ eX ∈ G est bijective au voisinage de l’identité ;
– qu’elle est surjective (= elle atteint tout élément de G) si G est connexe et compact ;
– qu’elle est injective (un g ∈ G n’a qu’un seul antécédent) seulement si G est simplement
connexe. Un exemple de non injectivité est fourni par G =U(1), pour lequel g = iR et
tous les i(x+2πk), k ∈ Z ont la même image par exp. La réciproque est en général fausse :
par exemple, dans SU(2) qui est simplement connexe, si n est de norme 1, eiπn.σσ = −I,
σ de g =su(2) ont même image !
donc tous les éléments iπ n.σ
? Exemple de groupe non compact pour lequel l’application exp n’est pas surjective : G=SL(2,R), pour
lequel g =sl(2,R), ensemble des matrices réelles de trace nulle. Pour toute matrice A ∈ g, donc de trace
nulle, montrer en utilisant son équation caractéristique que tr A2n+1 = 0, tr A2n = 2(− det A)n , donc tr eA =
√
2 cosh − det A ≥ −2. Cependant il existe dans G des matrices de trace < −2, par exemple diag (−2, − 12 ).
? Pour un groupe non compact, l’application exponentielle est aussi utile. On démontre que tout élément
d’un groupe de Lie matriciel peut s’écrire comme le produit d’un nombre fini d’exponentielles d’éléments de son
algèbre de Lie. [Cornwell p 151].

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

46 Chap.1. Groupes. Groupes et algèbres de Lie

? On a encore det eX = etr X , une propriété qu’on établit aisément si X appartient à l’ensemble des matrices
diagonalisables. Ces dernières étant denses dans M (d, R), la propriété est vraie en général.

1.3.4 L’espace tangent comme algèbre de Lie

On va maintenant montrer que l’espace tangent g en e ≡ I au groupe de Lie G est muni d’une
structure d’algèbre de Lie. Étant donnés deux groupes à un paramètre engendrés par deux
éléments distincts X et Y de g, nous mesurons leur défaut de commutativité en formant leur
commutateur (dans un sens différent du sens usuel !) g = etX euY e−tX e−uY ; pour t ∼ u petits,
ce g est proche de l’identité, donc s’écrit g = exp Z, Z ∈ g. Calculons Z au premier ordre non
trivial

etX euY e−tX e−uY = (I + tX + 21 t2 X 2 )(I + uY + 12 u2 Y 2 )(I − tX + 21 t2 X 2 )(I − uY + 12 u2 Y 2 )

= I + (XY − Y X)tu + O(t3 ) . (1.20)

On a effectué le calcul dans l’algèbre (associative) des matrices, l’élément neutre a été noté I.
Tous les termes négligés sont du 3ème ordre puisque t ∼ u. À l’ordre 2, on voit donc apparaı̂tre
le commutateur XY − Y X au sens habituel, c’est-à-dire le crochet de Lie des matrices X et Y .
En général, pour un groupe de Lie quelconque, on définit le crochet par

etX euY e−tX e−uY = eZ , Z = tu[X, Y ] + O(t3 ) (1.21)

et on démontre que ce crochet a les propriétés (1.14) d’un crochet de Lie.

Ce résultat fondamental découle d’une discussion détaillée de la forme locale des opérations dans un groupe
de Lie (“équations de Lie”, voir par exemple [OR]).

• Application adjointe dans l’algèbre de Lie g. Formule de Baker-Campbell-Hausdorff

Introduisons une notation commode. Pour tout X ∈ g, soit ad X l’opérateur linéaire dans
l’algèbre de Lie défini par
Y 7→ (ad X)Y := [X, Y ] , (1.22)
et donc
(ad p X)Y = [X, [X, · · · [X, Y ] · · · ]]
avec p crochets (commutateurs).
Étant donnés deux éléments X et Y de g, eX et eY les éléments de G qu’ils engendrent,
existe-t-il Z ∈ g tel que eX eY = eZ ? La réponse est positive, au moins pour X et Y suffisamment
petits.
Notons d’abord que si [X, Y ] = 0, les règles du calcul ordinaire s’appliquent et Z = X+Y . En
général, la formule de Baker-Campbell-Hausdorff, que nous admettrons, donne une expression
explicite de Z.

eX eY = eZ Z 1
Z = X+ dtψ(exp ad X exp t ad Y )Y (1.23)
0

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

1.3. Étude locale d’un groupe de Lie. Algèbre de Lie 47

où ψ(.) est la fonction

u ln u 1 1
ψ(u) = = 1 + (u − 1) − (u − 1)2 + · · · , (1.24)
u−1 2 6
régulière en u = 1. Explicitement, les premiers termes du développement en puissances de X
et Y s’écrivent
1 1
Z = X + Y + [X, Y ] + [X, [X, Y ]] + [Y, [Y, X]] + · · · (1.25)
2 12

La formule admet des cas particuliers intéressants à connaı̂tre. Ainsi si X et Y commutent avec [X, Y ], on
a simplement
1 1
eX eY = eX+Y + 2 [X,Y ] = eX+Y e 2 [X,Y ] , (1.26)

formule qu’on démontre en utilisant l’identité vraie en général

∞
X 1
eX Y e−X = ad n X Y (1.27)
0
n!

(qui n’est autre que le développement de Taylor à t = 0 de etX Y e−tX évalué en t = 1) et en écrivant et en
résolvant l’équation différentielle satisfaite par f (t) = etX etY , f (0) = 1

f 0 (t) = (X + etX Y e−tX )f (t) (1.28)

= (X + Y + t[X, Y ])f (t) . (1.29)

Par ailleurs, au premier ordre en Y , on peut remplacer l’argument de ψ dans (1.23) par exp ad X et on voit
qu’on a
∞
X Bn n
Z=X+ (−1)n (ad X) Y + O(Y 2 ) (1.30)
n=0
n!
n
t
= 0 Bn tn! , B0 = 1, B2 = 16 , B4 = − 30
1
et en dehors de B1 = − 21 ,
P
où les Bn sont les nombres de Bernoulli : et −1
tous les B d’indice impair sont nuls. Toujours au premier ordre en Y , on a encore
Z 1
eX+Y = eX + dt etX Y e(1−t)X + O(Y 2 )
0

qu’on obtient en écrivant et en intégrant l’équation différentielle satisfaite par F (t) = exp t(X + Y ). exp −tX.
La convergence des expressions peut se démontrer pour X et Y assez petits. Bien noter
que cette formule de BCH ne fait appel qu’à l’application ad dans l’algèbre de Lie, et non
à la multiplication ordinaire des matrices de GL(d, R). C’est cela qui lui donne un caractère
canonique et universel.

1.3.5 Un exemple explicite : l’algèbre de Lie so(n) de SO(n)

De la définition des éléments de g comme vecteurs tangents à G en e ≡ I, ou encore de la
construction de sous-groupes à un paramètre associés à chaque X ∈ g, il découle l’interprétation
de X comme “générateur infinitésimal” du groupe G. Le calcul concret de l’algèbre de Lie d’un
groupe de Lie donné G peut s’effectuer de diverses façons, selon la manière dont on définit ou
représente le groupe.

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

48 Chap.1. Groupes. Groupes et algèbres de Lie

Si on a une paramétrisation explicite des éléments de G en termes de d paramètres réels, les

générateurs infinitésimaux s’obtiennent par différentiation par rapport à ces paramètres. Voir
au chapitre 0, le cas explicite de SO(3) ou SU(2) traité de cette façon.
Si le groupe a été défini comme groupe d’invariance d’une forme quadratique dans des
variables x, on peut en tirer une expression des générateurs infinitésimaux comme opérateurs
différentiels en x. Illustrons cela sur le groupe O(n), groupe d’invariance de la forme ni=1 x2i . La
P

transformation linéaire la plus générale laissant cette forme invariante s’écrit x → x0 = Ox, avec
O orthogonale. Sous forme infinitésimale, O = I +ω, et ω = −ω T est une matrice antisymétrique
arbitraire. Une transformation infinitésimale de la forme δxi = ω i j xj peut encore s’écrire

δxi = ω i j xj = − 21 ω kl Jkl xi (1.31)

Jkl = xk ∂l − xl ∂k : Jkl xi = xk δil − xl δik (1.32)

(notons que nous nous autorisons à monter et descendre librement les indices, ce qui est jus-
tifié avec la métrique de signature (+)n ). On dispose ainsi d’une représentation explicite des
générateurs infinitésimaux de l’algèbre so(n). C’est alors un calcul simple de calculer les rela-
tions de commutation 5

[Jij , Jkl ] = δil Jjk − δik Jjl − δjl Jik + δjk Jil . (1.33)

(Autrement dit, les seuls commutateurs non nuls sont de la forme [Jij , Jik ] = −Jjk pour tout
triplet i 6= j 6= k 6= i, et tous ceux qui s’en déduisent par antisymétrie dans les indices.)
On peut enfin procéder autrement, en utilisant une base des matrices de l’algèbre de Lie,
considérée comme ensemble des matrices antisymétriques n × n. Une telle base est donnée par
des matrices Aij indexées par des paires d’indices 1 ≤ i < j ≤ n, d’éléments de matrice

(Aij )kl = δik δjl − δil δjk .

Autrement dit, la matrice Aij n’a que deux éléments non nuls (et opposés), à l’intersection de
la ligne i et de la colonne j et vice versa. Vérifier que ces matrices Aij ont les relations de
commutation données par (1.33).
Exercice : répéter cette discussion et le calcul des relations de commutation pour le groupe SO(p, q) d’inva-
Pp Pp+q
riance de la forme i=1 x2i − i=p+1 x2i . On introduira le tenseur métrique g = diag ((+1)p , (−1)q ).

Application physique. Courants de Noether du “modèle O(n)”

Une théorie des champs très souvent étudiée (cf. cours de F. David et Chap. 4) est le modèle
O(n). Son lagrangien, écrit ici dans la version euclidienne de la théorie et pour un champ
bosonique φ = {φk } réel à n composantes,
1 1 λ 2 2
L = (∂φ φ)2 + m2φ2 + (φ φ) (1.34)
2 2 4
est invariant sous l’effet des rotations de O(n). Les courants de Noether se calculent en considérant
ij
P
des transformations infinitésimales du type précédent δφ φ = φ
i<j δω Aij , ou, en compo-
(ij)
santes, δφk = ij k l
= ∂∂∂L k l
P
i<j δω (Aij ) l φ , donc (à un possible facteur près) jµ µ φk (Aij ) l φ =

5. Noter que par rapport au calcul mené pour le groupe O(1,3) au chapitre 0, § 0.6.2, nous avons changé nos
conventions et adopté ici des générateurs infinitésimaux antihermitiens.

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

1.4. Relations entre les propriétés de g et de G 49

∂µ φk (Aij )kl φl . Vérifier en utilisant l’antisymétrie des matrices A et l’équation d’Euler–Lagrange

que ces courants sont bien de divergence nulle, ce qui implique la conservation de dim so(n) =
1
2
n(n − 1) “charges”.

1.3.6 Un exemple de dimension infinie : l’algèbre de Virasoro

Dans ces notes nous avons convenu de nous restreindre à des groupes et algèbres de Lie de dimension finie.
Donnons ici un exemple de dimension infinie. On s’intéresse aux difféomorphismes z 7→ z 0 = f (z) où f est une
fonction analytique (holomorphe) de son argument sauf en 0 et à l’infini. (On parle aussi des “difféomorphismes
du cercle”.) C’est à l’évidence un groupe et une variété de dimension infinie, et cela se manifeste dans son
algèbre des difféomorphismes infinitésimaux z 7→ z 0 = z + (z), engendrés par les opérateurs différentiels `n
∂
`n = −z n+1 , n∈Z (1.35)
∂z
qui satisfont
[`n , `m ] = (n − m)`n+m . (1.36)
comme un calcul immédiat le montre. Cette algèbre est l’algèbre de Witt. C’est sous la forme de son extension
centrale (cf. chap. 2), où on lui ajoute un générateur c supplémentaire “central”, c’est-à-dire commutant avec tous
les générateurs, que cette algèbre, dite alors algèbre de Virasoro, est la plus intéressante. Appelons maintenant
Ln et c les générateurs
c
[Ln , Lm ] = (n − m)Ln+m + n(n2 − 1)δn,−m [c, Ln ] = 0 . (1.37)
12
(On peut penser aux Ln comme réalisant dans une théorie quantique des champs les opérateurs `n , le terme c
résultant d’effets quantiques. . .)
Vérifier que l’identité de Jacobi est bien satisfaite par cette algèbre. On montre que c’est l’extension centrale
la plus générale de (1.36) respectant l’identité de Jacobi. Montrer que la sous-algèbre engendrée par L±1 , L0 n’est
pas affectée par le terme central. Quelle est l’interprétation géométrique des transformations correspondantes˜ ?
L’algèbre de Virasoro joue un rôle central dans la construction des théories de champs invariantes conformes
et dans leur application à la physique des phénomènes critiques bidimensionnels et à la théorie des cordes. . ..
Plus de détails dans [DFMS].

1.4 Relations entre les propriétés de g et de G

Certaines propriétés du groupe G se traduisent sur son algèbre de Lie g.

1.4.1 Simplicité, semi-simplicité

Considérons la version infinitésimale de la notion de sous-groupe invariant. Un idéal (on dit
aussi une sous-algèbre invariante) dans une algèbre (de Lie) g est un sous-espace I de g stable
par multiplication (au sens du crochet de Lie) par un élément quelconque de g, c’est-à-dire tel
que [I, g] ⊂ I. L’idéal est dit abélien si [I, I] = {0}.
Une algèbre de Lie g est simple si g n’a pas d’autre idéal que {0}. Elle est semi-simple si g
n’a pas d’autre idéal abélien que {0}.
Exemple. Considérons l’algèbre de Lie de SO(4), notée so(4), cf les formules données en
(1.33) pour so(n). On vérifie aisément que les combinaisons
1 1 1
A1 := (J12 − J34 ), A2 = (J13 + J24 ), A3 := (J14 − J23 )
2 2 2

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

50 Chap.1. Groupes. Groupes et algèbres de Lie

commutent avec
1 1 1
B1 := (J12 + J34 ), B2 = (−J13 + J24 ), B3 := (J14 + J23 )
2 2 2
et que
[Ai , Aj ] = ijk Ak [Bi , Bj ] = ijk Bk , [Ai , Bj ] = 0

où on reconnaı̂t deux copies commutantes de l’algèbre so(3). On écrit so(4)=so(3)⊕ so(3). À
l’évidence l’algèbre so(4) n’est pas simple, mais elle est semi-simple.
Bien noter la différence entre ce cas de so(4) et le cas de l’algèbre so(1,3) étudiée au chapitre 0, § 0.6.2. Là, la
signature indéfinie nous a obligés à complexifier l’algèbre pour “découpler” les deux copies de l’algèbre so(3).
On a les relations suivantes
G simple =⇒ g simple
G semi-simple =⇒ g semi-simple
mais la réciproque n’est pas vraie ! Plusieurs groupes de Lie différents peuvent en effet avoir la
même algèbre de Lie, tels SO(3) qui est simple, et SU(2) qui n’est pas semi-simple, comme on
l’a vu plus haut au § 1.1.7. 6

1.4.2 Compacité. Complexification

Une algèbre de Lie semi-simple est dite compacte si elle est l’algèbre de Lie d’un groupe de
Lie compact.
A ce stade, cette définition semble non intrinsèque à l’algèbre, et liée au groupe de Lie dont elle est issue.
On verra plus bas une condition (critère de Cartan) qui permet de s’affranchir de cette relation.
Il faut aussi examiner la notion de complexification. Plusieurs groupes distincts peuvent avoir
des algèbres de Lie différentes mais qui deviennent isomorphes si on autorise la complexification
des paramètres. Par exemple les groupes O(3) et O(2,1), l’un compact, l’autre non, ont pour
algèbres de Lie

 X1 = z∂y − y∂z

o(3) X2 = x∂z − z∂x [X1 , X2 ] = y∂x − x∂y = X3 etc

X3 = y∂x − x∂y


e2 ] = y∂x − x∂y = X
 X1 = z∂y + y∂z [X
 e e1 , X e3
o(2, 1) X
e2 = x∂z + z∂x [X
e2 , Xe3 ] = −z∂y − y∂z = −Xe1 (1.38)

X3 = y∂x − x∂y [X
e3 , Xe1 ] = −x∂z − z∂x = −X
 e e2

qui ne sont pas isomorphes sur les réels, mais iX e2 et −X

e 1 , iX e3 vérifient l’algèbre o(3). On
dit que les algèbres o(3) et o(2,1) ont la même complexifiée, et qu’elles en sont des formes
réelles, mais seule la forme réelle o(3) (ou so(3)=su(2)) de cette complexifiée est compacte.
6. Attention ! Certains auteurs appellent “simple” tout groupe de Lie dont l’algèbre de Lie est simple. Cela
revient à faire une distinction entre le concept de groupe simple et groupe de Lie simple. Ce dernier est tel
qu’il ne possède pas de sous-groupe de Lie invariant non trivial. Le groupe de Lie SU(2) est simple au sens des
groupes de Lie, mais pas simple au sens général des groupes (il a un sous-groupe invariant Z2 qui n’est pas de
Lie) . . .

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

1.4. Relations entre les propriétés de g et de G 51

Cette complexifiée n’est autre que l’algèbre sl(2,C), dont sl(2,R) est aussi une forme réelle non
compacte. (Voir Exercice B et les TD).
[Exercice. Étudier les algèbres réelles de dimension 3 : so(3)=su(2), so(2,1), su(1,1), sp(2,R), usp(1) et
sl(2,R). En trouver les isomorphismes et montrer qu’à isomorphisme près, deux seulement sont indépendantes.
(Voir [DNF] vol. 1, § 13 et 24 pour plus de détails sur ces isomorphismes et leur interprétation géométrique.) ]
Les algèbres so(4) et so(1,3) étudiées plus haut et au Chap. 0 offrent un autre exemple
de deux algèbres, qui sont deux formes réelles non isomorphes de la même complexifiée. Autre
exemple, sp(2n, R) et usp(n). (Voir Appendice A).
De façon générale, on démontre ([FH] p. 130) que
• toute algèbre de Lie complexe semi-simple a une unique forme réelle compacte.

En résumé, les propriétés topologiques locales d’un groupe de Lie sont transcrites dans son
algèbre de Lie. L’algèbre de Lie ne capte cependant pas les propriétés topologiques globales du
groupe (connexité, simple-connexité, . . .), comme nous le discutons maintenant.

1.4.3 Connexité, simple-connexité

– Si G n’est pas connexe et G0 est le sous-groupe composante connexe de l’identité, les algèbres
de Lie de G et G0 coı̈ncident g = g0 . Par exemple, o(3)=so(3).
– Si G n’est pas simplement connexe, soit G e son groupe de recouvrement universel. G et G e
étant localement isomorphes, ils ont mêmes algèbres de Lie. Exemples U(1) et R ; SO(3) et
SU(2) ; SO(1,3) et SL(2, C).
Pour résumer :
Étant donné un groupe de Lie G, on a construit son algèbre de Lie. Réciproquement, un
théorème de Lie affirme que toute algèbre de Lie de dimension finie est l’algèbre de Lie d’un
certain groupe de Lie [Ki-Jr, p.34]. Plus précisément, à toute algèbre de Lie g correspond un
unique groupe de Lie G connexe et simplement connexe dont g est l’algèbre de Lie. Tout autre
groupe de Lie G0 connexe ayant g comme algèbre de Lie est de la forme G0 = G/H où H est
un sous-groupe invariant fini ou discret de G. Cela est en accord avec ce nous avons vu plus
haut : si G est le groupe de recouvrement de G0 , G0 = G/π1 (G0 ). [H nécessairement contenu dans
le centre Z(G)] Par exemple U(1)=R/Z, SO(3)=SU(2)/Z2 . Si G0 n’est pas connexe, la propriété
précédente s’applique à la composante connexe de l’identité.

1.4.4 Constantes de structure. Forme de Killing. Critères de Cartan

Choisissant une base {tα } dans l’algèbre de g de dimension d, tout élément X s’écrit X =
Pd α
α=1 x tα . Nous définissons les constantes de structure de g (dans cette base) par

[tα , tβ ] = Cαβγ tγ , (1.39)

qui sont évidemment antisymétriques dans leurs deux indices inférieurs, Cαβγ = −Cβαγ . Pour
l’opérateur ad défini en (1.22), on a donc
X
ad X Y = [X, Y ] = xα y β Cαβγ tγ .

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

52 Chap.1. Groupes. Groupes et algèbres de Lie

Considérons alors l’opérateur linéaire ad Xad Y

ad X ad Y Z = [X, [Y, Z]] = Cαδ Cβγδ xα y β z γ t .

Exercices (faciles !) : montrer que l’identité de Jacobi est équivalente à l’identité

X
Cαδ Cβγδ + Cβδ Cγαδ + Cγδ Cαβδ = 0

(1.40)
δ

(bien noter la structure : permutation cyclique sur les trois indices α, β, γ à fixe et δ sommé) ;
et montrer que cette identité s’exprime encore comme

[ad X, ad Y ]Z = ad [X, Y ]Z . (1.41)

En prenant la trace de cet opérateur linéaire ad X ad Y , on définit la forme de Killing

X
(X, Y ) := tr (ad Xad Y ) = Cαδγ Cβγδ xα y β =: gαβ xα y β , (1.42)
γ,δ

qui est une forme bilinéaire symétrique (un produit scalaire) sur les vecteurs de l’algèbre de
Lie. Autrement dit, le tenseur symétrique gαβ est donné par
X
gαβ = Cαδγ Cβγδ = tr (ad tα ad tβ ) .
γ,δ

(La symétrie en α, β est manifeste sur la 1ère expression, elle résulte de la cyclicité de la trace
dans la 2ème.)
Noter que cette forme de Killing est invariante sous l’action de tout ad Z :

∀X, Y, Z ∈ g (ad Z X, Y ) + (X, ad Z Y ) = ([Z, X], Y ) + (X, [Z, Y ]) = 0 (1.43)

(penser à l’action de ad Z comme celle d’un générateur infinitésimal agissant à la manière d’une
dérivation, soit sur le premier terme, soit sur le second). En effet par (1.41), le premier terme
vaut tr (ad Zad Xad Y − ad Xad Zad Y ) et le second tr (ad Xad Zad Y − ad Xad Y ad Z), et ils
sont opposés grâce à la cyclicité de la trace. On démontre que dans une algèbre de Lie simple,
une forme bilinéaire invariante est nécessairement multiple de la forme de Killing.
On peut alors utiliser le tenseur gαβ pour abaisser le 3ème indice de Cαβγ , définissant ainsi

Cαβγ := Cαβδ gγδ = Cαβδ Cγ κ Cδκ

Montrons alors que ce Cαβγ est complètement antisymétrique en α, β, γ. Compte tenu de l’anti-
symétrie en α, β déjà connue, il suffit d’établir que Cαβγ est invariant par permutation cyclique.
Cela découle de (1.43) qui peut être écrite sous une forme plus symétrique selon

(X, [Y, Z]) = (Y, [Z, X]) = (Z, [X, Y ]) = Cαβγ xα y β z γ = Cβγα y β z γ xα = Cγαβ z γ xα y β , (1.44)

ce qui établit la propriété annoncée.

Un théorème très remarquable d’E. Cartan affirme :
• (i) Une algèbre de Lie est semi-simple ssi la forme de Killing est non-dégénérée, c’est-à-dire

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

1.4. Relations entre les propriétés de g et de G 53

det g 6= 0.
• (ii) Une algèbre de Lie semi-simple réelle est compacte ssi la forme de Killing g est définie
négative.
Ce sont les critères de Cartan.
Dans un sens, la propriété (i) est aisée à établir. Supposons que g n’est pas semi-simple et montrons que
det g = 0. Soit I un idéal de g, choisissons une base de g faite d’une base de I, {ti }, i = 1, · · · r, complétée par
ta , a = r + 1, · · · d. Calculons, pour 1 ≤ i, j ≤ r, gij = αβ Ci,αβ Cjβα . La propriété d’idéal nous dit que α et
P

β sont eux-mêmes entre 1 et r, gij = 1≤k,l≤r Ci,kl Cjl k . donc la restriction de la forme de Killing de g à I est
P

la forme de Killing de I. Si en outre, on suppose l’idéal abélien, gij = 0 et gia = 0. La forme est clairement
dégénérée (det g = 0). La réciproque, det g = 0 ⇒ g non semi-simple, est un peu plus délicate à établir.
De même, la propriété (ii) est assez aisée à établir dans le sens compacité ⇒ forme définie négative. Partons
d’une forme bilinéaire symétrique définie positive arbitraire ; par exemple dans une base {tα } donnée, considérons
P α β
h X, Y i = x y . Pour un groupe G compact, on peut rendre cette forme invariante en moyennant sur
G : ϕ(X, Y ) := dµ(g)h gXg −1 , gY g −1 i. Elle est invariante ϕ(gXg −1 , gY g −1 ) = ϕ(X, Y ), soit sous forme
R

infinitésimale, ϕ([Z, X], Y ] + ϕ(X, [Z, Y ]) = 0, (cf (1.43)). Elle est aussi définie positive. Soit eα une base qui la
diagonalise, ϕ(eα , eβ ) = δαβ . Calculons dans cette base la matrice de l’opérateur ad X et montrons qu’elle est
antisymétrique, (ad X)αβ = −(ad X)βα :

(ad X)αβ = ϕ(eα , [X, eβ ]) = −ϕ(eβ , [X, eα ]) = −(ad X)βα .

Donc la forme de Killing

X X
(X, X) = tr (ad Xad X) = (ad X)αβ (ad X)βα = − ((ad X)αβ )2 ≤ 0
α,β α,β

est semi-définie négative, et si l’algèbre est semi-simple, définie négative, q.e.d.

Exemple. Le cas de SO(3) ou SU(2) est bien familier. Les constantes de structure sont
données par le tenseur complètement antisymétrique Cαβγ = αβγ . La forme de Killing est
gαβ = −2δαβ . Exercice : calculer la forme de Killing pour l’algèbre so(2, 1) (voir Exercice B).
[Sous-algèbres dérivées de g
g(0) = g g(n) = [g(n−1) , g(n−1) ]

L’algèbre est soluble si ∃n : g(n) = 0. Théorème de Lie : Toute représentation d’une alg soluble sur C (de dim
finie) est equiv à une rep triangulaire. ]
Enfin un dernier théorème important (toujours de Cartan !) énonce que
• Toute algèbre de Lie semi-simple g est somme directe d’algèbres de Lie simples gi

g = ⊕i gi .

Ceci est une conséquence simple de (1.44). Considérons une algèbre semi-simple g ayant un idéal I et
appelons C le complément de I par rapport à la forme de Killing, c’est-à-dire (I, C) = 0. Par (1.44), ([C, I], I) =
(C, [I, I]) = (C, I) = 0 (puisque I est une sous-algèbre), et ([C, I], C) = (I, C) = 0 (puisque I est un idéal),
donc [C, I], orthogonal à tout g pour la forme de Killing non dégénérée, s’annule, [C, I] = 0, ce qui signifie que
g = I ⊕ C. En itérant l’argument sur C, on obtient la propriété annoncée.
Ces propriétés ont été mises à profit par Cartan pour classifier les algèbres de Lie simples
complexes ou réelles. Nous reviendrons au Chapitre 3 sur cette classification.

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

54 Chap.1. Groupes. Groupes et algèbres de Lie

1.4.5 Opérateur(s) de Casimir

Avec les notations précédentes, étant données une algèbre g semi-simple, donc dotée d’une
forme de Killing g inversible, et une base {tα } de g, on définit
X
C2 = g αβ tα tβ (1.45)
α,β

où g αβ est l’inverse de gαβ , c’est-à-dire gαγ g γβ = δαβ .

Formellement, cette combinaison des t qui ne fait pas appel au crochet de Lie ne vit pas dans l’algèbre de
Lie mais dans son algèbre enveloppante universelle Ug, définie comme l’algèbre associative des polynômes dans
les éléments de g. Ici, puisque nous nous sommes restreints à g ⊂ M (n, R), Ug peut aussi être considérée comme
une sous-algèbre de M (n, R).
Montrons que C2 a un crochet (commutateur) nul avec tout tγ donc avec tout élément de
g. C’est l’opérateur de Casimir quadratique.
X
[C2 , tγ ] = g αβ [tα tβ , tγ ]
α,β
X
= g αβ (tα [tβ , tγ ] + [tα , tγ ]tβ )
α,β
X
= g αβ Cβγδ (tα tδ + tδ tα ) (1.46)
α,β,δ
X
= g αβ g δκ Cβγκ (tα tδ + tδ tα ) .
α,β,δ,κ

Le terme βκ g αβ g δκ Cβγκ est antisymétrique en α ↔ δ, tandis que le terme entre parenthèses

est symétrique. La somme s’annule donc, qed.

On démontre que dans une algèbre de Lie simple, (plus précisément dans son algèbre en-
veloppante universelle), une expression quadratique dans les t qui commute avec tous les t est
proportionnelle à l’opérateur de Casimir C2 . Autrement dit, l’opérateur de Casimir quadratique
est unique à un facteur près.
Exemple. Dans l’algèbre so(3)∼ = su(2), l’opérateur de Casimir C2 est (à un signe près) J2 ,
qui, comme chacun sait, commute avec les générateurs infinitésimaux J i de l’algèbre. Dans une
algèbre non simple, il y a autant d’opérateurs de Casimir quadratiques qu’il y a de composantes
simples, voir par exemple les deux opérateurs de Casimir J2 et K2 dans l’algèbre du groupe
de Lorentz complexifiée (see Chap. 0 § 0.6.2) ; ou P 2 et W 2 dans l’algèbre de Poincaré (non
semi-simple), see Chap. 0, § 0.6.5.
Il peut exister d’autres opérateurs de Casimir de degré plus élevé. Vérifier ainsi que
0 0 0
Cr = g α1 α1 g α2 α2 · · · g αr αr Cα1 β1β2 Cα2 β2β3 · · · Cαr βrβ1 tα01 tα02 · · · tα0r (1.47)

a un crochet nul avec tout tγ . Que vaut C3 dans su(2) ? Voir Bourbaki [Bo] pour la discussion de ces opérateurs
de Casimir généraux. Voir aussi l’exercice C ci-dessous.
Si on se rappelle que les générateurs infinitésimaux (vecteurs de l’algèbre de Lie) s’in-
terprètent comme des opérateurs différentiels dans les coordonnées sur le groupe, on conçoit
que les opérateurs de Casimir fournissent des opérateurs différentiels invariants (puisque com-
mutant avec les générateurs infinitésimaux). En particulier, l’opérateur de Casimir quadratique
correspond à un laplacien sur le groupe (see Chap. 0, § 0.2.3 pour le cas de SO(3)).

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

1.4. Relations entre les propriétés de g et de G 55

Ces opérateurs de Casimir vont jouer un rôle important dans l’étude des représentations
des groupes.

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

56 Chap.1. Groupes. Groupes et algèbres de Lie

Bibliographie sommaire
Ouvrages mathématiques
[Bo] N. Bourbaki, Groupes et Algèbres de Lie, Chap. 1-9, Hermann 1960-1983.
[Bu] D. Bump, Lie groups, Series “Graduate Texts in Mathematics”, vol. 225, Springer
2004.
[Ch] C. Chevalley, Theory of Lie groups, Princeton University Press.
[D] J. Dieudonné, Éléments d’analyse, Gauthier-Villars, en particulier tomes 5-7 (très com-
plets mais difficiles !).
[DNF] B. Doubrovine, S. Novikov et A. Fomenko, Géométrie contemporaine, Éditions de
Moscou, en particulier, les §14, 23 et 24 du volume 1 et les chapitres 1 (variétés) et 4 et 5
(homotopie) du volume 2. La version française étant épuisée, voici les références de la version
anglaise : Dubrovin, B. A., Fomenko, A. T., Novikov, S. P. Modern geometry—methods and
applications. Part I. The geometry of surfaces, transformation groups, and fields. Graduate
Texts in Mathematics, 93. Springer-Verlag, New York, 1992. Part II. The geometry and topology
of manifolds. Graduate Texts in Mathematics, 104. Springer-Verlag, New York, 1985. (a third
volume deals with homology. . .)
[Ki-Jr] A. Kirillov Jr, An Introduction to Lie groups and Lie algebras, (Cambridge Studies
in Advanced Mathematics), Cambridge Univ. Pr., 2008.
[Po] L.S. Pontryagin, Topological Groups, Gordon and Breach, 1966.
[W] H. Weyl, Classical groups, Princeton University Press

Un ouvrage récent écrit par une mathématicienne, mais avec un contenu et dans un esprit
proches du présent cours, est celui de
[K-S] Y. Kosmann-Schwarzbach, Groupes et symétries, Groupes finis, groupes et algèbres de
Lie, représentations, Les Éditions de l’École Polytechnique, 2006.

Théorie des groupes pour physiciens

[Wi] E. Wigner, Group Theory and its Applications to Quantum Mechanics. Academ. Pr.
1959
[Co] J.F. Cornwell, Group theory in physics. An introduction, Academic Pr. contient beau-
coup d’information mais utilise une terminologie parfois différente du reste de la littérature. . .
[Gi] R. Gilmore, Lie groups, Lie algebras and some of their applications, Wiley
[Ha] M. Hamermesh, Group theory and its applications to physical problems, Addison-Wesley
[Itz] C. Itzykson, Notes de cours pour l’Ecole de Physique Mathématique de l’Université de
Toulouse (Saclay report (in French), September 1974)
[OR] L. O’ Raifeartaigh, Group structure of gauge theories, Cambridge Univ. Pr. 1986.
Voir aussi plusieurs cours de théorie des groupes par et pour des physiciens disponibles sur
le serveur du CCSD, [Link] entre autres
J.-B. Z., Introduction à la théorie des groupes et de leurs représentations, (Notes de cours au
Magistère MIP 1994), qui met plutôt l’accent sur les groupes finis.

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

App. A. Quaternions et groupes symplectiques 57

Appendix A. Corps des quaternions et groupes symplec-

tiques
A.1 Quaternions
L’ensemble des quaternions est l’algèbre engendrée par 4 éléments 1, ei , i = 1, 2, 3,

q = q (0) 1 + q (1) e1 + q (2) e2 + q (3) e3 q (.) ∈ C (A.1)

dotée de la multiplication e2i = e1 e2 e3 = −1, d’où il découle que

e1 e2 = −e2 e1 = e3

et ses permutations cycliques. On peut représenter les ei en termes des matrices de Pauli : ei 7→ −iσi .
Le conjugué d’un quaternion q est le quaternion

q̄ = q (0) 1 − q (1) e1 − q (2) e2 − q (3) e3 . (A.2)

à ne pas confondre avec son complexe conjugué

q ∗ = q (0)∗ 1 + q (1)∗ e1 + q (2)∗ e2 + q (3)∗ e3 . (A.3)

Noter que q q̄ := |q|2 = |q (0) |2 + |q (1) |2 + |q (2) |2 + |q (3) |2 , la norme carrée du quaternion, et donc q −1 = q̄/|q|2 si
sa norme est non nulle.
On définit encore le conjugué hermitique de q

q † = q̄ ∗ = q (0)∗ 1 − q (1)∗ e1 − q (2)∗ e2 − q (3)∗ e3 (A.4)

(en accord avec le fait que les matrices de Pauli sont hermitiennes).
Noter que la conjugaison et la conjugaison hermitique renversent l’ordre des facteurs

(q1 q2 ) = q̄2 q̄1 (q1 q2 )† = q2† q1† . (A.5)

Un quaternion réel est un quaternion de la forme (A.1) avec q (µ) ∈ R , donc identique à son complexe
conjugué.
L’ensemble des quaternions réels forment un corps, qui est aussi un espace de dimension 4 sur R. Il est
désigné par H (H comme Hamilton).

A.2 Matrices de quaternions

On considère des matrices Q d’éléments quaternioniques (Q)ij = qij , ou Q = (qij ). On peut appliquer à Q les
conjugaisons définies plus haut. En outre, on peut transposer Q. L’hermitique conjugué de Q est défini par
†
(Q† )ij = qji . (A.6)

Le dual QR d’une matrice quaternionique Q est la matrice

(QR )ij = q̄ji . (A.7)

(Cela joue pour les matrices quaternioniques le même rôle que le conjugué hermitique pour des matrices
complexes.) Une matrice quaternionique est donc dite self-duale si

QR = Q = (qij ) = (q̄ji ) , (A.8)

elle est quaternionique réelle si

QR = Q† ∗
donc qij = qij , (A.9)
donc si ses éléments sont des quaternions réels.

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

58 Chap.1. Groupes. Groupes et algèbres de Lie

A.3 Groupes symplectiques Sp(2n, R) et USp(n), algèbres de Lie sp(2n)

et usp(n)
Soit la matrice 2n × 2n !
0 In
S= (A.10)
−In 0
où In est la matrice identité en dimension n, et la forme bilinéaire alternée (“skew-symmetric” en anglais)
associée
X n
(X, Y ) = X T SY = (xi yi+n − yi xi+n ) . (A.11)
i=1

Le groupe symplectique Sp(2n, R) est le groupe de matrices réelles 2n × 2n préservant cette forme

B T SB = S . (A.12)
!
0 1
Dans la base où X T = (x1 , xn+1 , x2 , xn+2 , · · · ), la matrice S = diag = diag (−e2 ) en termes quater-
−1 0
nioniques, et le groupe symplectique est alors engendré par des matrices quaternioniques n × n Q satisfaisant
(α)
QR .Q = I, (le vérifier !) ; cependant, la matrice B étant réelle, les éléments de Q sont tels que les qij sont réels
pour α = 0, 2 et imaginaires purs pour α = 1, 3. Ce groupe n’est pas compact. Son algèbre de Lie sp(2n, R) est
engendrée par les matrices réelles A telles que AT S + SA = 0. La dimension de ce groupe ou de son algèbre de
Lie est n(2n + 1). Pour n = 1, Sp(2,R)=SL(2,R).
Un groupe relié est le groupe USp(n) engendré par les matrices n × n unitaires et quaternioniques réelles
QR = Q† = Q−1 . C’est le groupe d’invariance de la forme hermitienne quaternionique x̄i yi , x, y ∈ Hn .
P

Il est compact car c’est un sous groupe de U(2n). Son algèbre de Lie usp(n) est engendrée par les matrices
quaternioniques réelles antiselfduales A = −AR = −A† (le vérifier). Elle a aussi n(2n + 1) pour dimension. Pour
n = 1, USp(1)=SU(2).
En exprimant la condition sur les matrices A de sp(n, R) en termes de quaternions, on constate que les deux
algèbres sp(2n, R) et usp(n) ont la même algèbre complexifiée, qui n’est autre que sp(2n, C). Seule usp(n) est
compacte.

Appendix B. Rappels et compléments de topologie et de

géométrie différentielle
B.1 Petit lexique de quelques concepts de topologie utilisés dans ces
notes
Espace topologique : ensemble E doté d’une collection de sous-ensembles, dits ouverts, avec
la propriété que l’union d’ouverts ou l’intersection d’un nombre fini d’ouverts est un ouvert, et
que E et ∅ sont des ouverts.
Fermé de E : complémentaire d’un ouvert dans E.
Voisinage d’un point x : sous-ensemble de E contenant un ouvert contenant x. Soit V(x)
l’ensemble des voisinages de x.
Un espace topologique est séparé (ou de Hausdorff) si deux points distincts possèdent deux
voisinages distincts. On supposera toujours cette propriété satisfaite dans ces notes.
Base de voisinages B(x) d’un point x : sous-ensemble de V(x) tel que tout V ∈ V(x) contient
un W ∈ B(x). (Intuitivement, une base est constituée de “suffisamment” de voisinages.)

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

App. B. Rappels de topologie et de géométrie différentielle 59

Espace compact E : espace topologique (séparé) tel que de tout recouvrement de E par des
ouverts, on peut extraire un recouvrement fini ;
Conséquences : si E est compact,
– toute suite infinie de points de E admet un point d’accumulation ;
– si f : E 7→ F est continue, f (E) est compact ;
– toute fonction continue sur E est bornée.
Si E est un sous-espace de Rn , E compact ⇔ E borné et fermé (théorème de Heine–Borel).
Espace localement compact : espace (séparé) dont tout point a au moins un voisinage com-
pact. Exemples : R n’est pas compact mais localement compact ; Q n’est ni compact ni locale-
ment compact.

B.2 Notion de variété

Une variété M (manifold en anglais) de dimension n est un espace qui localement, au voisinage
de chaque point, “ressemble” à Rn ou Cn . Des contre-exemples sont fournis par deux droites
sécantes, ou par −−− . Plus précisément, il existe une base de voisinages Ui couvrant M , avec
des cartes fi , fonctions inversibles et bicontinues (homéomorphismes) entre Ui et un ouvert de
Rn :fi (Ui ) ⊂ Rn . Soit m un point de M , m ∈ Ui , et fi (m) = (x1 , x2 , . . . xn ) son image dans Rn :
(x1 , x2 , . . . xn ) sont les coordonnées locales de m, elles dépendent de la carte. Il est fondamental
de savoir changer de carte (de système de coordonnées). On dit que la variété est différentiable
de classe C k si pour toute paire d’ouverts Ui et Uj d’intersection non nulle, fj ◦ fi−1 qui applique
fi (Ui ∩ Uj ) ⊂ Rn sur fj (Ui ∩ Uj ) est de classe C k .
Exemple : la sphère S 2 est une variété analytique de dimension 2. On peut choisir comme
deux ouverts la sphère privée de son pôle Nord, resp. Sud, avec comme carte la projection
stéréographique (cf Problème ci-dessous) à partir de ce pôle.
Une variété riemannienne est une variété différentiable réelle dont l’espace tangent est muni
d’un produit scalaire défini positif. Si ce produit scalaire est seulement supposé non dégénéré
et de signature (+1)p , (−1)n−p ), la variété est dite pseudo-riemannienne. Dans des coordonnées
locales xi , un vecteur tangent (voir ci-dessous § B.3) s’écrit X = X i ∂x∂ i , et ce produit scalaire
et l’élément de longueur carrée sont donnés par le tenseur métrique g

(X, Y ) = gij X i Y j , ds2 = gij dxi dxj . (B.1)

B.3 Espace tangent

En géométrie différentielle, un vecteur tangent X à une variété M en un point x0 est un opérateur différentiel
linéaire, du premier ordre dans les dérivées en x0 , agissant sur les fonctions f sur M . En coordonnées locales
xi ,
X ∂
X: f (x) 7→ Xi f (x)
i
∂xi x0

et par changement de coordonnées {xi } → {y i }, ces opérateurs se transforment par la matrice jacobienne
∂
P ∂xi ∂ i j
∂y j = i ∂y j ∂xi avec la transformation des X → Y qui en découle.
x0

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

60 Chap.1. Groupes. Groupes et algèbres de Lie

Xe
XC(t)
e C

C(t)

Figure 1.4 – Le champ de vecteurs tangents à la courbe C(t) est un champ invariant à gauche

Vecteur tangent à une courbe : si une courbe C(t) passe par le point x0 en t = 0, on peut dériver une
fonction f le long de cette courbe
df (C(t))
f 7→ .
dt t=0

Cela définit le vecteur tangent à la courbe C au point x0 , appelé aussi vecteur vitesse et noté C 0 (t)|t=0 = C 0 (0).
L’espace tangent à M en x0 , noté Tx0 M , est l’espace vectoriel engendré par les vecteurs vitesses à toutes
∂
les courbes passant par x0 . L’espace Tx0 M a pour base les ∂x i
x0
: il a la même dimension que M .
On appelle champ de vecteurs sur une variété M la donnée en tout point x ∈ M d’un vecteur Xx tangent
à M en x.

B.4 Groupe de Lie. Application exponentielle

Soit un groupe G, e son identité. Soit C(t) une courbe passant par C(0) = e, et soit Xe = (C 0 (t))t=0 son
vecteur vitesse en e. Pour g ∈ G, on définit la translatée à gauche g.C(t) de C par g. Son vecteur vitesse en g,
Xg = (g.C(t))0t=0 , est appelé vecteur translaté à gauche de Xe . Le champ de vecteurs g 7→ Xg est dit invariant
à gauche, ce qui se justifie, puisque c’est l’ensemble des vecteurs translatés à gauche de Xe . L’espace tangent
en e et l’espace des champs de vecteurs invariants sont donc isomorphes, on les note g.
Inversement, étant donné Xe un vecteur tangent à G en e, on note

C(t) = exp tXe (B.2)

l’unique solution de l’équation différentielle

C 0 (t) = XC(t) (B.3)

qui exprime que la courbe C(t) est tangente en chacun de ses points au champ de vecteurs invariant à gauche,
équation complétée par la condition initiale C(0) = e. Cette équation différentielle du premier ordre a en effet
une solution déterminée à une constante (dans le groupe) près, constante qui est fixée de façon unique par la
condition initiale.
La fonction définie par (B.2) satisfait la propriété (1.15). En effet, si C(t) satisfait (B.3), C(t + t0 ) la satisfait
aussi et diffère donc de C(t) par une constante, C(t + t0 ) = k.C(t), (k dans le groupe), constante qui est fixée
en prenant t = 0, C(t0 ) = k, donc C(t + t0 ) = C(t0 )C(t) et C(−t) = C(t)−1 , qed.
Dans le cas des groupes matriciels considéré dans ce cours, cette fonction exp s’identifie bien sûr à la fonction
exponentielle définie par son développement de Taylor (1.19).

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

App. C. Mesures invariantes sur SU(2) et sur U(n) 61

Appendix C. Mesures invariantes sur SU(2) et sur U(n)

Le groupe SU(2) isomorphe à une sphère est compact et on peut donc intégrer une fonction
sur ce groupe avec une grande variété de mesures d’intégration dµ(g). La mesure invariante,
c’est-à-dire telle que dµ(g.g1 ) = dµ(g1 .g) = dµ(g −1 ) = dµ(g), est, elle, unique à un facteur près.
Une manière possible de trouver cette mesure est de considérer la transformation U → U 0 =
U.V où U, V et donc U 0 sont unitaires de la forme (0.10) (c’est-à-dire U = u0 I −u.σ σ , u ∈ S 3 etc) ;
si on relâche momentanément la condition que u20 + u2 = 1 (mais qu’on garde v02 + v2 = 1), cela
0
définit une transformation linéaire u → u0 qui conserve la norme det U = u20 + u2 = u02 + u02 =
det U 0 . C’est donc une isométrie de l’espace R4 qui préserve la mesure naturelle d4 u δ(u2 − 1)
sur la sphère unité S 3 d’équation det U = 1. En d’autres termes, cette mesure sur la sphère
S 3 fournit une mesure invariante à droite : dµ(U ) = dµ(U.V ). On démontrerait de la même
façon que cette mesure est aussi invariante à gauche : dµ(U ) = dµ(V.U ). Cette mesure est aussi
invariante par U → U −1 , car l’inversion dans SU(2) est la restriction à S 3 de la transformation
orthogonale u0 → u0 , u → −u de R4 , qui préserve bien sûr la mesure naturelle sur S 3 :

dµ(U ) = dµ(U V ) = dµ(V U ) = dµ(U −1 ) .

La forme explicite de la mesure dépend de la paramétrisation utilisée. Si on adopte la

direction n (ou ses deux angles polaires θ et φ) et l’angle de rotation ψ, on prendra
1 2ψ
dµ(U ) = sin sin θ dψ dθ dφ (C.1)
2 2
normalisée pour SU(2) à
Z Z π Z 2π Z 2π
1 ψ
v(SU(2)) = dµ(U ) = dθ sin θ dφ dψ sin2 = 2π 2 (C.2)
SU(2) 2 0 0 0 2

qui est l’“aire” de la sphère unité S 3 et le “volume” de SU(2). Pour SO(3) où l’angle ψ est
R
restreint à (0, π), on a plutôt v(SO(3)) = SO(3) dµ(g) = π 2 .
On obtient l’expression dans tout autre système de coordonnées, par exemple les angles
d’Euler, en calculant le jacobien adéquat,
1
dµ(U ) = sin β dα dβ dγ . (C.3)
8
(Noter que 0 ≤ γ ≤ 4π pour SU(2), tandis que 0 ≤ α ≤ 2π et 0 ≤ β ≤ π).
Comparer ces formules avec celles trouvées par une autre méthode au Chapitre 0, App. 0.
• Cas de U(n).
Examinons finalement rapidement le cas du groupe U(n) en lui appliquant la méthode du Chap. 0, App. 0.
Toute matrice unitaire U ∈ U(n) peut se diagonaliser sous la forme

U = V ΛV † , (C.4)

où Λ = diag (λ1 , · · · , λn ) et les λi sont en fait des phases λj = eiαj . Les λi peuvent être considérées comme
des variables “radiales”, tandis que V représente les variables “angulaires”. Noter que V doit être restreint à
ne pas commuter avec la matrice diagonale Λ. Supposant cette dernière générique, avec des valeurs propres λi

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

62 Chap.1. Groupes. Groupes et algèbres de Lie

toutes distinctes, V vit dans U(n)/U(1)n . La métrique naturelle, invariante par U 7→ U 0 U ou 7→ U U 0 , s’écrit
tr (dU dU † ). Or dU = V (dΛ + [dX, Λ])V † , où dX := V † dV est antihermitienne (et sans termes diagonaux,
pourquoi ?). On a donc tr (dU dU † ) = i |dαi |2 + 2 i<j |dXij |2 |λi − λj |2 ce qui définit le tenseur métrique gαβ
P P

dans les coordonnées ξ α = (αi , <eXij , =mXij ) et détermine la mesure d’intégration

p Y Y
dµ(U ) = det g dξ α = const. |∆(eiα )|2 dαi dµ(V ) . (C.5)

Ici ∆(λ) est le déterminant de Vandermonde

λn−1
1 λn−1
2 ··· λn−1
n
.. ..
. .
Y
∆(λ) := (λi − λj ) = . (C.6)
i<j λ 1 λ2 ··· λn
1 1 ··· 1

La partie “radiale” de la mesure d’intégration est donc donnée par |∆(eiα )|2 dαi à un facteur constant près,
Q

soit encore
Y αi − αj Y
dµ(U ) = const. sin2 dαi × partie angulaire . (C.7)
i<j
2

Noter que cette partie radiale de la mesure est suffisante si on a à intégrer sur le groupe une fonction de U
invariante par U → V U V † , V ∈U(n). Par exemple dµ(U ) tr P (U ), avec P un polynôme.
R

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

Exercices et Problème du Chapitre 1 63

Exercices et problème du chapitre 1

A. Action d’un groupe dans un ensemble.

Soit E un ensemble, G un groupe. On dit que le groupe G agit dans l’ensemble E s’il existe un homomorphisme
β de G dans le groupe des bijections de E dans lui-même.
1. Écrire précisément les conditions requises.
[g 7→ β(g) ∈ Bij(E), g −1 7→ β(g −1 ) = β(g)−1 , g1 .g2 7→ β(g1 .g2 ) = β(g1 ).β(g2 ), β(e) = idE
ou plus simplement ∀g ∈ G, ∀x ∈ E, (g, x) 7→ β(g)(x) = g · x ∈ E est t.q. ((g.h) · x = g · (h · x) ”associativité”.]
On définit alors l’orbite O(x) d’un point x ∈ E comme l’ensemble des images β(g)x pour g ∈ G.
2. Montrer que l’appartenance à une même orbite est une relation d’équivalence. [x ∼ y ⇔ ∃g ∈ G : y =
β(g)x, réflexif : x = β(e)x, symétrique x = β(g −1 y, transitif . . .]
3. Exemple : action du groupe O(n) sur l’espace Rn . Que sont les orbites ? [sphères de centre O ou origine
O]
4. Un espace est homogène s’il n’a qu’une seule orbite. Exemple trivial : Rn sous l’action des translations.
Plus généralement, qu’en est-il de l’action à gauche de G sur lui-même, avec E = G ? [G homogène car ∀x, y ∃g =
y.x−1 : g.x = y] Donner d’autres exemples d’espaces homogènes pour G = O(3) ou L =O(1,3). [sphère dans
R3 , cône de lumière ou hyperboloı̈de p2 > 0, p0 > 0, etc ]
5. On définit aussi le groupe d’isotropie, (appelé aussi stabilisateur, ou, par les physiciens, petit groupe) S(x)
de l’élément x ∈ E : c’est le sous-groupe de G laissant x invariant :

S(x) = {g ∈ G|β(g)x = x} .

Montrer que si x et y appartiennent à la même orbite, leurs groupes d’isotropie sont conjugués. [Si y ∼ x donc
∃g ∈ G : y = β(g)x, considérons S(y) = {g 0 |β(g 0 )y = y}, donc β(g 0 )β(g)x = β(g)x donc β(g −1 g 0 g)x = x
c’est-à-dire g −1 g 0 g ∈ S(x), donc g −1 S(y)g ⊂ S(x) et en fait en inversant les opérations, g −1 S(y)g = S(x), qed.]
Quel est le groupe d’isotropie d’un point x ∈ Rn sous l’action de SO(n) ? d’un vecteur de genre temps p dans
l’espace de Minkowski ?
0
[S(x) ≈ SO(n − 1) ; S(p) =O(3) si p = p = (m, ~0) donc de façon générale, un groupe conjugué à O(3) :
0
p = Λp, ∀R ∈ O(3), ΛRΛ−1 p = p. ] Le stabilisateur S(x) est-il un sous-groupe invariant ? [en général non,
puisqu’on sait qu’un sous-groupe invariant est égal à tous ses conjugués : si S(x) était invariant, il serait égal à
tous les stabilisateurs S(y) des points y de O(x). Dans le cas de SO(3), par exemple, absurde . . .]
6. Montrer qu’il existe une bijection entre les points de l’orbite O(x) et l’ensemble quotient G/S(x). [(g ∼ g 0
en ce sens que g 0−1 g = h ∈ S(x)) ⇔ β(g)x = β(g 0 )β(h)x = β(g 0 )x donc g et g 0 sont équivalents (même left
coset) par rapport à S(x) ssi ils définissent le même point sur l’orbite O(x).] Pour un groupe fini G, en déduire
une relation entre les ordres de G, de O(x) et de S(x). [∀x |G| = |O(x)| × |S(x)|.] Cet ensemble G/S(x) est-il
un espace homogène pour l’action de G ?[oui puisque toute orbite l’est.]
Le sujet du chapitre 2 porte sur le cas particulier où E est un espace vectoriel avec comme bijections les
transformations linéaires du groupe GL(E) : on parle alors de représentations du groupe G dans E.

B. Groupes et algèbres de Lie de dimension 3

1. Rappeler la définition du groupe SU(1,1). [matrices 2 × 2 complexes A telles que AgA† = g avec g =
diag (1, −1).] Quelle est sa dimension ?
2. Quelle équation définit son algèbre de Lie ? [X.g + gX † = 0.] Quelle conséquence cela implique-t-il sur
∗
les éléments de matrices de X ∈ su(1,1) ? [X11 et X22 imaginaires purs, X12 = X21 .] Montrer qu’on peut écrire
une base de su(1,1) en termes des 3 matrices de Pauli et en calculer les relations de commutation. [par ex.,
s3 = iσ3 , s1 = σ1 et s2 = σ2 , relns de comm. [s1 , s2 ] = 2s3 , [s2 , s3 ] = −2s1 , [s3 , s1 ] = −2s2 . ] Cette algèbre
est-elle isomorphe à l’algèbre de so(3) ?[Non ! D’une part on ne peut pas trouver de changement de base qui
amène une algèbre sur l’autre ; de l’autre on va voir plus bas que l’une est compacte et l’autre pas.]
3. On considère maintenant le groupe linéaire réel SL(2,R). Quelle est sa définition ? Comment son algèbre
de Lie est-elle définie ? En donner une base en termes de matrices de Pauli. [matrices réelles de trace nulle, base
e1 = σ1 , e2 = iσ2 , e3 = σ3 , [e1 , e2 ] = 2e3 , [e2 , e3 ] = −2e1 , [e3 , e1 ] = 2e2 .]

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

64 Chap.1. Groupes. Groupes et algèbres de Lie

4. Montrer l’isomorphisme des deux algèbres su(1,1) et sl(2,R). [(e3 , e1 , e2 ) ↔ (s1 , s2 , s3 )]

5. Mêmes questions avec l’algèbre so(2,1) : définition, dimension, relations de commutation, isomorphisme
avec l’une des précédente ? [groupe SO(2,1) : groupe d’invariance de la forme x2 + y 2 − z 2 , donc matrices B 3 × 3
satisfaisant (i) BgB t = g où g = diag (1, 1 − 1), ce qui donne 6 conditions, (dimension de O(2,1)= 9 − 6 = 3), et
(ii) det B = 1 qui ne réduit pas la dimension puisque (det B) = ±1 comme conséquence de (i). Pour l’algèbre,
la forme infinitésimale de la condition (i) est Xg + gX t = 0, qui dit que les éléments diagonaux de X sont nuls
et X12 = −X21 (cf l’antisymétrie habituelle dans O(3)), tandis que  X23 = X32et X13 =  X31 , et lacondition
0 0 0 0 0 1
(ii) dit que tr X = 0. Une base est donnée par les 3 matrices J1 = 0 0 1 , J2 = 0 0 0 , J˜3 =
˜ ˜
   

0 1 0 1 0 0
 
0 −1 0
1 0 0, qui satisfont donc aux relations de commutation [J˜1 , J˜2 ] = J˜3 , [J˜2 , J˜3 ] = −J˜1 , [J˜3 , J˜1 ] = −J˜2 ,
 

0 0 0
isomorphes à celles de su(1,1) et sl(2, R). ]
6. En utilisant les critères de Cartan, discuter la semi-simplicité et la compacité de ces différentes algèbres.
Quelle est leur complexifiée et leur relation avec su(2) ? [On calcule la forme de Killing, par exemple de so(2,1) :
g11 = 2C123 C132 = 2, g22 = 2 et g33 = −2, indéfinie, de signature (+, +, −), donc l’algèbre est semi-simple mais
pas compacte.]
(Pour la relation géométrique entre les groupes SU(1,1), SL(2,R) et SO(1,2)), cf. le §13, vol. 1 de [DNF].

C. Opérateurs de Casimir de u(n).

1. Montrer que les n2 matrices t(ij) , 1 ≤, i, j ≤ n, matrices n × n d’éléments (t(ij) )ab = δia δjb forment une
base de l’algèbre u(n). En calculer les relations de commutation et les constantes de structure. [[t(ij) , t(kl) ] =
(mp) (mp)
δjk t(il) − δil t(kj) = C(ij)(kl) t(mp) avec C(ij)(kl) = δim δjk δln − δkm δil δjn ]
2. Calculer la forme de Killing dans cette base et en vérifier les propriétés liées aux critères de Cartan.
[g(ij)(kl) = 2nδil δjk − 2δij δkl is degenerate since for any matrix X = xI, g(ij)(kl) Xkl = 0. This is of course due
to the U (1) factor in U(n) or u(n)=u(1)⊕ su(n). ]
3. Montrer que les éléments de l’algèbre enveloppante C (r) = 1≤i1 ,i2 ,···ir ≤n t(i1 i2 ) t(i2 i3 ) · · · t(ir i1 ) commutent
P

avec tous les t(ij) [commutateur = somme télescopique périodique !] et sont donc des opérateurs de Casimir de
degré r.
4. Comment modifier ce qui précède pour l’algèbre su(n) ? ([Bu], chap 10) [Introduce traceless matrices t̃(ij) ,
= (t̃(ij) )ab = δia δjb − n1 δij δab ]

Problème : Transformations conformes

I-1. On rappelle que dans une théorie (classique) des champs locale invariante par translations, on sait définir
un tenseur énergie–impulsion Θµν (x) tel que
– sous l’effet d’un changement de coordonnées infinitésimal xµ → x0µ = xµ + aµ (x), l’action subit une
variation Z
δS = dd x (∂µ aν ) Θµν (x) ; (1.49)

– Θµν est conservé : ∂µ Θµν (x) = 0 ;

– on suppose Θµν symétrique en µ , ν.
Montrer que si Θ est en outre de trace nulle, Θµµ = 0, l’action est aussi invariante sous l’effet des dilatations,
xµ → x0µ = (1 + δλ)xµ .
2. Dans un espace riemannien ou pseudo-riemannien de dimension d, doté d’une métrique gµν (x) de signature
{(+1)p , (−1)d−p }, on appelle transformation conforme une transformation des coordonnées xµ → x0µ qui dilate
localement les longueurs

ds2 = gµν (x)dxµ dxν → ds02 = gµν (x0 )dx0µ dx0ν = α(x)ds2 (1.50)

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

Exercices et Problème du Chapitre 1 65

a) Écrire la forme infinitésimale de cette condition, quand xµ → x0µ = xµ + aµ (x). (On reliera le paramètre de
dilatation 1 + δα à aµ en prenant une trace adéquate.)
b) Montrer que pour un espace euclidien ou pseudo-euclidien de métrique gµν = diag {(+1)p , (−1)d−p }, la
condition se ramène à
2
∂µ aν + ∂ν aµ = gµν ∂ρ aρ . (1.51)
d
3. Montrer en utilisant (1.49), (1.51) que sous les conditions du 1. et du 2.b, toute théorie invariante par
translations, rotations et dilatations l’est aussi sous l’effet des transformations conformes.
4. On va maintenant étudier les conséquences de (1.51). On pose D := d1 ∂ρ aρ .
– a) En dérivant (1.51) par rapport à xν , montrer que

∂ 2 aµ = (2 − d)∂µ D. (1.52)

– b) En dérivant (1.52) par rapport à xµ , montrer qu’en dimension d > 1, D est une fonction harmonique :
∂ 2 D = 0.
– c) On suppose dans la suite que d ≥ 2. En dérivant (1.52) par rapport à xν , en symétrisant en µ et ν et
en utilisant (1.51), montrer que si d > 2, alors ∂µ ∂ν D = 0. En conclure qu’il existe une constante h et un
vecteur constant k tel que D = kµ xµ + h.
– d) En dérivant (1.51) par rapport à xσ et en antisymétrisant en ν et σ, montrer que

∂µ (∂σ aν − ∂ν aσ ) = 2(gµν kσ − gµσ kν ) = ∂µ (2kσ xν − 2kν xσ ). (1.53)

– e) En déduire qu’il existe un tenseur antisymétrique constant lσν tel que

∂σ aν − ∂ν aσ = (2kσ xν − 2kν xσ ) + 2lσν , (1.54)

qui combiné avec (1.51) donne

∂σ aν = xν kσ − xσ kν + lσν + gνσ kρ xρ + hgνσ .

– f) En conclure que l’expression générale d’une transformation conforme infinitésimale en dimension d > 2
s’écrit
1
aν = kσ xσ xν − xσ xσ kν + lσν xσ + hxν + cν (1.55)
2
avec c un vecteur constant 7 . De combien de paramètres réels indépendants dépend une telle transforma-
tion en dimension d ?

II-1. On apprend que dans l’espace (pseudo-)euclidien de dimension d > 2, les transformations conformes
sont engendrées par les translations, les rotations, les dilatations et “les transformations conformes spéciales”,
obtenues en composant une inversion xµ → xµ /x2 , une translation et à nouveau une inversion. Écrire la forme
finie puis la forme infinitésimale de ces transformations conformes spéciales, et vérifier que le résultat est bien
en accord avec (1.55), ce qui justifie l’assertion précédente.
2. Écrire l’expression des générateurs infinitésimaux Pµ des translations, Jµν des rotations, D des dilatations
et Kµ des transformations spéciales, comme opérateurs différentiels en x.
3. Écrire avec le minimum de calculs les relations de commutation de ces générateurs (on utilisera les
résultats déjà connus sur les générateurs Pµ et Jµν et on tirera profit de l’homogénéité et de la définition des
transformations conformes spéciales pour réduire le seul calcul non trivial à celui de [Kµ , Pν ]). Vérifier que des
relations de commutation se ferment bien sur les générateurs P, J, D et K.
4. Quelle est la dimension du groupe conforme dans l’espace euclidien Rd ?

III-1. Pour mieux comprendre la nature du groupe conforme, on applique l’espace Rd , complété du point à
l’infini et doté de sa métrique x2 = x21 + · · · + x2d , sur la sphère S d . Cette sphère est définie par l’équation

7. Ce joli raisonnement est dû à Michel Bauer.

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

66 Chap.1. Groupes. Groupes et algèbres de Lie

rd+1

Sd N
r

Figure 1.5 – Projection stéréographique depuis le pôle Nord

r2 + rd+1
2
= 1 dans l’espace Rd+1 , et l’application est réalisée grâce à la projection stéréographique à partir du
“pôle Nord” r = 0, rd+1 = 1 (voir Fig. 1.5). Montrer que l’on a

2x x2 − 1
r= rd+1 = .
x2 +1 x2 + 1

Quelle est l’image du point à l’infini ? Quel est l’effet de l’inversion dans Rd sur le point r = (r, rd+1 ) ∈ S d ?
2. La sphère précédente est à son tour considérée comme la section du cône de lumière C dans l’espace de
Minkowski M1,d+1 de métrique z02 − z2 − zd+1 2
= 0 par l’hyperplan z0 = 1. Montrer que de cette façon on a
une correspondance biunivoque entre les points de Rd ∪ {∞} et les rayons du cône de lumière (c’est-à-dire les
vecteurs à une dilatation près) et que l’expression de x ∈ Rd en fonction de z = (z0 , z, zd+1 ) ∈ C est
z
x= .
z0 − zd+1

3. On va montrer maintenant que l’action du groupe conforme dans Rd découle de transformations linéaires
dans M1,d+1 préservant le cône de lumière. Sans aucun calcul, montrer que ces transformations doivent alors
appartenir au groupe de Lorentz de M1,d+1 , soit O(1, d + 1).
a) Identifier les transformations linéaires de z correspondant aux rotations de x dans Rd . Montrer que les
dilatations de x correspondent à des “boosts” de rapidité β dans le plan (z0 , zd+1 ), en donnant la relation entre
le paramètre de dilatation et la rapidité.
b) On considère ensuite les transformations de O(1, d + 1) qui préservent z0 − zd+1 . Écrire la matrice Ta
d’une telle transformation infinitésimale agissant sur les coordonnées (z0 , z, zd+1 ) telle que δz = a(z0 − zd+1 )
(au premier ordre en a). A quelle transformation de x ∈ Rd correspond-elle ? Calculer par exponentiation de Ta
la matrice d’une transformation finie (on pourra par exemple calculer les premières puissances Ta2 , Ta3 . . .).
c) Quelle est enfin l’interprétation de l’inversion de Rd dans le groupe de Lorentz de M1,d+1 ? Que dire
des transformations conformes spéciales ? Quelle est la dimension du groupe O(1, d + 1) ? Qu’en conclure sur la
relation entre le groupe de Lorentz dans l’espace de Minkowski M1,d+1 et le groupe conforme dans Rd ?

IV. Question subsidiaire : Connaissez-vous des transformations conformes de l’espace R2 autres que celles
mentionnées au II.1 ?

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

Chapitre 2

Représentations linéaires des groupes

La question de l’action d’un groupe dans un ensemble a déjà été évoquée au chapitre
précédent (Exercice A et TD). On va s’intéresser maintenant plus particulièrement à l’action
linéaire d’un groupe dans un espace vectoriel. Cette situation est rencontrée fréquemment en
géométrie et en physique (mécanique quantique, mécanique statistique, théorie des champs,. . .).
Il faut cependant garder à l’esprit que d’autres actions de groupe peuvent aussi avoir un intérêt
physique : ainsi le groupe des rotations SO(n) agit sur la sphère S n−1 de façon non linéaire,
et cela apparaı̂t par exemple dans des modèles de ferromagnétisme et des théories de champs
dites modèles σ non linéaires, cf cours de F. David.

2.1 Définitions et propriétés générales.

2.1.1 Définitions de base
On dit qu’un groupe G est représenté dans un espace vectoriel E (sur un corps qui pour
nous sera toujours R ou C), ou encore, que E porte une représentation de G, si on a un
homomorphisme D du groupe G dans le groupe des transformations linéaires GL(E) :

∀g ∈ G g 7→ D(g) ∈ GL(E)
∀g, g 0 ∈ G D(g.g 0 ) = D(g).D(g 0 ) (2.1)
D(e) = I
∀g ∈ G D(g −1 ) = (D(g))−1

où I désigne l’opérateur identité dans GL(E). Si l’espace de représentation est de dimension
p, la représentation est dite elle-même de dimension p. La représentation qui à tout g ∈ G
associe 1 (considéré comme ∈ GL(R)) est appelée triviale ou représentation identité ; elle est
de dimension 1.
Si G est un groupe topologique, resp. un groupe de Lie, on demandera aussi à l’application g 7→ D(g) d’être
continue, resp. différentiable. Dans la suite de ces notes, on supposera toujours ces conditions satisfaites.

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

68 Chap.2. Représentations linéaires des groupes

La représentation est dite fidèle si ker D = {e}, ou encore si D(g) = D(g 0 ) ⇔ g = g 0 . Sinon,
le noyau de l’homomorphisme est un sous-groupe invariant H, et la représentation du groupe
G/H dans E est fidèle (le vérifier). En conséquence, toute représentation non triviale d’un
groupe simple est fidèle. Inversement, si G a un sous-groupe invariant H, toute représentation
de G/H fournit une représentation dégénérée (= non fidèle) de G.
Si E est de dimension finie p, on peut choisir une base ei , i = 1, . . . , p, et associer à tout
g ∈ G la matrice représentative de D(g), notée avec une lettre calligraphiée

D(g)ej = ei Dij (g) (2.2)

avec, comme (presque) toujours dans ces notes, la convention de sommation sur les indices
répétés. La disposition des indices (i : indice de ligne, j indice de colonne) est dictée par la loi
(2.1). En effet, on a bien

D(g.g 0 )ek = ei Dik (g.g 0 )

= D(g) (D(g 0 )ek ) = D(g)ej Djk (g 0 )
= ei Dij (g)Djk (g 0 )
hence Dik (g.g 0 ) = Dij (g)Djk (g 0 ) . (2.3)

Exemples : Le groupe SO(2) des rotations dans le plan admet une représentation de dimension
deux, avec des matrices !
cos θ − sin θ
(2.4)
sin θ cos θ
qui décrivent bien les rotations d’angle θ autour de l’origine.
Le groupe SU(3) est défini comme l’ensemble des matrices U unitaires, 3×3 et de déterminant
1. Ces matrices forment elles-mêmes une représentation de SU(3), c’est la “représentation de
définition”. Montrer que les matrices U ∗ complexes conjuguées forment aussi une représentation
de SU(3). !
1 a
De quel groupe les matrices forment-elles une représentation ?
0 1

2.1.2 Représentations équivalentes. Caractères

Soient D et D0 deux représentations de G dans des espaces E et E 0 , supposons qu’il existe
un opérateur linéaire V de E dans E 0 tel que

∀g ∈ G V D(g) = D0 (g)V . (2.5)

Un tel V est dit opérateur d’entrelacement (“intertwiner” en anglais). Si V est inversible (et
donc E et E 0 ont même dimension, si elle est finie), on dit que les représentations D et D0 sont
équivalentes. (C’est une relation d’équivalence entre représentations !).
Dans le cas de dimension finie, où on identifie E et E 0 , on voit que les matrices représentatives
de D et D0 sont reliées par une transformation de similitude et peuvent être considérées comme
différant par un changement de base. Il n’y a donc pas lieu de distinguer fondamentalement

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

2.1. Définitions et propriétés générales. 69

deux représentations équivalentes, et en “théorie de la représentation” on va s’attacher à étudier

les représentations inéquivalentes.
On appelle caractère d’une représentation de dimension finie la trace de l’opérateur D(g) :

χ(g) = tr D(g) . (2.6)

C’est une fonction de G dans R ou C qui satisfait les propriétés suivantes (les vérifier) :
– Le caractère est indépendent du choix de base dans E.
– Deux représentations équivalentes ont le même caractère.
– Le caractère prend la même valeur pour les différents éléments d’une même classe 1 de G :
on dit que le caractère est une fonction de classe : χ(g) = χ(hgh−1 ).
La réciproque de cette dernière propriété, à savoir une fonction de classe peut-elle s’exprimer
en termes des caractères, est vraie pour tout groupe fini ; elle l’est aussi pour tout groupe de
Lie compact et toute fonction continue (ou de la classe de carré sommable) sur G : c’est l’objet
du théorème de Peter–Weyl, voir plus bas § 2.3.1.
On notera encore que le caractère, évalué pour l’élément identité du groupe, fournit la
dimension de la représentation
χ(e) = dim D . (2.7)

2.1.3 Représentations réductibles et irréductibles

Un autre type de redondance est lié à la somme directe des représentations. Supposons qu’on
a construit deux représentations D1 et D2 de G dans deux espaces E1 et E2 . On peut alors
construire une représentation dans l’espace somme directe E = E1 ⊕ E2 et la représentation
est dite somme directe des représentations D1 et D2 et notée D1 ⊕ D2 . (Rappelons que tout
vecteur de E1 ⊕ E2 peut s’écrire de façon unique comme combinaison linéaire d’un vecteur de
E1 et d’un vecteur de E2 ). Les sous-espaces E1 et E2 de E sont bien sûr laissés invariants par
l’action of D1 ⊕ D2 .
Inversement, si une représentation de G dans un espace E laisse invariant un sous-espace de
E, elle est dite réductible. Dans le cas contraire, elle est irréductible. Si D est réductible et laisse
le sous-espace E1 invariant, et aussi son sous-espace supplémentaire E2 , on dit que la représenta-
tion est complètement réductible (on dit aussi décomposable) ; on peut alors considérer E comme
somme directe de E1 et E2 et la représentation comme somme directe des représentations dans
E1 et E2 .
Quand on s’intéresse à un groupe topologique, resp. de Lie, il est préférable d’ajouter dans la définition de
réductibilité d’une représentation la condition que le sous-espace invariant est fermé, ou une condition de même
nature, en accord avec la topologie. Cela sera considéré comme implicite dans la suite.
Si E est de dimension finie, ceci se traduit simplement sur les matrices de la représentation
qui prennent la forme suivante (dans une base adaptée à la décomposition !) en termes de blocs

1. Les classes du groupe G dont il s’agit ici sont celles résultant de la relation d’équivalence dans G :
g ∼ g 0 ⇔ ∃h ∈ G : g 0 = hgh−1 . Ne pas confondre ces classes avec celles (“cosets”) liées à un sous-groupe.

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

70 Chap.2. Représentations linéaires des groupes

de dimensions dim E1 et dim E2

 
D1 (g) 0
∀g ∈ G D(g) =   . (2.8)
 

0 D2 (g)

Si la représentation est réductible sans être complètement réductible, (représentation indécomposable),

sa matrice prend la forme, dans une base constituée par une base de E1 et d’une base d’un
sous-espace supplémentaire  
D1 (g) D0 (g)
D(g) =   . (2.9)
 

0 D2 (g)
C’est le cas des représentations du groupe des translations à une dimension. La représentation
!
1 a
D(a) = (2.10)
0 1

est réductible, puisqu’elle laisse invariants les vecteurs (X, 0) mais n’a pas de sous-espace
supplémentaire invariant.
En revanche, si la représentation réductible de G dans E laisse invariant le sous-espace E1 ,
il existe une représentation dans le sous-espace E2 = E/E1 . Dans les notations de l’équ. (2.9),
sa matrice représentative est D2 (g).
Il faut encore souligner l’importance du corps de base dans la discussion de l’irréductibilité.
C’est ainsi que la représentation (2.4) qui est irréductible sur un espace vectoriel sur R ne l’est
pas sur C : on peut au prix d’un changement de base la récrire comme
!
e−iθ 0
. (2.11)
0 eiθ

2.1.4 Représentations conjuguée et contragrédiente

Etant donnée une représentation D, soit D sa matrice dans une certaine base, les matrices
D complexes conjuguées forment une autre représentation D∗ dite conjuguée, puisqu’elles
∗

satisfont bien (2.3)

∗
Dik (g.g 0 ) = Dij∗ (g)Djk
∗
(g 0 ) .
La représentation D est dite réelle s’il existe une base où D = D∗ . Cela implique que son
caractère χ est réel. Réciproquement si χ est réel, la représentation D est équivalente à sa
conjuguée D∗ 2 . Si les représentations D et D∗ sont équivalentes mais qu’il n’existe pas de base
où D = D∗ , les représentations sont dites pseudoréelles. (C’est par exemple le cas de la repré-
sentation de spin 21 de SU(2).) Voir le problème III à la fin du chapitre pour une définition plus
canonique de cette notion de représentation réelle ou pseudoréelle.
2. Ceci est vrai au moins pour les représentations irréductibles des groupes finis ou continus compacts pour
lesquelles on verra plus bas (§ 2.3) que deux représentations irréductibles non équivalentes ne peuvent avoir le
même caractère.

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

2.1. Définitions et propriétés générales. 71

Ce concept joue un rôle dans le contrôle de l’“anomalie chirale non-singlet” dans les théories de jauge : si
les fermions appartiennent à une représentation réelle ou pseudoréelle du groupe de jauge, ils n’induisent pas
d’anomalie. Voir le chapitre 5 de ce cours.
La représentation contragrédiente de D est définie quant à elle par

D̄(g) = D−1 T (g)

c’est-à-dire D̄ij (g) = Dji (g −1 ), qui satisfait bien aussi (2.3). Pour une représentation unitaire, cf alinéa suivant,
∗
D̄ij (g) = Dij (g), la contragrédiente s’identifie à la conjuguée. Les représentations D, D∗ et D̄ sont simultanément
réductibles ou irréductibles.
[Dans SL(2, C), (cf. Chapitre 00), la représentation avec indices pointés est la conjuguée de la contragrédiente.
Dans SU(2), elle est equivalent à la représentation à indices non pointés puisqu’elle est unitary. ]

2.1.5 Représentations unitaires

Supposons que l’espace vectoriel E est “préhilbertien”, c’est-à-dire possède un produit sca-
laire (forme J(x, y) = h x|y i = h y|x i∗ bilinéaire symétrique sur R, ou sesquilinéaire sur C),
tel que la norme est définie positive : x 6= 0 ⇒ h x|x i > 0. Si la dimension de E est finie, on
peut trouver une base orthonormale où la matrice de J se réduit à I et y définir des opérateurs
unitaires U tels que U † U = I. Si on est dans un espace de dimension infinie, espace que
nous supposerons préhilbertien séparable 3 , on sait qu’on peut trouver une base orthonormale
dénombrable, donc indexée par un indice discret. Une représentation de G dans E est dite
unitaire si pour tout g ∈ G, l’opérateur D(g) est unitaire. On a donc pour tous g ∈ G et
x, y ∈ E

h x|y i = h D(g)x|D(g)y i (2.12)

†
donc D(g) D(g) = I (2.13)
et D(g −1 ) = D−1 (g) = D† (g) . (2.14)

On a les propriétés importantes suivantes :

(i) Toute représentation unitaire réductible est complètement réductible (théorème de Ma-
schke).
[théorème de Maschke : pour un groupe fini, toute rep est complt red] En effet soit E1 un sous-espace
invariant, E2 = (E1 )⊥ son espace supplémentaire est invariant puisque pour tous g ∈ G, x ∈ E1
et y ∈ E2 on a
h x|D(g)y i = h D(g −1 )x|y i = 0 (2.15)
ce qui prouve que D(g)y ∈ E2 .
(ii) Toute représentation d’un groupe fini ou d’un groupe compact dans un espace doté d’un
produit scalaire est “unitarisable”, c’est-à-dire équivalente à une représentation unitaire.
Preuve. Considérons d’abord le cas d’un groupe fini et formons
X
Q= D† (g 0 )D(g 0 ) (2.16)
g 0 ∈G

3. Un espace est dit séparable s’il contient un sous-ensemble dénombrable dense.

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

72 Chap.2. Représentations linéaires des groupes

qui satisfait
X
D† (g)QD(g) = D† (g 0 .g)D(g 0 .g) = Q (2.17)
g 0 ∈G
P P
où on a remplacé g0 par g0 .g (“lemme de réarrangement”), (cf § 1.2.4) L’opérateur auto-
adjoint Q est défini positif, (pourquoi ?), on peut donc l’écrire sous la forme

Q = V †V (2.18)

avec V inversible. (Par exemple, la diagonalisation de l’opérateur auto-adjoint Q par un opérateur

unitaire, Q = U Λ2 U † , avec Λ diagonal réel, permet d’en extraire la “racine carrée” V = U ΛU † .)
L’entrelaceur V définit une représentation D0 équivalente à D et unitaire :

D0 (g) = V D(g)V −1
D0† (g)D0 (g) = V †−1 D† (g)V † V D(g)V −1 (2.19)
(2.17)
= V †−1 D† (g)QD(g)V −1 = V †−1 QV −1 = I .

Dans le cas d’un groupe continu compact, l’existence de la mesure invariante de Haar (cf §
1.2.4) permet de répéter l’argument avec Q = dµ(g 0 )D† (g 0 )D(g 0 ). cqfd
R

Comme corollaire des deux propriétés précédentes, toute représentation réductible d’un
groupe fini ou d’un groupe compact sur un espace préhilbertien est (équivalente à) une re-
présentation unitaire et complètement réductible. Il s’agit donc pour nous de construire et de
classifier les représentations unitaires irréductibles. On va montrer plus bas que, pour un groupe
fini ou compact, ces représentations irréductibles sont de dimension finie.
!
1 a
Contre-exemple dans le cas d’un groupe non compact : les matrices forment une représentation
0 1
indécomposable (non complètement réductible).

2.1.6 Lemme de Schur

Soit deux représentations irréductibles D dans E et D0 dans E 0 et un opérateur d’entrelacement
entre elles, comme défini en (2.5). On a alors l’important
Lemme de Schur : ou bien V = 0, ou bien V est une bijection et les représentations sont
équivalentes.
Preuve : Supposons V 6= 0. Alors V D(g) = D0 (g)V implique que le noyau de V est un sous-
espace de E invariant par D ; par l’hypothèse d’irréductibilité, il se réduit donc à 0 (il ne peut
être égal à E tout entier sans quoi V serait nul). De même, l’image de V est un sous-espace de
E 0 invariant par D0 , il ne peut être nul et est donc identique à E 0 . Des théorèmes classiques sur
les applications linéaires entre espaces vectoriels, il découle que V est une bijection de E dans
E 0 et que les représentations sont donc équivalentes. c.q.f.d.
[a) ∀x ∈ ker V , ∀g ∈ G, D(g)x ∈ ker V puisque V D(g)x = D0 (g)V x = 0. Donc ker V est un sous-espace
invariant de E. b) ∀x0 ∈ ImV ∃y ∈ E : x0 = V y, et D0 (g)x0 = D0 (g)V y = V D(g)y ∈ ImV . Donc ImV est
sous-espace invariant de E 0 . ]

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

2.1. Définitions et propriétés générales. 73

N.B. Si les deux représentations ne sont pas irréductibles, c’est bien sûr faux en général. Un
contre-exemple
! est fourni par la représentation (2.10) qui commute avec les matrices V =
0 b
.
0 0
Corollaire 1. Tout opérateur d’entrelacement d’une représentation irréductible sur le corps C
avec elle-même, c’est-à-dire tout opérateur commutant avec tous les représentants du groupe,
est un multiple de l’identité.
En effet, sur C, V a au moins une valeur propre λ (qui est non nulle puisque V est inversible
par le lemme de Schur). L’opérateur V − λI est lui aussi un opérateur d’entrelacement, mais il
est singulier donc nul.
Corollaire 2. Une représentation irréductible sur C d’un groupe abélien est nécessairement de
dimension 1.
En effet, soit g 0 ∈ G, D(g 0 ) commute avec tous les D(g) puisque G est abélien. Donc (corollaire
1) D(g 0 ) = λ(g 0 )I. La représentation se décompose en dim D copies de la représentation de
dimension 1 : g 7→ λ(g), et l’irréductibilité impose que dim D = 1.
Insistons sur l’importance du caractère algébriquement clos de C, par opposition à R,
dans ces deux ! corollaires. La représentation sur R du groupe SO(2) par les matrices D(θ) =
cos θ − sin θ
vient fournir des contrexemples aux deux propositions précédentes : toute ma-
sin θ cos θ
trice D(α) commute avec D(θ) mais n’a pas de valeur propre réelle (si α 6= 0, π) et la représen-
tation est irréductible sur R, quoique de dimension deux.
Application du Corollaire 1 : dans l’algèbre de Lie d’un groupe de Lie, les opérateurs de Casimir quadra-
tiques définis à la fin du Chap. 1 commutent avec tous les générateurs infinitésimaux et donc avec tous les
éléments du groupe. Anticipant un peu sur la discussion à venir des représentations d’une algèbre de Lie, dans
une représentation unitaire on peut choisir ces opérateurs de Casimir hermitiens, donc diagonalisables, ce qui
permet d’appliquer le raisonnement du Corollaire 1 : dans toute représentation irréductible, ils sont multiples
de l’identité. Ainsi pour SU(2), J2 = j(j + 1)I dans la représentation de spin j.

2.1.7 Produit tensoriel de représentations ; décomposition de Clebsch-

Gordan
Produit tensoriel de représentations

Une méthode couramment utilisée pour construire des représentations irréductibles d’un groupe
donné consiste à construire le produit tensoriel de représentations connues et à le décomposer en
représentations irréductibles. C’est aussi la situation qu’on rencontre en Mécanique Quantique,
quand on connaı̂t la transformation des composantes d’un système et qu’on étudie comment le
système composé se transforme (système de deux particules de spin j1 et j2 par exemple).
Soient E1 et E2 deux espaces vectoriels portant des représentations D1 et D2 d’un groupe G.
L’espace produit tensoriel 4 E = E1 ⊗ E2 est l’espace engendré par les combinaisons linéaires de
“produits” (tensoriels) d’un élément de E1 et d’un élément de E2 : z = i x(i) ⊗ y (i) . L’espace
P

E porte lui même une représentation, notée D = D1 ⊗ D2 , produit tensoriel (ou produit direct)
4. On trouvera à l’Appendice D un petit rappel sur les produits tensoriels et les tenseurs.

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

74 Chap.2. Représentations linéaires des groupes

des représentations D1 et D2 . (Voir au Chap. 0 l’exemple du groupe SU(2)). Sur l’élément z

ci-dessus
X
D(g)z = D1 (g)x(i) ⊗ D2 (g)y (i) . (2.20)
i

On vérifie immédiatement que le caractère de la représentation D est le produit des caractères

χ1 et χ2 de D1 et D2
χ(g) = χ1 (g)χ2 (g) (2.21)

En particulier en évaluant cette relation pour g = e, on a pour des représentations de dimension

finie
dim D = dim(E1 ⊗ E2 ) = dim E1 . dim E2 = dim D1 . dim D2 (2.22)

comme il est bien connu pour un produit tensoriel.

Décomposition de Clebsch-Gordan

La représentation produit direct de deux représentations irréductibles D et D0 n’est en général

pas irréductible. Si elle est complètement réductible (comme c’est le cas pour les représen-
tations unitaires qui vont nous intéresser au premier chef), on effectue la décomposition de
Clebsch-Gordan en représentations irréductibles

D ⊗ D0 = ⊕j Dj (2.23)

où au second membre apparaissent un certain nombre de représentations irréductibles D1 , · · · .

La notation ⊕j recouvre des situations très variées : sommation sur un ensemble fini (groupes
finis), sur un sous-ensemble fini d’un ensemble a priori infini mais discret (groupes compacts)
ou sur des variables éventuellement continues (groupes non compacts).
Si G est fini ou compact et si ses représentations irréductibles inéquivalentes ont été classées
et indexées : D(ρ) , on peut préférer à (2.23) une autre écriture qui indique lesquelles de ces re-
présentations inéquivalentes apparaissent, et avec quelle multiplicité

D ⊗ D0 = ⊕ρ mρ D(ρ) . (2.24)

Une écriture plus correcte serait E ⊗ E 0 = ⊕ρ Fρ ⊗ E (ρ) où Fρ est un espace vectoriel de dimension mρ , l’“espace
de multiplicité”.
Les entiers mρ sont non négatifs. Les équations (2.23) et (2.24) impliquent des règles simples
sur les caractères et les dimensions
X X
χD .χD0 = χj = mρ χ(ρ) (2.25)
j ρ
X X
0
dim D. dim D = dim Dj = mρ dim D(ρ) . (2.26)
j ρ

Exemple : le produit tensoriel de deux copies de l’espace euclidien de dimension 3 ne forme

pas une représentation irréductible du groupe des rotations SO(3). Cet espace est engendré par

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

2.1. Définitions et propriétés générales. 75

les produits tensoriels de vecteurs ~x et ~y et on sait construire le produit scalaire ~x.~y qui est
invariant par le groupe (représentation triviale), un tenseur antisymétrique à deux indices

Aij = xi yj − xj yi

qui se transforme comme une représentation irréductible de dimension 3 (de spin 1), 5 et un
tenseur symétrique de trace nulle
2
Sij = xi yj + xj yi − δij ~x.~y
3
qui se transforme selon une représentation irréductible de dimension 5 (spin 2) ; on peut donc
décomposer tout tenseur xi yj selon
1 1 1
xi yj = δij ~x.~y + Aij + Sij ;
3 2 2
le total des dimensions est bien sûr de 9 = 3 × 3 = 1 + 3 + 5 et en repérant dans ce cas simple
les représentations par leur dimension, on écrit

D(3) ⊗ D(3) = D(1) ⊕ D(3) ⊕ D(5) . (2.27)

Ou encore, dans la notation en “spins”

(1) ⊗ (1) = (0) ⊕ (1) ⊕ (2)

où on reconnaı̂t bien sûr les règles familières d’“addition du moment angulaire” (voir Chap. 0)
0
(j) ⊗ (j 0 ) = ⊕j+j 00
j 00 =|j−j 0 | (j ) . (2.28)

En itérant, on trouve de même

D(3) ⊗ D(3) ⊗ D(3) = D(1) ⊕ 3D(3) ⊕ 2D(5) ⊕ D(7) , (2.29)

avec cette fois des multiplicités.

Invariants.
Un problème rencontré fréquemment consiste à compter le nombre d’invariants (par l’action
d’un groupe G) indépendants, obtenus en “combinant” (par produit tensoriel) des quantités
ayant des transformations prescrites (c’est-à-dire se transformant selon des représentations
données de G). C’est précisément l’information contenue dans les décompositions en représenta-
tions irréductibles comme (2.24, 2.27, 2.29), où la multiplicité de la représentation identité four-
nit bien ce nombre d’invariants dans le produit tensoriel des représentations considérées. Exer-
cice : interpréter en termes d’invariants géométriques classiques les multiplicités m0 = 1, 1, 3
de la représentation identité apparaissant dans les représentations (1) ⊗ (1), (1) ⊗ (1) ⊗ (1),
(1) ⊗ (1) ⊗ (1) ⊗ (1) de SO(3). On fera grand usage de ce type de considérations au Chap 4 en
discutant les amplitudes invariantes par le groupe SU(3). Voir aussi le Problème II à la fin de
ce chapitre.
5. (un tel tenseur est “dual” d’un vecteur : Aij = ijk zk , z = x ∧ y.)

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

76 Chap.2. Représentations linéaires des groupes

Coefficients de Clebsch-Gordan

La formule (2.23) décrit comment dans une transformation du groupe les matrices de re-
présentation se décomposent en représentations irréductibles. Il est aussi souvent important
(ρ)
de savoir comment les vecteurs des représentations concernées se décomposent. Soit eα , α =
1, · · · , dim D(ρ) , une base de vecteurs de la représentation ρ. On cherche à développer le produit
(ρ) (σ) (τ )
de deux tels objets, soit eα ⊗ eβ , sur des eγ . Comme la représentation τ peut intervenir un
nombre mτ de fois, il convient d’introduire un indice supplémentaire i = 1, · · · , mτ . On écrira

(σ)
X
e(ρ)
α ⊗ eβ = Cρ,α; σ,β|τi ,γ eγ(τi ) . (2.30)
τ,γ,i

ou encore avec des notations plus familières en Mécanique Quantique

Les coefficients Cρ,α; σ,β|τi ,γ = h τi γ|ρ, α; σ, β i sont les coefficients de Clebsch-Gordan. Au

contraire des mρ de (2.24), ils n’ont aucune raison d’être entiers, comme on l’a vu au Cha-
pitre 00 dans le cas du groupe des rotations, ni même réels en général. Supposons que les
représentations considérées sont unitaires et que les bases ont été choisies orthonormées. Les
coefficients de C.-G. qui représentent un changement de base orthonormée dans l’espace E1 ⊗E2
satisfont donc à des relations d’orthonormalité et de complétude
X
h τi γ|ρ, α; σ, β ih τi γ|ρ, α0 ; σ, β 0 i∗ = δα,α0 δβ,β 0 (2.32)
τ,γ,i
X
h τi γ|ρ, α; σ, β ih τj0 γ 0 |ρ, α; σ, β i∗ = δτ,τ 0 δγ,γ 0 δi,j . (2.33)
α,β

Ceci permet d’inverser la relation (2.31) en

X
|τi γ i = h τi γ|ρ, α; σ, β i∗ |ρ, α; σ, β i (2.34)
α,β

Finalement en appliquant une opération du groupe aux deux membres de (2.31) et en utilisant
ces relations, on décompose le produit des matrices D(ρ) et D(σ) de façon tout à fait explicite

(ρ) (σ)
X (τ )
Dαα0 Dββ 0 = h τi γ|ρ, α; σ, β i∗ h τi γ 0 |ρ, α0 ; σ, β 0 i Dγγi0 . (2.37)
τ,γ,γ 0 ,i

On verra plus bas (§ 2.4.4) une application de ces formules au théorème de Wigner-Eckart.

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

2.2. Représentations des groupes et représentations des algèbres de Lie 77

2.1.8 Décomposition d’une représentation d’un groupe en représen-

tations irréductibles d’un sous-groupe
Étant un sous-groupe H d’un groupe G, toute représentation D de G fournit par restriction à
H une représentation D0 de ce dernier

∀h ∈ H D0 (h) = D(h) . (2.38)

Il s’agit là d’une méthode souvent utilisée pour fabriquer des représentations de H, une fois
connues celles de G. En général, si D est irréductible (sur G), D0 ne l’est pas (sur H), et se pose
à nouveau la question de la décomposer en représentations irréductibles. Par exemple, étant
donné un sous-groupe fini de SU(2), il s’agit de dresser la liste (finie, comme on verra plus
bas) de ses représentations irréductibles à partir de celles de SU(2). Autre exemple rencontré
souvent en physique : un groupe de symétrie G est “brisé” en un sous-groupe H ; comment les
représentations de G se décomposent-elles en représentations de H ? Exemples : en physique des
solides, le groupe G ⊂ SO(3) de symétrie “ponctuelle” (c’est-à-dire de rotations et réflexions)
d’un cristal est brisé en H par un champ extérieur ; en physique des particules, on rencontrera
aux chapitres 4 et 5 les cas de SU(2)⊂ SU(3) ; U(1)×SU(2)× SU(3) ⊂ SU(5), etc.

2.2 Représentations des groupes et représentations des

algèbres de Lie

2.2.1 Définition. Universalité

La notion de représentation s’applique aussi aux algèbres de Lie.
On appelle représentation d’une algèbre de Lie g dans un espace vectoriel E un homomor-
phisme de g dans l’algèbre de Lie des opérateurs linéaires sur l’espace E, c’est-à-dire une appli-
cation X ∈ g 7→ d(X) ∈ End E qui respecte linéarité et crochet de Lie : X, Y ∈ g, [X, Y ] 7→
d([X, Y ]) = [d(X), d(Y )] ∈ End V . Un corollaire de cette définition est que dans toute représen-
tation de l’algèbre, les (représentants des) générateurs satisfont les mêmes relations de commu-
tation. Autrement dit, dans des bases bien choisies, les constantes de structure sont les mêmes
dans toutes les représentations. Plus précisément, si ti est une base de g, avec [ti , tj ] = Cij k tk ,
et si Ti = d(ti ) est son image par la représentation d

[Ti , Tj ] = [d(ti ), d(tj )] = d([ti , tj ]) = Cij k d(tk ) = Cij k Tk .

Ainsi des calculs menés dans une représentation particulière mais faisant appel uniquement
aux règles de commutation de l’algèbre de Lie demeurent valables dans toute représentation.
On a vu au Chap. 0, § 0.2.2, une illustration de cette propriété d’universalité.
En revanche, les opérateurs de Casimir prennent des valeurs différentes dans des représen-
tations irréductibles différentes.

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

78 Chap.2. Représentations linéaires des groupes

En parallèle avec les définitions du § 2.1.1, on définit les notions de représentation fidèle
d’une algèbre de Lie (son noyau ker d = {X|d(X) = 0} se réduit à l’élément nul de g), de
représentation réductible ou irréductible (existence ou non d’un sous-espace invariant), etc.

2.2.2 Représentations d’un groupe de Lie et de son algèbre de Lie

Toute représentation différentiable D de G dans un espace E fournit une application d de
l’algèbre de Lie g dans l’algèbre des opérateurs sur E. On l’obtient en prenant la forme infi-
nitésimale de D(g), pour g(t) = I + tX (ou g = etX )

d
d(X) := D(g(t)) , (2.39)
dt t=0

ou encore, pour t infinitésimal,

D(etX ) = etd(X) . (2.40)

Montrons que cette application est bien compatible avec les crochets de Lie, et que c’est donc
une représentation de l’algèbre de Lie. Pour cela nous répétons la discussion du chap. 1, §
3.4, pour faire apparaı̂tre le commutateur de façon naturelle. Soient g(t) = etX et h(u) = euY
deux sous-groupes à un paramètre, pour t et u infiniment petits et du même ordre. On a
etX euY e−tX e−uY = eZ avec Z = ut[X, Y ] + · · · , et donc

ed(Z) = D(eZ ) = D(etX euY e−tX e−uY ) = D(etX )D(euY )D(e−tX )D(e−uY )
= etd(X) eud(Y ) e−td(X) e−ud(Y )
= eut[d(X),d(Y )]+··· , (2.41)

d’où en identifiant les termes dominants, d([X, Y ]) = [d(X), d(Y )], ce qu’il fallait démontrer.
◦ Ce passage d’une représentation de G à une représentation de g s’applique en particulier
à une représentation de G qui joue un rôle spécial, la représentation adjointe de G dans son
algèbre de Lie g . Cette représentation est définie par l’action suivante

X∈g Dadj (g)(X) = gXg −1 , (2.42)

ce qu’on note Ad g X. (Il faut comprendre le membre de droite de (2.42) soit comme résultant
de la dérivation en t = 0 de g etX g −1 , soit, selon le point de vue généralement adopté dans
ces notes, au sens de la multiplication matricielle, les matrices g et X agissant dans le même
espace.)
La représentation adjointe de G donne lieu à une représentation de g dans l’espace g,
également appelée représentation adjointe. On l’obtient en prenant la forme infinitésimale de
(2.42), formellement g = I + tY , ou encore en considérant le sous-groupe à un paramètre
engendré par Y ∈ g, g(t) = exp tY et en calculant Ad g(t)X = g(t)Xg −1 (t) = X +t[Y, X]+O(t2 )
(cf. chap.1 (3.15)), et donc

d
Ad g(t)X = [Y, X] = ad Y X . (2.43)
dt t=0

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

2.3. Représentations des groupes de Lie compacts 79

où on retrouve (et justifie) notre notation ad du chap. 1.

Exercice : montrer que les matrices Ti définies par (Ti )j k = Cik j satisfont les relations
de l’algèbre de Lie comme conséquence de l’identité de Jacobi, et forment donc une base de
générateurs dans la représentation adjointe.
N.B. À une représentation unitaire de G correspond une représentation de g par des opérateurs (ou matrices)
anti-hermitien(ne)s. Les physiciens, qui aiment bien les opérateurs hermitiens, incluent en général un “i” devant
les générateurs infinitésimaux : cf e−iψJ , [Ja , Jb ] = iabc Jc , etc.

◦ Inversement, une représentation d’une algèbre de Lie g engendre une représentation de

l’unique groupe G connexe et simplement connexe ayant g comme algèbre de Lie. Autrement
d
dit si X 7→ d(X) est une représentation de l’algèbre, eX 7→ ed(X) en est une du groupe G. En
effet, la formule de BCH étant “universelle”, c’est-à-dire n’impliquant que des combinaisons
linéaires de crochets dans l’algèbre de Lie et étant donc insensible à la représentation de g, on
a:
eX eY = eZ 7→ ed(X) ed(Y ) = ed(Z) ,

ce qui prouve que l’homomorphisme des algèbres de Lie s’intègre en un homomorphisme des
groupes au voisinage de l’identité. On démontre enfin qu’un tel homomorphisme infiniment
différentiable et local (au voisinage de l’identité) d’un groupe simplement connexe G dans
un groupe G0 (ici, le groupe linéaire GL(E)) s’étend de façon unique en un homomorphisme
infiniment différentiable de tout G dans G0 . En résumé, il suffit donc pour trouver les représen-
tations (éventuellement unitaires) du groupe G de trouver les représentations par des opérateurs
(éventuellement antihermitiques) de son algèbre de Lie g.
C’est ce principe fondamental qui a déjà été illustré au Chap. 0 sur les deux cas concrets
de SU(2) et de SL(2, C).

2.3 Représentations des groupes de Lie compacts

Dans cette section, nous allons nous intéresser aux représentations des groupes compacts
sur le corps des complexes C. La plupart des résultats qu’on va obtenir reposent sur le fait
qu’on peut effectuer la sommation sur le groupe avec la mesure de Haar dµ(g). On comparera à
l’occasion avec la situation du cas non compact. Dans toute cette discussion, il est bon d’avoir
toujours à l’esprit les deux cas de référence : le groupe compact U(1)= {eix } avec x ∈ R/2πZ
(un angle modulo 2π), et le groupe non compact R, groupe additif des réels. On mentionnera
aussi rapidement, “pour mémoire”, le cas des groupes finis, très proche de celui des groupes
compacts.

2.3.1 Orthogonalité et complétude

Soit G un groupe compact. Nous admettrons que ses représentations irréductibles inéquivalentes
sont indexées par un indice discret, qu’on mettra en position supérieure : D(ρ) . [Heuristiquement,
pour un groupe compact, le Casimir C2 ≈ le laplacien sur le groupe est un opérateur elliptique sur un domaine
compact, donc a un spectre discret. Une irrep est indexée par une de ses valeurs propres et l’indice ρ représente

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

80 Chap.2. Représentations linéaires des groupes

Ces représentations sont a priori de dimension finie ou infinie, mais on verra

donc cette v.p de C2 . ]
plus bas que la dimension de D(ρ) notée nρ est en fait finie ; dans une base finie ou dénombrable,
(ρ)
les matrices Dαβ peuvent être supposées unitaires d’après le résultat du paragraphe 2.1.3. (Au
contraire, une représentation générique d’un groupe non compact dépend d’un indice continu.
Et on va voir que ses représentations unitaires sont nécessairement de dimension infinie.)
Dans nos deux cas de référence, les représentations irréductibles de U(1) (donc de dimension 1 pour ce groupe
abélien) sont telles que D(k) (x)D(k) (x0 ) = D(k) (x + x0 ), elles sont de la forme par D(k) (x) = eikx avec k ∈ Z,
cette dernière condition garantissant que la représentation est univaluée quand on change de détermination
x → x + 2πn. Pour G = R, on peut encore prendre x 7→ eikx , mais rien ne restreint k ∈ C, sauf l’unitarité qui
force k ∈ R.
(ρ)
Théorème : Pour un groupe compact, les matrices Dαβ satisfont les propriétés d’orthogonalité
suivantes Z
dµ(g) (ρ) (ρ0 )∗ 1
Dαβ (g)Dα0 β 0 (g) = δρρ0 δαα0 δββ 0 (2.44)
v(G) nρ
et leurs caractères satisfont donc
Z
dµ(g) (ρ) 0
χ (g)χ(ρ )∗ (g) = δρρ0 . (2.45)
v(G)
R
Dans ces formules, dµ(g) désigne la mesure de Haar et v(G) = dµ(g) est le “volume du
groupe”.
Preuve : Soit M une matrice quelconque de dimension nρ × nρ0 . Considérons alors la matrice
Z
0
V = dµ(g 0 )D(ρ) (g 0 )M D(ρ )† (g 0 ) . (2.46)

Le membre de gauche de (2.44) est (à un facteur v(G) près) la dérivée par rapport à Mββ 0 de
Vαα0 . Les représentations étant unitaires, D† (g) = D(g −1 ), il est facile, en utilisant l’invariance
à gauche de la mesure dµ(g 0 ) = dµ(gg 0 ), de vérifier que V satisfait
0
V D(ρ ) (g) = D(ρ) (g)V (2.47)

pour tout g ∈ G. La matrice V est donc par le lemme de Schur nulle si les représentations ρ et
ρ0 sont différentes, et un multiple de l’identité si ρ = ρ0 .
a) Dans le premier cas, en choisissant une matrice M dont le seul élément non nul est Mββ 0 = 1
et en identifiant l’élément de matrice Vαα0 , on obtient la propriété d’orthogonalité (2.44).
b) Si ρ = ρ0 , choisissons d’abord M11 = 1, les autres Mββ 0 nuls. On a V = c1 I, où le coefficient
c1 est obtenu en prenant la trace : c1 nρ = v(G)D11 (I) = v(G), ce qui prouve que la dimension
nρ est finie.
c) En répétant l’argument avec une matrice M arbitraire, on a à nouveau V = cM I et on
calcule cM en prenant la trace : cM nρ = v(G)tr M , ce qui, par différentiation par rapport à
Mββ 0 , conduit à l’orthonormalité (2.44), cqfd.
La proposition (2.45) découle simplement de la précédente en prenant la trace sur α = β et
α = β 0.
0

Soulignons deux conséquences importantes de cette discussion :

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

2.3. Représentations des groupes de Lie compacts 81

– on vient de voir que toute représentation irréductible (et unitaire) d’un groupe compact
est de dimension finie ;
– la relation (2.45) implique que deux représentations D(ρ) et D(σ) sont équivalentes (en
fait identiques, compte tenu de notre convention d’indexation) ssi leurs caractères sont
égaux : χ(ρ) = χ(σ) .

Cas d’un groupe non compact

La plus grande partie du calcul précédent s’applique aussi à un groupe non compact pourvu qu’il soit doté
d’une mesure invariante à gauche (ce qui est vrai dans une large classe de groupes, cf chap. 1, fin du § 1.2.4)
et que la représentation soit dans un espace préhilbertien séparable, donc doté d’une base discrète, et soit de
carré intégrable : Dαβ ∈ L2 (G). En choisissant M comme en b), on a à nouveau dµ(g) = c1 tr I. Au membre
R

de gauche, l’intégrale sur le groupe (le “volume du groupe” G) diverge. Au membre de droite, tr I, la dimension
de la représentation, est donc infinie.
De façon générale, on peut dire que
Toute représentation unitaire de carré intégrable d’un groupe non compact est de dimension
infinie.
Bien sûr, la représentation triviale g 7→ 1 (qui n’est pas L2 (G)) échappe à cet argument.

Testons à nouveau ces résultats sur les deux cas de U(1) et R. Pour la représentation unitaire
ikx
e de U(1), la relation (2.44) (ou (2.45), cela ne fait pas de différence pour ces représentations
de dimension 1) exprime que Z 2π
dx ikx −ik0 x
e e = δkk0 ,
0 2π
comme on sait bien. Par contre pour R elle conduirait à
Z ∞
0
dxeikx e−ik x = 2πδ(k − k 0 )
−∞

avec la fonction de Dirac. Bien sûr, cette expression n’a pas de sens pour k = k 0 , la représen-
tation n’est pas de carré intégrable.

Complétude
ρ
Revenons au cas d’un groupe compact. On peut démontrer que les matrices Dαβ (g) satisfont
aussi une propriété de complétude
X (ρ) (ρ)∗
nρ Dαβ (g)Dαβ (g 0 ) = v(G)δ(g, g 0 ) , (2.48)
ρ,α,β

ou encore si on préfère
X (ρ) (ρ)†
X
nρ Dαβ (g)Dβα (g 0 ) = nρ χ(ρ) (g.g 0−1 ) = v(G)δ(g, g 0 ) , (2.48)0
ρ,α,β ρ

où δ(g, g 0 ) est la distribution de Dirac adaptée à la mesure de Haar, c’est-à-dire telle que
dµ(g 0 )f (g 0 )δ(g, g 0 ) = f (g) pour toute fonction f sur G suffisamment régulière.
R

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

82 Chap.2. Représentations linéaires des groupes

Cette propriété de complétude est importante : elle nous apprend que toute fonction sur le
groupe, continue ou de carré intégrable, à valeurs dans C, peut être développée sur les fonctions
(ρ)
Dαβ (g)
dµ(g 0 ) (ρ)† 0
Z X Z X
0 0 0 (ρ) (ρ) (ρ)
f (g) = dµ(g )δ(g, g )f (g ) = nρ Dαβ (g) Dβα (g )f (g 0 ) =: nρ Dαβ (g)fαβ .
ρ,α,β
v(G) ρ,α,β
(2.49)
C’est le théorème de Peter–Weyl, non trivial, que nous admettrons. Un corollaire dit alors que
les caractères χ(ρ) d’un groupe compact forment un système complet de fonctions de classe,
c’est-à-dire invariante par g ∼ hgh−1 . Autrement dit, toute fonction de classe continue peut se
décomposer sur les caractères irréductibles.
Donnons la démonstration de cette dernière assertion. Soit f une fonction de classe continue, f (g) =
f (hgh−1 ), appliquons lui le théorème de Peter-Weyl, et examinons l’intégrale apparaissant dans (2.49) :
dµ(g 0 ) dµ(g 0 )
Z Z
(ρ) (ρ)† (ρ)†
fαβ = f (g 0 )Dβα (g 0 ) = f (hg 0 h−1 )Dβα (hg 0 h−1 ) ∀h
v(G) v(G)
dµ(h) dµ(g 0 )
Z
(ρ)† (ρ)† (ρ)†
= f (g 0 )Dβγ (h)Dγδ (g 0 )Dδα (h−1 )
v(G) v(G)
dµ(g 0 )
Z
(ρ)† 1
= f (g 0 )Dγδ (g 0 ) δαβ δγδ par (2.44)
v(G) n ρ
Z 0
1 dµ(g )
= f (g 0 )χ(ρ)∗ (g 0 )δαβ (2.50)
nρ v(G)
d’où il découle que (2.49) se réduit bien à un développement sur les caractères, cqfd.
Testons à nouveau ces relations de complétude sur le cas U(1). Elles expriment dans ce cas
∞
0
X
eikx e−ikx = 2πδP (x − x0 ) (2.51)
k=−∞

où δP (x − x0 ) = ∞ 0
P
`=−∞ δ(x − x − 2π`) est la distribution de Dirac périodique (alias “peigne de
Dirac”). Et (2.49) signifie que toute fonction périodique de période 2π (et avec des conditions
adéquates de régularité) peut être représentée par sa série de Fourier
∞ Z π
X dx
f (x) = ikx
e fk fk = f (x)e−ikx . (2.52)
k=−∞ −π 2π

Pour le groupe non compact R, la relation de complétude (qui est encore vraie dans ce cas)
équivaut à la transformation de Fourier
Z ∞ Z ∞
dx
f (x) = dk f˜(k)eikx
f˜(k) = f (x)e−ikx . (2.53)
−∞ −∞ 2π
Le théorème de Peter–Weyl pour un groupe quelconque est donc une généralisation des
décompositions de Fourier.
Le groupe des rotations dans le plan SO(2) est isomorphe au groupe U (1). Noter que si on s’intéresse à
des représentations irréductibles réelles, la dimension n’est plus égale à 1 (sauf pour la représentation identité !)
mais à 2
!
cos kα − sin kα
(k)
D (α) = , k ∈ N∗ , χ(k) (α) = 2 cos kα (2.54)
sin kα cos kα

Que deviennent les relations d’orthogonalité et de complétude ?

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

2.3. Représentations des groupes de Lie compacts 83

2.3.2 Conséquences
Pour un groupe compact,
(i) toute représentation étant complétement réductible, son caractère s’écrit
X
χ= mρ χ(ρ) (2.55)
ρ

et les multiplicités peuvent se calculer par la formule

Z
dµ(g)
mρ = χ(g)χ(ρ)∗ (g) . (2.56)
v(G)

On a aussi kχk2 := dµ(g)

R
|χ(g)|2 = ρ m2ρ , un entier supérieur ou égal à 1. Par conséquent, une
P
v(G)
représentation est irréductible ssi son caractère satisfait la condition kχk2 = 1. De façon générale
le calcul de kχk2 nous donne des indications sur le nombre de représentations irréductibles
apparaissant dans la décomposition de la représentation de caractère χ, une information souvent
très utile dans les problèmes évoqués aux § 2.1.7 et 2.1.8.
Plus généralement, toute fonction de classe peut se décomposer sur les caractères irréductibles
(théorème de Peter-Weyl). Comme on vient de le voir, cette décomposition des fonctions de
classe sur les caractères irréductibles est une généralisation de la décomposition de Fourier.
(ii) De même on peut déterminer les multiplicités dans la décomposition de Clebsch-Gordan
d’un produit direct de deux représentations en projetant le produit de leurs caractères sur les
caractères irréductibles.
Illustrons ceci sur le produit de deux représentations irréductibles ρ et σ

D(ρ) ⊗ D(σ) = ⊕τ mτ D(τ )

X
χ(ρ) χ(σ) = mτ χ(τ ) (2.57)
τ
Z
dµ(g) (ρ)
mτ = χ (g)χ(σ) (g)χ(τ )∗ (g) ,
v(G)
donc la représentation τ apparaı̂t dans le produit ρ ⊗ σ avec la même multiplicité que σ ∗ dans
ρ ⊗ τ ∗ . Exercice : vérifier qu’en particulier, la représentation identité apparaı̂t dans le produit
des irreps ρ et σ ssi σ = ρ∗ , la représentation complexe conjuguée de ρ.

Cas de SU(2)

C’est un bon exercice de comprendre comment les différentes propriétés discutées dans ce
paragraphe sont réalisées par les matrices de représentation de SU(2). Cela sera discuté en
détail en TD et dans l’Appendice E.

2.3.3 Cas des groupes finis

Nous n’évoquerons que très brièvement le cas des groupes finis. En fait les théorèmes (2.44,
2.45, 2.48) et leurs conséquences (2.55, 2.56, 2.57), qui étaient basés sur l’existence d’une me-
sure invariante, sont bien sûr toujours vrais. Il suffit de remplacer dans les expressions de ces

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

84 Chap.2. Représentations linéaires des groupes

R P
théorèmes le volume v(G) par l’ordre |G| (=nombre d’éléments) de G, et dµ(g) par g∈G :

1 X (ρ) (ρ0 )∗ 1
Dαβ (g)Dα0 β 0 (g) = δρρ0 δαα0 δββ 0 (2.58)
|G| g∈G nρ
X nρ (ρ) (ρ)∗
Dαβ (g)Dαβ (g 0 ) = δg,g0 . (2.59)
ρ,α,β
|G|

Mais les représentations des groupes finis jouissent de propriétés supplémentaires. Montrons
ainsi que les dimensions des représentations irréductibles non équivalentes vérifient
X
n2ρ = |G| . (2.60)
ρ

Cela découle du fait que le système d’équations (2.58-2.59) peut être vu comme exprimant que
12
nρ (ρ)
Dαβ (g) de dimensions ρ n2ρ × |G| satisfait UU † = I, U † U = I, ce
P
la matrice Uρ,αβ ; g := |G|
qui n’est possible que si c’est une matrice carrée, cqfd.
Cela implique en particulier que le nombre r de représentations irréductibles inéquivalentes est
fini, et nous allons montrer que
Proposition. Le nombre r de représentations irréductibles est fini et égal au nombre m des
classes Ci dans le groupe.
(ρ)
Preuve : En notant χj la valeur du caractère χ(ρ) dans la classe Ci , on peut récrire les relations
d’orthogonalité et de complétude des caractères selon
m
1 X (ρ) (ρ0 )∗
|Ci |χi χi = δρρ0 (2.61a)
|G| i=1
r
|Ci | X (ρ) (ρ)∗
χ χ = δij . (2.61b)
|G| ρ=1 i j

(Exercice : déduire la deuxième relation de (2.49) et (2.50), appliquées à un groupe fini.)

12
Mais à nouveau, ces relations expriment que la matrice Kρ i := |C i| (ρ)
|G|
χi de dimensions r × m
satisfait KK† = I, K† K = I, donc est carrée (et unitaire), m = r, cqfd.
La table de caractères d’un groupe fini est le tableau carré constitué par les nombres (réels ou complexes)
(ρ)
χi , ρ = 1, · · · r, i = 1, · · · , m = r. Ses lignes et colonnes satisfont les propriétés d’orthogonalité (2.61).
Illustrons cela sur l’exemple du groupe T , sous-groupe du groupe des rotations laissant invariant un tétraèdre
régulier. Ce groupe d’ordre 12 a 4 classes de conjugaison Ci , celle de l’identité, celle des 3 rotations de π autour
d’un axe joignant les milieux d’arêtes opposées, celle des 4 rotations de 2π/3 autour d’un axe passant par un
sommet, et celle des 4 rotations de −2π/3, voir Fig. 2.1.
Ce groupe a donc 4 représentations irréductibles, dont on vérifie aisément à l’aide de (2.60) que les dimensions
ne peuvent être que nρ = 1, 1, 1 et 3. La table des caractères est donc un tableau 4 × 4 dont on connaı̂t déjà
une ligne, celle de la représentation identité D1 , et une colonne, celles des dimensions nρ . La représentation
de spin 1 de SO(3) fournit une représentation de dimension 3 de T dont le caractère χ prend les valeurs
χi = 1 + 2 cos θi = (3, −1, 0, 0) dans les quatre classes ; selon le critère du § 3.2, kχk2 = i |C
P i| 2
|G| |χi | = 1 donc
ce caractère est irréductible. Cela nous fournit une deuxième ligne (celle notée D4 ). La représentation de spin 2
de SO(3) fournit une représentation de dimension 5 qui est elle réductible (selon le même critère) en somme de
3 irreps, mais orthogonale à D1 . C’est la somme des trois lignes D2 , D3 et D4 , dans lesquelles j = e2πi/3 , avec
j + j 2 = −1.

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

2.4. Représentations projectives. Théorème de Wigner 85

+ 2"
!
3
A

" D

B
C

Figure 2.1 – Un tétraèdre, avec deux axes de rotation

↓ irreps. ρ \ Classes Ci → C(0) C(π) C( 2π

3 ) C(− 2π
3 )
D1 1 1 1 1
D2 1 1 j j2
D3 1 1 j2 j
D4 3 -1 0 0
|Ci | 1 3 4 4

Vérifier que les relations (2.61) sont bien satisfaites. Expliquer aussi pourquoi le groupe T n’est autre que
le groupe A4 des permutations paires de 4 objets.
[Une autre propriété non triviale est que la dimension de toute irrep d’un groupe fini G divise l’ordre |G|.]

2.3.4 Récapitulation
Pour un groupe compact, toute représentation irréductible est de dimension finie et équivalente
à une représentation unitaire. Ses éléments de matrice et caractères satisfont des relations d’or-
thogonalité et de complétude. L’ensemble des représentations irréductibles est discret.
Pour un groupe fini, (cas qu’on n’a traité que très superficiellement dans ce cours), ces
mêmes propriétés d’orthogonalité et de complétude sont satisfaites. Mais on a des propriétés
supplémentaires, par exemple le nombre des représentations irréductibles inéquivalentes est fini,
et égal au nombre de classes du groupe.
Pour un groupe non compact, les représentations unitaires sont généralement de dimension
infinie. (Par contre il peut exister des représentations non unitaires de dimension finie, cf le
cas de SL(2,C) au Chap. 0). L’ensemble des représentations irréductibles est indexé par des
paramètres discrets et continus.

2.4 Représentations projectives. Théorème de Wigner

2.4.1 Définition
On appelle représentation projective d’un groupe G une représentation linéaire à une phase
près de ce groupe (on se restreint ici à des représentations unitaires). Pour g1 , g2 ∈ G, on a

U (g1 )U (g2 ) = eiζ(g1 ,g2 ) U (g1 g2 ) . (2.62)

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

86 Chap.2. Représentations linéaires des groupes

On peut toujours choisir U (e) = I, et on a donc ∀g ζ(e, g) = ζ(g, e) = 0. On peut aussi

redéfinir U (g) → U 0 (g) = eiα(g) U (g), ce qui change

ζ(g1 , g2 ) → ζ 0 (g1 , g2 ) = ζ(g1 , g2 ) + α(g1 ) + α(g2 ) − α(g1 g2 ) . (2.63)

La fonction ζ(g1 , g2 ) de G × G dans R forme ce qu’on appelle une 2-cochaı̂ne. Elle est fermée (et on l’appelle
alors 2-cocycle) en raison de la propriété d’associativité :

∀g1 , g2 , g3 (∂ζ)(g1 , g2 , g3 ) := ζ(g1 , g2 ) + ζ(g1 g2 , g3 ) − ζ(g2 , g3 ) − ζ(g1 , g2 g3 ) = 0 (2.64)

(le vérifier). En général, pour une n-cochaı̂ne ϕ(g1 , · · · , gn ), on définit l’opérateur ∂ qui fait passer des n-
cochaı̂nes aux n + 1-cochaı̂nes :
n
X
(∂ϕ)(g1 , · · · , gn+1 ) = (−1)i+1 ϕ(g1 , g2 , · · · , (gi gi+1 ), · · · , gn+1 ) − ϕ(g2 , · · · , gn+1 ) + (−1)n ϕ(g1 , · · · , gn ) .
i=1

Pour une 1-cochaı̂ne α(g), ∂α(g1 , g2 ) = α(g1 .g2 ) − α(g1 ) − α(g2 ), et donc (2.63) s’exprime par ζ 0 = ζ − ∂α.
Vérifier que ∂ 2 = 0.
La question de savoir si la représentation U (g) est intrinsèquement projective ou peut être ramenée à une
représentation ordinaire par un changement de phase équivaut à savoir si le cocycle ζ est trivial, c’est-à-dire s’il
existe un α(g) tel que dans (2.63), ζ 0 = 0.
Autrement dit, le 2-cocycle ζ, qui est fermé (∂ζ = 0) par (2.64), est-il exact, c’est-à-dire de la forme ζ = ∂α ?
C’est un problème typique de cohomologie. La cohomologie des groupes de Lie est un vaste sujet qui a été très
étudié. . . mais dont nous ne dirons rien de plus dans ce cours.

On peut résumer une discussion un peu longue et complexe (esquissée plus bas au § 2.4.5) en
disant que pour un groupe semi-simple G, tel SO(n), l’origine de ces représentations projectives
est à chercher dans le caractère non simplement connexe de G. Dans ce cas, les représentations
unitaires de G,
e recouvrement universel de G, fournissent des représentations à une phase près
de G. Par exemple, on retrouve que les représentations projectives de SO(3) (à un signe près)
sont les représentations de SU(2). C’est le cas aussi du sous-groupe L↑+ du groupe de Lorentz
O(1,3), dont le recouvrement universel est SL(2,C).
Avant de poursuivre, il est légitime de se poser la question : pourquoi les représentations
projectives intéressent-elles les physiciens ? La raison est que les transformations d’un système
quantique y font appel, comme on va le voir.

2.4.2 Théorème de Wigner

Soit un système quantique dont les états (purs) sont représentés par les rayons d’un espace
de Hilbert H 6 observables sont des opérateurs auto-adjoints sur H. Supposons qu’il existe
une transformation g du système (états et observables) qui laissent inchangées les quantités
|h φ|A|ψ i|2 , c’est-à-dire

|ψ i → |g ψ i , A → gA tel que |h φ|A|ψ i| = |h g φ|gA|g ψ i| . (2.65)

On démontre alors le théorème suivant

6. rayon = vecteur à un facteur scalaire près, ou à une phase près s’il est normalisé

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

2.4. Représentations projectives. Théorème de Wigner 87

Théorème de Wigner. Si une bijection entre les rayons et entre les opérateurs auto-
adjoints d’un espace de Hilbert H préserve les modules des produits scalaires

|h φ|A|ψ i| = |h g φ|gA|g ψ i| , (2.66)

alors cette bijection est réalisée par un opérateur U (g), linéaire ou antilinéaire, unitaire sur H,
et unique à une phase près, c’est-à-dire

|g ψ i = U (g)|φ i , A = U (g)AU † (g) ;

g
U (g)U † (g) = U (g)† U (g) = I . (2.67)

Rappelons d’abord ce qu’on entend par opérateur antilinéaire. Un tel opérateur satisfait

U (λ|φ i + µ|ψ i) = λ∗ U |φ i + µ∗ U |ψ i (2.68)

et son adjoint est défini par

h φ|U † |ψ i = h U φ|ψ i∗ = h ψ|U φ i , (2.69)

de façon à être compatible avec la linéarité :

h λφ|U † |ψ i = λ∗ h φ|U † |ψ i . (2.70)

S’il est en outre unitaire,

h ψ|φ i∗ = h φ|ψ i = h φ|U † U |ψ i = h U φ|U ψ i∗ , (2.71)

donc h U φ|U ψ i = h ψ|φ i.

La preuve du théorème est un peu laborieuse. Elle consiste à montrer que si on a une base
orthonormée |ψk i de H, on peut trouver des représentants |g ψk i des rayons transformés tels
P P 0 g
qu’un représentant du rayon transformé de ck |ψk i soit ck | ψk i avec avec ou bien tous les
0 0 ∗
ck = ck , ou bien tous les ck = ck . Autrement dit, l’action |ψ i → |g ψ i est à travers tout H soit
linéaire, soit antilinéaire.
Une fois connue la transformation des états par l’opérateur U (g), on détermine celle des
observables gA = U (g)AU † (g) de façon à avoir

h g φ|gA|g ψ i = h U φ|U AU † |U ψ i
= h φ|U † U AU † U |ψ i#
= h φ|A|ψ i# (2.72)

avec # = rien ou ∗ selon que U est linéaire ou antilinéaire.

Le cas antilinéaire n’a pas qu’un intérêt académique. Il se rencontre dans l’étude du renver-
sement du sens du temps. En effet cette opération T laisse l’opérateur position x inchangé, mais change le
signe des vitesses, donc de l’impulsion p

x0 = U (T )xU † (T ) = x (2.73)
0 †
p = U (T )pU (T ) = −p . (2.74)

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

88 Chap.2. Représentations linéaires des groupes

Les relations de commutation canoniques ne sont compatibles avec cette transformation que si U (T ) est anti-
linéaire

[x0j , p0k ] = −[xj , pk ] = −i~δjk

= U (T )[xj , pk ]U † (T ) = U (T )i~δjk U † (T ) (2.75)

Autre argument : U (T ) commute avec les translations dans le temps dont le générateur est i fois l’hamiltonien :
U (T )iHU † (T ) = −iH (puisque t → −t). Si U était linéaire, on conclurait que U HU † = −H, ce qui est gênant
si on veut que Spec(H) ≥ 0 !
Les transformations d’un système quantique, c’est-à-dire les bijections du théorème de Wi-
gner, forment un groupe G : si g1 et g2 sont de telles bijections, leur composition g1 g2 en est
une aussi, ainsi que g1−1 . Les opérateurs U (g) qu’on va supposer linéaires dans la suite de ce
cours forment donc une représentation à une phase près (cf l’unicité à une phase près dans le
théorème), c’est-à-dire une représentation projective de G.

Une parenthèse sur un point important de terminologie

Jusqu’à ce point, nous avons mené la discussion des transformations d’un système quantique
sans rien supposer sur son éventuelle invariance sous ces transformations, c’est-à-dire sur la
façon dont elles affectent (ou non) sa dynamique. Ces transformations peuvent être envisagées
d’un point de vue actif : on considère en parallèle le système initial et le système transformé,
ou d’un point de vue passif : il s’agit du même système, examiné dans deux systèmes de
coordonnées, deux référentiels, différents, obtenus l’un à partir de l’autre par la transformation
considérée.

2.4.3 Invariances d’un système quantique

Supposons maintenant que sous l’action d’un certain groupe de transformations G, le système
est invariant, en ce sens que sa dynamique, contrôlée par son hamiltonien H, est inchangée. On
va écrire
H = U (g)HU † (g)

ou encore
[H, U (g)] = 0 . (2.76)

On définit donc une invariance (ou symétrie) d’un système quantique sous l’action d’un groupe
G comme l’existence d’une représentation projective unitaire (linéaire ou antilinéaire) de ce
groupe dans l’espace des états, qui commute avec l’hamiltonien.
• Cette situation implique l’existence de lois de conservation. En effet toute observable
fonction des U (g) commute avec H, donc est une quantité conservée

∂F(U (g))
i~ = [F(U (g)), H] = 0 (2.77)
∂t
et chacune de ses valeurs propres est un “bon nombre quantique” : si le système appartient à
un sous-espace propre de F au temps t, il y demeure lors de son évolution dans le temps. Si G

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

2.4. Représentations projectives. Théorème de Wigner 89

est un groupe de Lie, pour g une transformation infinitésimale et si T désignent les générateurs
infinitésimaux dans la représentation considérée,

U (g) = I − i δαj Tj

(où on choisit les T auto-adjoints pour avoir U unitaire), les Tj sont des observables commutant
avec H, donc des quantités conservées, mais en général, pas simultanément mesurables.
Exemples.
Groupe des translations −→ Pµ énergie-impulsion ; groupe des rotations −→ Mµν moment
cinétique.
Noter encore que ces opérateurs Ti qui réalisent dans la théorie quantique les opérations in-
finitésimales du groupe G, forment d’un point de vue mathématique une représentation de
l’algèbre de Lie g. On peut donc affirmer qu’ils satisfont les relations de commutation

[Ti , Tj ] = iCijk Tk (2.78)

(avec un “i” parce qu’on a fait un choix d’opérateurs hermitiens). Le nombre maximal de
ces opérateurs qu’on peut diagonaliser simultanément, donc de ces quantités conservées qu’on
pourra fixer, dépend de la structure de g et de ces relations de commutation.
• Mais l’hypothèse d’invariance faite plus haute a une autre conséquence, d’application
fréquente et importante. Si l’espace des états H qui “porte une représentation” du groupe G
est décomposé en représentations irréductibles, dans chaque espace E (ρ) , supposé de multiplicité
1, l’hamiltonien est multiple de l’identité en vertu du lemme de Schur. On a donc dans ce cas une
information complète sur la nature du spectre : espaces propres E (ρ) et multiplicités des valeurs
propres Eρ de H égales à dim E (ρ) 7 . Si certains espaces de représentation E (ρ) apparaissent avec
une multiplicité mρ supérieure à 1, il faut encore diagonaliser H dans la somme de ces espaces
⊕i E (ρ,i) , ce qui est tout de même plus simple que le problème de diagonalisation dans l’espace
H de départ. On verra plus bas que le théorème de Wigner-Eckart permet de réduire encore la
complexité de ce dernier calcul. La théorie des groupes nous a donc considérablement simplifié
la tâche . . . mais elle ne nous fournit pas les valeurs des énergies propres Eρ .
Dans ce qui précède, nous avons considéré le point de vue hamiltonien. Comme on le sait, on peut mener une
discussion parallèle dans le formalisme quantique – classique ou quantique –. Là, les invariances du lagrangien (ou
de l’action) se traduisent par l’existence de courants de Noether de divergence nulle et de quantités conservées.

2.4.4 Transformations des observables. Théorème de Wigner–Eckart

Selon (2.67), la transformation d’un opérateur sur H obéit à : A → U (g)AU (g)† . Supposons
qu’on a un ensemble de tels opérateurs, Aα , α = 1, 2, · · · , qui se transforment linéairement les
uns dans les autres dans ces transformations, c’est-à-dire qui forment une représentation :
X
Aα → U (g)Aα U (g)† = Aα0 Dα0 α (g) . (2.79)
α0

7. Il peut arriver que la multiplicité d’une valeur propre de H soit plus élevée, soit à cause de l’existence d’un
groupe de symétrie plus grand que G, soit parce que certaines représentations viennent en paires complexes
conjuguées, soit pour une autre raison.

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

90 Chap.2. Représentations linéaires des groupes

Si la représentation D est irréductible, les opérateurs Aα forment ce qu’on appelle un opérateur

(ou “tenseur”) irréductible. Par exemple, en physique atomique, l’opérateur moment cinétique
J~ et l’opérateur moment dipolaire électrique i qi~ri se transforment comme des vecteurs sous
P

l’effet des rotations. Utilisant les notations de la sect. 2, supposons que les Aα se transforment
par la représentation irréductible D(ρ) et appliquons les sur des états |σβ i se transformant selon
la représentation irréductible D(σ) . L’état résultant se transforme selon
(ρ) (σ)
U (g)Aα |σβ i = U (g)Aα U (g)† U (g)|σβ i = Dα0 α (g)Dβ 0 β (g)Aα0 |σβ 0 i (2.80)

c’est-à-dire selon le produit tensoriel des représentations D(ρ) et D(σ) . Comme on l’a fait en
(2.37), on peut développer sur des représentations irréductibles
(ρ) (σ)
X (τ )
Dα0 α (g)Dβ 0 β (g) = h τi γ|ρ, α; σ, β ih τi γ 0 |ρ, α0 ; σ, β 0 i∗ Dγ 0 iγ (g) . (2.81)
τ,γ,γ 0 ,i

Supposons maintenant que le groupe G est compact (ou fini). Les matrices des représentations
satisfont les propositions d’orthogonalité (2.44). On peut alors écrire

h τ γ|U (g)† U (g)Aα |σβ i

Notons
1 X
h τ k A k σ ii := h τi γ 0 |ρ, α0 ; σ, β 0 i∗ h τi γ 0 |Aα0 |σβ 0 i . (2.83)
nτ α0 ,β 0 ,γ 0

Il en découle que (théorème de Wigner–Eckart) :

mτ
X
h τ γ|Aα |σβ i = h τ k A k σ ii h τi γ|ρ, α; σ, β i (2.84)
i=1

dans laquelle les éléments de matrice “réduits” h . k A k . ii sont indépendants de α, β, γ.

L’élément de matrice du membre de gauche dans (2.84) s’annule si le coefficient de Clebsch-
Gordan est nul (en particulier si la représentation τ n’apparaı̂t pas dans le produit de ρ et σ).
Ce théorème a de nombreuses conséquences en physique atomique et nucléaire, où il occasionne
des “règles de sélection”. Voir par exemple à l’Appendice E.3 le cas des opérateurs moments
multipolaires électriques.
Ce théorème nous permet aussi de simplifier encore le problème de diagonalisation de l’ha-
miltonien H mentionné à la fin du § 2.4.3, quand un espace de représentation apparaı̂t avec
une multiplicité mρ . En repérant par un indice i = 1, · · · mρ les différentes copies de la repré-
sentation, on a en vertu de (2.84)

h ραi|H|ρα0 i0 i = δαα0 h ρi k H k ρi0 i (2.85)

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

2.4. Représentations projectives. Théorème de Wigner 91

et le problème n’implique plus que la diagonalisation d’une matrice de taille mρ × mρ .

Exercice. Pour le groupe SO(3), soit K1m les composantes d’un opérateur irréductible vectoriel (par
exemple, l’opérateur moment dipolaire de l’Appendice B.3). Montrer en utilisant le théorème de Wigner-Eckart
que
~K
h J. ~ ij
h j, m1 |K1m |j, m2 i = h j, m1 |J m |j, m2 i
j(j + 1)
~K
où h J. ~ ij désigne la valeur moyenne de J.
~K ~ dans l’état j. En d’autres termes, on peut remplacer K
~ par sa
h ~K
J. ~ ij
projection J~ j(j+1) .

2.4.5 Forme infinitésimale d’une représentation projective. Exten-

sion centrale
Si G est un groupe de Lie, d’algèbre de Lie g, soit ta une base de g

[ta , tb ] = Cabc tc .

Dans une représentation projective, examinons la composition de deux transformations infinitésimales de la

forme I + αta et I + βtb . Comme ζ(I, g) = ζ(g, I) = 0, ζ(I + αta , I + βtb ) est d’ordre αβ

iζ(I + αta , I + βtb ) = αβzab . (2.86)

Les ta sont représentés par Ta , et en développant au deuxième ordre, on trouve

1

e−iζ(I+αta ,I+βtb ) U (eαta )U (eβtb ) = U eαta eβtb = U e(αta +βtb ) e 2 αβ[ta ,tb ]

et donc, avec U (eαta ) = eαTa etc,

1 1
αβ −zab I + [Ta , Tb ] − Cabc Tc = 0
2 2

(ce qui prouve que zab doit être antisymétrique en a, b). On trouve donc que les relations de commutation des
T sont modifiées par un terme central (c’est-à-dire commutant avec tous les autres générateurs)

[Ta , Tb ] = Cabc Tc + 2zab I .

L’existence de représentation projective peut donc se traduire par la réalisation d’une extension centrale de
l’algèbre de Lie. On appelle ainsi la nouvelle algèbre de Lie engendrée par les Ta et par un (ou plusieurs)
nouveau(x) générateur(s) Cab commutant avec tous les Ta (et entre eux)

[Ta , Tb ] = Cabc Tc + Cab [Cab , Tc ] = 0 [Cab , Ccd ] = 0 . (2.87)

(Dans une représentation irréductible de l’algèbre, le lemme de Schur nous assure que Cab = cab I.) La trivia-
lité (ou non-trivialité) du cocycle ζ se traduit sous forme infinitésimale par la possibilité (ou l’impossibilité)
d’éliminer le terme central par une redéfinition des T

Ta → Tea = Ta + Xa [Tea , Teb ] = Cabc Tec , (2.88)

en exploitant les contraintes sur les Cabc et Cab provenant de l’identité de Jacobi.
Exercice. Écrire la contrainte supplémentaire que l’identité de Jacobi met sur les constantes Cabc et Cab .
Montrer que Cab = Cabc Dc en fournit une solution et qu’une redéfinition telle (2.88) est alors possible.
On démontre (Bargmann) que pour un groupe de Lie connexe G, les cocycles sont triviaux si
1. il n’existe pas d’extension centrale non triviale de g ;
2. G est simplement connexe.

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

92 Chap.2. Représentations linéaires des groupes

En ce qui concerne le point 1, un théorème de Bargmann nous assure qu’il n’existe pas d’extension centrale
non triviale pour tout algèbre semi-simple, comme celles des groupes classiques SU(n), SO(n), Sp(2n). C’est
donc plutôt le point 2 qui nous intéresse. [par contre, Galilée ?]
Si le groupe G n’est pas simplement connexe, on étudie les représentations (disons unitaires) de son recou-
vrement universel G,e qui sont des représentations à une phase près de G (le groupe π1 (G) = G/G
e est représenté
sur U (1)). C’est le cas des groupes SO(n) et de leur recouvrement universel Spin(n), (par exemple du groupe
SO(3)), ou du groupe de Lorentz O(1,3), comme rappelé plus haut.

Bibliographie sommaire (suite)

Outre les références déjà données dans l’Introduction et au chap. 1,
Théorie générale des représentations
[Ki] A.A. Kirillov, Elements of the theory of representations, Springer.
[Kn] A. Knapp, Representation Theory of semi-simple groups, Princeton U. Pr.
[FH] W. Fulton and J. Harris, Representation Theory, Springer.
Pour la démonstration du théorème de Peter-Weyl, voir par exemple
[BrD] T. Bröcker and T. tom Dieck, Representations of compact Lie groups, Springer.
Pour la démonstration du théorème de Wigner, voir E. Wigner, [Wi], ou A. Messiah, [M] t. 2,
p 774, ou S. Weinberg, [Wf] chap 2, app A.
Sur les représentations projectives, voir
[Ba] V. Bargmann, Ann. Math. 59 (1954) 1-46, or
S. Weinberg [Wf] Chap 2.7.

Appendix D. “Tenseurs, vous avez dit tenseurs ?”

Le mot de tenseur recouvre plusieurs concepts reliés mais pas tout à fait identiques. Le but
de cet appendice est d’éclaircir ces choses. . .

D.1. Définition algébrique

Soient deux espaces vectoriels E et F , leur produit tensoriel est par définition l’espace vectoriel
E ⊗ F engendré par les paires (x, y), x ∈ E, y ∈ F , notées x ⊗ y. Un élément de E ⊗ F peut
donc s’écrire
X
z= x(α) ⊗ y (α) (D.1)
α

avec une somme finie sur des vecteurs x(α) ∈ E, y (α) ∈ F (on a absorbé dans le vecteur x(α) un
éventuel coefficient scalaire λα dans la combinaison linéaire).

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

App. E. Représentations de SU(2) 93

Si A, resp. B, est un opérateur linéaire agissant dans E, resp. F , A ⊗ B est l’opérateur

linéaire agissant dans E ⊗ F selon

A ⊗ B(x ⊗ y) = Ax ⊗ By (D.2)
X X
A⊗B (x(α) ⊗ y (α) ) = Ax(α) ⊗ By (α) (D.3)
α α

En particulier si E et F ont deux bases ei et fj , z = x ⊗ y = i,j xi y j ei fj , la base de E ⊗ F

et les composantes de z sont indexées par des paires d’indices (i, j), et A ⊗ B est décrit dans
cette base par une matrice qu’on lit sur
0 0 0 0
X
(A ⊗ B)z = Aii0 Bjj 0 xi y j ei fj =: (A ⊗ B)ii0 ;jj 0 z i j ei ⊗ fj (D.4)
i,i0 ,j,j 0

soit
(A ⊗ B)ij;i0 j 0 = Aii0 Bjj 0 , (D.5)
formule qui est parfois prise comme définition du produit tensoriel de deux matrices.

D.2. Action d’un groupe

Si un groupe G admet des représentations D et D0 dans deux espaces vectoriels E et F ,
x ∈ E 7→ D(g)x = ei Dij xj , ibid. pour y ∈ F , on définit la représentation produit tensoriel
D ⊗ D0 dans E ⊗ F par

D(g) ⊗ D0 (g)(x ⊗ y) = D(g)x ⊗ D0 (g)y (D.6)

en accord avec (D.2). La matrice de D ⊗ D0 dans une base ei ⊗ fj est Dii0 Djj 0
0.

Autre façon de dire les choses : si x se transforme par la représentation D g et y par D0 ,

sous l’action de g ∈ G, x0 = D(g)x, y 0 = D0 (g)y, x ⊗ y 7→ x0 ⊗ y 0 , avec
0 0
(x0 ⊗ y 0 )ij = xi y j = Dii0 Djj
0 i j
0x y , (D.7)

autre formule parfois prise comme définition d’un tenseur (sous l’action de G).
La construction que l’on vient de faire des tenseurs z ij de rang 2 peut s’itérer pour construire
des produits tensoriels E1 ⊗ E2 ⊗ · · · Ep et des tenseurs z i1 ···ip de rang p. C’est ce que nous
avons fait au Chap. 0, § 0.3.3, dans la construction des représentations de SU(2) par produits
tensoriels symétrisés de la représentation de spin 12 , ou au § 6.3 pour celles de SL(2,C) par
produits tensoriels symétrisés des deux représentations à indices pointés (0, 21 ) ou non pointés
( 21 , 0).

Appendix E. Compléments sur les matrices de représentation

de SU(2)
On revient ici sur les matrices Dj des représentations de SU(2) définies au § 0.3.3 du Chap.
0.

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

94 Chap.2. Représentations linéaires des groupes

E.1. Orthogonalité, complétude, caractères

Nous faisons appel à la mesure invariante sur le groupe SU(2) introduite au Chap. 1 (§ 1.2.4
et Appendice C) pour énoncer des propriétés d’orthogonalité et de complétude des matrices
Dj . Nous avons construit au Chap. 0 toutes les représentations unitaires de SU(2). Selon la
discussion du § 2.3, les éléments des matrices Dj satisfont des propriétés d’orthogonalité et de
complétude
Z
dµ(U ) j j0∗
(2j + 1) 2
Dmn (U )Dm 0 n0 (U ) = δjj 0 δmm0 δnn0 (E.1)
2π
X
j
(2j + 1)Dmn j∗
(U )Dmn (U 0 ) = 2π 2 δ(U, U 0 ) .
jmn

La fonction δ(U, U 0 ) qui apparaı̂t dans le second membre de (E.1) est celle adaptée à la mesure
dµ(U ), telle que dµ(U 0 )δ(U, U 0 )f (U 0 ) = f (U ) ; dans les angles d’Euler α, β, γ par exemple,
R

δ(U, U 0 ) = 8δ(α − α0 )δ(cos β − cos β 0 )δ(γ − γ 0 ) , (E.2)

(voir Appendice C du Chap. 1). La signification de la seconde équation (E.1) est que les fonctions
j
Dmn (U ) forment une base complète sur l’espace des fonctions (continues ou de carré intégrable)
sur le groupe SU(2). C’est le théorème de Peter-Weyl, qui généralise donc le théorème de Fourier.
Les caractères des représentations de SU(2) se déduisent des expressions précédentes

j
X
j
χj (U ) = χj (ψ) = tr D (n, ψ) = eimψ
m=−j

sin 2j+1

2
ψ
= . (E.3)
sin ψ2

Noter que ces expressions sont des polynômes (dits de Tchebichev de 2ème espèce, Chebyshev
dans la transcription anglo-saxonne) de la variable 2 cos ψ2 (voir l’exercice D en fin de chapitre).
En particulier
ψ
χ0 (ψ) = 1 χ 1 (ψ) = 2 cos χ1 (ψ) = 1 + 2 cos ψ etc . (E.4)
2 2
On est alors en mesure de vérifier toutes les propriétés attendues

unitarité et réalité χj (U −1 ) = χ∗j (U ) = χj (U )

parité et périodicité χj (−U ) = χj (2π + ψ) = (−1)2j χj (U ) (E.5)
R 2π
orthogonalité 0
dψ sin2 ψ2 χj (ψ)χj 0 (ψ) = πδjj 0
0
χj (ψ)χj (ψ 0 ) = π
δ(ψ − ψ 0 ) = π
δ(cos ψ2 − cos ψ2 )
P
complétude j=0, 21 ,··· sin2 ψ
2 sin ψ
2 2

La dernière exprime que les caractères forment une base complète des fonctions de classe, c’est-
à-dire des fonctions paires périodiques de 12 ψ. On retrouve là une variante du développement
de Fourier.
Les formules de multiplicité (2.57) conduisent-elle bien aux formules connues (2.28) ?

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

App. E. Représentations de SU(2) 95

E.2. Fonctions spéciales. Harmoniques sphériques

On a déjà vu à plusieurs reprises qu’un générateur infinitésimal agissait dans chaque représen-
tation comme un opérateur différentiel. Cette propriété est vraie en particulier dans le cas de
SU(2) qui nous occupe ici : les générateurs Ji apparaissent comme des opérateurs différentiels
par rapport aux paramètres de la rotation, cf. le cas d’un sous-groupe à un paramètre exp −iJψ
j
où J = i∂/∂ψ. Cela va donner lieu à des équations différentielles satisfaites par les Dm 0 m et

faire apparaı̂tre leur relation avec des “fonctions spéciales” de la Physique Mathématique.
On a déjà noté que la discussion des matrices D de Wigner au Chap. 0 § 0.3.3 s’applique !
a b
non seulement aux matrices de SU(2) mais aussi à des matrices quelconques A = du
c d
groupe linéaire GL(2,C). L’équation (0.70) du Chap. 0 est donc toujours vraie dans ce cas
X j
Pjm (ξ 0 , η 0 ) = Pjm0 (ξ, η)Dm 0 m (A) . (0.70)
m0

La combinaison (aξ + cη)j+m (bξ + dη)j−m satisfait évidemment

2
∂2

∂
− (aξ + cη)j+m (bξ + dη)j−m = 0 (E.6)
∂a∂d ∂b∂c
j
donc en raison de l’indépendance des Pjm (ξ, η), les Dm 0 m (A) satisfont la même équation. Si
∗ ∗
maintenant on impose que d = a , c = −b , mais ρ = |a|2 + |b|2 est arbitraire, les matrices A
2

satisfont AA† = ρ2 I, det A = ρ2 , donc A = ρ U , U ∈ SU(2), et (E.6) conduit à

2
∂2

j ∂ j
∆4 Dm0 m (A) = 4 ∗
+ ∗
Dm 0 m (A) = 0 (E.7)
∂a∂a ∂b∂b
où ∆4 est le laplacien dans l’espace R4 des ! variables u0 , u,
! avec a = u0 + iu3 , b = u1 + iu2 . [le 4
0 1 0 1 √
car dans les coordonnées a, a∗ , gµν = 12 ⇒ g µν = 2 , donc ∆ = √1g ∂ξ∂µ g µν g ∂ξ∂ν = 4 · · · .] En
1 0 1 0
coordonnées polaires,
∂2 3 ∂ 1
∆4 = 2
+ + 2 ∆S 3 (E.8)
∂ρ ρ ∂ρ ρ
où le dernier terme, laplacien sur la sphère S 3 , n’agit que sur les “variables angulaires” U ∈
SU(2) (voir Chap. 0, App. 0). Les fonctions Dj étant homogènes de degré 2j en a, b, c, d donc
en ρ, on a finalement
1 j j
− ∆S 3 Dm 0 m (U ) = j(j + 1)Dm0 m (U ) . (E.9)
4
Par exemple, en utilisant la paramétrisation des angles d’Euler, on trouve que (voir (0.122))
2
∂2 ∂2
n 1 ∂
∂ 1 ∂ o
sin β + 2 + − 2 cos β +j(j +1) Dj (α, β, γ)m0 m = 0 . (E.10)
sin β ∂β ∂β sin β ∂α2 ∂γ 2 ∂α∂γ
Pour m = 0 (donc j nécessairement entier), la dépendence en γ disparaı̂t (cf. (00.3.14)).
Choisissons par exemple γ = 0 et effectuons le changement de notations (j, m0 ) → (l, m)
et (β, α) → (θ, φ), afin de retrouver des notations traditionnelles. L’équation se réduit à
1 ∂2

1 ∂ ∂ l
sin θ + + l(l + 1) Dm0 (φ, θ, 0) = 0 . (E.11)
sin θ ∂θ ∂θ sin2 θ ∂φ2

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

96 Chap.2. Représentations linéaires des groupes

L’opérateur différentiel constitué des deux premiers termes est le laplacien ∆S 2 sur la sphère
unité S 2 . L’équation (E.11) définit donc les harmoniques sphériques Ylm (θ, φ) comme vecteurs
propres du laplacien ∆S 2 . La normalisation correcte est que
21
2l + 1 l
Dm0 (φ, θ, 0) = Ylm∗ (θ, φ) . (E.12)
4π

• Introduisons encore les polynômes et fonctions de Legendre Pl (u) et Plm (u) définies pour l
entier et u ∈ [−1, 1] par

1 dl 2
Pl (u) = l l
(u − 1)l (E.13)
2 l! du
1 dm
Pl (u) = (1 − u2 ) 2 m m Pl (u)
m
pour 0 ≤ m ≤ l . (E.14)
du
Les polynômes de Legendre Pl (u) sont des polynômes orthogonaux sur l’intervalle [−1, 1] avec
R1 2
le poids 1 : −1 duPl (u)Pl0 (u) = 2l+1 δll0 . Les premiers Pl sont

1 1
P0 = 1 P1 = u P2 = (3u2 − 1) P3 = (5u3 − 3u) , · · · (E.15)
2 2
1
tandis que Pl0 = Pl , Pl1 = (1−u2 ) 2 Pl0 , etc. Les harmoniques sphériques sont reliées aux fonctions
de Legendre Plm (cos θ) (pour m ≥ 0) par
12
(2l + 1) (l − m)
Ylm (θ, φ) = (−1)m Plm (cos θ)eimφ (E.16)
4π (l + m)
donc
21 12
l (l − m) 4π
Dm0 (0, θ, 0) = dlm0 (θ) = (−1) m
Plm (cos θ) = Ylm∗ (θ, 0) . (E.17)
(l + m) 2l + 1

En particulier, dl00 (θ) = Pl (cos θ). En général, dlm0 m (θ) est relié au polynôme de Jacobi

(α,β) (−1)l −α −β d
l
α+l β+l

Pl (u) = (1 − u) (1 + u) (1 − u) (1 + u) (E.18)
2l l! dul
par
21 m+m0 m−m0
(j + m0 )!(j − m0 )!

θ θ (m0 −m,m0 +m)
djm0 m (θ) = cos sin Pj−m0 (cos θ) . (E.19)
(j + m)!(j − m)! 2 2
Polynômes de Jacobi et de Legendre relèvent de la théorie générale des polynômes orthogonaux dont on
montre qu’ils satisfont des relations de récurrence linéaires à trois termes. Ils satisfont en outre des équations
différentielles. C’est ainsi que les polynômes de Jacobi sont orthogonaux pour la mesure
Z 1
(α,β) (α,β) 2α+β+1 Γ(l + α + 1)Γ(l + β + 1)
du(1 − u)α (1 + u)β Pj (u)Pj 0 (u) = δjj 0 (E.20)
−1 (2l + α + β + 1)l!Γ(l + α + β + 1)

et satisfont la relation de récurrence

(α,β)
2(l + 1)(l + α + β + 1)(2l + α + β)Pl+1 (u) (E.21)
2 2 (α,β) (α,β)
= (2l + α + β + 1)[(2l + α + β)(2l + α + β + 2)u + α − β ]Pl (u) − 2(l + α)(l + β)(2l + α + β + 2)Pl−1 .

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

App. E. Représentations de SU(2) 97

(α,β)
Le polynôme de Jacobi Pl (u) est solution de l’équation différentielle

d2 d (α,β)
{(1 − u2 ) + [β − α − (2 + α + β)u] + l(l + α + β + 1)}Pl (u) = 0 . (E.22)
du2 du
Les polynômes de Legendre correspondent au cas α = β = 0. Ces relations apparaissent ici comme reliées à
celles des Dj . Cela est un phénomène général : de nombreuses fonctions spéciales (Bessel, etc) sont reliées à des
matrices de représentations de groupes. La théorie des groupes permet donc de mettre dans une perspective
géométrique des résultats de l’analyse classique.

• Revenons aux harmoniques sphériques et à leurs propriétés.

(i) Elles satisfont les équations différentielles

(∆S 2 + l(l + 1)) Ylm =0 (E.23)

∂
Jz Ylm = −i Ylm = mYlm (E.24)
∂φ
et peuvent s’écrire
s l−m
(−1)l

(2l + 1)(l + m)! imφ −m d
Ylm (θ, φ) = l e sin θ sin2l θ . (E.25)
2 l! 4π(l − m)! d cos θ

(ii) Elles sont normalisées à 1 sur la sphère unité et plus généralement y satisfont des propriétés
d’orthogonalité et de complétude
Z Z 2π Z π
m∗ m0 0
dΩ Yl Yl0 = dφ dθ sin θ Ylm∗ Ylm
0 = δll0 δmm0 (E.26)
0 0
∞ l
X X δ(θ − θ0 )δ(φ − φ0 )
Ylm∗ (θ, φ)Ylm (θ0 , φ0 ) = δ(Ω − Ω0 ) =
l=0 m=−l
sin θ
= δ(cos θ − cos θ0 )δ(φ − φ0 ) (E.27)

(iii) On peut considérer Ylm (θ, φ) comme fonction du vecteur unitaire n d’angles directeurs θ, φ.
Si le vecteur n est transformé en n0 par la rotation R, on a
0
Ylm (n0 ) = Ylm (n)Dl (R)m0 m (E.28)

ce qui exprime que les Ylm se transforment comme des vecteurs de la représentation de spin l.
(iv) On vérifie sur l’expression ci-dessus les relations de symétrie en m

Ylm∗ (θ, φ) = (−1)m Yl−m (θ, φ) (E.29)

et de parité
Ylm (π − θ, φ + π) = (−1)l Ylm (θ, φ) . (E.30)
Noter qu’à θ = 0, Ylm (0, φ) s’annule sauf pour m = 0, cf. (E.13, E.16).
(v) Les harmoniques sphériques satisfont aussi des relations de récurrence de deux types : celles
issues de l’action de J± , opérateurs différentiels qui agissent selon (0.116)

±iφ ∂ ∂ p
e ± + icotg θ Ylm = l(l + 1) − m(m ± 1)Ylm±1 (E.31)
∂θ ∂φ

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

98 Chap.2. Représentations linéaires des groupes

et celles provenant de la multiplication des représentations de spin 1 et l,

21 12
√

(l + m)(l − m) (l + m + 1)(l − m + 1)
2l + 1 cos θ Ylm = m
Yl−1 + m
Yl+1 . (E.32)
2l − 1 2l + 3

On a plus généralement la formule de produit

21
(2l + 1)(2l0 + 1)

m0 0
X
0 0 0
m
Yl (θ, φ)Yl0 (θ, φ) = h lm; l m |L, m + m i YLm+m (θ, φ) . (E.33)
L
4π(2L + 1)

(vi) Finalement citons la très utile “formule d’addition”

l
2l + 1 X
Pl (cos θ) = Ylm (n)Ylm∗ (n0 ) (E.34)
4π m=−l

où θ désigne l’angle entre les directions n et n0 . Cette formule peut se vérifier en démontrant
que le membre de droite satisfait bien les équations différentielles satisfaites par Pl (exercice 1
ci-dessous).
Exercices.
1. Démontrer que le polynôme de Legendre Pl vérifie

(∆S 2 + l(l + 1)) Pl (n.n0 ) = 0

comme fonction de n ou de n0 , ainsi que (J + J0 ) Pl = 0 où J et J0 sont les générateurs des rotations de n et
n0 respectivement. En déduire qu’il a un développement sur les harmoniques sphériques donné par le théorème
d’addition de (E.34) (On rappelle que Pl (1) = 1).
2. Montrer qu’une fonction génératrice des polynômes de Legendre est
∞
1 X
√ = tl Pl (u) . (E.35)
1 − 2ut + t2 l=0

On pourra vérifier que l’équation différentielle des Pl (cas particulier de (E.22) pour α = β = 0) est bien
satisfaite et que les coefficients Pl apparaissant dans cette formule sont bien des polynômes en u. En déduire
l’identité (on suppose r0 < r),
∞ X r0l X 4π r0l
1
= P l (cos θ) = Y m∗ (n)Ylm (n0 ) . (E.36)
|~r − ~r0 | rl+1 2l + 1 rl+1 l
l=0 l,m

Les expressions des premiers Ylm peuvent être utiles

1
Y00 = √
4π
r r
3 ±1 3
= Y10
cos θ Y1 = ∓ sin θ e±iφ (E.37)
4π 8π
r r r
5 ±1 15 ±iφ ±2 15
0 3
sin2 θ e±2iφ .

Y2 = 3 cos θ − 1 Y2 = ∓ cos θ sin θ e Y2 =
16π 8π 32π

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

App. E. Représentations de SU(2) 99

E.3. Applications physiques

E.3.1. Moments multipolaires
On considère un potentiel créé par une distribution de charge statique ρ(~r)

d3 r0 ρ(~r0 )
Z
1
φ(~r) =
4π0 |~r − ~r0 |

et on le développe sur les harmoniques sphériques selon (E.36). Il vient

1 X 1 Ylm∗ (n)
φ(~r) = Qlm (E.38)
0 l,m 2l + 1 rl+1

où les Qlm , définis par Z

Qlm = d3 r0 ρ(~r0 )r0l Ylm (n0 ) (E.39)

sont les moments multipolaires de la distribution de charge ρ. Par exemple, si ρ(~r) = ρ(r) est
√
invariant par rotation, seul Q00 est non nul, égal à la charge totale (à 1/ 4π près)

Q √ Z 2 Q
Q00 = √ = 4π r drρ(r) φ(r) = .
4π 4π0 r

Pour un ρ(~r) quelconque, les trois composantes de Q1m reconstruisent le moment dipolaire
R 3 0 0 0
d r ρ(~r )~r . Plus généralement, sous l’effet des rotations, les Qlm forment les composantes
d’un opérateur tensoriel se transformant selon la représentation de spin l (et cf. (E.30), de
parité (−1)l ).
En Mécanique Quantique, les Qlm deviennent des opérateurs. On peut leur appliquer le
théorème de Wigner-Eckart et en conclure que

h j1 , m1 |Qlm |j2 , m2 i = h j1 ||Ql ||j2 ih j1 , m1 |l, m; j2 , m2 i

avec un élément de matrice réduit indépendant des m. . En particulier, si j1 = j2 = j, la valeur

moyenne de Ql n’est non nulle que pour l ≤ 2j.

E.3.2. Etats propres de moment angulaire en Mécanique Quantique

Les harmoniques sphériques peuvent s’interpréter comme les fonctions d’onde dans les coor-
~ = ~J~ = ~~r ∧ ∇
données θ, φ des états propres du moment angulaire L ~

Ylm (θ, φ) = h θ, φ|l, m i

en analogie avec
1
ei~x.~p = h ~x|~p i .
(2π)3/2
(On a pris ~ = 1.) En particulier, supposons que dans un processus de collision décrit par un
Hamiltonien invariant par rotation, un état d’impulsion initiale p~i selon l’axe des z, (c’est-à-dire

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

100 Chap.2. Représentations linéaires des groupes

θ = φ = 0), interagit avec un certain centre diffuseur et ressort dans un état d’impulsion p~f ,
avec |pi | = |pf | = p, selon la direction n = (θ, φ). On écrit l’amplitude
0
X
h p, θ, φ|T |p, 0, 0 i = Ylm (θ, φ)h p, l, m|T |p, l0 , m0 iYlm
0
∗
(0, 0)
ll0 mm0
X
= Ylm (θ, φ)h p, l, m|T |p, l, m iYlm∗ (0, 0) (E.40)
lm
X 2l + 1
= Tl (p)Pl (cos θ)
l
4π

selon à nouveau la formule d’addition et h plm|T |pl0 m0 i = δll0 δmm0 Tl (p) exprimant l’invariance
par rotation. C’est le développement en ondes partielles de l’amplitude de diffusion, très utile
dans l’analyse des résultats expérimentaux et dans la modélisation.

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

Exercices et Problèmes du Chapitre 2 101

Exercices et problèmes du chapitre 2

A. Représentations unitaires d’un groupe simple
Soit G un groupe simple non abélien. Soit D une représentation unitaire de G.
1. Montrer que det D est une représentation de dimension 1 du groupe, et que c’est un homomorphisme du
groupe dans le groupe U(1).
2. Que peut-on dire du noyau K de cet homomorphisme ? Montrer que tout “commutateur” g1 g2 g1−1 g2−1
appartient à K et que K ne peut donc être trivial.
3. En conclure que la représentation est unimodulaire (de déterminant 1).
4. Peut-on appliquer cet argument à SO(3) ? à SU(2) ?
[Exemple : les représentations unitaires de SO(3) sont a priori unimodulaires, donc les générateurs infi-
nitésimaux de trace nulle, ce qu’on constate bien sur la construction explicite des représentations de spin j
entier. (Pour le groupe SU(2), qui n’est pas simple, le même argument ne peut être appliqué, mais la conclusion
demeure, comme on le sait : toutes les représentations unitaires de SU(2) sont unimodulaires.)]
B. Représentation adjointe
1. Montrer que si l’algèbre de Lie g d’un groupe de Lie G est simple, la représentation adjointe de G est
irréductible. [Si elle ne l’était pas, elle laisserait un sous-espace h de g invariant : ∀g ∈ G Ad(g)h = ghg −1 ⊂ h, et
donc, en en prenant l’action infinitésimale, [g, h] ⊂ h et h serait donc un idéal de g ce qui contredit l’hypothèse
de simplicité. QED.]
2. Montrer que si g est semi-simple, sa représentation adjointe est fidèle : ker ad = 0. [Si elle ne l’était
pas, ker ad 6= 0, donc ∃X : ad X = 0, c’est-à-dire ∃X, ∀Y : [X, Y ] = 0, donc ker ad forme un idéal abélien,
contradiction avec semi-simplicité.]
C. Produit tensoriel D ⊗ D∗
Soit G un groupe compact. Soient D(ρ) ses représentations irréductibles. On note D(1) la représentation
identité, D(ρ̄) la représentation conjuguée de D(ρ) .
Quelle est la multiplicité de D(1) dans la décomposition en représentations irréductibles de D(ρ) ⊗ D(σ̄) ?
D. Polynômes de Tchebichev
Soit l’expression
sin(l + 1)θ
Ul = ,
sin θ
où l est un entier ≥ 0.
1. Par un calcul trigonométrique élémentaire, exprimer Ul−1 + Ul+1 en fonction de Ul , avec un coefficient
indépendant de l.
2. En déduire que Ul est un polynôme en z = 2 cos θ de degré l, qu’on notera Ul (z).
3. Quelle est l’interprétation groupiste du résultat obtenu en 1) ?
4. Avec le minimum de calculs supplémentaires, que peut-on dire de

2 1
Z
1
dz (1 − z 2 ) 2 Ul (z)Ul0 (z)
π −1
et Z 1
2 1
dz (1 − z 2 ) 2 Ul (z)Ul0 (z)Ul00 (z) ?
π −1

Les Ul (z) sont les polynômes de Tchebichev (Chebyshev dans la transcription anglo-saxonne) de 2ème espèce.
Ils sont orthogonaux (la première des relations de la question 4) et satisfont une relation de récurrence à trois
termes (question 1), qui sont deux propriétés générales des polynômes orthogonaux.

E. Harmoniques sphériques

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

102 Chap.2. Représentations linéaires des groupes

Montrer que l’intégrale Z

dΩ Ylm
1
1
(θ, φ)Ylm
2
2
(θ, φ)Ylm
3
3
(θ, φ)

est proportionnelle au coefficient de Clebsch-Gordan (−1)m3 h l1 , m1 ; l2 , m2 |l3 , −m3 i, avec un coefficient indépendant
des m qu’on déterminera.

Problème I. Décomposition d’une amplitude

On considère deux représentations réelles et unitaires (ρ) et (σ) d’un groupe de Lie simple compact G de
(ρ)a (σ)a
dimension d. On note |ρ, α i, resp. |σ, β i, deux bases de ces représentations, et Tαα0 , resp. Tββ 0 , a = 1, · · · d, les
matrices de représentation d’une base de l’algèbre de Lie orthonormée pour la métrique de Killing. Ces matrices
sont supposées antisymétriques réelles et satisfont donc tr T a T b = −δab . On va s’intéresser à la quantité
d
(ρ)a (σ)a
X
Xαβ;α0 β 0 := Tαα0 Tββ 0 . (2.89)
a=1

Pour simplifier l’écriture, on supposera que toutes les représentations apparaissant dans le produit tensoriel des
représentations (ρ) et (σ) sont réelles et sans multiplicité. Soit |τ γ i une base d’une telle représentation. On
introduit alors les coefficients de Clebsch-Gordan (réels) qu’on écrit comme des matrices

M(τ γ) = h τ γ|ρα; σβ i . (2.90)
αβ

1. Rappeler pourquoi ces coefficients satisfont des propriétés d’orthogonalité et de complétude qu’on écrira.
2. En déduire qu’on peut écrire
X
Xαβ;α0 β 0 = − M(τ γ) T (ρ)a M(τ γ) T (σ)a . (2.91)
αβ α0 β 0
τγ

3. En faisant agir le générateur infinitésimal T a sur les deux membres de la relation

X
|ρα; σβ i = M(τ γ) |τ γ i (2.92)
αβ
τ,γ

montrer qu’on obtient

X (τ )a 0
X X
Tγγ 0 M(τ γ ) = M(τ γ) (T (ρ)a )α0 α + M(τ γ) (T (σ)a )β 0 β (2.93)
αβ α0 β αβ 0
γ0 α0 m02

ou encore en termes de matrices de dimensions dim(ρ) × dim(σ)

X (τ )a 0
Tγγ 0 M(τ γ ) = −T (ρ)a M(τ γ) + M(τ γ) T (σ)a . (2.94)
γ0

4. En utilisant de façon répétée cette relation (2.94) dans (2.91), montrer qu’on a
1X
Xαβ;α0 β 0 = (Cρ + Cσ − Cτ ) M(τ γ) M(τ γ) 0 0 (2.95)
2 τγ αβ αβ

où les C sont les opérateurs de Casimir quadratiques, par exemple

X
Cρ = − (T (ρ)a )2 . (2.96)
a

5. Pourquoi peut-on dire que les “grandes représentations” τ tendent à rendre le coefficient (Cρ + Cσ − Cτ )
de plus en plus négatif ? On pourra prendre l’exemple de SU(2) avec ρ et σ deux représentations de spin
(entier) égal à j.
6. Pouvez-vous imaginer une théorie de champs dans laquelle le coefficient Xαβ;α0 β 0 apparaı̂trait dans une
amplitude de diffusion à deux corps (à l’approximation en arbres) ? Quelle conséquence la propriété
discutée aurait-elle sur cette amplitude ?

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

Exercices et Problèmes du Chapitre 2 103

#
"
S
!

Figure 2.2 – Diagramme de Bratteli : construction graphique des nr

Problème II. Produit tensoriel dans SU(2)

1. On considère la représentation R 21 de spin 21 de SU(2) et on veut calculer le nombre nr de fois où la re-
présentation identité apparaı̂t dans la décomposition en représentations irréductibles du produit tensoriel
de r copies de R 12 .

(a) Interpréter nr en termes du nombre d’invariants linéairement indépendants multilinéaires en ξ1 , · · · , ξr

où les ξi sont des spineurs se transformant selon la représentation R 21 .
(b) Par convention n0 = 1. Sans aucun calcul, que valent n1 et n2 ?
(c) Montrer que l’on peut exprimer simplement nr à l’aide d’une intégrale impliquant les caractères
χj (ψ) de SU(2), cf les formules (A.3-A.5) du chapitre 2 du cours. (On ne cherchera pas à calculer
explicitement cette intégrale pour r arbitraire.)
(d) Vérifier que cette formule donne bien les valeurs de n1 et n2 obtenues au b).
(e) On va montrer que l’on peut aussi obtenir les nr par la méthode graphique et récursive suivante.
Sur le graphe de la Fig. 1, on attache n0 = 1 au sommet le plus à gauche, puis à chaque sommet S,
la somme α = β + γ des nombres situés aux sommets situés à sa gauche et directement reliés à S.
i. Montrer que les nr sont les nombres figurant sur l’axe horizontal. Quelle est l’interprétation
des axes horizontal et vertical ?
ii. Calculer avec cette méthode la valeur de n4 et n6 .

2. On cherche à répéter ce calcul pour la représentation R1 de spin 1, et donc à déterminer le nombre Nr

de fois où la représentation identité apparaı̂t dans le produit tensoriel de r copies de R1 .
(a) Comment le graphe de la Fig. ?? doit-il être modifié pour obtenir les Nr ?
(b) Calculer ainsi N2 , N3 et N4 . [N0 , · · · , N5 , = 1, 0, 1, 1, 3, 6, · · · : “nombres de Motzkin” ]
(c) Que représentent ces nombres en termes de vecteurs V1 , · · · , Vr se transformant selon la représen-
tation R1 ? [Le nombre d’invariants indépendants multilinéaires en V1 , · · · , Vr . ]

Problème III. Représentations réelles, complexes et quaternioniques

Question préliminaire
Étant donné un espace vectoriel E de dimension d, on note E ⊗ E l’espace des tenseurs de rang 2 et
(E ⊗ E)S , resp. (E ⊗ E)A , l’espace des tenseurs de rang 2 symétriques, resp. antisymétriques, appelé encore
produit tensoriel (anti)symétrisé. Quelle est la dimension des espaces E ⊗E, (E ⊗E)S , (E ⊗E)A ? [d2 , d(d+1)/2,
d(d − 1)/2 ]

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

104 Chap.2. Représentations linéaires des groupes

A. Représentations réelles et quaternioniques

1. Soit G un groupe compact. Si D(g) est une représentation de G, montrer que D−1 T (g) en est une autre,
qu’on appelle la représentation contragrédiente. [g 7→ D−1 T (g) est bien un homomorphisme de groupe
comme on le vérifie immédiatement. ]
[g 7→ D−1 T (g) est bien un homomorphisme de groupe comme on le vérifie immédiatement. ]
2. Rappeler sommairement pourquoi on peut toujours supposer que les représentations de G sont unitaires,
ce que l’on fera dans la suite. [Si G est compact, on peut unitariser ses représentations, cf le cours ]
3. Montrer que la représentation contragrédiente s’identifie alors à la représentation complexe conjuguée.
[On a alors D−1 T (g) = D†T (g) = D∗ (g) ]
4. On suppose que la représentation unitaire D est (unitairement) équivalente à sa contragrédiente (ou sa
conjuguée). Montrer qu’il existe une matrice S (unitaire) telle que

D = SD−1 T S −1 (2.97)

[D unitairement équivalente à D−1 T ⇔ ∃S unitaire t.q. (1) .]

5. Montrer que (2.97) signifie que la forme bilinéaire S est invariante. [(1) se récrit Dii0 Djj 0 Si0 j 0 = Sij qui
exprime bien l’invariance de la forme S.]
6. Cette forme est-elle dégénérée ? [S unitaire donc det S 6= 0, forme non dégérée. ]
7. Montrer en manipulant (2.97) que
DSS −1T = SS −1T D . (2.98)

[Transposant (1) on a DT = S −1T D−1 S T qu’on reporte dans (2.97) : D = SS −1T DS T S −1 , qui donne
(2.98)). ]
8. Montrer alors que si D est irréductible, S = λS T , avec λ2 = 1. [SS −1T entrelace D avec elle-même, donc,
lemme de Schur, SS −1T = λI, S = λS T , λ2 = 1.]
9. En conclure que la forme invariante S est soit symétrique soit antisymétrique. [Si λ = 1, resp. = −1, la
forme S est symétrique, resp. antisymétrique. ]
Dans le premier cas (symétrique), la représentation est dite réelle, dans le second (S antisymétrique), elle
est dite pseudoréelle (ou quaternionique). On peut montrer que dans le premier cas, il existe une base
sur R dans laquelle les matrices de la représentation sont réelles, et qu’il n’en existe pas dans le second.
1
10. Connaissez-vous un exemple du second cas ? [La représentation de spin 2 de SU(2) est “pseudoréelle”. ]

B. Indicatrice de Frobenius–Schur
1. Soit G un groupe fini ou un groupe de Lie compact. On repère ses représentations irréductibles par un
indice ρ et on note χ(ρ) (g) leur caractère. Soit χ(g) le caractère d’une représentation arbitraire, réductible
ou non.

(a) Pour toute fonction F sur le groupe fini G, on note h F i sa moyenne

1 X
hF i = F (g) . (2.99)
|G|
g∈G

Par quoi faut-il remplacer cette définition dans le cas d’un groupe de Lie compact (et d’une fonction
1
P
F continue) ? [Il faut substituter à |G| g∈G l’intégration sur le groupe avec la mesure de Haar
normalisée dµ(g)/v(G). ]

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

Exercices et Problèmes du Chapitre 2 105

(b) - Rappeler pourquoi h χ i est un entier et ce qu’il vaut.

- Si ρ̄ dénote la représentation conjuguée de la représentation irréductible ρ, rappeler pourquoi
h χ(ρ) χ(ρ̄) i = 1 et ce que cela implique sur la décomposition en représentations irréductibles de
ρ ⊗ ρ̄. [h χ i est la multiplicité de la représentation identité dans la représentation considérée ;
h χ(ρ) χ(ρ̄) i = 1 est une des relations d’orthogonalité entre caractères irréductibles, elle implique
que la représentation identité apparaı̂t toujours une fois et une seule dans la décomposition en
représentations irréductibles de ρ ⊗ ρ̄. ]
(c) Montrer qu’une représentation irréductible ρ est équivalente à ρ̄ si et seulement si
2
(ρ)
χ (g) =1.

Que vaut cette expression si ρ n’est pas équivalente à ρ̄ ? [La même relation d’orthogonalité de
caractères irréductibles dit que χ(ρ) χ(σ̄) = δρσ , donc l’expression ci-dessus vaut 1 ssi ρ ∼ ρ̄, et 0
sinon. ]

2. On considère la représentation D(ρ) agissant dans un espace E, et son carré tensoriel D(ρ) ⊗2 , qui agit
sur les tenseurs de rang 2 de E ⊗ E.
(a) Écrire explicitement l’action de D(ρ) ⊗2 sur un tenseur t = {tij },

tij 7→ t0ij = · · ·

(ρ)i (ρ)j i0 j 0
[tij 7→ t0ij = D i0 D j0 t .]
(b) Montrer que tout tenseur de rang 2, t = {tij }, est la somme d’un tenseur tS symétrique et
d’un tenseur tA antisymétrique dans leurs deux indices, se transformant selon des représenta-
tions indépendantes. Écrire explicitement les matrices de transformation de tS et tA en veillant
bien aux propriétés de symétrie des objets considérés. [Les tenseurs de rang 2 symétriques, resp.
antisymétriques, se transforment selon

1 (ρ)i 0 0
tijS 7→ t0ij
(ρ)j (ρ)i (ρ)j
S = D i0 (g)D j 0 (g) ± D i0 (g)D j 0 (g) tiSj
A A 2 A

]
(c) Montrer que les caractères des représentations des tenseurs symétriques et antisymétriques sont
respectivement
(ρ⊗ρ) S 1 (ρ)
χ A (g) = (χ (g))2 ± χ(ρ) (g 2 ) . (2.100)
2
[Cela s’obtient en prenant la trace des matrices de la question précédente.]
(d) Que valent ces caractères pour g = e, l’identité dans le groupe ? Ces résultats étaient-ils prévisibles ?
(ρ⊗ρ) S
[Pour g = e, on a χ A (e) = dim D S = 12 d(d ± 1), dimensions des espaces de tenseurs
A
symétriques, resp. antisymétriques de rang 2, dans un espace de dimension d, cf Question préliminaire.
]

3. On définit alors l’indicatrice de Frobenius–Schur de la représentation irréductible ρ par

D E
ind(ρ) = χ(ρ) (g 2 ) . (2.101)

(a) Montrer en utilisant les résultats du 2. que l’on peut écrire

ind(ρ) = h χ(ρ⊗ρ)S i − h χ(ρ⊗ρ)A i .

[Trivial à partir de (2.100).]

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

106 Chap.2. Représentations linéaires des groupes

(b) Montrer en utilisant les résultats du 1. que

h (χ(ρ) (g))2 i = h χ(ρ⊗ρ)S i + h χ(ρ⊗ρ)A i

prend la valeur 0 ou 1, selon des cas que l’on précisera [C’est égal à 1 ou 0, selon que ρ ∼ ρ̄ ou non,
cf question 1.c).]
(c) - Montrer que h χ(ρ⊗ρ)S i et h χ(ρ⊗ρ)A i sont des entiers non négatifs, et qu’ils fournissent une mul-
tiplicité que l’on précisera. [h χ(ρ⊗ρ)S i et h χ(ρ⊗ρ)A i sont des entiers (cf question 1.b)), qui donnent
la multiplicité de la représentation identité (c’est-à-dire le nombre d’invariants) dans (ρ ⊗ ρ)S , resp.
(ρ ⊗ ρ)A . ]
- Montrer que finalement l’indicatrice de Frobenius–Schur (2.101) ne peut prendre que les trois
valeurs 0 et ±1 selon des cas que l’on précisera. [Si ρ ∼ ρ̄, leur somme est 1, leur différence est donc
ou bien 1 ou bien −1 ; si ρ ∼/ ρ̄, leur somme est 0, donc leur différence est nulle. On a donc trois
cas 
 1

 si ρ ∼ ρ̄ et h χ(ρ⊗ρ)S i = 1
ind[ρ] = 0 si ρ ∼
/ ρ̄


−1 si ρ ∼ ρ̄ et h χ(ρ⊗ρ)A i = 1


]
(d) Commentez la relation entre cette discussion et celle de l’exercice A.
[Dans le premier cas, où h χ(ρ⊗ρ)S i = 1, qui signale l’existence d’un tenseur (ou forme) invariant(e)
bilinéaire symétrique dans V (ρ) ⊗ V (ρ) , la représentation est réelle, selon la terminologie du A ;
dans le dernier cas, où la forme est antisymétrique, la représentation est quaternionique. Enfin, la
représentation est complexe si elle n’est pas équivalente à sa conjuguée. ]
(ρ)
P
4. ? On se restreint au cas d’un groupe fini. Pour tout h ∈ G, on définit Q(h) := ρ ind(ρ)χ (h).
Démontrer le
Théorème. Q(h) = #{g ∈ G|g 2 = h}
[Proof . Q(h) = h ρ χ(ρ) (g 2 )χ(ρ) (h) (since only representations ρ ∼ ρ̄ contribute, we may drop the com-
P
|G| 1
P
plex conjugation of the second character). The sum over ρ gives |[h]| δ[g2 ],[h] . Thus Q(h) = |[h]| g∈G δ[g 2 ],[h] .
But each element in [h] has the same number of “square roots” : h = g ⇔ h = γhγ = (γgγ −1 )2 = g 02
2 0 −1

and g1 6= g2 ⇔ g10 6= g20 . Hence Q(h) = 1/|[h]|#{solutions of [g 2 ] = [h]} = #{solutions of g 2 = h}, qed. ]

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

Chapitre 3

Algèbres de Lie simples, classification

et représentations

3.1 Sous-algèbre de Cartan. Racines. Forme canonique

de l’algèbre.
On considère une algèbre de Lie g semi-simple (pas d’idéal abélien). [On pourrait même supposer
g simple en vertu du théorème de décomposition du chapitre 1, § 3.7. ] On se propose de construire une
forme canonique des relations de commutation calquée sur le cas de SU(2)

[Jz , J± ] = ±J± [J+ , J− ] = 2Jz . (3.1)

Il sera important de considérer l’algèbre sur C, c’est-à-dire d’utiliser C comme corps de nombres
(au prix de la complexifier si elle était réelle). La représentation adjointe va être utilisée. Comme
elle est fidèle pour une algèbre semi-simple (ad X = 0 ⇒ X = 0), cf exercice B du Chap. 2, on
ne perd pas d’information.
Il peut être utile de se rappeler que l’algèbre complexe a une version réelle compacte dans
laquelle les constantes de structure réelles conduisent à une forme de Killing définie négative,
et, les représentations y étant unitarisables, les éléments de l’algèbre de Lie (générateurs in-
finitésimaux) peuvent être considérés comme hermitiens soit comme antihermitiens, selon nos
besoins.

3.1.1 Sous-algèbre de Cartan

On définit d’abord la notion de sous-algèbre de Cartan. On appelle ainsi une sous-algèbre
abélienne maximale de g telle que tous ses éléments sont diagonalisables (donc simultanément
diagonalisables) dans la représentation adjointe, donc dans toute représentation. Le fait qu’une
telle algèbre existe est non trivial et doit être établi, mais nous l’admettrons.
Si on choisit de travailler avec la version réelle unitaire de la représentation adjointe, les éléments de g sont
des matrices hermitiennes, et les matrices de h qui commutent entre elles sont simultanément diagonalisables.

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

108 Chap.3. Algèbres de Lie simples, classification et représentations

Cette algèbre de Cartan n’est pas unique, mais on démontre que deux choix distincts sont
reliés par un automorphisme de l’algèbre.
Ainsi si g est l’algèbre de Lie d’un groupe de Lie G et si h est une sous-algèbre de Cartan de g, tout conjugué
−1
ghg de h par un élément quelconque g de G est aussi une sous-algèbre de Cartan.
Soit h une telle sous-algèbre de Cartan. Soit ` sa dimension, elle est indépendante du choix
de h et on l’appelle le rang de l’algèbre g. Pour su(2), ce rang est 1, (le choix de Jz par exemple) ;
pour su(n), le rang est n − 1. En effet, pour su(n), une algèbre de Cartan est engendrée 1 par
les matrices diagonales de trace nulle. Une base en est donnée par les n − 1 matrices

H1 = diag (1, −1, 0, · · · , 0), H2 = diag (0, 1, −1, 0, · · · , 0), · · · , Hn−1 = diag (0, · · · , 0, 1, −1) .
(3.2)
Une matrice quelconque de l’algèbre de Lie (dans cette représentation), (anti-)hermitienne et
de trace nulle, est diagonalisable par une transformation unitaire ; sa forme diagonale est de
trace nulle et s’exprime donc comme combinaison linéaire des hj ; la matrice de départ est donc
conjuguée, par une transformation unitaire, d’une combinaison linéaire des hj . Cette propriété
est générale, et on démontre (Cartan, cf [Bu], chapitre 16) que
Si g est l’algèbre de Lie du groupe G, tout élément de g est conjugué par G d’un élément de h.

Application. Forme canonique des matrices antisymétriques. En utilisant ce théorème, démontrer la

Proposition Si A = A∗ = −AT est une matrice réelle antisymétrique de dimension!N , alors on peut trouver
0 µj
une matrice orthogonale réelle O telle que A = ODOT où D = diag ( ) si la dimension
−µj 0
! j=1,··· ,n
0 µj
N = 2n et D = diag (0, ) si N = 2n + 1, avec des µj réels.
−µj 0
j=1,··· ,n
Si on s’autorise à complexifier les
! matrices orthogonales, on peut complètement
! diagonaliser la matrice A sous
iµj 0 iµj 0
la forme D = diag ( ) ou D = diag (0, ). Pour une démonstration ne
0 −iµj 0 −iµj
j=1,··· ,n j=1,··· ,n
faisant appel qu’à la théorie des matrices, voir par exemple [M.L. Mehta, Elements of Matrix Theory, p 41].
[Proof : the eigenvalues of A are purely imaginary (or zero). Let X + iY be an eigenvector of A for the
e-value iµ. Then AX = −µY, AY = µX, and X T AX = −(X T AX)T = −µX T Y = 0. Thus if µ 6= 0,
X T Y = 0. Moreover, since X T AY = µX T X and Y T AX = −µY T Y = −(X T AY )T = −µX T X, one may
normalize simultaneously X X = Y T Y = 1. Then by Schmidt orthogonalization procedure, one may construct
an orthogonal matrix, whose first two columns are X and Y , O1 = (X, Y, Q1 ). Let us compute
     
XT 0 µ X T AQ1 0 µ 0
 T
 Y  A(X Y Q1 ) = −µ 0 Y T AQ1  = −µ 0 0 
   

QT1 0 0 QT1 AQ1 0 0 QT1 AQ1

where the last form follows from the antisymmetry of the lhs. One may then iterate, and construct a matrix O
satisfying the property of the Lemma.]

3.1.2 Base canonique de l’algèbre de Lie

Soit Hi , i = 1, · · · , ` une base de h. Il est commode de choisir les ad Hi hermitiens. Par définition
[Hi , Hj ] = 0 (sous-algèbre abélienne), ou plus précisément puisqu’on est dans la représentation
1. Nous nous plaçons momentanément dans la représentation “de définition” (matrices n × n) et non plus
dans la représentation adjointe.

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

3.1. Sous-algèbre de Cartan. Racines. Forme canonique de l’algèbre. 109

adjointe,
[ad Hi , ad Hj ] = 0 . (3.3)
On peut diagonaliser simultanément ces ad Hi . On
[[ad Hi , ad Hj ] = 0 = ad [Hi , Hj ] ⇔ [Hi , Hj ] = 0]
en connaı̂t déjà des vecteurs propres de valeur propre nulle puisque ∀i, j, ad Hi Hj = 0, et on
peut trouver un ensemble de vecteurs propres Eα indépendants des Hj

ad Hi Eα = α(i) Eα (3.4)

c’est-à-dire un ensemble d’éléments de g tels que

[Hi , Eα ] = α(i) Eα , (3.5)

avec des α(i) pas tous nuls (sans quoi la sous-algèbre abélienne h ne serait pas maximale).
L’espace h∗ . Dans ces expressions, les α(i) sont les valeurs propres des opérateurs ad Hi .
Puisqu’on a choisi les ad Hi hermitiens, leurs valeurs propres α(i) sont réelles. Par combinaison
linéaire, pour un élément arbitraire de h écrit H = i hi Hi ,
P

ad HEα = α(H)Eα , (3.6)

P i
où la valeur propre de ad H sur Eα est α(H) := i h α(i) , qui est une forme linéaire sur
h. (Rappel : d’une façon générale, les formes linéaires sur un espace vectoriel E forment un
espace vectoriel E ∗ , appelé l’espace dual de l’espace E.) On peut donc considérer la racine α de
composantes α(i) comme un vecteur de l’espace dual de h, donc α ∈ h∗ . Noter que α(Hi ) = α(i) .

[Réalité de α. En outre, les matrices Hi (toujours dans la représentation adjointe) ont pour éléments de
matrice ad (Hi )ab = iCiab , qui sont antisymétriques imaginaires pures. Leurs valeurs propres non nulles viennent
donc en paires de nombres réels et opposés

ad (Hi ) Eα = α(i) Eα ad (Hi ) E−α = −α(i) E−α .

]
Les racines jouissent des propriétés suivantes
– (i) si α est une racine, −α en est une autre ;
– (ii) l’espace propre correspondant à la valeur propre α est de dimension 1 (pas de multi-
plicité) ;
– (iii) si α est une racine, les seules racines de la forme λα sont ±α ;
– (iv) les racines α engendrent tout l’espace dual h∗ . (voir exercice).
Pour une preuve des points (i–iii), voir plus bas, pour (iv), voir Exercice A.
Nombre de racines. Les matrices Hj ayant été supposées diagonalisables, le nombre de leurs
vecteurs propres Eα plus celui de leurs vecteurs propres Hi de valeur propre nulle doit être égal
à la dimension de l’espace, ici la dimension d de la représentation adjointe (donc la dimension
de l’algèbre g). Comme toute racine non nulle vient accompagnée de son opposée, le nombre
de racines α non nulles est pair et égal à d − `. On note ∆ l’ensemble des racines.
Dans la base {Hi , Eα } de g, la forme de Killing prend une forme simple

(Hi , Eα ) = 0 (Eα , Eβ ) = 0 sauf si α + β = 0 . (3.7)

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

110 Chap.3. Algèbres de Lie simples, classification et représentations

En effet (H, [H 0 , Eα ]) = α(H 0 )(H, Eα ), mais aussi, en utilisant la définition de la forme de Killing et la cyclicité
de la trace
(H, [H 0 , Eα ]) = tr (ad H[ad H 0 , ad Eα ]) = tr ([ad H, ad H 0 ] ad Eα ) = 0 (3.8)

puisque [ad H, ad H 0 ] = 0. Il en découle que ∀H, H 0 ∈ h, α(H 0 )(H, Eα ) = 0, donc que (H, Eα ) = 0. De même

([H, Eα ], Eβ ) = α(H)(Eα , Eβ ) = −(Eα , [H, Eβ ]) = −β(H)(Eα , Eβ ) (3.9)

à nouveau par la cyclicité de la trace, et donc (Eα , Eβ ) = 0 si ∃H : (α + β)(H) 6= 0, c’est-à-dire si α + β 6= 0.

Noter que le point (i) découle simplement de (3.7) : si −α n’était pas racine, Eα serait orthogonal à tous
les éléments de la base donc à tout élément de g, et la forme serait dégénérée, contrairement à l’hypothèse de
semi-simplicité. Pour une démontration élégante [(mais partielle pour (iii) puisqu’il ne considère que k ∈ Z]des
points (ii) et (iii), voir [OR, p. 29].
La restriction de cette forme à la sous-algèbre de Cartan h est non-dégénérée, sans quoi on
aurait ∃H ∈ h, ∀H 0 ∈ h : (H, H 0 ) = 0, mais (H, Eα ) = 0, autrement dit ∀X ∈ g, on aurait
(H, X) = 0 donc la forme serait dégénérée sur g, contrairement à l’hypothèse de semi-simplicité
et à un des théorèmes de Cartan (cf. Chap. 1, § 4.4). La forme de Killing étant non-dégénérée
sur h, elle induit un isomorphisme entre h et h∗ : à α ∈ h∗ on associe l’unique Hα ∈ h tel que

∀H ∈ h (Hα , H) := α(H) , (3.10)

et α(i) = α(Hi ) = (Hα , Hi ). (Autrement dit on résout le système linéaire gij hjα = α(i) qui est de
Cramer puisque gij = (Hi , Hj ) est inversible.) On a aussi une forme bilinéaire sur h∗ héritée de
la forme de Killing
h α, β i := (Hα , Hβ ) , (3.11)

dont nous allons faire usage au § 2 pour étudier la géométrie du système de racines.
Il reste à découvrir les relations de commutation (les crochets) des Eα entre eux. En utilisant
l’identité de Jacobi, on trouve que

ad Hi [Eα , Eβ ] = [Hi , [Eα , Eβ ]] = [Eα , [Hi , Eβ ] − [Eβ , [Hi , Eα ]] = (α + β)(i) [Eα , Eβ ] . (3.12)

En invoquant l’absence de multiplicité, on voit que trois cas se présentent. Si α + β est une
racine, [Eα , Eβ ] est proportionnel à Eα+β , avec un coefficient de proportionnalité Nαβ dont on
montrera plus bas (§ 2.1 et exercice C) qu’il est non nul. Si α + β 6= 0 n’est pas une racine,
[Eα , Eβ ] doit s’annuler. Enfin si α + β = 0 , [Eα , E−α ] est un vecteur propre de tous les ad Hi de
valeur propre nulle, donc [Eα , E−α ] = H ∈ h. Pour déterminer cet H, procédons comme dans
(3.9)

(Hi , [Eα , E−α ]) = tr (ad Hi [ad Eα , ad E−α ]) = tr ([ad Hi , ad Eα ] ad E−α )

= α(i) (Eα , E−α ) = (Hi , Hα )(Eα , E−α ) (3.13)

donc
[Eα , E−α ] = (Eα , E−α )Hα . (3.14)

Pour récapituler, nous avons construit une base canonique de l’algèbre g

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

3.2. Géométrie des systèmes de racines 111

[Hi , Hj ] = 0
[Hi , Eα ] = 
α(i) Eα

Nαβ Eα+β si α + β est une racine



 (3.15)
[Eα , Eβ ] = (Eα , E−α ) Hα si α + β = 0


0

sinon

Jusqu’à ce point, nous n’avons pas fixé la normalisation des Hi et des Eα . Il est usuel de
choisir, en accord avec (3.7)
(Hi , Hj ) = δij (Eα , Eβ ) = δα+β,0 . (3.15)
(En effet la restriction de la forme de Killing à h, après la multiplication par i à laquelle on a
procédé pour rendre les ad Hi hermitiens, est définie positive.) Avec cette normalisation, Hα
défini plus haut par (3.10) satisfait aussi
Hα = α.H := α(i) Hi . (3.16)
Noter que Eα , E−α et Hα forment une sous-algèbre su(2)
[Hα , E±α ] = ± h α, α i E±α [Eα , E−α ] = Hα . (3.17)
(C’est en fait Hα /h α, α i que nous identifions à Jz , et cette normalisation va être utilisée plus
bas.) Toute algèbre semi-simple contient donc une algèbre isomorphe à su(2) associée à chacune
de ses racines.
Noter qu’avec les normalisations de (3.15), la métrique de Killing s’écrit dans la base
{Hi , Eα , E−α }
 
I` 0
 
 0 1 
 
 1 0 
gab =  (3.18)
 
0 ... 

 

 0 1
1 0
où le premier bloc est une matrice identité de dimension ` × `.

3.2 Géométrie des systèmes de racines

3.2.1 Produits scalaires de racines. La matrice de Cartan
Comme noté en(3.11), l’espace des racines, c’est-à-dire l’espace (de dimension `, cf (iv) ci-dessus)
engendré par les d − ` racines α hérite de la métrique euclidienne de h
X
h α, β i := (Hα , Hβ ) = α(Hβ ) = β(Hα ) = (α.H, β.H) = α(i) β(i) , (3.19)
i

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

112 Chap.3. Algèbres de Lie simples, classification et représentations

où les différentes expressions visent à familiariser avec les notations rencontrées ci-dessus.
(Seules les deux dernières expressions dépendent du choix de normalisation (3.15).) On va
montrer que la géométrie –longueurs et angles– des racines est fortement contrainte. Il suffit de
se rappeler les leçons de l’algèbre su(2) : dans une représentation de dimension finie, Jz a des
Hα
valeurs propres entières ou demi-entières. Donc ici, où chaque h α,α i
joue le rôle d’un Jz et a les
Eβ pour vecteurs propres, ad Hα Eβ = h α, β iEβ , c’est-à-dire

[Hα , Eβ ] = h α, β iEβ (3.20)

nous concluons que

h α, β i
2 =m ∈Z. (3.21)
h α, α i

Chaı̂nes de racines

Il est en fait utile de reprendre la discussion précédente et de l’affiner. L’idée est comme dans
su(2) d’appliquer de façon répétée les opérateurs “montant” Eα et “descendant” E−α (“ladder
operators”) sur un vecteur propre Eβ donné. On a vu que si α et β sont deux racines avec
α + β 6= 0, il peut se faire que β ± α soient aussi des racines. Soit p ≤ 0 le plus petit entier tel
que (ad E−α )|p| Eβ soit non nul, donc que β + pα soit racine, et soit q ≥ 0 le plus grand entier
tel que (ad Eα )q Eβ soit non nul, donc que β + qα soit racine. On appelle l’ensemble de racines
{β + pα, β + (p + 1)α, · · · , β, · · · β + qα} la α-chaı̂ne passant par β. Notons que les Eβ 0 , quand
β 0 parcourt cette chaı̂ne, forment une base d’une représentation de dimension finie de l’algèbre
su(2) engendrée par Hα et E±α . D’après ce que nous savons de ces représentations de su(2), les
valeurs propres minimale et maximale de Hα sont opposées

h α, β + pα i = −h α, β + qα i

soit 2h β, α i = −(q + p)h α, α i, donc avec la notation (3.21)

m = −p − q . (3.22)

Mais cette construction nous montre aussi que β − mα = β + (p + q)α est dans la α-chaı̂ne
passant par β, (puisque p ≤ −m ≤ q), donc que c’est une racine.
Remarque. La discussion du § 3.1 a laissé les coefficients Nαβ indéterminés. On démontre (cf Exercice B) en
utilisant les relations de commutation des E le long d’une chaı̂ne que les coefficients Nαβ satisfont des relations
non linéaires et qu’ils sont déterminés à des choix de signes près par la géométrie du système de racines selon
r
1
|Nαβ | = (1 − p)qh α, α i . (3.23)
2
Noter que comme annoncé, Nαβ s’annule si q = 0, c’est-à-dire si α + β n’est pas une racine.

Groupe de Weyl

Pour tout vecteur x dans l’espace des racines h∗ , définissons la transformation linéaire
h α, x i
wα (x) = x − 2 α. (3.24)
h α, α i

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

3.2. Géométrie des systèmes de racines 113

C’est une réflexion dans l’hyperplan orthogonal à α passant par l’origine : (wα )2 = I, wα (α) =
−α, et wα (x) = x si x est orthogonal à α. C’est bien sûr une isométrie, préservant le produit
scalaire : h wα (x), wα (y) i = h x, y i. On appelle wα une réflexion de Weyl. Par définition le
groupe de Weyl W est le groupe engendré par les wα , c’est-à-dire l’ensemble de tous les produits
possibles de wα pour des racines α. D’après la remarque suivant (3.22), si α et β sont deux
racines, wα (β) = β − mα est une racine. L’ensemble des racines est donc préservé par l’action
du groupe de Weyl. Le groupe W est complètement déterminé par son action sur les racines, qui
consiste donc à les permuter. C’est un sous-groupe du groupe de permutations de l’ensemble
fini ∆, c’est donc un groupe fini 2 .
Exemple : pour l’algèbre su(n), on montre que W = Sn , le groupe de permutations de n objets,
cf plus bas § 3.2.
Signature d’un élément de W . Soit w ∈ W , écrit comme le produit de r réflexions élémentaires
(3.24) : w = wαr . . . wα2 .wα1 . On définit sa signature comme sign(w) := (−1)r . Cela généralise
la notion familière dans le groupe W = Sn , et l’on montre que cette définition est cohérente et
indépendante de l’écriture de w comme produit.
Notons que si β+ = β + qα est la plus haute racine dans la α-chaı̂ne passant par β, et β− = β + pα la plus
basse, wα (β± ) = β∓ et plus généralement, les racines de la chaı̂ne sont échangées deux par deux par l’action de
wα . La chaı̂ne est donc invariante par wα . Cela est une généralisation de la symétrie des “multiplets” de su(2)
(−j, −j + 1, · · · , j − 1, j), et cela s’applique à toute α-chaı̂ne passant par tout β, et donc à tout l’ensemble des
racines. On en conclut que
L’ensemble des racines est invariant par W .

Racines positives, racines simples. Matrices de Cartan

Les racines ne sont pas indépendantes dans h∗ . On montre qu’on peut subdiviser leur ensemble ∆
en racines dites “positives” et racines “négatives”, l’opposé d’une racine positive étant négative,
et trouver une base αi , i = 1, · · · , ` de ` racines simples, telles que toute racine positive (resp.
négative) s’exprime comme combinaison linéaire à coefficients entiers positifs ou nuls (resp.
négatifs ou nuls) de ces racines simples. Une racine simple ne peut donc s’écrire comme somme
de deux racines positives (pourquoi ?).[sinon, si αi pouvait s’exprimer comme somme de racines positives
βj , elles-mêmes combinaisons linéaires à coefficients ∈ N de racines simples, cela contredirait l’indépendance des
racines simples. ]
Ni le choix d’un ensemble de racines positives, ni celui de la base de racines simples n’est
unique. On passe d’un ensemble de racines simples à un autre par une opération du groupe de
Weyl.
Si α et β sont des racines simples, α − β ne peut être une racine (pourquoi ?). L’entier p
dans la discussion précédente est donc nul et m = −q ≤ 0. Il en découle que h α, β i ≤ 0.

2. Cette propriété n’est pas triviale : en général, quand on se donne m vecteurs dans l’espace euclidien
m
R , le groupe engendré par les réflexions dans les hyperplans qui leur sont orthogonaux est infini. Il faut des
configurations bien particulières des vecteurs pour que le groupe soit fini. Les groupes de réflexion finis ont
été classifiés par Coxeter. Les groupes de Weyl des algèbres simples forment un sous-ensemble des groupes de
Coxeter.

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

114 Chap.3. Algèbres de Lie simples, classification et représentations

3 ! 1+ 2 !2

!2 ! ! +! ! +2 ! !2 ! +! 2! +! 3! +! !2
! +!
2
1 1 2 1 2 1 2 1 2 1 2
1

"! !1 !2 !1 !1
1

" ! 1" ! 2 " !2

A2 B2 G2 D2

Figure 3.1 – Systèmes de racines de rang 2. Les deux racines simples positives sont en trait
gras. Pour les algèbres B2 , G2 et D2 , on n’a noté que les racines positives. The two racines
simples are drawn in thick lines. For the algebras B2 , G2 et D2 , only racines positives have
been labelled.

Le produit scalaire de deux racines simples est négatif ou nul. (3.25)

On définit alors la matrice de Cartan comme

h αi , αj i
Cij = 2 . (3.26)
h αj , αj i

Attention, cette matrice n’est pas a priori symétrique 3 . Ses éléments diagonaux valent 2, ses
éléments non diagonaux sont des entiers négatifs ou nuls.
Il faut se rappeler que le produit scalaire qui figure au numérateur de (3.26) est défini
positif. Selon l’inégalité de Schwarz, h α, β i2 ≤ h α, α ih β, β i avec égalité seulement si α et
β sont colinéaires. Cette propriété, avec les propriétés d’intégrité de leurs éléments, suffit à
classifier toutes les matrices de Cartan possibles, comme on va le voir.
Écrivons h αi , αj i = kαi k kαj k cos α
\ i , αj . Notons d’abord qu’en multipliant ou en divisant
les deux équations (3.21) pour la paire {αi , αj }, i 6= j, à savoir Cij = mi ≤ 0 et Cji = mj ≤ 0,
et en utilisant la propriété (3.25), on obtient que si i 6= j,

1√

cos α
\ i , αj = − 2 mi mj 

k αi k
r
mi avec mi , mj ∈ N , (3.27)
= 
k αj k

mj

et la valeur −1 du cosinus est interdite, parce que αi 6= −αj par hypothèse, si bien que les
√ √
seules valeurs possibles de ce cosinus sont 0, − 12 , − 22 , − 23 , c’est-à-dire que les seuls angles
possibles entre racines simples sont π2 , 2π , 3π
3 √
ou 5π , avec des rapports de longueurs des racines
4 √ 6
respectivement égaux à ?(indéterminé), 1, 2, 3.
Il n’existe bien sûr qu’une seule algèbre de rang 1, c’est l’algèbre su(2) complexifiée (3.1)
ou (3.17). On lui donnera désormais le nom de A1 . Il est ensuite aisé de classifier les algèbres
possibles de rang 2. Les quatre cas sont représentés sur la Fig. 3.1, avec leurs matrices de Cartan
3. Attention aussi que certains auteurs appellent matrice de Cartan la transposée de (3.26) !

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

3.2. Géométrie des systèmes de racines 115

6
Al 1 2 3 l 1 2 4 5
E6
3
7
Bl 1 2 3 l 1 2 4 5 6
E7
3
8
Cl 1 2 3 l 1 2 4 5 6 7
E8
3
l !1
1 2 3 4
F4
Dl 1 2 3

1 2
l
G2

Figure 3.2 – Diagrammes de Dynkin

s’écrivant
! ! ! !
2 −1 2 −2 2 −1 2 0
A2 : B2 : G2 : D2 : . (3.28)
−1 2 −1 2 −3 2 0 2

La nomenclature, A2 , B2 , G2 et D2 , est conventionnelle, ainsi que la numérotation des racines.

Le dernier cas, D2 , qui a h α1 , α2 i = 0, est mentionné pour mémoire : il correspond à une algèbre
semi-simple, somme directe de deux algèbres A1 . (Rien ne force d’ailleurs ses deux racines à
avoir la même longueur).
En général, si on peut séparer l’ensemble des racines en deux sous-ensembles mutuellement
orthogonaux, on voit que l’algèbre de Lie se décompose en somme directe de deux algèbres, et
vice versa. Se rappelant que toute algèbre semi-simple peut toujours se décomposer en somme
directe de sous-algèbres simples (fin du Chapitre 1), dans la suite, on ne considérera que des
algèbres simples.

Diagramme de Dynkin

En rang plus élevé, c’est-à-dire en dimension de l’espace des racines plus élevée, il devient
difficile de représenter le système des racines. On adopte une autre représentation, en codant
la matrice de Cartan dans un diagramme de la façon suivante. À chaque racine simple αi est
associé un vertex i du diagramme. Deux vertex sont unis par une ligne ssi h αi , αj i =
6 0 ; la ligne
est simple si Cij = Cji = −1 (angle de 2π/3, longueurs égales) ; elle est double (resp. triple) si
√
Cij = −2 (resp. −3) et Cji = −1 (angle de 3π resp. 5π , avec un rapport des longueurs de 2,
√ 4 6
resp. 3) et porte alors une flèche (ou plutôt un signe >) entre i et j indiquant quelle racine
est la plus longue. (Attention que là encore, certains auteurs utilisent la convention opposée
pour l’orientation de ces flèches !)

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

116 Chap.3. Algèbres de Lie simples, classification et représentations

3.2.2 Systèmes de racines des algèbres simples. La classification de

Cartan
Une analyse de tous les cas possibles a mené Cartan 4 à une classification des algèbres de
Lie simples complexes en termes de 4 familles infinies et de 5 cas exceptionnels. La notation
traditionnelle est la suivante

A` , B` , C` , D` , E6 , E7 , E8 , F4 , G2 . (3.29)

Dans chaque cas, l’indice indique le rang de l’algèbre. La géométrie des systèmes de racines est
codée dans les diagrammes de Dynkin de la Fig. 3.2.
La preuve est un peu laborieuse et sera omise ici. Elle consiste à exploiter le fait que la matrice de Cartan
est définie positive pour montrer successivement qu’au plus un seul de ses éléments non diagonaux peut être
différent de 0 ou −1 (une seule arête du diagramme de Dynkin peut être multiple), que le diagramme ne contient
pas de boucle, que la seule coordinence possible d’un vertex est 0, 1 ou 2 et qu’un diagramme a au plus un
vertex de coordinence 3, etc, et finalement que la liste des diagrammes possibles se réduit à celle de la Fig. 3.2.
Les quatre familles infinies sont identifiées aux algèbres de Lie (complexifiées) de groupes
classiques

A` = sl(` + 1, C), B` = so(2` + 1, C), C` = sp(2`, C), D` = so(2`, C) , (3.30)

ou à leur unique forme réelle compacte, respectivement A` = su(` + 1), B` = so(2` + 1),
C` = usp(`), D` = so(2`).
Les “algèbres exceptionnelles” E6 , . . ., G2 ont pour dimensions respectives 78, 133, 248, 52 et 14. Ce sont les
algèbres de groupes de Lie . . . exceptionnels ! G2 est le groupe d’automorphismes d’octonions, F4 est lui-même
un groupe d’automorphismes de matrices d’octonions, etc.
Parmi ces algèbres, les algèbres A, D, E, dont toutes les racines ont même longueur, sont dites simple-
ment lacées. Il est curieux de remarquer que de nombreux problèmes, sous-groupes finis de su(2), singularités
“simples”, théories conformes “minimales”, etc, sont classifiés selon ce schéma ADE . . . mais cela est une autre
histoire !
Les formes réelles de ces algèbres simples complexes ont aussi été classifiées par Cartan. On trouve 12 séries
infinies et 23 cas exceptionnels !

3.2.3 Base de Chevalley de l’algèbre

Il existe une autre base de l’algèbre de Lie g, dite base de Chevalley, avec des crochets qui ont l’avantage de
ne dépendre que de la matrice de Cartan. Soient hi , ei et fi , i = 1, · · · , `, des générateurs attachés aux racines
simples αi selon
12 12
2 2 2αi .H
ei = Eαi , fi = E−αi , hi = . (3.31)
h αi , αi i h αi , αi i h αi , αi i
Leurs relations de commutation s’écrivent

[hi , hj ] = 0
[hi , ej ] = Cji ej (3.32)
[hi , fj ] = −Cji fj
[ei , fj ] = δij hj

4. Ce travail de classification, entrepris par Killing a été complété et corrigé par É. Cartan, puis simplifié
par van der Waerden, Dynkin, . . .

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

3.2. Géométrie des systèmes de racines 117

(le vérifier). L’algèbre est engendrée par les ei , fi , hi et tous leurs commutateurs contraints par (3.32) et par les
“relations de Serre”

ad (ei )1−Cji ej = 0
1−Cji
ad (fi ) fj = 0. (3.33)

Cela prouve que toute l’algèbre est bien codée dans la donnée des racines simples et de leur géométrie (la matrice
de Cartan ou le diagramme de Dynkin). [Attention que les Hi et Eα de (3.15) forment une base de g comme
e.v., et les hi , ei , fi une base de g comme alg. de Lie !]
Noter aussi la propriété remarquable, pas évidente a priori, que dans cette base, toutes les constantes de
structure (coefficients des relations de commutation) sont des entiers.

3.2.4 Coracines. Plus haute racine. Nombres, exposants de Coxeter

Nous donnons ici quelques compléments sur des notations et concepts qu’on rencontre dans l’étude des algèbres
de Lie simples et de leurs systèmes de racines.
Comme la combinaison
2
αi∨ := αi , (3.34)
h αi , αi i
pour αi une racine simple, apparaı̂t fréquemment, on lui donne le nom de coracine. La matrice de Cartan se
récrit donc
Cij = h αi , αj∨ i . (3.35)
La racine la plus haute θ est la racine positive qui a la propriété que la somme de ses composantes dans
une base de racines simples est maximale : on montre que cela suffit à la caractériser de façon unique. Ses
composantes dans la base des racines et celle des coracines
X 2 X
θ= ai αi , θ= a∨ ∨
i αi , (3.36)
i
h θ, θ i i

appelées aussi indices de Kac ou indices de Kac duaux, jouent aussi un rôle, en particulier par leurs sommes,
X X
h=1+ ai , h∨ = 1 + a∨
i . (3.37)
i i

∨
Ces nombres h et h sont respectivement le nombre de Coxeter et le nombre de Coxeter dual. Quand il faut
choisir une normalisation des racines, ce que nous n’avons pas fait encore, on choisit en général d’imposer que
h θ, θ i = 2.
Enfin la diagonalisation de la matrice de Cartan symétrisée
h αi , αj i
C
bij := 2 p (3.38)
h αi , αi ih αj , αj i
donne un spectre de valeurs propres

b = 4 sin2 π mi ,
n o
valeurs propres de C i = 1, · · · , ` , (3.39)
2h
faisant apparaı̂tre un nouvel ensemble d’entiers mi , les exposants de Coxeter, compris entre 1 et h − 1, avec de
possibles multiplicités. Ces nombres sont importants à plusieurs titres. Ils contiennent des informations utiles
sur le groupe de Weyl. En leur ajoutant 1, (ce qui les rend ≥ 2), on obtient les degrés des opérateurs de Casimir
algébriquement indépendants, ou encore les degrés où le groupe de Lie a une cohomologie non triviale, etc etc.
P
Exemples : pour An−1 alias su(n), racines et coracines sont identiques. La plus haute racine θ = i αi , donc
h = h∨ = n, les exposants de Coxeter sont 1, 2 · · · , n − 1. Pour Dn alias so(2n), racines et coracines sont encore
identiques, θ = α1 + 2α2 + · · · + 2αn−2 + αn−1 + αn , h = 2n − 2, et les exposants sont 1, 3, · · · , 2n − 3, n − 1,
avec donc n − 1 double si n est pair.
Voir l’Appendice F pour des données sur les algèbres simples classiques.

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

118 Chap.3. Algèbres de Lie simples, classification et représentations

3.3 Représentations des algèbres semi-simples

3.3.1 Poids. Réseau des poids
Nous étudions maintenant les représentations des algèbres semi-simples, en suivant une démarche
parallèle à celle des sections précédentes. Dans tout ce qui suit, “représentation” signifie repré-
sentation de dimension finie. On supposera aussi cette représentation unitaire : c’est le cas qui
nous intéresse pour la construction des représentations de groupes compacts. Les éléments de
la sous-algèbre de Cartan commutant entre eux, ils commutent aussi dans toute représentation.
Notant avec des “bras” et des “kets” les vecteurs de cette représentation, et écrivant simplement
X (au lieu de d(X)) pour le représentant de l’élément X ∈ g, on peut trouver une base |λa i
qui diagonalise simultanément les éléments de l’algèbre de Cartan

H|λa i = λ(H)|λa i (3.40)

ou de façon équivalente
Hi |λa i = λ(i) |λa i , (3.41)

avec une valeur propre λ qui est à nouveau une forme sur l’espace h, donc un élément de h∗ ,
l’espace des racines. On donne le nom de poids à un tel vecteur λ = (λ(i) ) de h∗ . Noter que pour
une représentation unitaire, les H sont hermitiens, donc λ est à valeurs réelles : les poids sont
des vecteurs réels de h∗ . La valeur propre λ pouvant apparaı̂tre avec une multiplicité, nous avons
doté les états propres d’un indice a de multiplicité. L’ensemble des poids d’une représentation
forme dans l’espace h∗ le diagramme des poids de la représentation, voir Fig. 3.5 ci-dessous pour
des exemples dans le cas de su(3).
La représentation adjointe est une représentation particulière de l’algèbre dont les poids
non nuls sont les racines. Les racines étudiées aux paragraphes précédents appartiennent donc
à l’ensemble des poids dans h∗ .
Les vecteurs |λa i formant une base de la représentation, leur nombre total, multiplicité
incluse, égale la dimension de l’espace E de représentation. Cet espace E contient des sous-
espaces de représentation de chacune des algèbres su(2) que nous avons identifiées au § 3.2,
engendrées par {Hα , Eα , E−α }. Par le même argument qu’au § 3.2, on va montrer que tout
poids λ satisfait
h λ, α i
∀α, 2 = m0 ∈ Z , (3.42)
h α, α i
et réciproquement, on montre que tout λ ∈ h∗ satisfaisant (3.42) est le poids d’une représenta-
tion de dimension finie. On peut donc utiliser (3.42) comme autre définition d’un poids. Pour
se convaincre que le poids de toute représentation satisfait (3.42), on peut, comme au § 3.2,
définir la chaı̂ne maximale des poids passant par λ

λ + p0 α, · · · , λ, · · · , λ + q 0 α p0 ≤ 0, q 0 ≥ 0 ,

qui forment une représentation de la sous-algèbre su(2), et montrer alors que m0 = −p0 − q 0 .
0 0
Soient p0 le plus petit entier ≤ 0 tel que (E−α )|p | |λa i =
6 0, et q 0 le plus grand entier ≥ 0 tel que (Eα )q |λa i =
6 0,

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

3.3. Représentations des algèbres semi-simples 119

Hα a pour valeurs propres sur ces deux vecteurs h λ, α i + p0 h α, α i, resp h λ, α i + q 0 h α, α i. En exprimant que
les valeurs propres de 2Hα /h α, α i sont entières et opposées, on a
h λ, α i h λ, α i
2q 0 + 2 = 2j 2p0 + 2 = −2j . (3.43)
h α, α i h α, α i
En soustrayant membre à membre, on a q 0 − p0 = 2j, la longueur de la chaı̂ne est bien 2j + 1 (dimension de la
représentation de spin j de su(2)), tandis qu’en ajoutant membre à membre pour éliminer 2j, on a
h λ, α i
2 = −(q 0 + p0 ) =: m0 , comme annoncé en (3.42).
h α, α i
Cette chaı̂ne est invariante sous l’action de la réflexion de Weyl wα . (Cela est une généralisa-
tion de la symétrie des “multiplets” de su(2) (−j, −j + 1, · · · , j − 1, j).) Plus généralement,
l’ensemble des poids est invariant par le groupe de Weyl : si λ est un poids d’une représentation,
wα (λ) en est un aussi, et on montre qu’il est de même multiplicité. Le diagramme des poids
d’une représentation est donc invariant sous l’action de W .
L’ensemble des poids est découpé par le groupe de Weyl W en “chambres”, en nombre égal
à l’ordre de W . La chambre associée à l’élément w de W est le cône

Cw = {λ|h wλ, αi i ≥ 0 , ∀i = 1, · · · , `} , (3.44)

où les αi sont les racines simples. (Ce n’est pas tout à fait une partition, car il existe des poids
sur les “murs” de séparation.) La chambre fondamentale est C1 , correspondant à l’identité dans
W . Les poids appartenant à cette chambre fondamentale sont appelés poids dominants. Tout
poids peut être amené dans C1 par une opération de W : il est sur l’“orbite” (pour le groupe
de Weyl) d’un unique poids dominant. Parmi les poids de toute représentation irréductible, il
en existe au moins un qui est dans C1 .
Par ailleurs, de [Hi , Eα ] = α(i) Eα , il découle que

Hi Eα |λa i = ([Hi , Eα ] + Eα Hi )|λa i = (α(i) + λ(i) )Eα |λa i

donc que Eα |λa i, s’il n’est pas nul, est un vecteur de poids λ + α. Or dans une représentation
irréductible, tous les vecteurs s’obtiennent à partir les uns des autres par de telles actions de
Eα , d’où il découle que
. Deux poids de la même représentation irréductible diffèrent par une combinaison à coefficients
entiers de racines,
(mais cette combinaison n’est en général pas une racine).
On introduit alors un ordre partiel sur les poids d’une même représentation : on dit que
λ0 > λ si λ0 − λ = i ni αi , avec des coefficients ni entiers non négatifs. Il existe (parmi les poids
P

de cette représentation) un unique plus haut poids Λ, dont on montre qu’il est de multiplicité
1. Le vecteur de plus haut poids sera noté |Λi (sans indice a). Il est tel que pour toute racine
positive Eα |Λi = 0, (sans quoi il ne serait pas le plus haut), donc q 0 = 0 dans l’équation (3.43)
ci-dessus, et hΛ, αi = 21 hα, αij > 0, Λ est un poids dominant.
. Le plus haut poids d’une représentation est un poids dominant, Λ ∈ C1 .
Ce vecteur de plus haut poids caractérise la représentation irréductible. (Dans le cas de su(2),
ce serait un vecteur |j, m = j i.) Autrement dit, deux représentations sont équivalentes ssi elles
ont le même plus haut poids.

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

120 Chap.3. Algèbres de Lie simples, classification et représentations

On introduit ensuite les indices de Dynkin du poids λ par

h λ, αi i
λi = 2 ∈Z (3.45)
h αi , αi i

avec αi les racines simples. Pour un poids dominant, donc pour tout poids le plus haut d’une
représentation irréductible, ces indices sont non négatifs, c’est-à-dire dans N.
Les poids fondamentaux Λi satisfont par définition

h Λj , αi i
2 = δij . (3.46)
h αi , αi i

Leur nombre égale le rang ` de l’algèbre, ils constituent une base de h∗ . Chacun d’eux est le plus
haut poids d’une représentation irréductible dite fondamentale ; il y a donc ` représentations
fondamentales. Nous avons donc obtenu
. Toute représentation irréductible est caractérisée par son plus haut poids,
et par abus de notation, on désignera par (Λ) la représentation irréductible de poids le plus
haut Λ.
. Tout plus haut poids se décompose sur les poids fondamentaux, avec pour composantes ses
indices de Dynkin (3.45),
X`
Λ= λj Λj , λi ∈ N . (3.47)
j=1

et tout Λ de la forme (3.47) est le plus haut poids d’une représentation irréductible.
Autrement dit, la connaissance des poids fondamentaux suffit à construire toutes les représen-
tations irréductibles de l’algèbre.
Montrer en utilisant les propriétés énoncées ci-dessus que le plus haut poids de la représentation adjointe
ne peut être que θ, défini en eq. (3.36).

Réseaux des poids et des racines

En général, étant donnée une base de vecteurs e1 , · · · ep dans un espace de dimension p, on

appelle réseau engendré par ces vecteurs l’ensemble des vecteurs pi=1 z i ei avec des coefficients
P

z i ∈ Z. On note encore ce réseau Ze1 + · · · + Zep .

Le réseau P des poids est le réseau engendré par les ` poids fondamentaux Λi . Le réseau
Q des racines est celui engendré par les ` racines simples αi . C’est un sous-réseau de P . Tout
poids d’une représentation irréductible se trouve sur P .
On peut considérer les différentes classes du groupe additif P par rapport à son sous-groupe
Q. Ces classes de congruence, dont le nombre fini |P/Q| se trouve être égal au déterminant
de la matrice de Cartan, rassemblent tous les poids qui diffèrent par un vecteur du réseau des
racines. Dans le cas de su(n), il y a n de ces classes, nous y reviendrons. (Exercice : prouver
la propriété que |P/Q| = det C. Indication : comparer les deux déterminants des Λi et des αi
dans la base des coracines.)
On peut aussi introduire le réseau Q∨ engendré par les ` coracines αi∨ (cf § 2.4). C’est le “dual” de P
puisque h αi∨ , Λj i ∈ Z.

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

3.3. Représentations des algèbres semi-simples 121

On montre enfin que les sous-groupes du groupe fini P/Q sont aussi isomorphes aux groupes d’homotopie
des groupes G ayant g comme algèbre de Lie ! Par exemple pour su(n), on verra plus bas que P/Q = Zn , et
ces sous-groupes sont caractérisés par un diviseur d de n. Pour chacun d’eux, SU(n)/Zd a pour algèbre de Lie
su(n). Le cas n = 2, avec SU(2) et SO(3), nous est familier.

Dimension et opérateur de Casimir

Il est utile de connaı̂tre la dimension d’une représentation de plus haut poids donné et la
valeur qu’y prend l’opérateur de Casimir quadratique. Elles sont données en termes du vecteur
de Weyl ρ, défini par deux formules (non trivialement !) équivalentes

ρ = 21 α>0 α
P
P
= j Λj . (3.48)

Une formule remarquable, due à Weyl, exprime la dimension de la représentation de plus haut
poids Λ comme un produit sur les racines positives
Y h Λ + ρ, α i
dim(Λ) = (3.49)
α>0
h ρ, α i

tandis que la valeur propre du Casimir quadratique est

1
C2 (Λ) = h Λ, Λ + 2ρ i . (3.50)
2
Une question liée est celle de la trace des générateurs de g dans la représentation (Λ). Soit ta une base
de g telle que tr ta tb = TA δab , avec un coefficient TA dont le signe dépend des conventions (t hermitiques ou
antihermitiques, cf Chapitre 1). Dans la représentation de plus haut poids Λ, on doit avoir (voir ci-dessous
Exercice B du Chap. 5)
tr dΛ (ta )dΛ (tb ) = TΛ δab . (3.51)
P 2
Mais dans cette base, l’opérateur de Casimir quadratique s’écrit C2 = a (dΛ (ta )) donc en prenant la trace,
P 2 P
tr C2 = a tr (dΛ (ta )) = TΛ a 1 = TΛ dim g
= C2 (Λ) tr IΛ = C2 (Λ) dim(Λ) (3.52)

d’où
dim(Λ)
TΛ = C2 (Λ) , (3.53)
dim g
une formule souvent utile dans les calculs (théories de jauge. . .). Dans la représentation adjointe, dim(A) = dim g,
donc TΛ = TA = C2 (A).
[Formule “étrange” de Freudenthal–de Vries
h
h ρ, ρ i = h θ, θ i dim g
24
]
Il existe une floppée de formules variées, souvent intrigantes, reliant différents aspects de la théorie des
algèbres de Lie et de leurs représentations. Ainsi par exemple la “formule étrange” de Freudenthal–de Vries qui
h
relie les normes des vecteurs ρ et θ à la dimension de l’algèbre et au nombre de Coxeter : h ρ, ρ i = 24 h θ, θ i dim g.
Il existe encore une formule (Freudenthal) qui décrit la multiplicité d’un poids λ au sein d’une représentation
de plus haut poids Λ. [(Λ + ρ)2 − (λ + ρ)2 mult(λ) = 2 α>0 j>0 hλ + jα, αimult(λ + jα) ] Et aussi, question
P P

liée, une formule de Weyl qui donne l’expression du caractère χΛ (eH ) de cette représentation évalué sur un
élément du “tore de Cartan”, qui résulte de l’exponentiation de l’algèbre de Cartan h.

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

122 Chap.3. Algèbres de Lie simples, classification et représentations

Représentation conjuguée
Étant donnée une représentation de plus haut poids Λ, sa représentation conjuguée est en général non équivalente.
On sait caractériser quel est son plus haut poids Λ grâce au groupe de Weyl. La non équivalence des re-
présentations (Λ) et (Λ) a à voir avec les symétries du diagramme de Dynkin. Pour les algèbres de type
B, C, E7 , E8 , F4 , G2 pour lesquelles il n’existe pas de telle symétrie non triviale, les représentations sont auto-
conjuguées. C’est aussi le cas de D2r . Pour les autres, la conjugaison correspond à la symétrie suivante sur les
indices de Dynkin

A` = su(` + 1) λi ↔ λ`+1−i `>1

D2r+1 = so(4r + 2) λ` ↔ λ`−1 , ` = 2r + 1
E6 λi ↔ λ6−i , i = 1, 2 . (3.54)

où l’indexation des poids fondamentaux, donc celle des indices de Dynkin, suit celle des racines simples, cf Fig.
3.2.

3.3.2 Racines et poids de su(n)

Examinons maintenant ce que sont concrètement les poids et donc les représentations irréductibles
de su(n).
On choisit d’abord une paramétrisation commode de l’espace h∗ , qui est, rappelons-le, de
dimension n − 1. Soient ei , i = 1, · · · n, n vecteurs de h∗ = Rn−1 (donc nécessairement liés),
satisfaisant n1 ei = 0. On les obtient à partir d’une base orthonormée êi de Rn en projetant
P

les êi dans un hyperplan orthogonal à ρ̂ := ni=1 êi , donc ei = êi − n1 ρ̂. Il est commode de se
P

placer dans l’hyperplan ni xi = 1 de l’espace Rn . Ces vecteurs ont pour produits scalaires
P

1
h ei , ej i = δij − . (3.55)
n
En termes de ces vecteurs, les racines positives de su(n)= An−1 , en nombre égal à |∆+ | =
n(n − 1)/2, sont
αij = ei − ej , 1 ≤ i < j ≤ n, (3.56)

et les ` = n − 1 racines simples sont

αi = αi i+1 = ei − ei+1 , 1≤i≤n−1 . (3.57)

Ces racines ont été normalisées à h α, α i = 2. La somme des racines positives se calcule aisément

2ρ = (n − 1)e1 + (n − 3)e2 + · · · + (n − 2i + 1)ei + · · · − (n − 1)en

= (n − 1)α1 + 2(n − 2)α2 + · · · + i(n − i)αi + · · · + (n − 1)αn−1 . (3.58)

On vérifie que la matrice de Cartan est bien


2 si i = j
Cij= h αi , αj i =
−1 si i = j ± 1

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

3.3. Représentations des algèbres semi-simples 123

0 " !

Figure 3.3 – Poids de su(2). Les parties positives des réseaux des poids (petits points) et des
racines (gros points)

en accord avec le diagramme de Dynkin de type An−1 . Les poids fondamentaux Λi i = 1, · · · , n−

1 s’écrivent alors aisément
i
X
Λi = ej , (3.59)
j=1
e1 = Λ1 , ei = Λi − Λi−1 for i = 2, · · · , n − 1, en = −Λn−1 (3.60)

avec des produits scalaires

i(n − j)
, i≤j .
h Λi , Λj i = (3.61)
n
Le groupe de Weyl W ≡ SN agit sur les racines et les poids en permutant les ei : w ∈ W ↔
w̄ ∈ SN : w(ei ) = ew̄(i) .

Dimension de la représentation de poids Λ

En réunissant les formules (3.49) et (3.56), démontrer l’expression suivante
n−1
Y fi − fj + j − i X
dim(Λ) = où fi := λk , fn = 0. (3.62)
j−i
1≤i<j≤n k=i

Représentations conjuguées

Si Λ = (λ1 , · · · , λn−1 ) est le plus haut poids d’une représentation irréductible de su(n), Λ =
(λn−1 , · · · , λ1 ) est celui de la représentation conjuguée, en général pas équivalente. On note que
ni la dimension, ni la valeur de l’opérateur de Casimir ne distinguent les représentations Λ et
Λ.

“n-alité”
Les classes de congruence de P par rapport à Q sont en nombre n. On les distingue par la valeur de

ν(λ) := λ1 + 2λ2 + · · · + (n − 1)λn−1 mod n , (3.63)

à laquelle on peut donner le vilain nom de “n-alité”, par extension de la “trialité” de su(3). Les éléments du
réseau des racines ont donc ν(λ) = 0.

Exemples de su(2) et su(3)

Dans le cas de su(2), il n’y a qu’un poids fondamental Λ = Λ1 et une racine positive α,
normalisée à h α, α i = 2, donc h Λ, α i = 1, h Λ, Λ i = 21 . Donc α = 2Λ, Λ correspond à la
représentation de spin 12 , α à celle de spin 1. Le réseau des poids et celui des racines sont
simples à dessiner, voir Fig. 3.3. L’indice de Dynkin λ1 s’identifie à l’entier 2j, les deux classes

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

124 Chap.3. Algèbres de Lie simples, classification et représentations

10
e3 e2
6 15 27
!2 e1
8 15
"23

3 6 10
"1

Figure 3.4 – Poids de su(3). Seule la première chambre de Weyl C1 a été détaillée, avec quelques
plus hauts poids. Les poids de trialité 0 (réseau des racines) sont représentés par un gros disque,
ceux de trialité 1, resp. 2, par un disque plein, resp. vide.

de congruence de P par rapport à Q correspondent aux représentations de spin entier ou demi-

entier, la dimension dim(Λ) = λ1 + 1 = 2j + 1 et l’opérateur de Casimir C2 (Λ) = 14 λ1 (λ1 + 2) =
j(j + 1), en accord avec les expressions bien connues.
Pour su(3), le réseau des poids est triangulaire, voir Fig. (3.4) sur laquelle on a indiqué la
trialité τ (λ) := λ1 + 2λ2 mod 3 et porté les poids fondamentaux et les poids les plus hauts des
premières représentations. Selon l’usage, les représentations sont repérées par leur dimension 5
1
dim(Λ) = (λ1 + 1)(λ2 + 1)(λ1 + λ2 + 2) , (3.64)
2
complétée par une barre pour distinguer la représentation de sa conjuguée, chaque fois que
nécessaire. La conjuguée de la représentation de poids Λ = (λ1 , λ2 ) est Λ = (λ2 , λ1 ). Seules les
représentations sur la bissectrice de la chambre de Weyl sont donc autoconjuguées.
Exercice. Calculer la valeur propre de l’opérateur de Casimir quadratique en termes des indices de Dynkin
λ1 , λ2 grâce aux formules (3.50) et (3.58). [sauf erreur : (λ21 + λ1 λ2 + λ22 )/3 + (λ1 + λ2 )]
[Does the cubic Casimir distinguish a representation from its conjugate ? sauf erreur, C3 = 21 (λ1 −λ2 ) 2
9 (λ1 + λ2 )2 + 91 λ1 λ2 + λ1
L’ensemble des poids des représentations les plus basses est représenté sur la Fig. 3.5, après
rotation des axes des figures précédentes. L’axe horizontal, porté par α1 , et l’axe vertical, porté
par Λ2 , vont en effet acquérir une signification physique : celle d’axes des coordonnées d’isospin
et d’“hypercharge”, voir chapitre suivant.
N.B. On a détaillé le cas de su(n). Des formules analogues pour les racines, poids fondamen-
taux, etc des autres algèbres simples sont bien sûr connues explicitement et tabulées dans la
littérature. Voir par exemple l’appendice A pour la fiche signalétique des algèbres “classiques”
de type A, B, C, D, et Bourbaki, chap.6 pour plus de détails sur les autres algèbres.
5. ce qui est parfois ambigu ; par exemple, identifier sur la Fig. (3.4) le poids d’une autre représentation de
dimension 15.

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

3.4. Produit tensoriel des représentations de su(n) 125

3 3

8 10

Figure 3.5 – Les diagrammes de poids des représentations les plus basses de su(3), désignées
par leur dimension. Noter qu’une rotation de 30o du réseau des poids a été effectuée par rapport
aux figures précédentes. Dans chaque représentation, le poids le plus haut est indiqué par une
petite indentation. Les points ont une multiplicité 1, le disque ouvert a la multiplicité 2.

3.4 Produit tensoriel des représentations de su(n)

3.4.1 Règles de Littlewood–Richardson et de Racah–Speiser

Étant données deux représentations irréductibles de su(n) (ou de toute autre algèbre de Lie),
c’est un problème souvent rencontré de décomposer leur produit tensoriel en somme de repré-
sentations irréductibles. Si on ne désire obtenir que les multiplicités et qu’on dispose de tables
de caractères du groupe correspondant, on peut utiliser les formules démontrées au Chap. 2, §
2.3.2.
Il existe aussi des règles assez complexes donnant la décomposition en représentations
irréductibles d’un produit de deux représentations irréductibles (Λ) et (Λ0 ) de su(n). Ce sont
les règles de Littlewood-Richardson, qui font appel à la représentation en tableaux d’Young (cf
§ suivant). Mais il est souvent plus simple de procéder de proche en proche, en notant que la
représentation irréductible (Λ0 ) se trouve dans un produit adéquat de représentations fonda-
mentales, et en examinant les produits successifs de la représentation Λ par ces représentations
fondamentales. Par l’associativité du produit tensoriel, on ramène le problème de départ à celui
du produit tensoriel de (Λ) par les diverses représentations fondamentales.
Cette dernière opération est aisée à décrire sur le réseau des poids. Étant donné le plus haut
poids Λ dans la première chambre de Weyl C1 , le produit tensoriel de (Λ) par la représenta-
tion fondamentale de plus haut poids Λi se décompose en représentations irréductibles de la

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

126 Chap.3. Algèbres de Lie simples, classification et représentations

6 15 27

3 8 15 24

1 3 6 10

Figure 3.6 – Opération de produit tensoriel de la représentation 8 par la représentation 3

figurée sur le diagramme des poids de su(3).

manière suivante : on ajoute de toutes les façons possibles les dim(Λi ) poids de la fondamentale
au vecteur Λ et on ne garde comme plus hauts poids de la décomposition que les poids résultant
de cette addition qui appartiennent à C1 .
Illustrons ceci sur le cas de su(3). Supposons que l’on désire calculer la décomposition de 8⊗8.
On sait que la représentation 8 (adjointe) se trouve dans le produit des deux fondamentales 3
et 3̄. Les poids de la représentation fondamentale “3” de plus haut poids Λ1 = e1 sont e1 , e2 , e3 .
Ceux de la représentation fondamentale “3̄” sont leurs opposés. Avec la règle ci-dessus, on
obtient donc

3⊗3 = 3̄ ⊕ 6 3 ⊗ 3̄ = 1 ⊕ 8
3⊗6 = 8 ⊕ 10 3 ⊗ 6̄ = 3̄ ⊕ 15
3⊗8 = 3 ⊕ 6̄ ⊕ 15
3 ⊗ 15 = 6 ⊕ 15 ⊕ 24 (3.65)

etc, et leurs conjuguées, cf Fig. 3.6. En général on ajoute les trois vecteurs e1 = (1, 0), e2 =
(−1, 1) et e3 = (0, −1) (dans la base Λ1 , Λ2 ) à Λ = (λ1 , λ2 ) : les poids les plus hauts de la
décomposition sont donc (λ1 + 1, λ2 ), (λ1 − 1, λ2 + 1) et (λ1 , λ2 − 1), dont on élimine ceux qui
ont un indice de Dynkin négatif. Noter la cohérence avec la trialité : toutes les représentations
apparaissant au membre de droite ont la même trialité, somme (modulo 3) des trialités de celles
du membre de gauche. Par exemple, τ (3) = 1, τ (15) = 1, τ (6) = 2, τ (15) = 2, etc.
En itérant cette opération, on peut alors calculer

8 ⊗ (1 ⊕ 8) = 8 ⊗ 3 ⊗ 3̄ = (3 ⊕ 6̄ ⊕ 15) ⊗ 3̄ = 1 ⊕ 8 ⊕ 8 ⊕ 8 ⊕ 10 ⊕ 10 ⊕ 27

d’où on tire
8 ⊗ 8 = 1 ⊕ 8s ⊕ 8a ⊕ 10 ⊕ 10 ⊕ 27 . (3.66)
Dans cette dernière expression,
[and more precisely (8 ⊗ 8)S = 1 ⊕ 8s ⊕ 27; (8 ⊗ 8A = 8a ⊕ 10 ⊕ 10.]
on a ajouté un indice s ou a pour distinguer les deux copies de la représentation 8 : l’une est
symétrique, l’autre antisymétrique dans l’échange des deux représentations 8 du membre de
gauche. Cette relation nous sera très utile dans le chapitre suivant, dans l’étude de la symétrie
SU(3) de saveur.
Bien que fastidieux, ce processus est simple et systématique. Il existe une règle un peu plus
élaborée pour le produit tensoriel de deux représentations de plus hauts poids quelconques (Λ)

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

3.4. Produit tensoriel des représentations de su(n) 127

et (Λ0 ) d’une algèbre quelconque, voir ci-dessous. Il existe aussi des codes qui calculent ces
décompositions, tel l’étonnant LiE, voir [Link]
LiE/[Link]
Une généralisation des règles précédentes, valide pour toute algèbre simple g, est donnée par l’algorithme
de Racah–Speiser, qui fournit les multiplicités Nλµν , pour des poids les plus hauts λ et µ de g (les notations
précédentes ont été changées Λ → λ, Λ0 → µ)

(λ) ⊗ (µ) = ⊕Nλµν (ν) . (3.67)

Considérons l’ensemble des poids σ = λ0 + µ + ρ où λ0 parcourt le diagramme de poids [λ] de la représentation
(λ) et ρ est le vecteur de Weyl. Trois cas peuvent advenir :
– i) si tous les indices de Dynkin de σ sont strictement positifs, λ0 + µ contribue à la somme sur ν dans
(3.67) avec une multiplicité égale à la multiplicité de σ (c’est-à-dire de λ0 ) ;
– ii) si σ ou l’une de ses images par le groupe de Weyl a un indice de Dynkin nul, c’est-à-dire si σ est sur
le mur d’une chambre de Weyl, λ0 + µ ne contribue pas à la somme sur ν ;
– iii) si σ a un (ou des) indice(s) de Dynkin négatif(s) (mais aucun nul), et n’est pas du cas discuté en (ii),
il peut être appliqué dans la chambre de Weyl fondamentale par un unique élément w du groupe de Weyl.
Le poids w[σ] − ρ contribue alors par sign(w) fois la multiplicité de λ0 à la somme sur ν, où sign(w) est
la signature de l’élément w de W , définie plus haut au § 3.2.1.
Ceci est résumé dans la formule
X X
Nλµν = sign(w) δν,w[λ0 +µ+ρ]−ρ (3.68)
λ0 ∈[λ] w∈W
w[λ0 +µ+ρ]−ρ∈P+

dans laquelle P+ est la chambre de Weyl fondamentale (murs compris) : ν ∈ P+ ⇔ νi ≥ 0 ∀i = 1, · · · n.

3.4.2 Construction tensorielle explicite des représentations de SU(2)

et SU(3)
Considérons un vecteur V ∈ Cn de la représentation de définition de SU(n). Sous l’action de
U ∈ SU(n), V 7→ V 0 = U V , ou en composantes v i 7→ v 0 i = U ij v j , avec des indices i, j = 1, · · · n.
Soit W un vecteur qui se transforme par la représentation complexe conjuguée, (tel W = V ∗ ),
soit W 7→ W 0 = U ∗ W . Il est natural de noter les composantes de W avec des indices inférieurs,
puisque U ∗ = (U † )T , donc w0 i = wj (U † )j i . On note alors que V.W := v i wi est invariant, en
vertu de U † .U = I. Autrement dit le tenseur mixte δji est invariant

i j0 0
δ 0 j = U ii0 U † j δji 0 = (U.U † )i j = δji .

Formons maintenant des tenseurs de rang (p, m), à p indices supérieurs et m indices inférieurs,
se transformant comme V ⊗p ⊗ W ⊗m , donc selon
i ···i ip † l1 lm j1 ···jp
t0 k11 ···kpm = U ij11 · · · U jp U k 1 · · · U† km tl1 ···lm . (3.69)

• Dans le cas de SU(2), on sait que les représentations U et U ∗ sont équivalentes. Cela
résulte de l’existence d’une matrice C = iσ2 , telle que CU C −1 = U ∗ , donc CV ∗ se transforme
0 0
comme V . Ou encore, puisque Cij = ij et i0 j 0 U ii U jj = ij det U = ij , le tenseur antisymétrique
, invariant et inversible (ij = −ij , ij jk = δik ), peut être utilisé pour monter et descendre les

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

128 Chap.3. Algèbres de Lie simples, classification et représentations

indices, (vi := ij v j , soit v1 = v 2 , v2 = −v 1 ) ; et il suffit de ne considérer que les tenseurs de

rang p à indices supérieurs. Pour toute paire d’indices, par exemple i1 et i2 , un tel tenseur peut
être écrit comme somme de composantes symétrique et antisymétrique dans ces indices

ti1 i2 ···ip = t[i1 ,i2 ]···ip + t{i1 ,i2 }···ip

avec t[i1 ,i2 ],···ip := 12 (ti1 i2 ···ip − ti2 i1 ···ip ) et t{i1 ,i2 }···ip := 12 (ti1 i2 ···ip + ti2 i1 ···ip ). Pour la composante an-
tisymétrique, on peut écrire t[i1 ,i2 ]···ip = i1 i2 t̃i3 ···ip , avec t̃i3 ···ip = − 12 ab tabi3 ···ip , et donc réduire son
rang 6 . Donc seuls les tenseurs complètement symétriques dans tous leurs p indices supérieurs
fournissent des représentations irréductibles, et on retrouve ainsi une nouvelle fois la construc-
tion de toutes les représentations irréductibles de SU(2) par produits tensoriels symétrisés de la
représentation de dimension 2, cf Chap. 0,, et le rang p s’identifie à 2j. On vérifie en particulier
que le nombre de composantes indépendantes d’un tenseur de rang p complètement symétrique
dans l’espace C2 est p + 1, puisque ces composantes possèdent 0, 1, · · · p indices égaux à 1, les
autres étant égaux à 2.
Un tenseur de rang p complètement symétrique sera représenté par un “diagramme d’Young”
avec p boı̂tes |{z} . (La définition précise d’un diagramme d’Young sera donnée au paragraphe
p
suivant.) Prenons p = 3 pour fixer les idées. Le produit tensoriel d’un tel tenseur de rang 3 par
un tenseur de rang 1 sera figuré par

⊗ = ⊕

ce qui signifie, en termes de composantes,

4tijk ul = (tijk ul + tjkl ui + tikl uj + tijl uk ) + (tijk ul − tjkl ui ) + (tijk ul − tikl uj ) + (tijk ul − tijl uk )

où le premier terme est complètement symétrique dans ses p + 1 = 4 indices, et les suivants
sont antisymétriques en (i, l), (j, l) ou (k, l). Selon l’argument précédent, ces derniers peuvent
être réduits à des tenseurs de rang 2,

(tijk ul − tjkl ui ) = il t̃jk , t̃jk = −ab tajk ub

ce que l’on représente en effaçant les colonnes à deux boı̂tes, soit

⊗ = ⊕

où on reconnaı̂t la règle familière j ⊗ 12 = (j + 12 ) ⊕ (j − 12 ).

Exercice : reproduire avec cette méthode la règle de décomposition de j ⊗ j 0 .
• Dans le cas de SU(n), n > 2, il faut considérer les tenseurs avec les deux types d’indices,
supérieur et inférieur, et les réduire. Mais ce n’est que dans le cas de SU(3) que cette construction
va nous fournir toutes les représentations irréductibles. Pour n > 3 il faudrait introduire d’autres
tenseurs se transformant selon les autres représentations fondamentales de SU(n) que la repré-
sentation de définition (de dimension n) et sa conjuguée.
6. Il est bon de se rappeler les identités ab cd = δac δbd − δad δbc et donc ab bc = −δac .

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

3.5. Tableaux d’Young et représentations de GL(n) et SU(n) 129

Restreignons nous dans la fin de ce paragraphe au cas de SU(3). Les tenseurs sont donc du
i ···i
type tj11 ···jpm , (i· , j· = 1, 2, 3), se transformant selon la représentation 3⊗p ⊗ 3̄⊗m . On a encore un
tenseur invariant, mais cette fois de rang 3
0 0 0
i0 j 0 k0 U ii U jj U kk = ijk det U = ijk ,

qui nous permet de troquer toute paire d’indices antisymétriques supérieurs pour un indice
inférieur et vice versa, et de réduire ainsi le rang. Mais on peut aussi contracter toute paire
d’indices supérieur et inférieur en un invariant, selon une remarque au début du paragraphe.
On se contente donc de considérer les tenseurs complètement symétriques et de trace nulle de
rang (p, m). On peut démontrer que ces tenseurs forment une représentation irréductible, qui
n’est autre que celle de poids le plus haut pΛ1 + mΛ2 dans les notations du § 3.2. Nous nous
contenterons de vérifier que les dimensions de ces représentations sont bien en accord avec celles
données en (3.64), see Exercise E. A cette représentation on associe à nouveau un diagramme
d’Young à deux lignes, la première à p + m, la seconde à m boı̂tes.
Les règles de produit tensoriel, en particulier celles par les représentations fondamentales
3 et 3̄ (cf § 3.4.1), se retrouvent aussi dans ce langage : il faut ajouter la boı̂te nouvelle de
toutes les façons possibles au diagramme, et effacer toute colonne de hauteur 3 (ce qui reflète
la propriété que det U = 1). Exercice : étudier la réduction de ⊗ et retrouver la règle
graphique du § 3.4.1 dans ce langage.
Un cas particulier que nous allons beaucoup utiliser au chapitre suivant est le suivant : la
représentation adjointe est celle des tenseurs de rang (1,1) et de trace nulle. Cela n’est pas
étonnant : la représentation adjointe est celle engendrée par l’algèbre de Lie su(3), donc par
les matrices (anti)hermitiennes 3 × 3 de trace nulle. Un tenseur de cette représentation se
0 0
transforme par tij 7→ t0 ij = U ii0 U ∗jj tij 0 , soit sous forme matricielle

t0 = U tU † , (3.70)

ce qui à nouveau n’est pas pour nous surprendre, cf la définition de la représentation adjointe
au chapitre 2. Quel diagramme d’Young associe-t-on à la représentation adjointe ?

3.5 Tableaux d’Young et représentations de GL(n) et

SU(n)
La construction précédente s’étend à su(n), en fait au groupe GL(n), et fait intervenir des opérations de
symétrisation ou d’antisymétrisation liées au groupe symétrique des permutations Sm . On va se borner à
quelques brèves indications.
Soit E = Cn l’espace vectoriel de dimension n. Le groupe GL(n, C), ou GL(n) en abrégé, est naturellement
représenté dans E
g ∈ GL(n), x ∈ E 7→ x0 = g.x . (3.71)
Formons la puissance tensorielle m-ième de E : F = E ⊗m = E ⊗ · · · ⊗ E. Dans F , le groupe GL(n) agit par
une représentation, la puissance tensorielle m-ième de (3.71)

g ∈ GL(n), D(g)x(1) ⊗ · · · x(m) = g.x(1) ⊗ · · · ⊗ g.x(m) (3.72)

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

130 Chap.3. Algèbres de Lie simples, classification et représentations

qui est en général réductible. Mais dans F , agit aussi le groupe symétrique Sm selon
−1 −1
(1)
σ ∈ Sm , D(σ)x
b ⊗ · · · x(m) = x(σ 1) ⊗ · · · ⊗ x(σ m) . (3.73)
Faisons le choix d’une base ei dans E, et notons gij les éléments de matrice de g ∈ GL(n) dans cette base. La
représentation de GL(n) dans F a pour matrice
m
Y
D(g){i1 ···im }{j1 ···jm } = gik jk (3.74)
k=1

et celle de Sm
m
Y
D(σ)
b {i ···i }{j ···j } =
1 m 1 m
δiσk jk . (3.75)
k=1
Un tenseur t, élément de F , a dans cette base des composantes ti. et se transforme sous l’action de g ∈ GL(n),
resp. de σ ∈ Sm , en un tenseur t0 de composantes t0i. = Di. j. tj. , resp. D
bi ,j tj . Ces deux ensembles de matrices
. . .
commutent
X Q Q
D(g){i. },{j. } D(σ)
b {j },{k }
. .
= l gil jl δjl ,kσ−1 l = l giσl kl
{j. }
P
= {j. } D(σ)
b {i },{j } D(g){j },{k } .
. . . .
(3.76)
Définissons alors un diagramme d’Young. Un diagramme d’Young est formé de m cases disposées en k lignes
P
de longueur non croissante : f1 ≥ f2 ≥ · · · fk , fi = m. Voici un exemple pour m = 8, ayant f1 = 4, f2 =
2, f3 = 2

On décore ensuite les m boı̂tes d’un diagramme d’Young, le transformant ainsi en un tableau, en y distribuant
les entiers de 1 à m. Un tableau standard est un tableau dans lequel les entiers sont croissants dans chaque ligne
de gauche à droite, et dans chaque colonne de haut en bas.
Le nombre nY de tableaux standards obtenus à partir d’un diagramme Y est calculé comme suit. On définit
les nombres ì = fi + k − i, i = 1, · · · , k. Ils forment une suite strictement décroissante : `1 > `2 > · · · > `k . On
démontre alors que
n! Y
nY = Q (ì − `j ) (3.77)
i ì ! i<j

où le produit du numérateur vaut 1 s’il n’y a qu’une seule ligne.

La théorie des représentations du groupe symétrique Sm nous apprend alors qu’il y a une bijection entre les
diagrammes d’Young à m boı̂tes Y et les représentations irréductibles D bY . La dimension de la représentation
DbY est donnée par le nombre (3.77) de tableaux standards de type Y .
On appelle tenseur de type (de symétrie) Y un tenseur se transformant par Sm selon cette représentation
DY . La commutation des matrices D(g) et D(σ)
b b garantit alors que les tenseurs de type Y forment un sous-espace
invariant pour l’action de GL(n).
Exemple. Considérons les cas de m = 2 et m = 3. Dans le premier cas, les tenseurs de rang 2 peuvent se
décomposer en leurs parties symétrique et antisymétrique qui se transforment indépendamment sous l’action de
GL(n)
1 i1 i2 1 i1 i2
ti1 i2 = + ti2 i1 + − ti2 i1 .

t t
2 2
Cette décomposition correspond aux deux tableaux d’Young à 2 boı̂tes, disposées horizontalement ou verticale-
ment. Pour le rang 3, on écrit de même les tenseurs associés aux 4 tableaux d’Young standards
1 2 3 A = ti1 i2 i3 + ti2 i3 i1 + ti3 i1 i2 + ti2 i1 i3 + ti3 i2 i1 + ti1 i3 i2 (3.78)
1 B = ti1 i2 i3 + ti2 i3 i1 + ti3 i1 i2 − ti2 i1 i3 − ti3 i2 i1 − ti1 i3 i2 (3.79)
2
3
1 2 C1 = ti1 i2 i3 − ti2 i3 i1 + ti2 i1 i3 − ti3 i2 i1 (3.80)
3
1 3 D1 = ti1 i2 i3 − ti2 i1 i3 + ti3 i2 i1 − ti3 i1 i2 (3.81)
2

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

3.5. Tableaux d’Young et représentations de GL(n) et SU(n) 131

où pour alléger les notations on n’a pas fait figurer les indices i1 , i2 , i3 sur A, · · · , D1 . Tout tenseur se décompose
sur cette base :
6ti1 i2 i3 = A + B + 2(C1 + D1 ) .

Les indices 1 sur C et D rappellent que sous l’action du groupe S3 , ces objets se mélangent avec une autre
combinaison C2 = ti1 i3 i2 − ti3 i1 i2 + ti2 i3 i1 − ti1 i2 i3 (resp. D2 = ti2 i1 i3 + ti2 i3 i1 − ti1 i2 i3 − ti1 i3 i2 ) des tijk en
des représentations de dimension 2. Au contraire l’action du groupe GL(n) mélange entre elles les différentes
composantes du tenseur A, celles du tenseur B, etc. Les tenseurs C et D se transforment selon des représentations
équivalentes.
Tous les tableaux d’Young, cependant, ne contribuent pas aux représentations de GL(n) pour n donné. Il
est clair qu’un tableau à k > n lignes implique une antisymétrisation de k indices prenant leurs valeurs dans
{1, · · · , n} et donne donc un résultat nul. En revanche il est aisé de voir que tout tableau à k ≤ n lignes donne
lieu à une représentation. On démontre, et nous admettrons, que cette représentation de GL(n) est irréductible
et que sa dimension est
(n) ∆(f1 + n − 1, f2 + n − 2, · · · , fn )
dimY = (3.82)
∆(n − 1, n − 2, · · · , 0)
Q
où ∆(a1 , a2 , · · · , an ) = i<j (ai − aj ) est le déterminant de Vandermonde des a et les fi désignent les longueurs
P
des lignes du tableau Y . C’est un polynôme de degré m = fi en n. Comparer à (3.62).
Dans le cas d’un tableau à une ligne, la formule résulte d’un argument combinatoire simple. La dimension
est égale au nombre de composantes du tenseur complètement symétrique ti1 ,···im où on peut supposer 1 ≤ i1 ≤
i2 ≤ · · · ≤ in ≤ n. Il s’agit de disposer de toutes les façons possibles n−1 signes < parmi les m indices i1 , · · · , im
n
pour marquer les blocs successifs de 1, 2, . . ., n. La dimension cherchée est donc le coefficient binômial Cn+m−1 ,
en accord dans ce cas particulier avec (3.82).
Dans l’exemple précédent avec m = 3, les deux derniers tenseurs C1 et D1 se transforment selon des
représentations équivalentes. On dit donc que E ⊗3 se décompose en

+ +2

où la troisième apparaı̂t avec la multiplicité deux. En général, la multiplicité dans E ⊗m d’une représentation de
GL(n) indexée par un tableau d’Young est égale à la dimension de la représentation correspondante de Sm .
Cette remarquable relation entre les représentations de Sm et de GL(n) est due à Frobenius et Weyl et
appelée dualité de Frobenius–Weyl.
On peut étendre ces considérations à d’autres groupes de transformations linéaires, SL(n), O(n), U(n), . . .
En raison des conditions additionnelles sur les matrices g dans ces groupes, une réduction supplémentaire des
représentations peut être possible. Par exemple, on a vu à la sect. 2.2 du chap. 2 que la puissance E ⊗2 de
l’espace euclidien à 3 dimensions se réduisait sous l’action de SO(3) en trois sous-espaces, correspondant à des
tenseurs de symétrie définie et de trace nulle et à un scalaire invariant.

Relations entre les diagrammes d’Young et les poids de su(n)

Donnons pour finir la relation entre les deux descriptions des représentations irréductibles obtenues pour SU(n)
ou son algèbre de Lie su(n). Dans ce cas, il suffit de limiter le nombre de lignes du diagramme d’Young Y à
k ≤ n − 1 pour obtenir toutes les représentations irréductibles. Le i-ème poids fondamental est représenté par
un diagramme d’Young fait d’une colonne de hauteur i, par exemple Λ3 = . Et la correspondance entre le

poids le plus haut Λ avec ses indices de Dynkin λi et le tableau Y avec ses lignes de longueur fi est comme suit
n−1
X
Λ = (λ1 , · · · , λn−1 ) ↔ Y = (fi = λj ) . (3.83)
j=i

Autrement dit, λk est le nombre de colonnes de Y de hauteur k, voir Fig. 3.7.

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

132 Chap.3. Algèbres de Lie simples, classification et représentations

{
{
!
!2 1
!5

{
!7

Figure 3.7 – Correspondance entre diagramme d’Young et poids le plus haut (ou ses indices de
Dynkin). Ici Y ↔ Λ = (2, 2, 0, 0, 1, 0, 2)

Références additionnelles
La description de la construction des poids et racines peut se trouver dans de nombreuses
références données plus haut (Bump ; Bröcker et Dieck ; Gilmore . . .) mais encore dans
J. E. Humphreys, Introduction to Lie Algebras and Representation Theory, Graduate Texts in
Mathematics 9, Springer.
Le chapitre 13 du “Gros livre jaune” de P. Di Francesco, P. Mathieu et D. Sénéchal, [DFMS],
Conformal Field Theory, Springer, est une mine d’informations sur les algèbres de Lie simples,
leurs représentations, les produits tensoriels d’ycelles . . .
Pour le calcul des expressions explicites des constantes Nαβ , voir [Gi], ou Wybourne, Clas-
sical groups for physicists, John Wyley.
Sur les octonions et les groupes exceptionnels, voir l’article très complet (et disponible en
ligne) de John C. Baez, Bull. Amer. Math. Soc. 39 (2002), 145-205.
Pour la classification des formes réelles, voir S. Helgason, Differential Geometry, Lie groups
and Symmetric spaces, Academic Press, 1978, ou Kirillov, op. cit. au chap. 2 .

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

Appendice F. Les algèbres classiques de type A, B, C, D 133

Appendix F. Les algèbres classiques de type A, B, C, D

F.1 sl(N )= AN −1

Rang = l = N − 1, dimension N 2 − 1, nombre de Coxeter h = N , nombre de Coxeter dual h∨ = N .

PN
ei , i = 1, · · · , N un ensemble de vecteurs de RN tels que 1 ei = 0, h ei , ej i = δij − N1 .
Racines αij = ei − ej , i 6= j = 1, · · · N ; racines positives αij = ei − ej , i < j ; leur nombre |∆+ | = N (N − 1)/2 ;
racines simples αi := αi i+1 = ei − ei+1 i = 1, · · · , N − 1.
Racine la plus haute θ = α1 + · · · + αN −1 = 2e1 + e2 + · · · + eN −1 = Λ1 + ΛN −1 = (1, 0, · · · , 0, 1).
Somme des racines positives

2ρ = (N − 1)e1 + (N − 3)e2 + · · · + (N − 2i + 1)ei + · · · − (N − 1)eN

= (N − 1)α1 + 2(N − 2)α2 + · · · + i(N − i)αi + · · · + (N − 1)αN −1 . (F.1)

 2 si i = j


Matrice de Cartan h αi , αj i = −1 si i = j ± 1


0 sinon

Pi
Poids fondamentaux Λi i = 1, · · · , N − 1, Λi = j=1 ej , e1 = Λ1 , ei = Λi − Λi−1 pour i = 2, · · · , N − 1,
eN = −ΛN −1 .
h Λi , Λj i = i(NN−j) pour i ≤ j.
Groupe de Weyl : W ≡ SN agit sur les poids en permutant les ei : w ∈ W ↔ w̄ ∈ SN : w(ei ) = ew̄(i)
Exposants de Coxeter {1, 2, · · · , N − 1}.

F.2 so(2l + 1) = Bl , l ≥ 2

Rang = l, dimension l(2l + 1), nombre de Coxeter h = 2l, nombre de Coxeter dual h∨ = 2l − 1
ei , i = 1, · · · , l , h ei , ej i = δij une base de Rl .
Racines ±ei , 1 ≤ i ≤ l et ±ei ± ej , 1 ≤ i < j ≤ l. Base de racines simples αi = ei − ei+1 , i = 1, · · · , l − 1, et
αl = el .
Racines positives
X
ei = αk , 1 ≤ i ≤ l ,
i≤k≤l
X
ei − ej = αk , 1 ≤ i < j ≤ l, (F.2)
i≤k<j
X X
ei + ej = αk + 2 αk , 1 ≤ i < j ≤ l,
i≤k<j j≤k≤l

leur nombre est |∆+ | = l2 .

Racine la plus haute θ = e1 + e2 = α1 + 2α2 + · · · + 2αl .
Somme des racines positives

2ρ = (2l − 1)e1 + (2l − 3)e2 + · · · + (2l − 2i + 1)ei + · · · + 3el−1 + el

= (2l − 1)α1 + 2(2l − 2)α2 + · · · + i(2l − i)αi + · · · + l2 αl . (F.3)

 2 si 1 ≤ i = j ≤ l




−1 si 1 ≤ i = (j ± 1) ≤ l − 1



∨
Matrice de Cartan h αi , αj i = −2 si i = l − 1 , j = l


−1 si i = l , j = l − 1





0 sinon


29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

134 Chap.3. Algèbres de Lie simples, classification et représentations

Pi 1
Pl
Poids fondamentaux Λi = j=1 ej , i = 1, · · · , l − 1, Λl = 2 j=1 ej ; donc e1 = Λ1 = (1, 0, · · · , 0), ei =
Λi − Λi−1 = (0, · · · , −1, 1, 0 · · · ), i = 2, · · · , l − 1, el = 2Λl − Λl−1 = (0, · · · , 0, −1, 2).
Indices de Dynkin des racines
α1 = (2, −1, 0, · · · ), αi = (0, · · · , −1, 2, −1, 0 · · · ), i = 2, · · · , l−2 ; αl−1 = (0, · · · , 0, −1, 2, −2) ; αl = (0, · · · , 0, −1, 2)
et θ = (0, 1, 0, · · · , 0)

Groupe de Weyl : W ≡ Sl n (Z2 )l , d’ordre 2l .l!, agit sur les poids en permutant les ei et ei 7→ (±1)i ei .

Exposants de Coxeter {1, 3, 5, · · · , 2l − 1}.

F.3. sp(2l) = Cl , l ≥ 2

Rang = l, dimension l(2l + 1), nombre de Coxeter h = 2l, nombre de Coxeter dual h∨ = l + 1
ei , i = 1, · · · , l , h ei , ej i = 21 δij une base de Rl (Attention ! au facteur 2 qui assure la normalisation θ2 = 2).
Base de racines simples αi = ei − ei+1 , i = 1, · · · , l − 1, et αl = 2el .
Racines ±2ei , 1 ≤ i ≤ l et ±ei ± ej , 1 ≤ i < j ≤ l.
Racines positives
X
ei − ej = αk , 1 ≤ i < j ≤ l ,
i≤k<j
X X
ei + ej = αk + 2 αk + αl , 1 ≤ i < j ≤ l, (F.4)
i≤k<j j≤k<l
X
2ei = 2 αk + αl , 1 ≤ i ≤ l,
i≤k<l

leur nombre est |∆+ | = l2 .

Racine la plus haute θ = 2e1 = 2α1 + 2α2 + · · · + 2αl−1 + αl .
Somme des racines positives

2ρ = 2le1 + (2l − 2)e2 + · · · + (2l − 2i + 2)ei + · · · + 4el−1 + 2el

1
= 2lα1 + 2(2l − 1)α2 + · · · + i(2l − i + 1)αi + · · · + (l − 1)(l − 2)αl−1 + l(l + 1)αl . (F.5)
2



 2 si 1 ≤ i = j ≤ l


−1 si 1 ≤ i = (j ± 1) ≤ l − 1



Matrice de Cartan h αi , αj∨ i = −1 si i = l − 1 , j = l


−2 si i = l , j = l − 1






0 sinon

Pi
Poids fondamentaux Λi = j=1 ej , i = 1, · · · , l, donc e1 = Λ1 = (1, 0, · · · , 0), ei = Λi −Λi−1 = (0, · · · , −1, 1, 0 · · · ),
i = 2, · · · , l.
Indices de Dynkin des racines
α1 = (2, −1, 0, · · · ), αi = (0, · · · , −1, 2, −1, 0 · · · ), i = 2, · · · , l − 1 ; αl = (0, · · · , 0, −2, 2) and θ = (2, 0, · · · , 0)

Groupe de Weyl : W ≡ Sl n (Z2 )l , d’ordre 2l .l!, agit sur les poids en permutant les ei et ei 7→ (±1)i ei .

F.4. so(2l) = Dl , l ≥ 3

Rang = l, dimension l(2l − 1), nombre de Coxeter = nombre de Coxeter dual h = 2l − 2 = h∨

ei , i = 1, · · · , l , h ei , ej i = δij une base de Rl .
Base de racines simples αi = ei − ei+1 , i = 1, · · · , l − 1, et αl = el−1 + el .

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

Appendice F. Les algèbres classiques de type A, B, C, D 135

Racines positives
X
ei − ej = αk , 1 ≤ i < j ≤ l,
i≤k<j
X X
ei + ej = αk + 2 αk + αl−1 + αl , 1 ≤ i < j ≤ l − 1, (F.6)
i≤k<j j≤k<l−1
X
ei + el = αk + αl , 1 ≤ i ≤ l − 1,
i≤k≤l−2

leur nombre est |∆+ | = l(l − 1).

Racine la plus haute θ = e1 + e2 = α1 + 2α2 + · · · + 2αl−2 + αl−1 + αl .
Somme des racines positives

2ρ = 2(l − 1)e1 + 2(l − 2)e2 + · · · + 2el−1

l(l − 1)
= 2(l − 1)α1 + 2(2l − 3)α2 + · · · + i(2l − i − 1)αi + · · · + (αl−1 + αl ). (F.7)
2

Groupe de Weyl : W ≡ Sl n (Z2 )l−1 , of order 2l−1 .l!, agit sur les poids en permutant les ei et ei 7→ (±1)i ei ,
Q
avec i (±1)i = 1.

Exposants de Coxeter {1, 3, 5, · · · , 2l − 3, l − 1}, avec l − 1 appaissant donc deux fois si l est pair.

 2 si 1 ≤ i = j ≤ l



−1 si 1 ≤ i = (j ± 1) ≤ l − 2


Matrice de Cartan h αi , αj i =


 −1 si (i, j) = (l − 2, l) or (l, l − 2)


0 sinon

Pi
Poids fondamentaux Λi = j=1 ej = α1 + 2α2 + · · · + (i − 1)αi−1 + i(αi + · · · + αl−2 ) + 2i (αl−1 + αl ) pour
i = 1, · · · , l − 2 ; Λl−1 = 12 (e1 + · · · + el−1 − el ) = 12 (α1 + 2α2 + · · · + (l − 2)αl−2 ) + 2l αl−1 + l−2
2 αl ; Λl =
1 1 l−2 l
2 (e1 + · · · + el−1 + el ) = 2 (α1 + 2α2 + · · · + (l − 2)αl−2 ) + 2 αl−1 + 2 αl .

Pour les algèbres exceptionnelles de types E, F, G, voir Bourbaki.

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

136 Chap.3. Algèbres de Lie simples, classification et représentations

Exercices et Problème du chapitre 3

A. Algèbre de Cartan et racines
P i
x Hi + α∈∆ xα Eα avec les notations du § 3.1.2.
P
1. Montrer que tout élément X de g peut s’écrire X =
Pour H quelconque dans l’algèbre de Cartan, calculer l’action de ad H sur un tel vecteur X ; en déduire que
ad Had H 0 X = α∈∆ xα α(H)α(H 0 )Eα et que (compte tenu que les espaces propres pour chaque racine α ont
P

dimension 1, cf (ii) du § 3.1.2), la forme de Killing s’écrit

X
(H, H 0 ) = tr (ad Had H 0 ) = α(H)α(H 0 ) . (3.82)
α∈∆

2. On veut montrer que les racines α définies par (3.5) ou (3.6) engendrent bien tout l’espace h∗ dual de la
sous-algèbre de Cartan h. Montrer que s’il n’en était pas ainsi, il existerait un élément H de h tel que

∀α ∈ ∆ α(H) = 0 . (3.83)

Montrer en utilisant (3.82) qu’alors, ∀H 0 ∈ h, (H, H 0 ) = 0. Pourquoi cela est-il impossible dans une algèbre
semi-simple ? (cf la discussion précédant l’équation (3.10)).
3. Variante de l’argument précédent : sous l’hypothèse du 2. et donc de (3.83), montrer que H commuterait
avec tous les Hi et tous les Eα , donc appartiendrait au centre de g. Montrer que le centre d’une algèbre est un
idéal abélien. Que peut-on dire du centre d’une algèbre semi-simple ? Conclure.

B. Calcul des Nαβ

1. Montrer que les constantes réelles Nαβ satisfont Nαβ = −Nβα et, en conjuguant [Eα , Eβ ] = Nαβ Eα+β
que
Nαβ = −N−α,−β . (3.84)

2. Soient trois racines satisfaisant α + β + γ = 0. En écrivant l’identité de Jacobi pour le triplet Eα , Eβ , Eγ ,

montrer que α(i) Nβγ + cycl. = 0. En déduire la relation

Nαβ = Nβ,−α−β = N−α−β,α . (3.85)

3. Considérant la α-chaı̂ne passant par β et les deux entiers p et q définis au § 3.2.1, écrire l’identité de
Jacobi pour Eα , E−α et Eβ+kα , avec p ≤ k ≤ q, et montrer qu’elle implique

h α, β + kα i = N−α,β+kα Nα,β+(k−1)α + Nβ+kα,α N−α,β+(k+1)α .

Soit f (k) := Nα,β+kα N−α,−β−kα . Montrer en utilisant les relations (3.85) que l’équation précédente se récrit

h α, β + kα i = f (k) − f (k − 1) . (3.86)

4. Que valent f (q) et f (q − 1) ? Montrer que la récurrence (3.86) se résout en

1
f (k) = −(Nα,β+kα )2 = (k − q)h α, β + (k + q + 1)α i . (3.87)
2
Que vaut f (p − 1) ? Montrer que l’on retrouve l’expression (3.21). Montrer que la formule (3.87) est en accord
avec (3.23). Il reste à déterminer le signe de la racine carrée. . ., cf [Gi].

C. Étude des algèbres Bl =so(2l + 1) et G2

1. so(2l + 1) = Bl , l ≥ 2
a. Quelle est la dimension du groupe SO(2l + 1) ou de son algèbre de Lie so(2l + 1) ? (Rép. l(2l + 1).)
b. Quel est le rang de l’algèbre ? (on cherchera à diagonaliser une matrice de so(2l + 1) sur C, ou à l’écrire
comme une diagonale de blocs 2 × 2, cf § 3.1)
c. Combien l’algèbre a-t-elle de racines ? Combien de racines positives ? Combien de simples ? (Rép. resp.
2l2 = dimension−rank, l2 et l)

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

Exercices et Problème du Chapitre 3 137

d. Soit ei , i = 1, · · · , l , une base orthonormée de Rl , h ei , ej i = δij . On considère l’ensemble de vecteurs

∆ = {±ei , 1 ≤ i ≤ l} ∪ {±ei ± ej , 1 ≤ i < j ≤ l}

Quel est le cardinal de ∆ ? (Rép. 2l + 2l(l − 1) = 2l2 ) . ∆ décrit l’ensemble des racines de l’algèbre so(2l + 1).
e. Une base de racines simples est donnée par αi = ei − ei+1 , i = 1, · · · , l − 1, et αl = el . Expliquer pourquoi
les racines
X
ei = αk , 1 ≤ i ≤ l,
i≤k≤l
X
ei − ej = αk , 1 ≤ i < j ≤ l, (3.88)
i≤k<j
X X
ei + ej = αk + 2 αk , 1 ≤ i < j ≤ l,
i≤k<j j≤k≤l

se qualifient comme racines positives.

(Rép. leur nombre est |∆+ | = l2 , elles se décomposent bien sur les racines simples avec des coefficients entiers
non négatifs, et avec leurs opposées (racines négatives), elles reproduisent bien tout l’ensemble ∆.) Vérifier
cette assertion sur le cas de B2 = so(5). (Rép. e1 = α1 + α2 , e2 = α2 sont les deux vecteurs orthogonaux de la
fig 1 du cours, etc.)
f. Calculer la matricede Cartan et vérifier qu’elle est en accord avec le diagramme de Dynkin donné en


 2 si 1 ≤ i = j ≤ l

−1 si 1 ≤ i = (j ± 1) ≤ l − 1

h α ,α i
cours. (Rép. 2 h αji ,αjj i = )


 −2 si i = l − 1 , j = l


−1 si i = l , j = l − 1

g. Calculer la somme ρ des racines positives. (Rép.

2ρ = (2l − 1)α1 + 2(2l − 2)α2 + · · · + i(2l − i)αi + · · · + l2 αl .

= (2l − 1)e1 + (2l − 3)e2 + · · · + (2l − 2i + 1)ei + · · · + 3el−1 + el

)
h. Le groupe de Weyl est le produit (“semi-direct”) W ≡ Sl n (Z2 )l , qui agit sur les ei (et donc sur les poids
et racines) par permutation et par changements de signe indépendants ei 7→ (±1)i ei . Quel est son ordre ? Dans
le cas de B2 , dessiner la première chambre de Weyl. (Rép. 2l .l!) (Rép. la permutation et les changements
de signe de e1 et e2 correspondent bien à des (produits de) réflexions dans les ”plans” orthogonaux à α1 et α2 ;
ils ne modifient pas le dessin de la fig 1 du cours. Ordre |W | = 2l l!. Pour B2 , |W | = 8, la première chambre de
Weyl est l’octant compris entre α1 + α2 et α1 + 2α2 . )
Pi Pl
i. Montrer que les vecteurs Λi = j=1 ej , i = 1, · · · , l − 1, Λl = 21 j=1 ej sont les poids fondamentaux.
h α ,Λ i
(Rép. On vérifie 2 h αi1 ,αji i = δij )
j. Calculer en utilisant la formule de Weyl : dim(Λ) = α>0 h Λ+ρ,α i
Q
h ρ,α i la dimension des 2 représentations
fondamentales de B2 et celle de poids le plus haut 2Λ2 . Au vu de ces dimensions, à quoi correspondent ces
représentations de SO(5) ? (Rép. Dans le cas de B2 , Λ1 = e1 , Λ2 = 12 (e1 + e2 ), ρ = 3e1 + e2 , racines positives
∆+ = {e1 , e2 , e1 ± e2 }, dim(Λ1 ) = 5, dim(Λ2 ) = 4, dim(2Λ2 ) = 10, ce sont les représentations vectorielle,
spinorielle et adjointe, respectivement, de SO(5). Noter que 2Λ2 = α1 + 2α2 est la plus haute racine.)
k. Dessiner sur un même dessin les racines et les premiers poids de so(5).

2. G2
Dans l’espace R2 , on considère trois vecteurs e1 , e2 , e3 de somme nulle, h ei , ej i = δij − 31 , puis on construit
les 12 vecteurs

±(e1 − e2 ), ±(e1 − e3 ), ±(e2 − e3 ), ±(2e1 − e2 − e3 ), ±(2e2 − e1 − e3 ), ±(2e3 − e1 − e2 )

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

138 Chap.3. Algèbres de Lie simples, classification et représentations

Ils constituent le système de racines de G2 , comme on va le vérifier.

a. Que peut-on dire alors de la dimension de l’algèbre G2 ? (Rép. Dimension de G2 = rang+ nombre total
de racines = 12+2=14.)
b. Montrer que α1 = e1 −e2 et α2 = −2e1 +e2 +e3 sont deux racines simples, en accord avec le diagramme de
Dynkin de G2 donné dans le cours. Calculer la matrice de Cartan. (Rép. On calcule h α1 , α1 i = 2,!h α2 , α2 i = 6,
2 −1
h α1 , α2 i = −3, en accord avec le diagramme de Dynkin et la matrice de Cartan C = .)
−3 2
c. Que sont les racines positives ? Calculer le vecteur ρ, demi-somme des racines positives. (Rép. ∆+ =
{α1 , α2 , α1 + α2 , 2α1 + α2 , 3α1 + α2 , 3α1 + 2α2 }. ρ = 5α1 + 3α2 )
d. Quel est le groupe d’invariance du diagramme des racines ? Montrer qu’il est d’ordre 12 et que c’est le
groupe de Weyl de G2 . Dessiner la première chambre de Weyl. (Rép. groupe diédral D6 d’ordre 12.)
e. Vérifier que les poids fondamentaux sont

Λ1 = 2α1 + α2 Λ2 = 3α1 + 2α2

f. Que sont les dimensions de représentations fondamentales ? (Rép. dim(Λ1 ) = 7, dim(Λ2 ) = 14. La
représentation (Λ2 ) est l’adjointe. Noter que là encore, Λ2 = 3α1 + 2α2 est la plus haute racine.)
g. Dans les deux cas de B2 et G2 , on constate que le poids le plus haut de la représentation adjointe est
donné par la racine la plus haute. Expliquer pourquoi cela est vrai en général. (Rép. Les racines sont les poids
de la représentation adjointe. Le poids le plus haut de la représentation adjointe est donc la racine la plus
haute.)

3. Un peu de physique (à voir après étude du Chap. 4)

Pourquoi les groupes SO(5) ou G2 ne convenaient-ils pas comme groupe de symétrie étendant le SU(2)
d’isospin, sachant qu’on avait observé plusieurs “octets” de particules ? (Rép. pas de représentation irréductible
de dimension 8, mais 7+1 n’était pas si mal ... ?)

D. Systèmes de racines. Repliements de diagrammes de Dynkin

On considère les racines simples αi de l’algèbre su(2n), numérotées comme dans le cours. (Attention ! nous
disons bien 2n !)
1. Quel est le rang de cette algèbre ? Que valent les h αi , αj i ? Dessiner le diagramme de Dynkin correspon-
dant. Quelle est la symétrie de ce diagramme ?(Rép. Rang = 2n − 1. Toutes les racines ont longueur carrée
2 si i = j
= 2, donc matrice de Cartan Cij = h αi , αj i = . Symétrie Z2 de réflexion.)
−1 si |i − j| = 1
√ √
2. On définit alors βi = (αi + α2n−i )/ 2, pour i = 1, · · · , n − 1 et βn = αn / 2. Calculer les h βi , βj i. (Rép.
On calcule h βi , βi i = 2 , h βi , βi+1 i = −1, ∀i.)
3. Montrer que les β forment un système de racines que l’on précisera. (Rép. Matrice de Cartan des β :
Cii0 = 2, puis Ci0 i+1 = Ci+10 0 0
i = −1, ∀i ≤ n − 2, et Cn−1 n = −2, Cn n−1 = −1, c’est la matrice de Cartan de
Bn .)
4. Plus généralement, tout système de racines simples de même longueur peut être “replié” selon une symétrie
éventuelle de son diagramme de Dynkin et donne alors un autre diagramme de Dynkin. Sans aucun calcul, quel
diagramme devrait-on obtenir de cette manière à partir du diagramme E6 ? (Rép. Si on replie E6 selon sa
0 0
symétrie Z2 , on doit obtenir un diagramme linéaire à 4 vertex, les deux liens extrêmes portent C12 = C34 = −1
0
et le médian porte C23 6= −1 par le même principe que ce qu’on vient de voir, ce ne peut être que F4 , ce que
confirme le calcul.)

E. Dimensions des représentations de SU(3)

Admettant que la construction du § 3.4.2, celle des tenseurs de rang (p, m) complètement symétriques et de
trace nulle de C3 , fournit bien les représentations irréductibles de poids le plus haut (p, m) de SU(3), on se
propose de calculer la dimension d(p, m) de l’espace de ces tenseurs.

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

Exercices et Problème du Chapitre 3 139

1. Montrer, en étudiant le produit de deux tenseurs de rang (p, 0) et (0, m) et en séparant les termes de trace
(contenant un δji entre des indices supérieur et inférieur) que (p, 0) ⊗ (0, m) = ((p − 1, 0) ⊗ (0, m − 1)) ⊕ (p, m)
et donc que
d(p, m) = d(p, 0)d(0, m) − d(p − 1)d(0, m − 1) .
[Les tenseurs de l’espace (p, 0) ⊗ (0, m) sont des tenseurs de rang (p, m) complètement symétriques dans
leurs p indices supérieurs, complètement symétriques dans leurs m indices inférieurs, mais a priori ayant des
i ···i
traces quelconques entre indices supérieurs et inférieurs. On veut montrer qu’on peut écrire tout tenseur tj11 ···jpm
de cet espace comme somme d’un tenseur de mêmes symétries et de trace nulle et d’un tenseur à trace, c’est-
i ···i Pm Pp i i ···ibq ···ip
à-dire de la forme vj11 ···jpm := n=1 q=1 δjqn u 1 c où le chapeau au dessus d’un indice veut dire qu’on
j1 ···jn ···jm
a omis l’indice et u est un tenseur à déterminer, complètement symétrique dans ses p − 1 indices supérieurs,
complètement symétrique dans ses m indices inférieurs, donc dans l’espace (p − 1, 0) ⊗ (0, m − 1). On veut donc
i ···i
écrire t = [t − v] + v et on va déterminer u en imposant que δij11 [t − v]j11 ···jpm = 0. (En raison des symétries de t et v
cela implique que toutes les traces entre un indice supérieur et un inférieur sont nulles.) Il est instructif de traiter
d’abord le cas p = m = 2. On trouve en prenant la trace de [t − v] avec δij11 que 0 = tii i2 i2 i
ij2 − (3 + 1 + 1)uj2 − δj2 ui ,
2

j2 ij
puis en prenant une nouvelle trace par δi2 que 8uii = tij ce qui, reporté dans l’équation précédente permet
de déterminer uij . Le cas général est un peu pénible à écrire, mais on voit bien qu’au bout d’un nombre fini
d’opérations (en nombre égal à inf(p, m)), on aura déterminé complètement u, ce qui achève la démonstration
de ce point. Le calcul de la relation entre les dimensions de ces espaces de tenseurs en découle alors. ]
2. Montrer par un calcul semblable à celui de SU(2) que
1
d(p, 0) = d(0, p) = (p + 1)(p + 2) .
2
3. En déduire l’expression de d(p, m) et comparer à(3.64).

Problème : algèbre de Lie à identifier

1. Rappel. Étant données deux matrices A et B, carrées de dimension 2 × 2, on définit la matrice A ⊗ B

(A ⊗ B)ij;kl := Aik Bjl

et on convient d’ordonner les paires (ij) ou (kl) selon l’ordre lexicographique 11, 12, 21, 22.
(a) Montrer que le produit de deux telles matrices satisfait

(A ⊗ B) · (C ⊗ D) = (A · C) ⊗ (B · D) .

(Rép. ((A ⊗ B) · (C ⊗ D)ij;kl = Aim Bjn Cmk Dnl = (A.C)ik (BD)jl = ((AC) ⊗ (BD))ij;kl .)
(b) En déduire une expression du commutateur [A ⊗ B, C ⊗ D] en termes des commutateurs [A, C] et
[B, D] (avec des coefficients qui peuvent encore impliquer les matrices A, · · · , D.
(Rép. [A ⊗ B, C ⊗ D] = AC ⊗ BD − CA ⊗ DB = [A, C] ⊗ BD + CA ⊗ [B, D] = AC ⊗ [B, D] +
[A, C] ⊗ DB)
2. On considère alors les 3 matrices de Pauli σa , a = 1, 2, 3 et la matrice identité I en dimension 2. On
forme les 10 matrices

Aa = σa ⊗ I, Ba = σa ⊗ σ1 , Ca = σa ⊗ σ3 , D = I ⊗ σ2 .

(Dans la mesure du possible, on s’abstiendra d’écrire l’expression explicite de ces matrices.)

(a) Avec le minimum de calculs, calculer les commutateurs de ce matrices et montrer qu’elles forment
une algèbre de Lie g. On admettra que cette algèbre est simple. (Rép. [Aa , Ab ] = 2iabc Ac , [Ba , Bb ] =
2iabc Ac , [Aa , Bb ] = 2iabc Bc , [Aa , Cb ] = 2iabc Cc , [Ba , Cb ] = · · · = −2iδab D , [Ca , Cb ] =
2iabc Ac , [Aa , D] = 0 , [Ba , D] = 2iCa , [Ca , D] = −2iBa . Les 10 matrices engendrent bien
une algèbre de Lie.)

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

140 Chap.3. Algèbres de Lie simples, classification et représentations

(b) Soient H1 = A3 et H2 = C3 . Pourquoi peut-on dire qu’elles appartiennent à une sous-algèbre de

Cartan ? Que signifie l’assertion : “elles engendrent une sous-algèbre de Cartan” ? On admettra que
c’est bien le cas. Quel est le rang de l’algèbre g ? (Rép. A3 and C3 are among the 10 matrices
the only diagonal ones ; they commute and thus belong to the a Cartan algebra. To say that they
generate a Cartan subalgebra means that they form une base de it, hence that the dimension of
that su-algebra, i.e. the rank of g, equals 2.)
(c) Montrer que l’on peut trouver 4 combinaisons linéaires X(1 , 2 ) = (A1 +1 C1 )+2 i(A2 +1 C2 ) avec
1 , 2 = ±1 telles que [Hi , X(1 , 2 )] = γi (1 , 2 )X(1 , 2 ), et déterminer les γi (1 , 2 ). (Indication :
ces γi (1 , 2 ) prennent les valeurs ±2.) (Rép. [A3 , X] = · · · = 22 X; [C3 , X] = · · · = 21 2 X.)
(d) De même montrer que B1 ± iB2 et B3 ± iD ont également des propriétés de commutation simples
avec H1 et H2 . (Indication : les “valeurs propres” sont cette fois 0, ±2.)(Rép. [A3 , B1 ± iB2 ] =
±2(B1 ± iB2 ), [C3 , B1 ± iB2 ] = 0 ; [A3 , B3 ± D] = 0, [C3 , B3 ± iD] = ±2(B3 ± iD).)
(e) Que peut-on dire des racines de l’algèbre g ? On en donnera les composantes dans une base de
l’algèbre de Cartan (duale). (Rép. We thus have 4 racines (2, 2), (2, −2), (−2, −2), (−2, 2) for the
X and 4 others (±2, 0), (0, ±2) for the B1 ± iB2 and B3 ± iD . )

3. On va maintenant identifier plus précisément g.

(a) Donner un système de racines positives, puis un système de racines simples. (Rép. Du système des
8 racines précédentes, on extrait les 4 positives (2, 2), (2, 0), (0, 2), (2, −2). Les ` = 2 racines simples
sont α1 = (−2, 2)) et α2 = (2, 0) en termes desquelles les autres sont combin. lin. à coefficients ≥ 0.
)
(b) Calculer la matrice de Cartan. Identifier de quelle algèbre de !
Lie il s’agit dans la classification de
2 −2
Cartan.(Rép. Cij = 2h αi , αj i/h αj , αj i hence C = . This is the B2 algebra !)
−1 2
(c) Dans le plan des racines, dessiner les racines simples, l’ensemble des racines. Indiquer quelle est la
chambre de Weyl fondamentale. (Rép. racines = medians and diagonals of a square ; fundamental
chamber : 2nd octant. )
(d) Calculer les composantes des poids fondamentaux et les indiquer sur la figure précédente. (Rép.
Λ1 = (0, 2), Λ2 = (1, 1).)
(e) Quel est le vecteur de Weyl ? Calculer la dimension des deux représentations fondamentales. A quoi
correspondent-elles d’un point de vue géométrique ? (Rép. ρ = Λ1 + Λ2 = 21 α>0 α = (1, 3). In
P

general dim(Λ) = α>0 h Λ+ρ,α i [Link]

Q
h ρ,α i . Hence for Λ1 = (0, 2), Λ1 + ρ = (1, 5), dim(Λ1 ) = [Link] = 5 ;
for Λ2 = (1, 1), Λ2 + ρ = (2, 4), dim(Λ2 ) = [Link]
[Link] = 4. The B2 Lie algebra is that of SO(5), the
5-dimensional représentation is the defining représentation, that of dim 4 is the spinor représenta-
tion)

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

Chapitre 4

Symétries globales en physique des

particules

La physique des particules va nous offrir un terrain de choix pour illustrer les différentes
manifestations de symétries en physique. Nous ne nous occuperons dans ce chapitre et le suivant
que de “symétries internes”, excluant les symétries d’espace-temps.
Nous allons examiner tour à tour différents types de symétries et leurs réalisations, comme
symétrie exacte ou brisée explicitement, spontanément ou par des anomalies quantiques. Nous
consacrerons pas mal d’attention au groupe de saveur SU(3).

4.1 Symétries globales exactes ou brisées. Brisure spon-

tanée
4.1.1 Panorama. Symétries exactes ou brisées
Les transformations dont on s’occupera dans ce chapitre sont des transformations globales. Un
groupe G agit sur les degrés de liberté de chaque champ φ(x) de la même façon en tous les
points x de l’espace-temps. Par exemple, G agit sur φ par l’intermédiaire d’une représentation,
et à chaque élément g du groupe correspond une matrice ou opérateur D(g), indépendamment
du point x
φ(x) 7→ D(g)φ(x) . (4.1)

Dans une théorie quantique, selon le théorème de Wigner, on suppose que cette transfor-
mation est aussi réalisée sur les états de l’espace de Hilbert par un opérateur unitaire U (g) ; en
tant qu’opérateur, φ(x) 7→ U (g)φ(x)U † (x).
Cette transformation peut être une symétrie de la dynamique, auquel cas U (g) commute
avec l’hamiltonien du système, ou dans le langage lagrangien, elle laisse le lagrangien invariant
et donne donc naissance à des courants de Noether jiµ de divergence nulle et à des charges

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

142 Chap.4. Symétries globales en physique des particules

R
conservées Qi = dx ji0 (x, t), i = 1, · · · , dim G. Ces charges agissent sur les champs comme
générateurs infinitésimaux, classiquement au sens du crochet de Poisson, {Qi , φ(x)}δαi = δφ(x),
et si tout se passe bien dans la théorie quantique, comme opérateurs dans l’espace de Hilbert
dotés de relations de commutation avec les champs [Qi , φ(x)]δαi = −i~δφ(x) et entre eux
[Qi , Qj ] = iCijk Qk . Une question importante va en effet être de savoir si une symétrie apparente
au niveau classique, disons sur le lagrangien, est bien réalisée dans la théorie quantique.
• Un exemple de symétrie exacte est fourni par l’invariance de groupe U(1), associé à la conser-
vation de la charge électrique. Un champ portant une charge électrique q (fois |e|) est un champ
complexe, il se transforme sous l’action du groupe U(1) selon la représentation irréductible
indexée par l’entier q
φ(x) 7→ eiqα φ(x) ; φ† (x) 7→ e−iqα φ† (x) .
S’il y a invariance (du lagrangien) quand tous les champs se transforment ainsi, on a alors
un courant de Noether j µ (x), somme des contributions des différents champs chargés, de di-
vergence nulle, ∂µ j µ (x) = 0, et la charge associée Q est conservée. La théorie quantique est
l’électrodynamique quantique, et on y démontre que la symétrie classique par le groupe U(1)
ainsi que la conservation du courant (et l’invariance de jauge) sont bien préservées par la quan-
tification et en particulier par la renormalisation, par exemple que toutes les charges électriques
se renormalisent de la même façon, cf cours de Théorie Quantique des Champs.
D’autres invariances et lois de conservation de nature similaire sont celles associées aux
charges baryoniques ou leptoniques, conservées (jusqu’à plus ample informé . . .).
• Une symétrie peut aussi être brisée explicitement. Par exemple le lagrangien contient des
termes non invariants sous l’action de G. Dans ce cas, les courants de Noether ne sont pas
conservés, mais leur divergence s’écrit
∂L(x)
∂µ jiµ (x) =
. (4.2)
∂αi
Nous verrons plus bas avec SU(3) un exemple de symétrie brisée (ou approchée).
Certains types de brisures, dites “douces” (soft), sont telles que la symétrie est restaurée à courte distance
ou haute énergie. C’est par exemple le cas de l’invariance d’échelle (par dilatations d’espace-temps), brisée par
la présence de toute échelle de masse dans la théorie, mais restaurée –de façon un peu subtile– à courte distance,
cf. l’étude du groupe de renormalisation dans les cours de théorie des champs.

• Un mécanisme plus subtil de brisure de symétrie est celui de brisure spontanée de symétrie.
On appelle ainsi les situations où l’état fondamental du système ne possède pas une symétrie
apparente sur le lagrangien. L’exemple le plus simple présentant ce phénomène est celui d’un
système classique à un degré de liberté décrit par le potentiel “à double puits” de la Fig. 1(a).
Bien que le potentiel exhibe une symétrie Z2 manifeste par x → −x, le système choisit un état
fondamental dans l’un des deux minima du potentiel, ce qui brise la symétrie. Ce mécanisme
joue un rôle fondamental en physique, avec des manifestations dans des situations très variées,
de la matière condensée –ferromagnétisme, superfluidité, supraconductivité . . .– à la physique
des particules –symétrie chirale, phénomène de Higgs– et à la cosmologie.
. Exemple. Brisure spontanée du modèle O(n)
Le lagrangien du “modèle O(n)” bosonique (minkovskien, ici), pour un champ φ = {φi } réel à

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

4.1. Symétries globales exactes ou brisées. Brisure spontanée 143

V(x) V(x)

x x
!a a
(a) (b)

Figure 4.1 – Potentiels (a) à “double puits” ; (b) en “chapeau mexicain”

n composantes,
1 1 λ 2 2
L = (∂φ φ)2 − m2 φ2 − (φ φ) (4.3)
2 2 4
est invariant sous l’effet des rotations de O(n). Le courant de Noether jµa = ∂µ φi (T a )ij φj (avec
T a antisymétrique réelle) a une divergence nulle, ce qui implique la conservation d’une “charge”
etc. Le minimum du potentiel correspond à l’état fondamental, alias le vide, de la théorie. Si
le paramètre m2 est choisi négatif, le minimum du potentiel V = 12 m2φ2 + λ4 (φ φ2 )2 n’est plus en
φ2 = 0 mais en une certaine valeur v 2 de φ2 telle que −m2 = λv 2 , cf Fig. 1(b). Le champ φ
“choisit” spontanément une direction n̂ (n̂2 = 1) dans l’espace interne, dans laquelle sa valeur
moyenne dans le vide (“vev” dans le jargon franglais) est non nulle

h 0|φ
φ|0 i = vn̂ . (4.4)

Cette “vev” brise le groupe d’invariance G = O(n) de départ en son sous-groupe H qui laisse
invariant le vecteur h 0|φ φ|0 i = vn̂, soit un groupe isomorphe à O(n − 1). Que cette valeur
moyenne dans le vide d’un champ non invariant par le groupe soit non nulle, h 0|φ φ|0 i =
6 0, est le
signal que le vide n’est pas invariant : on est bien dans un cas de symétrie brisée spontanément.
C’est le mécanisme à l’œuvre dans un ferromagnétique à basse température, par exemple, où
l’aimantation non nulle signale la brisure spontanée de la symétrie d’isotropie spatiale.
Exercice (cf cours de F. David) : Posant φ = (v+σ)n̂+π π , où π désigne les n−1 composantes du
champ φ orthogonales à h φ i = vn̂, calculer les termes de V (σ, π ) linéaires et quadratiques dans
les champs σ et π ˜ ; vérifier que le terme linéaire en σ s’annule (minimum du potentiel), que σ
a un terme de masse non nul, mais que les π sont de masse nulle, ce sont les bosons de Nambu–
Goldstone de la symétrie brisée spontanément. Il s’agit là d’un phénomène général : toute
symétrie continue brisée spontanément s’accompagne de l’apparition d’excitations de masse
nulle en nombre égal à celui des générateurs de la symétrie brisée (théorème de Goldstone).
Plus précisément quand un groupe G se brise spontanément en un sous-groupe H (le groupe de
symétrie résiduelle, groupe d’invariance du fondamental), il apparaı̂t un nombre d(G) − d(H)
de bosons de Goldstone de masse nulle. Dans l’exemple précédent, G = O(n), H = O(n − 1),
d(G) − d(H) = n − 1.
Donnons une démonstration simple de ce théorème dans le cas d’une théorie lagrangienne des champs. On
écrit L = 21 (∂φ)2 − V (φ) avec des notations très génériques, φ désigne un ensemble de champs {φi } sur lequel

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

144 Chap.4. Symétries globales en physique des particules

agit un groupe de transformations G. Le potentiel V est supposé invariant sous l’action de transformations
infinitésimales δ a φi , a = 1, · · · , dim G. Par exemple pour des transformations linéaires : δ a φi = Tija φj . On a
donc
∂V (φ(x)) a
δ φi (x) = 0 .
∂φi (x)
Dérivons cette équation par rapport à φj (x) (en omettant l’argument x partout)

∂V ∂δ a φi ∂2V a
+ δ φi = 0
∂φi ∂φj ∂φi ∂φj

et évaluons la en φ(x) = v, un minimum (constant, indépendant de x) du potentiel : le premier terme s’annule,

le second nous dit que
∂2V
δ a vi = 0 , (4.5)
∂φi ∂φj φ=v
en notant (un peu abusivement) δ a vi = δ a φi |φ=v . Par ailleurs on quantifie la théorie au voisinage de ce minimum
v (“vide” de la théorie) en écrivant φ(x) = v + ϕ(x) et en développant

1 ∂2V
V (φ) = V (v) + ϕi ϕj + · · ·
2 ∂φi ∂φj φ=v

et les masses des champs ϕ se lisent alors sur la forme quadratique. Or (4.5) nous apprend que la “matrice de
2
masse” ∂φ∂i ∂φV
j
|φ=v a autant de “modes zéros” (vecteurs propres de valeur propre nulle) qu’il y a de variations
indépendantes δ a vi 6= 0. Si H est le groupe d’invariance de v, δ a vi 6= 0 pour les générateurs de G qui ne sont
pas générateurs de H, et il y a donc bien dim G − dim H modes de masse nulle, cqfd.

4.1.2 Brisure de la symétrie chirale

Considérons un lagrangien impliquant des fermions de masse nulle,

L = ψ̄i/∂ ψ + g(ψ̄γ µ ψ)(ψ̄γµ ψ) , (4.6)

où ψ = {ψα }α=1,··· ,N est un vecteur à N composantes qui sont des champs de 4-spineurs. Noter
l’absence de terme de masse ψ̄ψ. Ce lagrangien est invariant sous l’action des deux types de
transformations infinitésimales

δA ψ(x) = δAψ(x) (4.7)

δB ψ(x) = δBγ5 ψ(x) ,

où les matrices A et B sont antihermitiennes infinitésimales, de taille N × N ; elles agissent

sur les indices de “saveur” α mais pas sur les indices spinoriels, et commutent donc avec les
matrices γ. On rappelle que γ5 est hermitienne et anticommute avec les γµ . Vérifier que δA ψ̄ =
−ψ̄δA, δB ψ̄ = ψ̄δBγ5 . Les courants de Noether conservés sont respectivement

Jµa = ψ̄T a γµ ψ Jµa(5) = ψ̄T a γ5 γµ ψ , (4.8)

avec T a des générateurs infinitésimaux du groupe unitaire U(N ). Les transformations de la

première ligne sont dites “vectorielles”, celle de la seconde ligne, qui impliquent γ5 , sont dites
“axiales”. On peut aussi redire cela en termes de transformations indépendantes de ψL :=

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

4.1. Symétries globales exactes ou brisées. Brisure spontanée 145

1
2
(I− γ5 )ψ et de ψR := 12 (I + γ5 )ψ ; on se rappelle que (γ5 )2 = I, et que 21 (I ± γ5 ) sont donc
des projecteurs ; on a donc ψ̄L = 12 ψ̄(I + γ5 ), etc, et

L = ψ̄L i/∂ ψL + ψ̄R i/∂ ψR + (ψ̄L γµ ψL + ψ̄R γµ ψR )(ψ̄L γ µ ψL + ψ̄R γ µ ψR )

qui est clairement invariant par les transformations unitaires finies ψL → U1 ψL , ψR → U2 ψR ,

avec U1 , U2 ∈ U(N ). Le groupe de symétrie chirale est donc U(N ) × U(N ). [One uses to say that
ψL transforms as (N, 0), ψR as (0, N ), why ? ]
Si maintenant nous introduisons un terme de masse δL = −mψ̄ψ (qui “couple” les com-
posantes ψL et ψR : δL = −m(ψ̄R ψL + ψ̄L ψR )), la symétrie “vectorielle” est préservée, mais
l’axiale ne l’est plus et donne lieu à une divergence

∂ µ Jµa(5) (x) ∝ mψ̄T a γ5 ψ . (4.9)

Le groupe de symétrie résiduelle

[un terme de dimension 3, dont l’effet est négligeable à courte distance.]
est U(N ), sous-groupe “diagonal” de U(N ) × U(N ) (diagonal en ce sens que l’on prend U1 = U2
dans les transformations de ψL,R .)
La symétrie axiale peut aussi être brisée spontanément. Partons d’un lagrangien somme de
termes du type (4.6) avec N = 2 et (4.3) pour n = 4, avec un terme couplant les fermions à
quatre champs de bosons, nommés traditionnellement σ et π
1 1 λ
π )2 + (∂σ)2 − m2 (σ 2 + π 2 ) − (σ 2 + π 2 )2 ,

L = ψ̄ i/∂ + g(σ + iπ
π .ττ γ5 ) ψ + (∂π (4.10)
2 2 4
dans laquelle les matrices de Pauli ont été désignées exceptionnellement par τ pour ne pas les
confondre avec le champ σ. Le groupe de symétrie est U(2) × U(2), avec les champs ψL , ψR
π .ττ se transformant respectivement par les représentations ( 21 , 0), (0, 12 ) et ( 12 , 12 ) de
et σ + iπ
SU(2) × SU(2) (cf exercice A). [On peut récrire le terme d’interaction fermion-boson ψ̄L (σ + iππ.ττ )ψR +
1 1
ψ̄R (σ − iπ
π .ττ )ψL ˜ ; dans le premier terme, on a les représentations de SU(2)L 2, 2 et 0, et de SU(2)R 0, 21 , 21 ,
Si m2 < 0, le champ φ = (σ, π ) acquiert une vev, qu’on peut orienter dans
d’où l’invariance. ]
la direction σ en ayant introduit au préalable un petit terme de brisure explicite δL = cσ,
l’analogue d’un petit champ magnétique, qu’on fait tendre vers zéro par la suite. La vev est
donnée comme plus haut par v 2 = −m2 /λ, et en récrivant le champ σ(x) = σ 0 (x) + v, où le
champ σ 0 a maintenant une valeur moyenne nulle dans le vide, on voit que les fermions ont
acquis un terme de masse mψ = −gv, tandis que les π sont de masse nulle. Ce lagrangien, le
modèle σ de Gell-Mann–Lévy, a été proposé comme modèle expliquant la brisure de l’invariance
chirale et la faible masse des mésons π, quasi-bosons de Nambu–Goldstone (“quasi” parce que
la symétrie chirale n’est qu’approchée avant d’être brisée spontanément). Nous en retrouverons
des éléments dans le modèle standard.

4.1.3 Brisures quantiques. Anomalies

Un autre mode de brisure de symétrie, de nature purement quantique, se manifeste dans les anomalies des
théories quantiques de champs. Une symétrie, apparente au niveau classique du lagrangien, est brisée par
l’effet des “corrections quantiques”. C’est par exemple ce qui se produit avec certaines symétries chirales, du

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

146 Chap.4. Symétries globales en physique des particules

type qu’on vient d’étudier : un courant axial de divergence classiquement nulle peut acquérir par un “effet à
une boucle” une divergence ∂µ J5µ 6= 0. Dans le cas où le courant “anormal” est le courant de Noether d’une
symétrie classique interne, cette symétrie est brisée par l’anomalie quantique, ce qui peut donner lieu à des
effets physiques intéressants (cf. discussion de la désintégration π 0 → γγ, par exemple dans [IZ] chap 11). Mais
dans une théorie comme une théorie de jauge où la conservation du courant axial est cruciale pour assurer la
cohérence –renormalisabilité, unitarité–, l’anomalie constitue un danger potentiel qu’il faut contrôler. C’est ce
qui se produit dans le Modèle Standard, et nous y reviendrons au chap. 5. Un autre exemple est fourni par
l’invariance par dilatation d’une théorie de masse nulle, cf l’étude du groupe de renormalisation dans le cours
de F. David.

4.2 La symétrie de saveur SU(3) et le modèle des quarks

Une symétrie approchée de grande importance est celle de SU(3) de saveur, à laquelle nous
consacrons le reste de ce chapitre.

4.2.1 Pourquoi le groupe SU(3) ?

On a vu (Chap. 0) que si on néglige leurs interactions faibles et électromagnétiques, les hadrons,
c’est-à-dire les particules soumises aux interactions fortes telles le proton et le neutron, les
mésons π etc, sont classifiés en “multiplets” d’un groupe SU(2) d’isospin. Ou dit autrement,
l’hamiltonien (ou le lagrangien) des interactions fortes est invariant sous l’action de ce groupe
SU(2) et en conséquence, le groupe SU(2) est représenté dans l’espace des états hadroniques
par des représentations unitaires. Proton et neutron appartiennent à une représentation de
dimension 2, d’isospin 12 , les trois pions π ± , π 0 forment une représentation de dimension 3,
d’isospin 1, etc. La charge électrique Q de chacune des particules que nous venons de citer est
reliée à la valeur propre de la troisième composante Iz de l’isospin par la relation
1
Q = B + Iz [for SU(2)] (4.11)
2
où apparaı̂t un nouveau nombre quantique B, la charge baryonique, supposée conservée (addi-
tivement) dans toutes les interactions (jusqu’à nouvel ordre). B vaut 0 pour les mésons π, et 1
pour les “baryons” que sont le proton et le neutron, −1 pour leurs antiparticules, 4 pour une
particule α (noyau d’helium), etc.
Cette relation entre Q et Iz doit être amendée pour de nouvelles familles de mésons K ± , K 0 , K̄ 0
ou de baryons Λ0 , Σ, Ξ, . . . découverts à la fin des années 50. On leur attribue un nouveau
nombre quantique, l’étrangeté S. Cette étrangeté est également supposée conservée (additive-
ment) dans les interactions fortes. Ainsi, si S vaut −1 pour le Λ0 et +1 pour le K + et le K 0 ,
le processus p + π − → Λ0 + K 0 conserve l’étrangeté, tandis que la désintégration observée
Λ0 → p + π − viole cette loi de conservation, car elle procède par les interactions faibles. La
relation (4.11) doit être modifiée en la relation de Gell-Mann–Nishima
1 1 1
Q = B + S + Iz = Y + Iz , (4.12)
2 2 2
où on a introduit l’hypercharge Y , qui, à ce stade, vaut Y = B + S. [KS0 et KL0 ]

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

4.2. La symétrie de saveur SU(3) et le modèle des quarks 147

Y Y

0 + *0 *+
K K K K
1 1

"! "0 ! "+ #! #0 $ 0 #+

Iz Iz
!1 0 1 1 !1 0 1 1
2 2

!
K K0 K *!
K *0
!1 !1

Figure 4.2 – Les octets de mésons. pseudoscalaires (J P = 0− ) et vecteurs (J P = 1− )

Ces lois de conservation et différentes propriétés des mésons et baryons découverts alors,
en particulier leur organisation en “octets”, ont conduit au début des années 60 Gell-Mann
et Ne’eman à postuler l’existence d’un groupe SU(3) de symétrie approchée des interactions
fortes. Les nombres quantiques conservés et simultanément mesurables Iz et Y sont interprétés
comme les valeurs propres de deux charges commutantes, c’est-à-dire de deux éléments d’une
algèbre de Cartan de rang 2, et c’est l’algèbre de SU(3) qui est le candidat naturel, puisque
possédant une représentation de dimension 8 (cf exercice C du chap. 3).
Dans la représentation 3 de définition de SU(3), on construit une base de l’algèbre de Lie
su(3), faite de 8 matrices hermitiennes λa qui jouent le rôle des matrices de Pauli σi pour su(2).
Ces matrices sont normalisées par
tr λa λb = 2δab . (4.13)
λ
1 et λ2 ,λ4et λ5 , λ
6 et λ
7 ont les
 mêmes éléments de matrice que σ1 et σ2 en position
. ∗ . . . ∗ . . .
∗ . .,  . . .  et . . ∗ respectivement, où les points signifient des zéros. Les deux
     

. . . ∗ . . . ∗ .
générateurs de l’algèbre de Cartan sont
  
1 . . 1 . .
1 
λ3 =  . −1 . λ8 = √  . 1 .  . (4.14)
  
3
. . . . . −2
Les charges Iz et Y sont alors les représentants dans la représentation considérée de 21 λ3 et de
√1 λ8 .
3
√
[Expliquer le 1/ 3] Voir l’exercice B pour le changement de coordonnées de (λ1 , λ2 ) (indices
de Dynkin d’une représentation, à ne pas confondre avec les matrices précédentes !) en (Iz , Y ).
Les matrices λa satisfont des relations de commutation

[λa , λb ] = 2ifabc λc (4.15)

avec les constantes de structure (réelles, complètement antisymétriques) fabc de l’algèbre su(3). Il est utile de
considérer aussi les anticommutateurs
4
{λa , λb } = δab + 2dabc λc . (4.16)
3

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

148 Chap.4. Symétries globales en physique des particules

Y
Y
" 0 + ++
' ' ' '
n p 1
1
#!" #!0 #!+ Iz
! 0 0 + !1 1 1 3
# % # # 0
Iz 2 2
!"
!1 0 1 1 $ $ !0
2 !1

$! $0 "
!1 &

1+ 3+
Figure 4.3 – L’octet (J P = 2
) et le décuplet (J P = 2
) de baryons.

Grâce à (4.13), (4.15) et (4.16) peuvent se récrire comme tr ([λa , λb ]λc ) = 4ifabc , tr ({λa , λb }λc ) = 4dabc . On
trouve ces nombres f et d tabulés dans la littérature . . . mais on les recalcule aisément ! Attention, au contraire
de (4.15), la relation (4.16) et les constantes dabc (réelles, complètement symétriques) sont propres à la repré-
sentation de dimension 3.
Les hadrons s’organisent en représentations de SU(3). Chaque multiplet regroupe des parti-
cules de même spin J et parité P . C’est ainsi que deux octets de mésons de J P égal à 0− ou 1−
et qu’un octet et un “décuplet” de baryons de charge baryonique B = 1 sont aisément identifiés.
Contrairement à la symétrie d’isospin, la symétrie SU(3) 1 n’est pas une symétrie exacte des
interactions fortes. Les règles de conservation ou de sélection auxquelles elle donne lieu ne sont
qu’approchées.
À ce point, on peut s’interroger sur l’absence d’autres représentations de trialité nulle, telle
la représentation 27, ou de celles de trialité non nulle, comme la 3 et la 3̄. On y reviendra au §
4.2.5.

4.2.2 Conséquences de la symétrie SU(3)

Les octets de champs

Concentrons nous sur les deux octets de baryons N = (N, Σ, Ξ, Λ) et de mésons pseudoscalaires
P = (π, K, η). Au vu de ce que l’on a dit au Chap. 3, § 3.4.2, à savoir que la représentation
adjointe est faite de tenseurs de rang (1, 1) et de trace nulle, il est naturel de regrouper les 8
champs associés à ces particules sous forme d’une matrice de trace nulle.
 
√1 π 0 − √1 η π+ K+
2 6
π− − √12 π 0 − √1 η K0  ,
 
Φ=
 6 q  (4.17)
− 0 2
K K̄ 3
η

1. dite “de saveur”, selon la terminologie moderne, mais appelée “symétrie unitaire” ou “voie octuple” à
l’époque de Gell-Mann et Ne’eman. . .

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

4.2. La symétrie de saveur SU(3) et le modèle des quarks 149

et  
√1 Σ0 − √1 Λ Σ+ p
2 6
Σ− − √12 Σ0 − √1 Λ
 
Ψ= 6
n  . (4.18)
 q 
Ξ− Ξ0 2
3
Λ

Pour s’assurer que les assignements de champs/particules aux différents éléments de matrice
sont corrects, il suffit de vérifier leurs nombres quantiques de charge et d’hypercharge. Les
générateurs de charge Q et d’hypercharge Y
   
2 0 0 1 0 0
1 1 1
Q = Iz + Y = 0 −1 0  Y = 0 1 0  (4.19)
 
2 3 3
0 0 −1 0 0 −2

agissent dans la représentation adjointe par commutation et on a bien

   
0 π + K+ 0 0 K+
[Q, Φ] =  −π− 0 0  [Y, Φ] =  0 0 K0  .
   

−K− 0 0 −K− −K̄0 0

Exercice : (i) sans aucun calcul, que doit valoir [Iz , Φ] ? Vérifier.
(ii) Calculer tr Φ2 ; en quoi le résultat justifie-t-il le choix de normalisation dans (4.17) ? Voir
aussi le Problème 2.c.
[Le lecteur attentif aura noté l’apparition d’un signe devant le Ξ0 dans (4.18) en comparaison de celui devant
le K̄ 0 . Cela est dû à la conjugaison des spineurs portés par les champs de fermions Ξ− et Ξ0 . . . .]

Produits tensoriels dans SU(3) et couplages invariants

On rappelle que pour SU(3), avec les notations du chapitre 3,

8 ⊗ 8 = 1 ⊕ 8 ⊕ 8 ⊕ 10 ⊕ 10 ⊕ 27 . (4.20)

(Notons au passage que la multiplicité 2 de la représentation 8 reflète l’existence des deux

tenseurs invariants indépendants fabc et dabc (cf. 4.15) et (4.16).) Montrons que cela a des
implications immédiates sur le nombre de couplages invariants entre champs.
• On se propose d’écrire un lagrangien invariant par SU(3) impliquant les champs d’octets
Φ et Ψ précédents. Quel est le nombre de “couplages de Yukawa”, c’est-à-dire de la forme
Ψ̄ΦΨ, invariants par SU(3) ? Autrement dit, quel est le nombre d’invariants dans 8 ⊗ 8 ⊗ 8 ?
Selon un raisonnement fait au chap 2, (cf § 2.3.2), ce nombre est égal au nombre de fois où la
représentation 8 apparaı̂t dans 8 ⊗ 8, soit selon (4.20), 2. Il y a donc deux couplages de Yukawa
invariants indépendants. Si on écrit les deux octets de champs Ψ et Φ sous forme de matrices
3 × 3 de trace nulle comme au sous-paragraphe précédent, Ψ = {ψj i } et Φ = {φki }, ces deux
couplages s’écrivent

tr Ψ̄ΨΦ = ψ̄j i ψi k φkj and tr Ψ̄ΦΨ = ψ̄j i φi k ψkj (4.21)

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

150 Chap.4. Symétries globales en physique des particules

(cette écriture omet les indices des spineurs de Dirac, l’éventuelle matrice γ5 etc). On préfère
souvent récrire ces deux termes en termes de leurs somme et différence, donc de tr Ψ̄[Φ, Ψ] et
tr Ψ̄{Φ, Ψ}, appelés terme f et terme d, par référence à (4.15) et (4.16).
• Autre question de même nature : quel est a priori le nombre d’amplitudes invariantes par
SU(3) dans la diffusion de deux particules des octets N et P : Ni + Pi → Nf + Pf ˜ ? (On
ne prend en compte que l’invariance par SU(3), en ne considérant pas d’éventuelles symétries
discrètes.) Il s’agit donc de chercher le nombre d’invariants dans la 4ème puissance tensorielle
de la représentation 8. Ou encore de façon équivalente, le nombre de fois où l’on trouve la même
représentation dans les deux produits 8 ⊗ 8 et 8 ⊗ 8. Si mi sont les multiplicités apparaissant
dans 8 ⊗ 8, soit m1 = 1, m8 = 2, etc, cf (4.20), ce nombre est i m2i = 8. Il y a donc huit
P

amplitudes invariantes. Autrement dit on peut écrire a priori l’amplitude de diffusion sous la
forme

h Nf Pf |T |Ni Pi i = (4.22)
X8
Ar (s, t) h (I, Iz , Y )(Nf ) , (I, Iz , Y )(Pf ) |r, (I, Iz , Y )(r) ih r, (I, Iz , Y )(r) |(I, Iz , Y )(Ni ) , (I, Iz , Y )(Pi ) i
r=1

(avec s et t les invariants relativistes usuels s = (p1 + p2 )2 , t = (p1 − p3 )2 ), toute la dépendance

dans la nature des particules membres des octets, repérées par les valeurs de leur isospin et
hypercharge, étant contenue dans des coefficients de Clebsch-Gordan de SU(3).
• Soient Φi , i = 1, 2, 3, 4 quatre champs d’octets distincts. Combien de couplages de degré 4 invariants
par SU(3) peut-on former avec ces quatre champs ? D’une part, le raisonnement précédent nous donne huit
couplages ; de l’autre, il est clair que pour toute permutation P de {1, 2, 3, 4}, les termes tr (ΦP 1 ΦP 2 ΦP 3 ΦP 4 ) et
tr (ΦP 1 ΦP 2 ) tr (ΦP 3 ΦP 4 ) sont invariants par SU(3). Un décompte rapide donne 9 termes différents, en contra-
diction avec l’argument précédent. Quelle est l’origine de cette contradiction ? Pour en savoir plus, rendez-vous
au Problème 1 en fin de chapitre. . .

4.2.3 Brisures électromagnétiques de la symétrie SU(3)

La symétrie SU(3) est brisée, on l’a dit, par les interactions fortes. Bien sûr, tout comme
la symétrie SU(2) d’isospin, elle l’est aussi par les interactions électromagnétiques et les in-
teractions faibles. Nous n’examinerons pas ici l’effet de ces dernières mais décrirons deux
conséquences des brisures fortes et électromagnétiques.
Le lagrangien d’interaction d’une particule de charge q avec le champ électromagnétique A
s’écrit
Lem = −qj µ Aµ (4.23)
où j est le courant électrique. Le champ A est invariant par les transformations de SU(3), mais
R
comment j se transforme-t-il ? On connaı̂t la transformation de sa charge Q = d3 xj0 (x, t),
puisque selon (4.12), Q est une combinaison linéaire de deux générateurs Y et Iz . Q se transforme
donc selon la représentation adjointe (8, alias (1, 1) en termes d’indices de Dynkin). Et il est
naturel de supposer que le courant j se transforme de la même manière. C’est d’ailleurs ce que
l’on trouve quand on construit le courant j µ comme courant de Noether de la symétrie U(1)
(exercice, le vérifier).

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

4.2. La symétrie de saveur SU(3) et le modèle des quarks 151

Moments magnétiques

Les facteurs de forme électromagnétiques de l’octet de baryons sont définis par

0 0
h B|jµ (x)|B 0 i = eikx ū(FeBB (k 2 )γµ + FmBB (k 2 )σµν k ν )u0 (4.24)

où ū et u0 sont des spineurs de Dirac décrivant respectivement les baryons B et B 0 ; k est
la quadri-impulsion transférée de B 0 à B. Fe est le facteur de forme électrique, si B = B 0 ,
Fe (0) = qB , charge électrique de B, tandis que Fm est le facteur de forme magnétique et FmBB (0)
donne le moment magnétique du baryon B. On veut calculer ces facteurs au premier ordre
électromagnétique et à l’ordre zéro dans les autres termes brisant éventuellement la symétrie.
D’un point de vue groupiste, l’élément de matrice h B|jµ (x)|B 0 i relève du théorème de
Wigner-Eckart : il y a deux façons de projeter 8 × 8 sur 8 (cf l’équ. (4.2) du chap 3), (ou
encore, il y a deux façons de construire un invariant avec 8 ⊗ 8 ⊗ 8). Il y a donc deux “éléments
de matrice réduits”, donc deux amplitudes indépendantes pour chacun des deux facteurs de
forme, complétées par des coefficients de Clebsch-Gordan de SU(3). Par un argument similaire
à (4.21), on vérifie que l’on peut écrire
0
BB
Fe,m (k 2 ) = Fe,m
(1)
(k 2 ) tr B̄QB 0 + Fe,m
(2)
(k 2 ) tr B̄B 0 Q

où Q est la matrice de (4.19)  

2
0 3
0
Q =  0 − 13 0  ,
 

0 0 − 31
et tr B̄QB 0 signifie le coefficient de B̄B 0 dans la trace matricielle tr Ψ̄QΨ, et de même pour
tr B̄B 0 Q. Par exemple, le moment magnétique du neutron µ(n) est proportionnel au terme
(1) (2) (1,2)
magnétique en n̄n, soit − 31 (Fm + Fm ). Les quatre fonctions Fe,m sont inconnues (leur calcul
ferait appel à la théorie des interactions fortes) mais on peut les éliminer et trouver des relations

µ(n) = µ(Ξ0 ) = 2µ(Λ) = −2µ(Σ0 ) µ(Σ+ ) = µ(p) (4.25)

√
3
µ(Ξ− ) = µ(Σ− ) = −(µ(p) + µ(n)) µ(Σ0 → Λ) = µ(n) ,
2
où la dernière quantité est le moment magnétique de transition Σ0 → Λ. Ces relations sont en
accord qualitatif avec les valeurs expérimentales.
Les moments magnétiques des “hypérons” (baryons de masse plus élevée que les nucléons) sont mesurés par
leur précession de spin dans un champ magnétique ou dans des transitions dans des atomes “exotiques” dans
le noyau desquels un nucléon a été remplacé par un hypéron. Le moment magnétique de transition Σ0 → Λ est
déterminé à partir de la section efficace Λ → Σ0 dans le champ coulombien d’un noyau lourd. On lit dans les
tables

µ(p) = 2.792847351 ± 0.000000028 µN µ(n) = −1.9130427 ± 0.0000005 µN

0
µ(Λ) = −0.613 ± 0.004 µN |µ(Σ → Λ)| = 1.61 ± 0.08 µN (4.26)
+ −
µ(Σ ) = 2.458 ± 0.010 µN µ(Σ ) = −1.160 ± 0.025 µN
µ(Ξ0 ) = −1.250 ± 0.014 µN µ(Ξ− ) = −0.6507 ± 0.0025 µN

où µN est le magnéton nucléaire, µN = e~

2mp = 3.152 10−14 MeV T−1 .

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

152 Chap.4. Symétries globales en physique des particules

Écarts de masses électromagnétiques

Des hypothèses et méthodes analogues permettent de trouver des relations entre les écarts de masses électromagnétiques,
entre particules de même hypercharge et isospin I, mais de charge différente, voir Problème 3.

4.2.4 Écarts de masses “forts”. Formule de masse de Gell-Mann–

Okubo
Au vu des disparités entre masses au sein d’un multiplet, le terme de masse dans le lagrangien
(ou l’hamiltonien) ne peut être un invariant de SU(3). Gell-Mann et Okubo ont fait l’hypothèse
que le terme non invariant ∆M se transforme selon la représentation 8, plus précisément,
puisqu’il doit avoir un isospin et une hypercharge nuls, qu’il se transforme comme la composante
η ou Λ des octets. On est donc conduit à considérer les éléments de matrice h H|∆M |H i pour
les hadrons H d’un multiplet, et à faire appel une nouvelle fois au théorème de Wigner–Eckart.
Selon les règles de décomposition de produit tensoriel données au chap. 3, la représentation
8 apparaı̂t au plus 2 fois dans le produit d’une représentation irréductible de SU(3) par sa
conjuguée, (le vérifier, en se rappelant que 8 = 3 ⊗ 3̄ 1) ; il y a au plus deux amplitudes
indépendantes qui décrivent les écarts de masse au sein du multiplet, ce qui conduit à des
relations entre ces écarts de masse.
Un argument élégant permet d’éviter le calcul des coefficients de Clebsch–Gordan et de trouver ces deux
amplitudes dans toute représentation. Les huit générateurs infinitésimaux se transformant eux-mêmes selon la
représentation 8 (représentation adjointe), on les dispose selon une matrice 3 × 3 comme précédemment

1
√ 
2√Y + Iz 2I+ ∗
1
2 Y − Iz ∗ 
G= 2I−
 

∗ ∗ −Y

où les ∗ désignent des générateurs changeant l’étrangeté qui ne nous concernent pas. (Noter que G11 = Iz + 12 Y =
 
0 0 0
Q, la charge électrique, est invariante par l’action (par commutation avec G) des générateurs X = 0 ∗ ∗
 

0 ∗ ∗
qui préservent la charge électrique.) On cherche deux combinaisons des générateurs Iz et Y se transformant
comme l’élément (3, 3) de cette matrice. L’une est bien sûr Y lui-même, l’autre est fournie par l’élément (3, 3)
du cofacteur de G, cofG33 = 14 Y 2 − Iz2 − 2I+ I− = 14 Y 2 − I~2 .
On obtient ainsi, pour toute représentation (tout multiplet), une formule de masse

1
M = m1 + m2 Y + m3 (I(I + 1) − Y 2 ) (4.27)
4

ce qui laisse trois constantes indéterminées (dépendant du multiplet). Par exemple pour l’octet
de baryons, on a quatre particules N , Σ, Λ et Ξ pour lesquelles (Y, I, I(I + 1) − 41 Y 2 ) =
(1, 12 , 21 ), (0, 1, 2), (0, 0, 0), (−1, 12 , 12 ) respectivement, et satisfaisant donc

1
MN = m1 + m2 + m3 MΣ = m1 + 2m3 (4.28)
2
1
MΛ = m1 MΞ = m1 − m2 + m3 . (4.29)
2

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

4.2. La symétrie de saveur SU(3) et le modèle des quarks 153

En éliminant les trois paramètres m1 , m2 , m3 entre ces quatre relations, on est amené à la règle
de somme
MΞ + MN 3MΛ + MΣ
= (4.30)
2 4
bien vérifiée expérimentalement : on trouve 1128,5 MeV/c2 au membre de gauche, 1136 MeV/c2
à celui de droite 2 . Pour le décuplet, vérifier que cette même formule donne des écarts de masse
égaux entre les quatre particules ∆, Σ∗ , Ξ∗ et Ω− . Cela a permis de prédire avec justesse
l’existence et la masse de cette dernière particule, ce qui a été considéré comme un des grands
succès de SU(3). Pour l’octet de mésons pseudoscalaires, la formule de masse implique (empi-
riquement) les carrés de masses
2
3m2η + m2π
mK = .
4

4.2.5 Les quarks

Les représentations 3 et 3̄ sont à ce stade les grandes absentes de la scène : parmi les particules
observées, aucun “triplet” ne semble se manifester. Le modèle de Gell-Mann–Zweig fait l’hy-
pothèse qu’un triplet (représentation 3) de quarks (u, d, s) (“up”, “down” et “strange”) et sa
représentation conjuguée 3̄ d’antiquarks (ū, d,¯ s̄) rassemblent les constituents élémentaires de
tous les hadrons (connus à l’époque). Leurs charges et hypercharges sont respectivement

Quarks u d s ū d¯ s̄
1
Isospin Iz 2
− 12 0 − 12 1
2
0
1 1 1
Baryonic charge B 3 3 3
− 13 − 31 − 13
Strangeness S 0 0 −1 0 0 1
1 1
Hypercharge Y 3 3
− 32 1
−3 −3 1 2
3
2 1
Electric charge Q 3
−3 − 31 −32 1
3
1
3

Table 1. Nombres quantiques des quarks u, d, s

On se rappelle (chapitre 3 § 3.4) que toute représentation irréductible de SU(3) s’obtient

dans la décomposition de produits itérés des représentations 3 et 3̄ ; en particulier, 3 ⊗ 3̄ = 1 ⊕ 8
et 3 ⊗ 3 ⊗ 3 = 1 ⊕ 8 ⊕ 8 ⊕ 10. Les mésons et baryons observés dans la nature et répertoriés
comme ci-dessus selon des représentations 8 et 10 de SU(3) sont des états liés de paires q q̄ ou
qqq, respectivement. Plus généralement, on suppose que seules les représentations de trialité
nulle peuvent donner lieu à des particules observables. Ainsi,

p = uud, n = udd, Ω− = sss, ∆++ = uuu, · · · , ∆− = ddd, (4.31)

¯
− dd) ¯
(uū + dd − 2ss̄)
¯ π 0 = (uū√
π + = ud, , π − = dū , η8 = √ , K + = us̄, K 0 = ds̄ etc.
2 6
2. Les masses observées de ces hadrons sont MN ≈ 939 MeV/c2 , MΛ = 1116 MeV/c2 , MΣ ≈ 1195 MeV/c2 ,
MΞ ≈ 1318 MeV/c2 ; celles des mésons pseudoscalaires mπ ≈ 137 MeV/c2 , mK ≈ 496 MeV/c2 et mη =
548 MeV/c2 . Pour le décuplet, M∆ ≈ 1232 MeV/c2 , MΣ∗ ≈ 1385 MeV/c2 , MΞ∗ ≈ 1530 MeV/c2 , MΩ ≈
1672 MeV/c2 .

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

154 Chap.4. Symétries globales en physique des particules

Y Y
s
d 1
u
1 1
3 Iz !2 2 Iz

!1
1
2 2
2 u d
s !3

Figure 4.4 – Les triplets de quarks et antiquarks.

Le modèle des quarks interprète le singulet qui apparaı̂t dans le produit 3 × 3̄ comme un état lié η1 =
¯
(uū+dd+ss̄)
√
3
.Les particules physiquement observées η (masse 548 MeV) et η 0 (958 MeV) résultent d’un “mélange”
(c’est-à-dire une combinaison linéaire) de ces η1 et η8 dû aux interactions brisant SU(3). Exercice : compléter
sur la Fig. 4.3 les interprétations des baryons comme états liés des quarks en s’aidant des charges et nombres
quantiques.

4.2.6 Courants hadroniques et interactions faibles

Les interactions faibles sont phénoménologiquement bien décrites par un lagrangien effectif de
la forme “courant-courant” (Fermi)
G
LFermi = − √ J ρ (x)Jρ† (x) (4.32)
2
où G est la constante de Fermi qui vaut (dans les unités où ~ = c = 1)

G = (1, 026 ± 0, 001) × 10−5 Mp−2 . (4.33)

(Ce lagrangien d’interaction a le défaut majeur de ne pas être renormalisable, un défaut que
vient corriger la théorie de jauge du Modèle Standard. À basse énergie, LFermi fournit toutefois
une bonne description de la physique, d’où le qualificatif d’“effectif”.) Le courant Jρ est la
somme d’une contribution leptonique et d’une hadronique

Jρ (x) = lρ (x) + hρ (x) (4.34)

Le courant leptonique

lρ (x) = ψ̄e (x)γρ (1 − γ5 )ψνe + ψ̄µ (x)γρ (1 − γ5 )ψνµ [+ψ̄τ (x)γρ (1 − γ5 )ψντ ]

est la somme des contributions des familles de leptons, e, µ (et τ que nous omettrons en première
analyse). Le courant hadronique si on se borne aux deux premières familles s’écrit

hρ = cos θC h(∆S=0)
ρ + sin θC h(∆S=1)
ρ (4.35)

comme combinaison de courants conservant ou changeant l’étrangeté, pondérée par l’angle de

Cabibbo θC ≈ 0, 25. (Ce “mélange” s’étend à l’introduction de la troisième famille, cf chapitre

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

4.3. De SU(3) à SU(4) et aux six saveurs 155

(∆S=0) (∆S=1)
suivant.) Enfin chacun des courants hρ , hρ est de la forme “V − A”, selon l’idée de
Feynman et Gell-Mann, c’est-à-dire est une combinaison de courants vectoriel et axial,
h(∆S=0)
ρ = (Vρ1 − iVρ2 ) − (A1ρ − iA2ρ ) (4.36)
h(∆S=1)
ρ = (Vρ4 − iVρ5 ) − (A4ρ − iA5ρ ) . (4.37)
Les courants vectoriels Vρ1,2,3 sont les courants de Noether d’isospin, les autres composantes de
Vρ ceux de la symétrie SU(3). On montre que leur conservation (exacte pour l’isospin, approchée
(∆S=0)
pour les autres) implique que dans l’élément de matrice Gh p|hρ |n i = ūp γρ (GV (q 2 ) −
GA (q 2 )γ5 )un mesuré dans la désintégration beta à transfert d’impulsion quasi-nul, le facteur de
forme vectoriel GV (0) = G. Au contraire, les courants axiaux ne sont pas conservés et GA (0)
est “renormalisé” (c’est-à-dire habillé) par les interactions fortes, GA /GV ≈ 1.22. Le courant
électromagnétique n’est autre que la combinaison jρ = Vρ3 + √13 Vρ8 . Dans le modèle des quarks,
ces courants hadroniques sont de la forme
λa λa
Vρa (x) = q̄(x)
γρ q(x) Aaρ (x) = q̄(x) γρ γ5 q(x) . (4.38)
2 2
Nous les retrouverons dans le Modèle Standard. [In rep 3, Iz = 21 λ3 , Y = √13 λ8 , Q = Iz + 12 Y =
λ3 √1 λ8 √1 V8 .
2 + 3 2
and accordingly J = V3 + 3
]

4.3 De SU(3) à SU(4) et aux six saveurs

4.3.1 Nouvelles saveurs
La découverte au milieu des années 70 de particules d’un nouveau type a relancé le jeu :
ces particules portent un autre nombre quantique, le “charme” (postulé antérieurement par
Glashow, Iliopoulos et Maiani et par Kobayashi et Maskawa pour des raisons différentes). Cela
amène à ajouter une 3ème direction à l’espace des symétries internes, en sus de l’isospin et
de l’étrangeté (ou de l’hypercharge). C’est un groupe SU(4), encore plus sévèrement brisé que
SU(3), qui est à l’œuvre. Les particules s’organisent en représentations de ce SU(4), etc. Une
quatrième saveur, le charme, est donc ajoutée, et un quatrième quark c charmé constitue avec
u, d, s la représentation 4 de SU(4), tout aussi inobservable que la 3 de SU(3), selon le même
principe.
Au jour d’aujourd’hui, on pense qu’il existe en tout six saveurs, les deux dernières étant
la “beauté” (beauty ou bottomness) et la vérité (... ?) (truth ou topness), donc deux quarks
supplémentaires b et t. Des mésons B, états liés ub̄, db̄ etc, sont observés quotidiennement par
exemple dans l’expérience LHCb au LHC, tandis que les preuves expérimentales de l’existence
du quark t sont plus indirectes. Le groupe hypothétique de saveur SU(6) est très fortement
brisé, comme l’attestent les masses des 6 quarks 3
mu ≈ 1.5 − 4 MeV , md ≈ 4 − 8 MeV , ms ≈ 80 − 130 MeV (4.39)
mc ≈ 1.15 − 1.35 GeV , mb ≈ 4 − 5 GeV , mt ≈ 175 GeV
3. Il faudrait bien sûr préciser le sens de la masse d’une particule qui reste invisible, ce qu’on sait faire
indirectement et avec plusieurs définitions possibles, d’où les plages de valeurs données.

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

156 Chap.4. Symétries globales en physique des particules

+
0 Ds
+
D D
0 +
K K
C
Y !
" "0 "+
! !c
I
z !
K K0

!
D !
D0
Ds

Figure 4.5 – Les mésons de spin J P = 0− de la représentation 15 de SU(4).

ce qui réduit son utilité. On peut toutefois récrire (4.12) sous la forme
1
Q = Y + Iz Y =B+S+C +B+T
2
avec les différents nombres quantiques contribuant additivement à l’hypercharge. La convention
est que la saveur d’un quark est nulle ou du même signe que sa charge électrique Q, voir Table
1. Ainsi C(c) = 1, B(b) = −1 etc. La Table 1 est donc à compléter comme suit

Quarks u d s c b t
1
Isospin Iz 2
− 12 0 0 0 0
1 1 1 1 1 1
Charge baryonique B 3 3 3 3 3 3
Étrangeté S 0 0 −1 0 0 0
Charme C 0 0 0 1 0 0
Beauté B 0 0 0 0 −1 0
Vérité T 0 0 0 0 0 1
1 1
Hypercharge Y 3 3
− 32 4
3
− 32 4
3
2
Charge électrique Q 3
− 13 − 31 2
3
− 31 2
3

Table 2. Nombres quantiques des quarks u, d, s, c, b, t

4.3.2 Introduction de la couleur

Des problèmes variés avec le modèle des quarks originel ont conduit à l’hypothèse (Han-Nambu)
que chaque saveur est dotée d’une multiplicité 3, qui reflète l’existence d’un groupe SU(3)
différent du précédent, le groupe de couleur SU(3)c .
Les considérations menant à cette hypothèse de triplement sont d’une part l’étude de la particule ∆++ , de
spin 3/2, composée de 3 quarks u. Ce système de 3 quarks a un spin 3/2 et un moment angulaire orbital L = 0,
qui lui donnent une fonction d’onde symétrique, en contradiction avec le caractère fermionique des quarks.
Le degré de liberté supplémentaire de couleur permet une antisymétrisation supplémentaire (conduisant à un
état singulet de couleur), et lève donc ce problème. D’autre part, le processus de désintégration π 0 → 2γ est
P 2
proportionnel à la somme Q Iz pour l’ensemble des constituents fermioniques élémentaires. Le proton, avec

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

Exercices et Problèmes du Chapitre 4 157

sa charge Q = 1 et Iz = 21 , conduit à une valeur en accord avec l’expérience. Les quarks (u, d, s) avec les valeurs
Q = ( 23 , 13 , − 31 ) et Iz = ( 12 , − 12 , 0) conduisant à un résultat trois fois trop petit, que la multiplicité de couleur
vient corriger. [ibidem pour R = (e+ e− → hadrons)/(e+ e− → µ+ µ− )]
Selon l’hypothèse de confinement des quarks, seuls les états de la représentation 1 de SU(3)c
sont observables. Les autres états, dits “colorés”, sont liés de façon permanente au sein des
hadrons. Cela s’applique aux quarks, mais aussi aux gluons, des particules vectorielles (spin
1) se transformant selon la représentation 8 de SU(3)c , dont l’existence est requise par la
construction de la théorie de jauge des interactions fortes, la chromodynamique quantique, voir
Chap. 5.
Pour être plus précis, l’hypothèse de confinement s’applique à température nulle ou faible, la libération des
quarks et gluons pouvant se produire dans la matière hadronique sous haute température ou pression (au sein
du “plasma de quarks et gluons”
Le modèle des quarks avec son groupe de couleur SU(3)c est maintenant considéré comme
partie intégrante de la chromodynamique quantique. Les six saveurs de quarks sont regroupées
en trois “générations”, (u, d), (c, s), (t, b), qui sont en correspondance avec trois générations
de leptons, (e− , νe ), (µ− , νµ ), (τ − , ντ ). Cette correspondance est importante pour la cohérence
du modèle standard (compensation des anomalies), voir chap. suivant.

Références aditionnelles pour le Chapitre 4

Sur SU(3) de saveur, la référence incontournable, contenant tous les articles historiques, est
M. Gell-Mann et Y. Ne’eman, The Eightfold Way, Benjamin 1964. On y trouvera en particulier
les tables de coefficients de Clebsch-Gordan pour SU(3) par J.J. de Swart.
Dans la discussion des brisures de SU(3), on a suivi S. Coleman, Aspects of Symmetry,
Cambridge Univ. Press 1985.
Pour un exposé plus récent sur la physique des saveurs, voir K. Huang, Quarks, Leptons
and Gauge Fields, World Scientific 1992.
Toutes les propriétés des particules citées se trouvent dans les tables du Particle Data Group,
en ligne sur le site [Link]

Exercices et Problèmes du chapitre 4

A. Modèle sigma et brisure de la symétrie chirale
πτ .
On considère le lagrangien (4.10) et on définit W = σ + iπ
1. Que vaut det W ? Montrer que l’on peut récrire L en termes de ψL,R et W selon

1 λ
L = ψ̄R i/ ∂ ψL + g(ψ̄L W ψR + ψ̄R W † ψL ) + LK − m2 det W − (det W )2
∂ ψR + ψ̄L i/
2 4

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

158 Chap.4. Symétries globales en physique des particules

où LK est le terme cinétique des champs (σ, π ). On peut donner à ce terme la forme LK = 12 (det ∂0 W −
P3
i=1 det ∂i W ) (d’allure un peu étrange, mais bel et bien invariant de Lorentz !).
2. Montrer que L est invariant par les transformations de SU(2) × SU(2) avec ψL → U ψL , ψR → V ψR , à
condition que W se transforme d’une façon qu’on précisera. Justifier l’assertion faite au § 4.1.2 : ψL , ψR et W
se transforment respectivement par les représentations ( 12 , 0), (0, 21 ) et ( 12 , 21 ).
3. Si le champ W acquiert une vev v, par exemple selon la direction de σ, h σ i = v, montrer que le champ
ψ acquiert une masse M = −gv

B. Changement de base dans SU(3)

Dans SU(3), identifier le changement de base qui fait passer des poids Λ1 , Λ2 du chapitre 3 aux axes utilisés
dans les Fig. 4.2, 4.3 et 4.4 . En déduire la transformation des coordonnées (λ1 , λ2 ) (indices de Dynkin) aux
coordonnées physiques (Iz , Y ). Quelle est la dimension de la représentation de SU(3) exprimée en termes de
l’isospin et de l’hypercharge de son plus haut poids˜ ? [(Λ1 , Λ2 ) 7→ (α1 , Λ2 ), avec α1 = 2Λ1 − Λ2 donc λ =
λ1 Λ1 + λ2 Λ2 = 12 λ1 α1 + ( 12 λ1 + λ2 )Λ2 = Iz α1 + 23 Y Λ2 , soit Iz = 12 λ1 , Y = 13 (λ1 + 2λ2 ). ]

C. Formule de Gell-Mann–Okubo
Compléter et justifier tous les arguments esquissés aux § 4.2.2, 4.2.3 et 4.2.4. En particulier vérifier que la
formule (4.27) conduit bien pour l’octet de baryon à la règle (4.30), et pour le décuplet, à des écarts de masse
constants.

D. Comptage d’amplitudes
Combien d’amplitudes indépendantes sont nécessaires pour décrire la diffusion BD → BD, où B et D décrivent
l’octet et le décuplet de baryons ?

Problèmes
1. Couplages à quatre champs invariants par SU(3)
On considère une matrice A, hermitienne, 3 × 3 et de trace nulle.
a. Montrer que l’équation caractéristique
1
A3 − (tr A)A2 + (tr A)2 − tr A2 A − det A = 0

2
implique une relation entre tr A4 et (tr A2 )2 .
b. Si le groupe SU(3) agit sur A par A → U AU † , montrer que toute somme de produits de traces de
puissances de A est invariante. On appelle une telle somme “polynôme invariant en A”. Combien y-a-t-il de tels
polynômes invariants de degré 4 en A et linéairement indépendants ?
P4
c. On “polarise” alors l’identité trouvée en a., c’est-à-dire qu’on écrit A = i=1 xi Ai avec 4 matrices Ai du
type précédent et 4 coefficients xi arbitraires, et que l’on identifie le coefficient de x1 x2 x3 x4 . Montrer que l’on
obtient une identité de la forme (identité de Burgoyne)
X X
tr (AP 1 AP 2 AP 3 AP 4 ) = a tr (AP 1 AP 2 ) tr (AP 3 AP 4 ) (4.40)
P P

avec des sommes sur les permutations P de 4 éléments et un coefficient a qu’on déterminera. Combien de termes
distincts apparaissent dans chacun des membres de cette identité ?
d. Combien de polynômes de degré 4 quadrilinéaires en A1 , · · · , A4 , invariants par l’action de SU(3) Ai →
U Ai U † et linéairement indépendants peut-on écrire ? Pourquoi l’identité (4.40) est-elle utile ?

2. Invariance cachée du lagrangien bosonique

On cherche à écrire un lagrangien pour le champ Φ de l’octet des mésons pseudoscalaires, cf (4.17).
a. Pourquoi est-il naturel d’imposer que ce lagrangien soit pair dans le champ Φ ?

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

Exercices et Problèmes du Chapitre 4 159

b. En utilisant les résultats du Problème 1., écrire la forme la plus générale du lagrangien de degré inférieur
ou égal à 4 et pair en Φ, invariant par SU(3).
c. On écrit alors chaque champ complexe en distinguant sa partie réelle et sa partie imaginaire, par exemple
K + = √12 (K1 − iK2 ), K − = √12 (K1 + iK2 ), et de même avec K 0 , K̄ 0 et avec π ± . Calculer tr Φ2 avec cette
paramétrisation et montrer qu’on obtient une forme quadratique simple dans les 8 composantes réelles. Quel
est le groupe d’invariance G de cette forme quadratique ? Ce groupe est-il un sous-groupe de SU(3) ?
d. En déduire que tout lagrangien de degré 4 en Φ invariant par SU(3) est en fait invariant par ce groupe
G.

3. Écarts de masses électromagnétiques dans un octet de SU(3)

Question préliminaire.
Étant donné un espace vectoriel E de dimension d, on note E ⊗ E l’espace des tenseurs de rang 2 et (E ⊗ E)S ,
resp. (E ⊗ E)A , l’espace des tenseurs de rang 2 symétriques, resp. antisymétriques, appelé encore produit
tensoriel (anti)symétrisé. Quelle est la dimension des espaces E ⊗ E, (E ⊗ E)S , (E ⊗ E)A ? (Rép. d2 , d(d + 1)/2,
d(d − 1)/2 )
On fait l’hypothèse que SU(3) est une symétrie exacte des interactions fortes, et on se propose d’étudier les
différences de masses dues aux effets électromagnétiques.
a. Combien y a-t-il de différences de masses indépendantes entre baryons de mêmes nombres quantiques I
+
et Y mais de charges Q (ou de composantes Iz ) différentes, dans l’octet de baryons J P = 12 ˜ ? (Rép. 4, par
ex Mn − Mp , MΣ− − Mσ0 , MΣ+ − Mσ0 , et MΞ− − MΞ0 . )
On admettra que ces effets électromagnétiques résultent de perturbations du second ordre dans le lagrangien
Lem (x) = −qj µ (x)Aµ (x). Si |B i est un état de baryon, il faudrait donc calculer
Z
δMB = h B|( d4 x Lem )2 |B i .

Faute de savoir calculer cet élément de matrice, on veut calculer le nombre d’amplitudes indépendantes y
contribuant.
b. Expliquer pourquoi ce calcul amène à compter les invariants apparaissant dans le produit tensoriel de
quatre représentations 8. Au vu des calculs effectués en cours, que devrait être ce nombre ? (Rép. Selon le
théorème de Wigner-Eckart, il y a autant d’amplitudes indépendantes que d’invariants dans le produit tensoriel
8⊗4 ; si mi sont les multiplicités apparaissant dans 8 ⊗ 8, soit m1 = 1, m8 = 2, etc, il semblerait que ce nombre
est i m2i = 8. )
P
R R
c. Mais attention ! le produit des deux lagrangiens est symétrique. En ce qui concerne le produit Lem Lem ,
il faut donc décomposer en représentations irréductibles le produit tensoriel symétrisé (8⊗8)S . Utiliser le résultat
de la Question préliminaire pour calculer le nombre de tenseurs indépendants symétriques de rang 2 dans la
représentation 8. Montrer que ce nombre est compatible avec la décomposition qu’on admettra

(8 ⊗ 8)S = 1 ⊕ 8 ⊕ 27 .

(Rép. Il y a 12 8 × 9 = 36 tenseurs de rang 2 symétriques dans leurs indices prenant 8 valeurs. Ce nombre
36 = 1 + 8 + 27, ok. )
d. i) Quel est alors le nombre d’amplitudes invariantes contribuant à δMB ? (Rép. Il y a m1 + m8 + m27 =
1 + 2 + 1 = 4 amplitudes indépendantes. )
d. ii) Quel est le nombre d’amplitudes invariantes contribuant à δMB − δMB 0 pour deux hadrons B et B 0
de mêmes nombres quantiques, comme discuté au a. ? (Rép. La représentation identité contribue également
à tous les δMB donc ne contribue pas aux écarts δMB − δMB 0 . Il n’y a que trois amplitudes indépendantes
contribuant à ces écarts. )
d. iii) Dans l’esprit de ce qui a été fait en cours sur les amplitudes contribuant aux moments magnétiques,
pouvez-vous écrire une base d’invariants en termes des matrices Ψ, Ψ̄ et Q ? (Rép. Les 4 amplitudes indépendantes

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

160 Chap.4. Symétries globales en physique des particules

peuvent être écrites par exemple comme tr B̄Q2 B, tr B̄QBQ, tr B̄BQ2 et tr B̄B ; en fait 3 seulement contri-
buent aux écarts de masse puisque la représentation 1 ne contribue pas à un écart (ou encore B̄B est la forme
diagonale identité).)

e. i) Montrer a priori que le nombre d’amplitudes calculé à la question d. ii) implique une relation entre les
écarts de masse électromagnétiques. (Rép. Il y a trois amplitudes contribuant à quatre écarts, d’où une relation
entre ces écarts.)

e. ii) Calculer alors ∆em M = αtr B̄Q2 B + βtr B̄BQ2 + γtr B̄QBQ, (l’usage de Maple ou de Mathematica
peut aider. . .), identifier dans cette expression les coefficients ∆em Mp de p̄p, ∆em Mn de n̄n, etc, et vérifier la
relation

MΞ− − MΞ0 = MΣ− − MΣ+ + Mp − Mn . (R)

Les valeurs expérimentales sont Mn = 939, 56 MeV/c2 , Mp = 938, 27 MeV/c2 , MΞ− = 1321, 71 MeV/c2 , MΞ0 =
1314, 86 MeV/c2 , MΣ− = 1197, 45 MeV/c2 , MΣ0 = 1192, 64 MeV/c2 , MΣ+ = 1189, 37 MeV/c2 . Calculer les
valeurs des deux membres de la relation (R). Commenter. (Rép. Le membre de gauche vaut 1321, 71−1314, 86 =
6, 85 MeV/c2 , celui de droite 1197, 45 − 1189, 37 + 938, 27 − 939, 56 = 8, 08 − 1, 29 = 6, 79 MeV/c2 . On voit que
les prédictions de SU(3) sont vérifiées à 1% près, ce qui est très remarquable. )

f. Octet des mésons pseudoscalaires. Pourrait-on raisonner de façon analogue avec les mésons pseudosca-
laires ? (Rép. Dans ce cas on n’a que 3 amplitudes indépendantes, dont 2 seulement contribuent aux écarts,
tr Φ2 Q2 et tr (ΦQ)2 , mais seulement deux différences de masses électromagnétiques indépendantes mπ+ −mπ0 =
mπ− − mπ0 , mK + − mK 0 = mK − − mK 0 en utilisant l’égalité des masses d’une particule et de son antiparticule
(invariance CPT). On n’a plus de relation entre ces écarts. . .)

g. Quid des écarts électromagnétiques au sein du décuplet ( 23 )+ ? (Rép. Il faut calculer le nombre d’invariants
dans 10 ⊗ 10¯ ⊗ (8 ⊗ 8)S . Mais 10 ⊗ 10
¯ = 1 ⊕ 8 ⊕ 27 ⊕ 64 et (8 ⊗ 8)S comme ci-dessus, donc 3 amplitudes dont seules
celles de la 8 et de la 27 contribuent au mass splitting, et on connaı̂t deux invariants, Q et Q2 se transformant
ainsi. Donc ∆mem = αQ + βQ2 . Vérification sur les masses expérimentales. . .)

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

Exercices et Problèmes du Chapitre 4 161

Robert Brout Nicola Cabbibo François Englert Enrico Fermi Richard Feynman
1928-‐2011 1935-‐2010 1932-‐ 1901-‐1954 1918-‐1988

Murray Gell-‐Mann Sheldon Glashow Jeffrey Goldstone David Gross Peter Higgs Gerard ‘t Hooft
1929-‐ 1932-‐ 1933-‐ 1941-‐ 1929-‐ 1946-‐

Jean Iliopoulos Maurice Lévy Makoto Kobayashi Luciano Maiani Toshihide Maskawa Yoichiro Nambu
1940-‐ 1922-‐ 1944-‐ 1941-‐ 1940-‐ 1921-‐

Yuval Ne’eman H. David Politzer Alexander Polyakov Carlo Rubbia Abdus Salam Simon van der Meer
1925-‐2006 1949-‐ 1945-‐ 1934-‐ 1926-‐1996 1925-‐2011

Martin Veltman Steve Weinberg Frank Wilczek Kenneth Wilson Chen Ning Yang Hideki Yukawa
1931-‐ 1933-‐ 1951-‐ 1936-‐2013 1922-‐ 1907-‐1981

Quelques-‐uns des physiciens mentionnés dans la deuxième partie de ces notes

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

162 Chap.4. Symétries globales en physique des particules

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

Chapitre 5

Théories de jauge. Modèle standard

En dehors d’un bref commentaire sur l’invariance de jauge de l’électrodynamique classique,

les transformations qu’on a rencontrées jusqu’à maintenant dans ce cours étaient des trans-
formations globales, indépendantes du point d’espace-temps où elles s’appliquent. Un autre
type de symétrie, beaucoup plus contraignant sur la dynamique du système, consiste à suppo-
ser que la transformation est locale. En chaque point d’espace-temps, agit une copie distincte
du groupe de transformations. Une telle symétrie, appelée symétrie de jauge, est familière en
électrodynamique. Son extension à des groupes de transformations non abéliens par Yang et
Mills s’est avérée être une des idées théoriques les plus fécondes de la seconde moitié du XXème
siècle. Un cours entier devrait lui être consacré. Plus modestement, le présent chapitre en don-
nera une introduction élémentaire.

5.1 Invariance de jauge. Couplage minimal. Lagrangien

de Yang–Mills
5.1.1 Invariance de jauge de l’électrodynamique
L’étude de l’électrodynamique a familiarisé avec la notion d’invariance locale. Le lagrangien de
l’électrodynamique
1
A − m)ψ − (∂µ Aν − ∂ν Aµ )(∂ µ Aν − ∂ ν Aµ )
L = ψ̄(i/∂ − e/ (5.1)
4
est invariant sous l’effet de transformations de jauge infinitésimale

δAµ (x) = −∂µ δα(x)

δψ(x) = ieδα(x)ψ(x) , (5.2)

puisque le tenseur de champ

Fµν = (∂µ Aν − ∂ν Aµ )

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

164 Chap.5. Théories de jauge. Modèle standard

est invariant, et que la combinaison

Dψ(x) := (i/∂ − e/
i/ A)ψ(x)

se transforme comme ψ. La forme finie de ces transformations est aussi aisée à écrire

Aµ (x) →
7 Aµ (x) − ∂µ α(x)
ψ(x) 7 eieα(x) ψ(x) ,
→ (5.3)

ce qui montre bien que les transformations sont celles d’une version locale (dépendant de x)
du groupe U(1) ou R (voir ci-dessous). Les transformations globales correspondantes sont
celles qui conduisent à un courant de Noether conservé, lié à la conservation de la charge
électrique. Le lagrangien met aussi en évidence le “couplage minimal” du champ ψ au champ
électromagnétique 1 . Tout autre champ chargé de charge q se couple au champ électromagnétique
par un terme impliquant la “dérivée covariante” i∂µ − qAµ (x).
C’est par exemple le cas d’un champ φ de boson chargé, donc complexe, dont la contribution
au lagrangien s’écrit

δL = [(∂µ − iqAµ )φ∗ ] [(∂ µ + iqAµ )φ] − V (φ∗ φ) (5.4)

qui est bien invariant sous φ(x) 7→ eiqα(x) φ(x), Aµ (x) 7→ Aµ (x) − ∂µ α(x).
Noter que si le champ A est couplé à plusieurs champs de charges q1 , q2 ,. . ., demander que le groupe de jauge
est U(1) (plutôt que R), c’est-à-dire identifier α(x) et α(x) + 2πx (x un réel donné), impose que xq1 , xq2 , · · · ∈ Z
et donc que les charges q1 , q2 ,. . . sont commensurables. Cela peut donc expliquer la quantification de la charge
électrique observée dans la nature.

5.1.2 Extension non abélienne de Yang–Mills

Selon l’observation brillante de Yang et Mills (1954), cette construction se transpose au cas d’un
groupe de Lie non abélien G, avec toutefois quelques intéressantes petites modifications . . . Soit
ψ un champ (que nous notons comme un champ fermionique, mais la chose est sans impor-
tance) se transformant par G selon une certaine représentation D. Soient Ta les représentants
des générateurs infinitésimaux dans cette représentation, nous les supposons antihermitiens :
[Ta , Tb ] = Cab c Tc ; la transformation infinitésimale de ψ s’écrit donc

δψ(x) = Ta δαa ψ(x) . (5.5)

(Dans ce paragraphe, on notera ta les matrices correspondantes dans la représentation adjointe.)

Pour étendre l’idée de transformation locale, nous avons besoin d’un champ de jauge Aµ , per-
mettant de construire une dérivée covariante Dµ ψ. Il est naturel de considérer que Aµ vit dans
l’algèbre de Lie de G (puisqu’il est associé à des transformations infinitésimales du groupe), et
qu’il porte donc des indices de la représentation adjointe

Aµ (x) = {Aaµ (x)} (5.6)

1. Un terme supplémentaire dans le lagrangien de la forme ψ̄[γµ , γν ]ψF µν serait invariant de jauge invariant
mais non minimal.

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

5.1. Invariance de jauge. Couplage minimal. Lagrangien de Yang–Mills 165

ou encore Aµ est représenté dans toute représentation par la matrice antihermitique 2

Aµ (x) = Ta Aaµ (x) . (5.7)

[ou encore est considéré comme une 1-forme

A(x) = Aµ (x)dxµ .

] La dérivée covariante s’écrit

Dµ ψ(x) := (∂µ − Aµ (x))ψ(x) , (5.8)

ou encore, en composantes

Dµ ψA (x) := ∂µ δAB − Aaµ (x) (Ta )AB ψB (x) .

(5.9)

Cette dérivée se transforme bien comme ψ, à l’instar du cas abélien, à condition qu’on impose
à Aµ de se transformer selon

δAaµ (x) = ∂µ δαa (x) + Cbc a δαb (x) (5.10)

= ∂µ δ ab − Acµ (x)(tc )ab δαb (x) = (Dµ δα)a (x) .

Au terme ∂µ δαa (x) près, on voit que {Aaµ } se transforme bien selon la représentation adjointe
(dont les matrices sont (tc )ab = −Cbc a ).). Enfin un tenseur de champ se transformant de façon
covariante (c’est-à-dire sans terme inhomogène en ∂δαa (x)) peut être construit

Fµν = ∂µ Aν − ∂ν Aµ − [Aµ , Aν ] (5.11)

ou en composantes
a
Fµν = ∂µ Aaν − ∂ν Aaµ − Cbc a Abµ Acν . (5.12)

On démontre, au prix d’un peu d’algèbre, et en utilisant l’identité de Jacobi, que

a
δFµν (x) = Cbc a δαb (x)Fµν
c
(x) , (5.13)

qui est bien une transformation infinitésimale dans la représentation adjointe.

Il est en fait profitable, et peut-être plus éclairant, de regarder l’effet d’une transformation
finie locale g(x) du groupe G,

ψ(x) →7 D(g(x))ψ(x)
a
Aµ = Aµ Ta → 7 D(g(x))(−∂µ + Aµ (x))D(g −1 (x)) , (5.14)

où D est la représentation portée par ψ, et pour la dérivée covariante agissant sur ψ on a

Dµ ψ(x) 7→ D(g(x))Dµ ψ(x) (5.15)

2. Attention, cette convention implique que certaines expressions diffèrent par un facteur i du cas abélien

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

166 Chap.5. Théories de jauge. Modèle standard

ou encore 3
Dµ 7→ D(g(x))Dµ D(g −1 (x)) . (5.16)

Or on vérifie aisément que dans une représentation donnée

a
[Dµ , Dν ] = −Fµν := −Fµν Ta (5.17)

d’où il découle que Fµν (x) 7→ D(g(x))Fµν D(g −1 (x)), et qu’en particulier, dans la représentation
a
adjointe, la transformation finie de Fµν = Fµν ta est

Fµν (x) 7→ g(x)Fµν (x)g −1 (x) , (5.18)

dont (5.13) est la version infinitésimale.

“Pure jauge”

Si le tenseur Fµν s’annule dans le voisinage d’un point x0 , on peut écrire localement (c’est-à-dire
dans ce voisinage) Aµ (x) comme une “pure jauge”, c’est-à-dire

Fµν = 0 ⇐⇒ Aµ (x) = (∂µ g(x)) g −1 (x) . (5.19)

L’appellation “pure jauge” se justifie par le fait qu’un tel Aµ (x) = (∂µ g(x)) g −1 (x) est le trans-
formé de jauge d’un champ de jauge . . . nul ! Le ⇐ se démontre au prix d’une ligne de calcul,
pour le ⇒, voir huit lignes plus bas. . . Insistons sur le caractère local de cette propriété.

Transport parallèle le long d’une courbe

Un autre objet intéressant est l’élément du groupe attaché à une courbe C allant de x0 à x
Z
µ
γ(C) := P exp dx Aµ (x) (5.20)
C

où A = Aa ta est pris dans la représentation adjointe et où le symbole P signifie qu’une pa-
ramétrisation x(s) de la courbe ayant été choisie, les termes dans le développement de l’ex-
ponentielle sont ordonnés de droite à gauche selon les s croissants (cf le T -produit en théorie
quantique des champs). On montre que sous l’effet de la transformation de jauge (5.14)

γ(C) 7→ g(x)γ(C)g −1 (x0 ) . (5.21)

Plus généralement, pour toute représentation D et avec A = Aa Ta , (5.20) définit un γD (C)

dans la représentation D se transformant selon γD (C) 7→ D(g(x))γD (C)D(g −1 (x0 )).
Exercice. Démontrer cette assertion en considérant d’abord une trajectoire infinitésimale de x
à x + dx, c’est-à-dire γ(C) ≈ 1 + Aµ (x)dxµ , et en effectuant une transformation de jauge finie
3. Attention aux notations : dans cette équation, qui porte sur un opérateur différentiel, la dérivée ∂µ contenue
dans Dµ agit sur tout ce qui est à sa droite, tandis que dans la deuxième équation(5.14), elle n’agit que sur
D(g −1 (x)).

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

5.1. Invariance de jauge. Couplage minimal. Lagrangien de Yang–Mills 167

Aµ (x) → g(x)(−∂µ + Aµ (x))g −1 (x), montrer que γ(C) → g(x + dx)γ(C)g −1 (x). Le résultat
pour une courbe finie s’ensuit en combinant ces éléments de courbe infinitésimaux.
Étant donné un objet, tel le champ ψ, se transformant selon une représentation D, le rôle de
γD (C) est de “transporter” ψ(x0 ) en un objet noté t ψ(x) se transformant comme ψ(x). Montrer
que pour un trajet infinitésimal (x, x + dx) la différence t ψ(x + dx) − ψ(x + dx) fait apparaı̂tre
de façon naturelle la dérivée covariante. [t ψ(x + dx) = (1 + dxµ Aµ )ψ(x), ψ(x + dx) = (1 + dxµ ∂µ )ψ(x)
donc t ψ(x + dx) − ψ(x + dx) = −dxµ (∂µ − Aµ )ψ = −dxµ Dµ ψ(x).]
Considérons alors le cas où x = x0 . La boucle C est fermée et γ(C) se transforme de façon
covariante, γ(C) 7→ g(x0 )γ(C)g −1 (x0 ). Examinons à nouveau le cas d’une boucle infinitésimale.
On montre alors que Z
1
γ(C) ≈ exp dxµ ∧ dxν Fµν , (5.22)
2 S
où l’intégrale s’effectue sur une surface infinitésimale S s’appuyant sur C.
Exercice : Démontrer cette assertion en considérant un circuit carré élémentaire s’étendant à
partir de x le long des axes de coordonnées µ et ν : (x → x + dxµ → x + dxµ + dxν →
x + dxν → x), et développer au second ordre en dx pour obtenir γ(C) ≈ 1 + dxµ dxν Fµν (sans
sommation sur µ, ν). Indication : la formule du commutateur du Chap. 1, (1.20), simplifie
beaucoup le calcul ! [On a en effet à calculer Uν−1 Uµ−1 (dx)Uν (dx)Uµ . A la contribution du commutateur
Uν−1 Uµ−1 Uν Uµ = 1 + dxµ dxν [Aν , Aµ ] s’ajoute les contributions des dx dans les U , soit (∂µ Aν − ∂ν Aµ )dxµ dxν . ]
Cela a une conséquence immédiate : si F = 0, tout γ(C) de la forme(5.20) n’est pas sensible
à de petites variations du contour C à extrémités x0 et x fixées et ne dépend donc que de x0 et
x. Le g(x, x0 ) := γ(C) qui en résulte satisfait (∂µ − Aµ )g(x, x0 ) = 0, (vérifier !), ce qui achève
la démonstration de (5.19).

Boucle de Wilson

Revenons au cas d’une boucle fermée C dans (5.20). Comme on vient de le noter, γ(C) se
transforme de façon covariante, γ(C) 7→ g(x0 )γ(C)g −1 (x0 ). Sa trace
I
W (C) = tr γ(C) = tr P exp dxµ Aµ (x) (5.23)

est donc invariante. Toute quantité physique doit être “invariante de jauge”, c’est-à-dire in-
variante par une transformation de jauge. C’est le cas de tr Fµν F µν , ψ̄i/∂ − A)ψ
/ etc. L’intérêt
de W (C) est d’être une quantité invariante non locale, dépendant du contour C. Noter qu’elle
dépend de la représentation dans laquelle on évalue A = Aa Ta . Cette boucle de Wilson a été
proposée par Wilson et Polyakov comme permettant la mesure du potentiel d’interaction entre
les particules se propageant le long de C, et comme fournissant donc un bon indicateur du
confinement. Voir plus bas au § 5.3.1, et voir le Problème I à la fin de ce chapitre pour une
version discrétisée de cette quantité.

5.1.3 Géométrie des champs de jauge

Les considérations qui précèdent montrent que la théorie des champs de jauge a une forte coloration géométrique.
Le langage approprié pour discuter ces choses est celui de la théorie des fibrés, fibré principal pour le groupe

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

168 Chap.5. Théories de jauge. Modèle standard

de jauge, fibré vectoriel pour chacun des champs de matière comme ψ, au dessus de l’espace de base qui est
l’espace-temps. Le champ de jauge est une connexion sur le fibré, qui permet de définir un transport parallèle
de point à point. Le tenseur Fµν en est la courbure, ce qu’exprime (5.17) ou (5.22). Toutes ces notions sont
définies localement, dans un système de coordonnées locales (une carte), et les changements de carte implique
des transformations de la forme (5.14). Ce langage devient particulièrement utile quand on s’intéresse aux
propriétés topologiques (instantons etc) ou globales (problème de Gribov) des théories de jauge. Pour la simple
introduction aux propriétés de symétrie locale et à la construction perturbative du modèle standard, nous n’en
aurons pas besoin.

5.1.4 Lagrangien de Yang–Mills

Le lagrangien décrivant le champ de jauge couplé à un champ de matière tel ψ via le couplage
minimal s’écrit donc
1
L = 2 tr (Fµν F µν ) + ψ̄ i(/∂ − A)

/ −m ψ , (5.24)
2g
avec un paramètre, le couplage g. La valeur de ce couplage est évidemment liée à la normalisation
a
des matrices Ta intervenant dans Fµν = Fµν Ta . On montre (cf Exercice B en fin de chapitre) que
pour toute algèbre de Lie simple on peut choisir une base telle que dans toute représentation
R, tr Ta Tb = −TR δab , avec TR un coefficient réel positif dépendant du groupe et de la représen-
tation. On choisira pour écrire Fµν la représentation fondamentale de dimension la plus basse
(la représentation de définition de dimension N dans le cas de SU(N )) avec la normalisation
Tf = 12 , donc tr Ta Tb = − 12 δab . Au lagrangien L, on peut ajouter la contribution de champs de
bosons, etc. Noter que la représentation portée par les fermions et les autres champs de matière,
qui apparaı̂t dans la dérivée covariante Dµ = ∂µ − Aaµ Ta , peut différer de cette représentation
fondamentale.
Tel quel, le lagrangien L de (5.24) ressemble beaucoup au lagrangien du cas abélien (5.1),
après qu’on a effectué le changement A → gA.
Retenons les éléments les plus marquants de cette construction :
– comme dans le cas abélien, le principe d’invariance de jauge implique un couplage minimal
de type universel, via la dérivée covariante ; (bien entendu, l’addition de termes invariants de jauge
“non minimaux”, tel ψ̄σµν F µν ψ, est possible mais limité par la contrainte de renormalizabilité) ;
– contrairement au cas abélien où chaque charge est indépendante et non quantifiée (tout
au moins si le groupe de jauge est R et non pas U(1)), la constante de couplage g de tous
les champs au champ de jauge est la même à l’intérieur de chaque composante simple du
groupe de jauge ;
– comme dans le cas abélien, le champ de jauge vient naturellement sans terme de masse : un
terme de masse 12 M 2 Aµ Aµ brise en effet l’invariance de jauge. Cela est très embarrassant
pour les applications physiques, les champs vectoriels (de spin 1) de masse nulle étant
exceptionnels dans la nature (le champ électromagnétique et ses excitations photoniques
étant le contre-exemple de base), et nous contraindra soit à introduire des mécanismes
“doux” de brisure de l’invariance de jauge (brisure spontanée) pour y remédier, soit à
invoquer le mécanisme du confinement pour cacher les gluons de masse nulle ;

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

5.1. Invariance de jauge. Couplage minimal. Lagrangien de Yang–Mills 169

a p b a p b
! µ ! µ

c c
" "
r r
a p a p
! !
q q
µ µ
b b

Figure 5.1 – Quelques diagrammes à une boucle dans une théorie de jauge

– contrairement au cas abélien, le champ de jauge “porte une charge du groupe” : on a

vu que pour les transformations globales (c’est-à-dire indépendantes de x) du groupe G,
Aµ se transforme selon la représentation adjointe. La propriété du champ d’être chargé a
des implications importantes dans de nombreux phénomènes, les effets infra-rouges entre
autres, mais aussi ultraviolets (signe de la fonction β), comme on verra plus bas.

5.1.5 Quantification. Règles de Feynman.

La quantification de la théorie de Yang–Mills nécessite de surmonter de sérieuses difficultés que
nous nous contenterons d’évoquer. Comme dans l’électrodynamique, la forme quadratique du
champ de jauge dans le lagrangien,

(∂µ Aν − ∂ν Aµ )2 ou dans l’espace de Fourier Aµ (−k)(k µ k ν − k 2 g µν )Aν (k)

est dégénérée, donc non inversible, ce qui est un reflet de l’invariance de jauge ; en conséquence,
le propagateur du champ Aµ n’est a priori pas défini. Il faut donc “fixer la jauge”, en imposant
une condition non-invariante de jauge, et la procédure de Faddeev et Popov, justifiée par leur
étude générale de la quantification des systèmes contraints, conduit via l’introduction de champs
supplémentaires à des règles de Feynman explicites, (voir par exemple [IZ, chap. 12] et les cours
du second semestre).
On démontre, et cela a été une étape décisive dans la construction du Modèle Standard 4 , que
la théorie de jauge ainsi quantifiée est renormalisable : toutes les divergences ultraviolettes ap-
paraissant dans les calculs de diagrammes de Feynman, peuvent, à tout ordre fini de la série des
perturbations, être absorbées dans une redéfinition des paramètres –couplages, normalisation
des champs, masses– du lagrangien. Cette procédure de renormalisation préserve l’invariance
de jauge.
Ainsi à l’ordre à une boucle, les diagrammes de la Fig. 5.1 ont des divergences qui peuvent
être absorbées dans un changement de la normalisation du champ Aµ (“renormalisation de

4. G. ’t Hooft et M. Veltman, prix Nobel 1999

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

170 Chap.5. Théories de jauge. Modèle standard

fonction d’onde”) et une renormalisation de la constante de couplage g

g2

11 4 Λ
g 7→ g0 = 1 − C2 − Tf log g, (5.25)
(4π)2 3 3 µ
où Λ est une échelle de coupure ultraviolette (“cutoff”) et µ une échelle de masse indispensable
à la définition de la procédure de renormalisation. Tf a été défini plus haut, juste après (5.24),
et C2 est la valeur de l’opérateur de Casimir quadratique dans la représentation adjointe,
Cacd Cbcd = C2 δab , donc C2 = c2 (adj) avec les notations de l’exercice A.1, et C2 = N pour
SU(N ), cf exercice A.2.

5.2 Champs de jauge massifs

5.2.1 Interactions faibles et bosons intermédiaires
On a vu au chapitre 4 (équ. (4.32)) que le lagrangien de Fermi
G
LFermi = − √ J ρ (x)Jρ† (x) (5.26)
2
fournissait une bonne description de la physique de basse énergie des interactions faibles :
processus leptoniques tel ν̄e e− → ν̄e e− ou ν̄µ µ− , semi-leptoniques comme π + → µ+ νµ ou la
désintégration β du neutron n → pe− ν̄e , ou non leptoniques : Λ → pπ − , K 0 → ππ, etc. Mais
qu’il n’était théoriquement pas satisfaisant, puisqu’il conduit à une théorie non renormalisable,
rendant impossible tout calcul au delà du “terme de Born”, le premier ordre de la série des
perturbations, lequel viole l’unitarité.
La violation de l’unitarité apparaı̂t dans le calcul de la section efficace totale σ de tout processus, au premier
ordre de la série des perturbations. Un simple argument dimensionnel donne à haute énergie

σ ∼ const. G2 s

où s est le carré de l’énergie dans le centre de masse. Mais ce comportement est en conflit avec des résultats
généraux basés sur l’unitarité qui prévoient que σ doit décroı̂tre dans chaque onde partielle comme 1/s. Une
√ 1
violation de l’unitarité du terme de Born est donc attendue à une énergie de l’ordre de s ∼ G− 2 ∼ 300 GeV.
Et la non-renormalisabilité de la théorie empêche d’améliorer ce terme de Born par le calcul de “corrections
radiatives”, c’est-à-dire de termes plus élevés de la série des perturbations.

L’idée est alors de regarder LFermi comme l’approximation d’une théorie où le courant chargé
J est couplé à un champ vectoriel chargé W de masse M , dans la limite de grande masse M 5 .
ρ

Considérons le nouveau lagrangien

1
[Link] = gJ ρ (x)Wρ† (x) + h.c. − Fµν F µν + M 2 Wρ† W ρ . (5.27)
4
Dans la limite de grande masse M , on peut négliger le terme cinétique − 41 Fµν F µν par rapport
au terme de masse, le champ W devient un simple champ auxiliaire sans dynamique sur lequel
on peut intégrer en “complétant le carré”, et on retrouve LFermi à condition que
G g2
√ = 2 (5.28)
2 M
5. L’inverse de la masse M représente la portée des interactions faibles qu’on sait courte, et la masse M est
donc élevée (de l’ordre de 100 GeV, comme nous verrons).

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

5.2. Champs de jauge massifs 171

reliant le nouveau couplage g au couplage de Fermi. La théorie (5.27) avec son “boson in-
termédiaire” W , vecteur des interactions faibles, est-elle la bonne théorie des interactions
faibles ? En fait le propagateur du champ massif W est

gµν − kM
µ kν
2
−i 2 2
(5.29)
k −M
qui se comporte mal pour k >> M et rend à nouveau la théorie non-renormalisable : on n’a
fait que déplacer le problème. La solution vient d’une manière douce et subtile ( !) d’introduire
la masse du champ W , via un mécanisme de brisure spontanée de symétrie.

5.2.2 Théorie de jauge à symétrie brisée spontanément. Mécanisme

de Brout–Englert–Higgs
Revenons au cas abélien décrit par (5.1), (5.4) et supposons maintenant que le potentiel V est
tel que son minimum est localisé à une valeur non nulle de φ∗ φ. En conséquence, le champ φ
√
acquiert une vev h φ i = v/ 2 6= 0. Reparamétrisant le champ φ selon
v + ϕ(x)
φ(x) = eiqθ(x)/v √ (5.30)
2
avec v réel et ϕ hermitien, et accompagnant cela d’une transformation de jauge
v + ϕ(x)
φ(x) 7→ φ0 (x) = e−iqθ(x)/v φ(x) = √
2
1
Aµ (x) 7→ A0µ (x) = Aµ (x) + ∂µ θ(x) (5.31)
v
et de la transformation correspondante pour les éventuels autres champs chargés (ψ . . .), on
voit que le lagrangien δL de (5.4) s’écrit

δL = (∂µ − iqA0µ )φ0 (∂ µ + iqA0µ )φ0 − V (φ02 )

1 0 2 1 2 2 0 0µ 1 2
= |(∂µ − iqAµ )ϕ| + q v Aµ A − V (v + ϕ) . (5.32)
2 2 2
Au final, on voit que la brisure spontanée de la symétrie U(1) par le champ bosonique φ conduit
à l’apparition d’un terme de masse du champ de jauge A0µ ! On note aussi que le champ θ qui
en l’absence du champ de jauge, aurait été le champ de Goldstone, a purement et simplement
disparu, “avalé” par le nouveau mode massif (“longitudinal”) du vecteur Aµ ; le nombre total de
degrés de liberté de ces champs n’est donc pas modifié. C’est le mécanisme de Brout–Englert–
Higgs 6 , dans sa version abélienne. Si le boson φ est couplé à un champ de fermions ψ par un
terme du type ψ̄φψ, l’apparition de sa “vev” donne lieu à un terme de masse √qv2 ψ̄ψ pour le ψ.
Remarque importante. Bien comprendre que dans ce mécanisme, la symétrie globale est
brisée spontanément, mais que l’invariance de jauge est bien toujours là. À preuve, la direction
dans laquelle “pointe” le champ scalaire n’est pas observable, (invariance de jauge), on sait
seulement que son module v est non nul (brisure spontanée)
6. F. Englert et P. Higgs, prix Nobel 2013

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

172 Chap.5. Théories de jauge. Modèle standard

Ce mécanisme de Brout–Englert–Higgs (B-E-H) s’étend à un groupe de jauge non abélien.

Les détails dépendent du schéma de brisure et du choix de représentation pour le champ boso-
nique. En général, si le groupe G est brisé en un sous-groupe H, les r = dim G − dim H bosons
de Goldstone, qui sont en correspondance avec les générateurs du quotient (“coset”) G/H, se
muent en modes longitudinaux de r vecteurs. Il reste dim H champs vectoriels de masse nulle.
Exemple : le modèle standard électrofaible du § 5.3.2 : G = SU(2) × U(1), H = U(1) (pas celui
qu’on croit !), trois champs de jauge deviennent massifs, un demeure de masse nulle.
Une étape cruciale dans la construction du modèle standard a été de comprendre que ce
mécanisme de brisure spontanée de symétrie dans une théorie de jauge, décrit ici au niveau
classique, est compatible avec la quantification de la théorie. La renormalisabilité à 4 dimensions
de la théorie de jauge n’est pas affectée par cette brisure, et la théorie obtenue est bien unitaire.
Seuls les états physiques (champs de jauge massifs ou de masse nulle, bosons ayant subsisté à
la brisure etc) participent à la somme sur les états intermédiaires dans la relation d’unitarité.

5.3 Le modèle standard

Ce qu’on appelle actuellement le modèle standard de la physique des particules est une théorie
de jauge basée sur un groupe de jauge non simple : SU(3) × SU(2) × U(1), dans lequel les
différents facteurs jouent des rôles bien distincts. Comme le groupe a trois facteurs, la théorie
dépend a priori de trois constantes de couplage indépendantes et possède des champs de jauge
pour chacun, qui sont couplés aux champs de matière, quarks et leptons, ainsi qu’à des champs
de bosons qui jouent un rôle auxiliaire mais crucial !

5.3.1 Le secteur fort

Le groupe SU(3) est celui de la couleur (cf chap. 4, § 4.3.2). Les champs de jauge Aµ portent
des indices de la représentation adjointe (de dimension 8). Les particules associées, ou gluons,
sont des particules de spin 1 et de masse nulle, jamais observées directement jusqu’à présent.
Les champs de gluons sont couplés aux degrés de liberté de couleur des champs fermioniques
de quarks, ψAi , qui portent un indice A de la représentation 3 (ou 3̄ pour les ψ̄) (et aussi un
indice de saveur i = u, d, s, c, b, t, sur lequel SU(3)c n’agit pas). La théorie ainsi définie est
la Chromodynamique Quantique (QCD dans l’acronyme anglais). Elle décrit la physique de
toutes les interactions fortes. Son lagrangien est du type (5.24), avec des masses fermioniques
dépendant de la saveur, engendrées par le secteur faible.

Liberté asymptotique

Connaissant les règles de Feynman et la renormalisabilité de la théorie, cf §1.6, on peut calculer

la renormalisation de la constante de couplage g, (5.25), et la fonction beta correspondante. On

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

5.3. Le modèle standard 173

trouve 7
g4

∂ 11 4
β(g ) = −Λ g2 (Λ)|g0 = −2
2
C2 − Tf + O(g6 ) (5.33)
∂Λ (4π)2 3 3
Il apparaı̂t donc que cette fonction beta est négative au voisinage de g = 0, tant que le coefficient
11
C − 43 Tf > 0 (pas trop de champs de matière !), autrement dit que g = 0 est un point fixe
3 2
2 (λ)
attractif ultraviolet du groupe de renormalisation : dg d log λ
< 0 ⇒ g2 (λ) ∼ (b log λ)−1 → 0 quand
λ → ∞, avec b = coefficient du terme −g4 dans (5.33).
C’est la liberté asymptotique, une propriété fondamentale des interactions fortes.
Exercice : combien de triplets de quarks sont compatibles avec la liberté asymptotique de la
QCD ?
Cette théorie de jauge non abélienne est la seule théorie des champs locale et renormalisable à 4 dimensions
à posséder cette propriété de liberté asymptotique. Comme telle, elle est la seule compatible avec les résultats
des expériences de diffusion profondément inélastique de leptons sur des hadrons, qui révèlent une structure
interne de ces derniers faite de constituents ponctuels quasi-libres à très courte distance (cf les cours du second
semestre sur la chromodynamique quantique).
Ce groupe de jauge SU(3) est non brisé, ni explicitement, ni spontanément. Ceci est essentiel
pour la cohérence du scenario imaginé pour expliquer le confinement des quarks et gluons (cf
chap. 4, § 4.3.2.) : les particules non singulets du groupe de jauge sont réputées inobservables,
car soumises à des interactions d’intensité croissant avec la distance quand on cherche à les
séparer.
Cette propriété d’“esclavage infra-rouge” (c’est-à-dire à grande distance) est le pendant de celle de “liberté
asymptotique”, à courte distance. Elle montre que le phénomène de confinement est un phénomène de couplage
fort, par essence non-perturbatif, c’est-à-dire inaccessible aux calculs de la théorie des perturbations.
Une approche non-perturbative qui a fourni de nombreux résultats qualitatifs et quantitatifs est la discré-
tisation de la chromodynamique en une théorie de jauge sur un réseau. Cela a ouvert la voie à l’utilisation
de méthodes empruntées à la Mécanique Statistique des modèles sur réseau, analytiques (calculs de couplage
fort ou de haute température, méthode de champ moyen, . . .) ou numériques (Monte-Carlo). Le scenario de
confinement semble confirmé dans cette approche par l’étude de la valeur moyenne de la boucle de Wilson
définie plus haut (§ 5.1.2). Selon l’idée de Wilson et Polyakov, pour une boucle rectangulaire C de dimensions
T × R, T >> R, et portant la représentation σ du groupe de jauge, W (σ) (C) décrit la propagation pendant le
temps T d’une paire de particules statiques (de masse très grande), figées à une distance relative R. On cherche
à calculer le potentiel entre ces charges statiques

1
Vσ (R) = − lim log W (σ) (C) .
T →∞ T

Si la boucle de Wilson a une “loi d’aire”, log W (C) ∼ −κRT , le potentiel entre les charges statiques croı̂t
linéairement, V ∼ κR, ce qui est en accord avec l’idée de confinement. C’est ce qui se passe en général dans
une théorie de jauge sur réseau en couplage fort, voir le Problème I en fin de chapitre. Les calculs de Monte-
Carlo confirment que ce comportement persiste aux couplages faibles pertinents pour la théorie continue (le
couplage de la théorie sur réseau est le couplage effectif à l’échelle de la maille du réseau a, donc selon la liberté
asymptotique, g02 = g2 (Λ = 1/a) → 0), et permettent même de déterminer numériquement le coefficient κ, ou
tension de corde.
La QCD est toujours un sujet d’étude très actif. Les interactions fortes sont en effet omni-
présentes et l’observation de toute autre interaction, de tout autre effet, présuppose une connais-
sance aussi précise que possible de la contribution forte. Dans l’analyse des données de LHC

7. David J. Gross, H. David Politzer, Frank Wilczek, prix Nobel 2004

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

174 Chap.5. Théories de jauge. Modèle standard

les calculs des contributions de QCD gardent une importance fondamentale : la “nouvelle phy-
sique” ne pourra être identifiée que si le fonds du Modèle Standard est parfaitement connu. De
plus, l’étude de l’hadronisation des quarks et gluons, de la diffusion profondément inélastique et
d’autres phénomènes hadroniques demeure un sujet très “chaud” et un point-clé où la théorie
se confronte à l’expérience.

5.3.2 Le secteur électro-faible, une esquisse.

La théorie de jauge de groupe SU(2) × U(1) décrit les interactions électro-faibles (modèle
de Glashow–Salam–Weinberg 8 ). On parle parfois d’isopin faible et d’hypercharge faible pour
désigner les générateurs de ces groupes SU(2) et U(1). Nous nous contenterons de présenter les
grandes lignes de la construction, sans bien expliquer les raisons qui ont conduit aux choix de
groupes, de représentations etc.
Appelons Aaµ , Wµi et Bµ les champs de jauge de SU(3), SU(2) et U(1) respectivement. Les
quarks et leptons gauches, ψL := 12 (1−γ5 )ψ, et droits, ψR := 21 (1+γ5 )ψ, sont couplés aux champs
Wµ et Bµ de façon différente. On peut écrire la dérivée covariante de l’un de ces champs selon
g1
Dµ ψ = (∂µ − g3 Aaµ Ta − g2 Wµj tj − i yBµ )ψ (5.34)
2
où Ta , resp. tj denotent des générateurs infinitésimaux antihermitiens de SU(3) et SU(2) dans
la représentation de ψ ; les représentations assignées à chaque champ, lepton ou quark, gauche
ou droit, sont la représentation triplet de SU(3)c pour les quarks et la triviale pour les leptons,
bien sûr, et pour la partie électro-faible, données dans la Table ci-dessous.
Une conséquence remarquable de l’utilisation de SU(2) comme groupe de symétrie des
interactions faibles est qu’en plus des deux courants chargés Jµ1,2 (ou Jµ± ) de la théorie de
Fermi apparaı̂t une troisième composante Jµ3 . Ce courant neutre, qui n’est pas le courant
électromagnétique et qui est couplé au champ de jauge W3µ , est nécessairement présent et contri-
bue par exemple à la diffusion e− νµ → e− νµ interdite dans la théorie de Fermi. La découverte
expérimentale de ces courants neutres (1973) 9 a été la première confirmation de la validité du
Modèle Standard.

Quarks & Leptons (νLe , eL ) νRe eR (uL , dL ) uR dR

Isospin faible tz ( 12 , − 12 ) 0 0 ( 21 , − 21 ) 0 0
1 1 4
Hypercharge faible y (−1, −1) 0 −2 (3, 3) 3
− 23
Charge électrique Q = 12 y + tz (0, −1) 0 −1 ( 23 , − 31 ) 2
3
− 13

Table 1. Nombres quantiques faibles des leptons ν e et e et des quarks u, d.

Les choses se répètent à l’identique pour les autres générations.

Le groupe U(1)em de l’électromagnétisme va maintenant être identifié par les charges des
champs. C’est un “mélange” du facteur U(1) initial et d’un sous-groupe U(1) de SU(2). Ce
8. S. Glashow, A. Salam, S. Weinberg, prix Nobel 1979
9. En lire l’histoire dans [Link]

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

5.3. Le modèle standard 175

mélange est caractérisé par un angle θW , dit angle de Weinberg : si on note Bµ et Wµ les
champs de jauge des groupes U(1) et SU(2) respectivement, le champ électromagnétique est
Aem
µ = cos θW Bµ + sin θW Wµ3 , la combinaison orthogonale correspondant à un autre champ
vectoriel nommé Z 0 .
Examinons les termes de “courant neutre” couplant par exemple l’électron et son neutrino aux bosons
neutres W 3 et B. On les lit sur les dérivées covariantes (5.34) avec les nombres quantiques de la Table 1
1
i ēL (−g2 Wµ3 − g1 Bµ )γ µ eL + ēR (−2g1 Bµ )γ µ eR + ν̄e (g2 Wµ3 − g1 Bµ )γ µ νe

2
La rotation W 3 = cos θW Z 0 + sin θW A, B = − sin θW Z 0 + cos θW A doit être telle que la charge électrique e
(couplage au A) est la même pour eL et eR et nulle pour νe . Il vient

2e = g2 sin θW + g1 cos θW = 2g1 cos θW et g2 sin θW − g1 cos θW = 0

qui sont bien compatibles et fournissent

g1
tan θW = e = g1 cos θW = g2 sin θW . (5.35)
g2
Le résultat de ce calcul ne dépend bien sûr pas de la représentation à laquelle on l’applique. A ce stade
nous n’avons fait qu’un changement de paramètres, (g1 , g2 ) 7→ (e, θW ) mais ces derniers sont physiquement
observables.

Le lagrangien contient aussi un!couplage à un champ bosonique, supposé être un dou-

φ+
blet complexe de SU(2) Φ = (isospin faible 21 , hypercharge faible y = +1), et donc
φ0
Dµ Φ = (∂µ − ig2 Wµi τ2i − 2i g1 Bµ )Φ. Le champ Φ est doté d’un potentiel V (Φ) en “chapeau mexi-
cain”, responsable de la brisure spontanée de SU(2) × U(1) en U(1)em , et donc de l’apparition
des masses des champs vectoriels selon le mécanisme décrit au § 5.2.2, et même de celle des
fermions. Ce champ (2 composantes complexes, donc 4 hermitiennes) voit trois de ces com-
posantes disparaı̂tre au profit des modes longitudinaux des champs de jauge devenus massifs.
Une seule des quatre composantes demeure, et c’est le boson de Higgs que cette composante ϕ
crée qui a été découverte en 2012 dans les expériences ATLAS et CMS du LHC. En parallèle,
trois des quatre champs de jauge, les W ± et le Z 0 , deviennent massifs, le quatrième, le champ
électromagnétique A demeurant de masse nulle.
La brisure de la symétrie SU(2) × U(1) par le champ Φ s’effectue dans une direction qui préserve U(1)em .
(Ou plus exactement c’est la direction de cette brisure qui détermine ce qu’on appelle U(1)em .) On écrit, en
j
généralisant (5.30) au groupe SU(2) de générateurs i τ2 (τ j = matrices de Pauli)
!
j
iξj (x) τ2v 0
Φ(x) = e v+ϕ(x) ,
√
2

que l’on accompagne d’une transformation de jauge, ce qui fait disparaı̂tre les champs ξj et donne pour les
champs W et B la forme quadratique (termes de masse)
1 2
v [(g1 B − g2 W 3 )2 + g22 ((W 1 )2 + (W 2 )2 )]
L(2) =
8
p
C’est bien comme attendu la composante Z 0 = (g1 B − g2 W 3 )/ g12 + g22 qui devient massive, ainsi que W 1,2 ,
p
tandis que la combinaison orthogonale A = (g2 B + g1 W 3 )/ g12 + g22 demeure de masse nulle. On trouve
1 1
q
MW ± = vg2 MZ 0 = v g12 + g22 (5.36)
2 2

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

176 Chap.5. Théories de jauge. Modèle standard

G g22
et en utilisant (5.35), la relation √
2
= 8MW 2 qu’on lit sur le lagrangien et la valeur expérimentale de e et de
G = 10−5 m2p
38 MW 38
MW ± ≈ GeV MZ 0 = ≈ GeV .
sin θW cos θW sin θW cos θW
Ces expressions subissent ensuite de petites corrections perturbatives. Enfin la masse du fameux boson de Higgs
ϕ n’est pas prédite par la théorie. Des expériences successives ont progressivement exclu des domaines de masses
de plus en plus étendus, en réduisant la “fenêtre” possible de 100–200 GeV à 120–130 GeV. Les résultats de
l’été 2012 ont finalement identifié une particule de masse 125.9 ± 0.4 GeV, et les déterminations de son spin,
de ses modes de désintégration, etc, semblent confirmer qu’il s’agit bien de la particule de Higgs attendue. Voir
les cours de P. Binétruy et P. Fayet au second semestre pour plus de détails.
Les “bosons intermédiaires” associés aux champs vectoriels massifs W ± et Z 0 ont été
découverts expérimentalement dès la fin des années 70 10 ; ils ont des masses MW ± = 80.4 GeV
et MZ 0 = 91.2 GeV compatibles avec une valeur de l’angle de Weinberg donnée par

sin2 θW ≈ 0.23 , (5.37)

également compatible avec tous les autres résultats expérimentaux.

Au total, le lagrangien décrivant toutes les interactions en dehors de la gravitation a la

forme remarquablement simple et compacte

1 X
L = − Fµν Fµν + ψ̄γ µ Dµ ψ + |DΦ|2 − V (Φ) + Higgs − fermions couplings , (5.38)
4 lef t et right
quarks & leptons

où Fµν désigne les trois tenseurs de champs de jauge A, W et A. Noter que l’invariance
SU(2) × U(1) interdit les couplages entre fermions gauches et droits (qui se transforment sous
des représentations différentes), et donc interdit des termes de masse. La seule échelle de masse
se trouve dans V (Φ), et ce sont le mécanisme de Higgs et le couplage du champ Φ aux fermions
–leptons et quarks– qui donnent lieu à l’apparition des masses de fermions et de (certains)
bosons-vecteurs. Ce couplage, dit de Yukawa, est de la forme générale, (écrite ici pour les
quarks),
e † uRj + h.c. ,
LY = −Yijd ψ̄Li .Φ dRj − Yiju ψ̄Li .Φ (5.39)

avec des matrices a priori arbitraires Yijd , Yiju : i, j = 1, 2, 3 sont des indices de génération, le
!
0†
e† = φ
point dénote le produit scalaire des doublets d’isospin Φ et Φ avec les doublets
−φ+†
des quarks ! ! ! ! !
ui u c t
ψLi = = , , .
di d s b
L L L L

Des couplages du même type apparaissent entre leptons et champs scalaires.

√
La vev v/ 2 du champ φ0 donne alors naissance à une “matrice de masse”. Une complication
de la théorie décrite par (5.38) est que la diagonalisation de cette matrice de masse des quarks
fait intervenir une rotation par une matrice unitaire de (uL , cL , tL ) et de (dL , sL , bL ) par rapport

10. Carlo Rubbia et Simon van der Meer, prix Nobel 1984

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

5.4. Compléments 177

à la base couplée aux champs de jauge dans (5.38) : si (uL , cL , tL ) et (dL , sL , bL ) désignent
maintenant les états propres de masse, le courant hadronique chargé couplé au champ W + est
 
d
Jµ = (ūc̄t̄)L γµ M s (5.40)
 

b L

avec M la matrice unitaire de Cabibbo-Kobayashi-Maskawa 11 . Ce mécanisme généralise à 3

générations le mélange par l’angle de Cabibbo rencontré au chapitre 4, (équ. (2.20)) dans le cas
de 2 générations. On écrit la matrice M sous la forme
   
Vud Vus Vub c12 c13 s12 c13 s13 e−iδ
M =  Vcd Vcs Vcb  = −s12 c23 − c12 s23 s13 eiδ c12 c23 − s12 s23 s13 eiδ s23 c13 
   

Vtd Vts Vtb s12 s23 − c12 c23 s13 eiδ −c12 s23 − s12 c23 s13 eiδ c23 c13

avec 4 angles δ et θij , (cij = cos θij et sij = sin θij ), et θ12 = θC = angle de Cabibbo.
Expérimentalement 0 θ13 θ23 θ12 π/2. La mesure précise des éléments de matrice
de M est actuellement l’objet d’une activité intense, en relation avec l’étude de la violation de
la symétrie CP (due en grande partie à la phase eiδ ) et des “oscillations de saveurs”.
C’est tout un cours qui serait nécessaire pour rendre compte des détails et des succès du
modèle standard, cf les cours du 2ème semestre. . .

5.4 Compléments
5.4.1 Modèle standard et au delà.
Le modèle standard est à la fois remarquablement vérifié et peu satisfaisant. En dehors de
la présence de neutrinos massifs, dont on est maintenant convaincu et qui nécessite de petits
amendements au lagrangien (5.38), on n’a à ce jour observé aucun désaccord significatif entre les
résultats expérimentaux et les prédictions du modèle. Les aspects non satisfaisants du modèle
standard sont pourtant nombreux : le nombre jugé excessif (une vingtaine) de paramètres libres
dans le modèle, le manque de “naturel” de la façon dont certains termes doivent être ajustés
de façon extrêmement fine ; la question du mécanisme B-E-H qui semble être confirmé par la
découverte du boson de Higgs, mais que certains physiciens considèrent comme une construction
ad hoc ; etc.
Il faut mentionner les tentatives d’améliorer le modèle standard en fusionnant les 3 groupes
de jauge au sein d’un plus grand groupe d’une théorie “grand-unifiée” (GUT en anglais ;-). On
y consacre le paragraphe suivant.
Les extensions les plus en vogue du modèle standard sont en définitive celles basées sur la
supersymétrie. Le “MSSM”, (“Maximally Supersymmetric (extension of the) Standard Model”),
ou le “NMSSM” (“Next-to- . . .”), résolvent le problème de hiérarchie, prédisent une convergence
11. M. Kobayashi, T. Maskawa, prix Nobel 2008, avec Y. Nambu

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

178 Chap.5. Théories de jauge. Modèle standard

effective
g1
couplings

g1 g

2 15 mass scale µ (GeV)

10 10
.

Figure 5.2 – Évolutions schématisées des 3 couplages effectifs du modèle standard et de celui de la
théorie grand-unifiée.

des couplages électro-faibles et fort à haute énergie (voir ci-dessous), et prédisent aussi l’exis-
tence de partenaires supersymétriques pour toutes les particules connues. Les résultats à venir
prochainement du LHC pourraient valider ou contre-dire tel ou tel modèle. . .

5.4.2 Théories grand-unifiées ou GUTs

L’observation que les trois constantes de couplage g1 , g2 , g3 semblent à partir de leurs valeurs mesurées aux
énergies actuelles converger sous l’effet du groupe de renormalisation vers une valeur commune à une énergie
d’environ 1015 ou 16 GeV a été une forte incitation dans le sens d’une grande unification, voir Fig. 5.2. La théorie
grand-unifiée qui en résulte doit non seulement être une théorie de jauge dotée d’un seul couplage si le groupe
d’unification G est simple, mais aussi être capable de prédire le contenu en champs et particules de matière
selon les représentations de SU(3)× SU(2)× U(1) à partir de représentations du groupe G. Pour des raisons
variées, le groupe SU(5) est le meilleur candidat. Cette GUT possède dim SU(5)= 24 champs de jauge.
La raison principale du choix de SU(5) vient du nombre de fermions chiraux par génération. Chaque
génération du Modèle Standard contient deux saveurs de quarks venant chacune en 3 couleurs, plus un lepton,
et chacun de ces 6+1 champs peut avoir deux chiralités, plus un neutrino supposé de masse nul et chiral. Au
total il y a 15 fermions chiraux par génération. (Se rappeler que l’antiparticule d’un fermion droit est gauche :
on peut se contenter de raisonner sur des fermions gauches.) On cherche donc un groupe G simple possédant
une représentation (réductible ou irréductible) de dimension 15 pouvant regrouper tous les fermions gauches
de chaque génération. Le seul candidat est en définitive le groupe SU(5) qui possède des représentations de
dimension 15 : la représentation tensorielle symétrique, et des représentations somme de 5 (ou 5̄) et 10 (ou 10).
Le groupe SU(5) des matrices unitaires 5 × 5 contient un sous-groupe SU(3) (sous-matrices 3 × 3 du coin
supérieur gauche), un sous-groupe SU(2) (blocs 2 × 2 du coin inférieur droit), ce qui donne les générateurs
correspondants de SU(3) × SU(2) ; le sous-groupe U(1) est engendré par la matrice diagonale et de trace nulle
diag (− 31 , − 13 , − 13 , 21 , 12 ). Il est clair que ces trois groupes commutent entre eux.
Il faut alors décomposer tous les champs (les représentations 5, 10, 15 et 24) en représentations de SU(3) ×
SU(2). Cet exercice montre que la représentation 15 est à écarter et que la représentation réductible 5̄ ⊕ 10 est
la représentation appropriée pour les champs de fermions : la 5̄ se décompose en représentations (3̄, 1) ⊕ (1, 2) et
contient les antiquarks d¯L et les leptons gauches e− L et νe ; la 10 se décompose en (1, 1) ⊕ (3, 2) ⊕ (3̄, 1) contenant
le lepton gauche e+ L singlet de SU(2) et de SU(3), les deux quarks gauches uL , dL qui forment un doublet de

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

5.4. Compléments 179

SU(2) et les antiquarks ūL .

De même, les 24 champs de jauge incorporent les 8 champs de gluons, les 3+1 vecteurs du secteur électro-
faible, plus 12 champs supplémentaires, qui acquièrent une masse très grande lors de la brisure attendue de
SU(5) → SU(3) × SU(2) × U(1).
La brisure SU(5) → SU(3) × SU(2) × U(1) devrait intervenir à une énergie de grand-unification de l’ordre de
1015 ou 1016 GeV, énergie à laquelle les couplages g3 , g2 , g1 de SU(3), SU(2) et U(1) semblent converger (Fig.
5.2). Les générateurs infinitésimaux étant maintenant rigidement liés au sein du groupe simple SU(5), on peut
relier la charge électrique et le couplage au champ de jauge de SU(2) et prédire l’angle de Weinberg : on trouve
que sin2 θ = 83 , . . . mais ce calcul s’applique à l’énergie d’unification ! L’angle est renormalisé entre cette énergie
et les énergies de la physique actuelle.
Une conséquence frappante de l’unification quarks–leptons au sein de multiplets est la violation des conser-
vations séparées des nombres leptonique et baryonique. En particulier, l’existence de termes d’interaction, par
exemple X ρ (dγ¯ ρ e+ + ūc γρ u), avec un des champs de jauge supplémentaires (les matrices des générateurs sont
omises), permet la désintégration du proton p = d uu → dde ¯ + = π 0 e+ , et par d’autres canaux encore. Il faut
donc calculer soigneusement si le taux de désintégration est compatible avec les données expérimentales sur la
durée de vie du proton (borne actuelle 1032±1 ans), . . . ce qui n’est pas le cas !
Il faudrait encore montrer dans quelle représentation se placent les champs bosoniques de Higgs pour
permettre la brisure en deux étapes SU(5) → SU(3)×SU(2)×U(1) → SU(3)×U(1) à deux échelles extrêmement
différentes.

Au final, la GUT SU(5)

– incorpore par construction la structure des générations de fermions ;
– place dans une même représentation leptons et quarks et explique donc la commensurabilité de leurs
charges électriques et la compensation des anomalies (voir § suivant) ;
– réduit le nombre de paramètres du modèle standard et prédit la valeur de l’angle de Weinberg (à l’échelle
d’unification) ;
mais à l’inverse
– elle n’explique pas le pourquoi des trois générations observées ;
– elle n’élucide pas la question du “naturel” (que nous avons juste évoquée) ni celle reliée de la “hiérarchie”
(pourquoi le rapport MGU T /MW est-il aussi grand ?) ;
– enfin, défaut fatal, elle prédit des effets tels la désintégration du proton à des taux qui semblent incom-
patibles avec les observations.
C’est ce dernier point qui a conduit à abandonner ce schéma d’unification et à lui préférer des voies super-
symétriques.

5.4.3 Anomalies
(5)
On a mentionné au chapitre 4 l’existence des anomalies chirales, affectant le courant axial Jµ de la symétrie
classique U(1). Dans la théorie de jauge du Modèle Standard, les champs de jauge électro-faibles sont couplés
de façon différente aux fermions gauches et droits, autrement dit, ils sont couplés aux courants axiaux, cf le
lagrangien
(1 − γ5 )
L = iψ̄(/∂ − A)
/ ψ
2
qui contient un terme Aµa Jµa avec Jµa = ψ̄Ta (1−γ 2
5)
ψ. Classiquement ce courant Jµa devrait avoir une dérivée
covariante (dans la représentation adjointe) nulle si la masse des fermions s’annule. On peut à nouveau effectuer
le calcul de la divergence (covariante) de ce courant à l’ordre à une boucle, et on trouve que
i 1
Dµ J µ = 2
∂µ µνρσ tr Ta (Aν ∂ρ Aσ + Aν Aρ Aσ ) .
24π 2
Curieusement le membre de droite n’est pas invariant de jauge (mais sa forme ne doit rien au hasard et est
dictée par des considérations géométriques que nous ne discuterons pas). L’anomalie de ce courant “non-singlet”

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

180 Chap.5. Théories de jauge. Modèle standard

(c’est-à-dire portant une représentation non triviale du groupe de jauge) brise donc l’invariance de jauge. Ce
faisant elle met en danger toute la cohérence, renormalisabilité et unitarité, de la construction de la théorie. On
conçoit que le contrôle de cette anomalie soit crucial pour la construction d’une théorie physique.
Or on constate que le coefficient “groupiste” de l’anomalie est proportionnel à

dabc = tr (Ta {Tb , Tc })

où {Tb , Tc } est l’anticommutateur des générateurs infinitésimaux, cf Exercice B.3.

En pratique on s’assure de l’annulation de l’anomalie dans deux cas :
– Supposons que les fermions appartiennent tous à des représentations réelles ou pseudoréelles. On rappelle
(cf chap 2) que l’on désigne ainsi les situations où la représentation est équivalente à sa représentation
conjuguée, Ta∗ = CTa C −1 . On s’est placé dans des représentations unitaires où les Ta sont antihermitiques,
Ta = −Ta† = −TaT ∗ . On vérifie alors (cf Exercice B.3) que le coefficient groupiste dabc = −dabc = 0 s’annule
et l’anomalie avec lui. Ainsi les théories (quadridimensionnelles) de groupe SU(2) (dont les représentations
sont réelles ou pseudoréelles) n’ont pas d’anomalie.
– Une autre situation est celle où il y a compensation des anomalies venant des différentes représentations
portées par les fermions. C’est ce qui se passe dans le modèle standard. Selon l’argument du a), il n’y
a pas d’anomalie associée aux seuls courants d’isospin faible, couplés au champ de jauge SU(2). Mais il
peut a priori y en avoir avec les courants d’hypercharge faible (groupe U(1)), ainsi que des anomalies
mixtes, par exemple 1 courant U(1) et deux SU(2) etc. Il faut donc vérifier que pour tous les choix de trois
générateurs indexés par a, b, c, la constante dabc s’annule quand on somme sur toutes les représentations
de fermions. En définitive, on montre que tout se réduit à l’annulation de tr (t23 Q) pour chaque génération,
qui est bien satisfaite. C’est encore ce qui se passe pour la théorie SU(5) discutée au § précédent : on
montre que pour chaque génération, les contributions des représentations 5̄ et 10 se compensent.
[Quelques sujets qui auraient dû être traités dans ce cours
– –Instantons topologiques
– –Choix du Higgs, schémas de brisure, monopôles
– –. . .
] [Martin L. Perl, Frederick Reines Nobel Prize in Physics 1995 Leon M. Lederman, Melvin Schwartz, Jack
Steinberger, 1988 Nobel Prize in Physics Georges Charpak, 1992 Nobel Prize in Physics James Watson Cronin,
Val Logsdon Fitch, 1980 Nobel Prize in Physics]

Références additionnelles pour le Chapitre 5

Sur les aspects géométriques des théories de jauge et une introduction à la théorie des
fibrés, voir par exemple M. Daniel et C. Viallet, The geometric setting of gauge theories of the
Yang-Mills type, Rev. Mod. Phys. 52 (1980) 175-197.
Sur les théories de jauge, Yang-Mills, le modèle standard, etc, on peut consulter tout livre
de théorie quantique des champs postérieur à 1975, par exemple [IZ], [PS], [Wf], [Z-J].
Sur les aspects “groupistes” des théories de jauge, voir L. O’Raifeartaigh, op. cit..
Une très bonne revue de la grand-unification est donnée dans Introduction to unified theories
of weak, electromagnetic and strong interactions - SU(5), A. Billoire et A. Morel, rapport Saclay
DPh-T/80/068, disponible sur le site du Master ICFP.

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

5.4. Compléments 181

Pour une revue détaillée du Modèle Standard et une compilation de toutes les propriétés
connues des particules élémentaires, voir The Review of Particle Physics, sur http ://[Link]/
déjà cité au Chap. 4.

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

182 Chap.5. Théories de jauge. Modèle standard

Exercices et Problèmes pour le chapitre 5

A. Champ de jauge non abélien
1. Compléter les démonstrations de (5.21) et de (5.22).
2. Pour un champ de jauge non abélien A, soit F son tenseur de champ. Montrer que la dérivée covariante
de F est telle que
Dµab Fνρb ta = [Dµ , Fνρ ] = ∂µ Fνρ − [Aµ , Fνρ ] .

Démontrer alors l’identité

[Dµ , Fνρ ] + [Dν , Fρµ ] + [Dρ , Fµν ] = 0 .

Rappeler quelle est la version abélienne de cette identité et son interprétation. [Cas abélien : la 2-forme
1 µ ν ~
2 Fµν dx ∧ dx est fermée, ce qui est équivalent aux équ de Maxwell divB = 0, rotE + ∂B/∂t = 0]

3. Soit l’opérateur D ∂ −A
/ =/ / agissant sur des fermions de Dirac dans la représentation R. On veut calculer
/ . En écrivant Dµ Dν γ γ = 21 Dµ Dν {γ µ , γ ν } + 12 [Dµ , Dν ]γ µ γ ν , montrer qu’on peut écrire D
D 2 µ ν
/ 2 comme
i
somme de D2 = Dµ Dµ et d’un terme de la forme aFµν σ µν , où σ µν = 2 [γ µ , γ ν ]. Calculer a.

B. Facteurs groupistes. . .

1. Opérateurs de Casimir
Soient G un groupe de Lie simple et compact de dimension d, R une de ses représentations, que l’on
suppose irréductible et unitaire. Soient ta une base de l’algèbre de Lie g de G, Ta ses représentants dans
la représentation R. Les ta et Ta sont choisis antihermitiens. On considère alors la forme bilinéaire sur
l’algèbre de Lie définie par
(X, Y )(R) = tr (Ta Tb )xa y b

si X = xa ta et Y = y b tb ∈ g (avec sommation sur les indices répétés).

(a) Démontrer que cette forme est invariante en ce sens que

∀Z ∈ g ([X, Z], Y )(R) + (X, [Y, Z])(R) = 0 .

[conséquence de la cyclicité de la trace] On rappelle que toute forme bilinéaire invariante sur une
algèbre de Lie simple est proportionnelle à la forme de Killing.
(b) Démontrer que l’on peut choisir une base des ta et donc des Ta telle que

tr (Ta Tb ) = −TR δab

avec TR un coefficient dépendant de la représentation. [La forme de K. est symétrique et déf

< 0, (g simple et compacte), donc on peut par une transformation orthogonale réelle, choisir
une base t.q. (ta , tb ) = −κδab , κ > 0 arbitraire. Par le théorème rappelé plus haut, on a alors
(Ta , Tb )(R) = −TR δab .]
(c) Quel est le signe de TR ? [Les matrices T sont antihermitiennes (même après le changement de
base) donc TR > 0.]
(d) On considère alors l’opérateur de Casimir quadratique

(R)
X
C2 =− (Ta )2 .
α

Sur combien de valeurs de a somme-t-on dans cette expression ? [d = dim g. ]

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

Exercices et Problèmes du Chapitre 5 183

(R)
(e) Rappeler pourquoi C2 est un multiple de l’identité dans l’espace de représentation de R
(R)
C2 = c2 (R) I .
(R)
[C2 commute avec tous les générateurs de g dans l’irrep R donc (lemme de Schur) c’est un
multiple de l’identité.]
(f) En quoi les hypothèses de simplicité de G et d’irréductibilité de R sont-elles importantes pour ce
(R)
résultat ? [Si R n’est pas irréductible, elle est complètement réductible (car unitaire) et C2 est
multiple de l’identité dans chaque sous-espace invariant. (Si G n’est pas un groupe de Lie simple
mais semi-simple, g = ⊕gi et la normalisation des générateurs est indépendante dans chaque ss-alg
gi . L’opérateur de Casimir quadratique n’est plus unique à un facteur près.)]
(R)
(g) Quel est le signe de c2 (R) ? Justifier. [Prenant la trace de la relation, on a tr C2 = c2 (R) dim R =
−tr a Ta2 = tr a Ta Ta† > 0 donc c2 (R) > 0.]
P P

(h) Montrer que TR est relié à la valeur de l’opérateur de Casimir quadratique c2 (R). Pour cela, on
pourra calculer de deux façons différentes la quantité
X
tr (Ta )2 .
a

(R)
Ta2 = −TR dim G =
P
[tr a −tr C2 = −c2 (R) dim R donc TR = c2 (R) dim R/ dim G.]
(i) À quoi se réduit cette relation pour la représentation adjointe de G ? [dim adj = dim G donc
T (adj) = c2 (adj). ]
(j) On normalise les générateurs (antihermitiens) de SU(N ) à être tels que dans la représentation de
définition tr Ta Tb = − 21 δab , soit Tf = 21 . Cela est-il bien vérifié par les générateurs infinitésimaux
i σ2a de SU(2) ? Quelle est alors la valeur de c2 dans cette représentation de définition ? [La repré-
sentation de définition est la représentation fondamentale f de dim N (qui sert à définir le groupe
2
SU(N ) de matrices N × N unitaires unimodulaires). Si Tf = 12 , dim(f ) = N , et c2 (f ) = N2N−1 ]

2. Calculs de traces et de Casimir dans les représentations de SU(N )

(a) Montrer que l’expression (3.50) du chap. 3, c2 (Λ) = 12 h Λ, Λ + 2ρ i, se récrit
c2 (Λ) = 21 (h Λ + ρ, Λ + ρ i − h ρ, ρ i i), soit pour SU(N ), en utilisant les expressions (3.48) et (3.61)
du Chap. 3
 
N −1 N −1
1 X X
c2 (Λ) = [(λi + 1)2 − 1]i(N − i) + 2 [(λi + 1)(λj + 1) − 1]i(N − j) .
2N i=1 j=i+1

P i(N −j)
[petit calcul sans malice utilisant ρ = Λi et hΛi , Λj i = N si i ≤ j. ]
(b) Calculer cette expression pour la représentation de définition. La valeur obtenue est-elle en accord
avec celle trouvée à la question 1.(j) ci-dessus ? [La représentation de définition a pour poids le plus
haut Λ = Λ1, le premier poids fondamental. En faisant λi = δi1 dans la formule précédente, il vient
1
PN −1
c2 (f ) = 2N 3(N − 1) + 2 j=2 (N − j) = · · · = (N 2 − 1)/2N , en accord avec le 1.j). ]
(c) Rappeler pourquoi le poids le plus haut de la représentation adjointe est la plus haute racine (notée
θ dans l’appendice F du chap 3). Pourquoi l’expression θ = Λ1 + ΛN −1 est-elle en accord avec ce
qu’on sait de la représentation adjointe ? [θ est un poids dominant, c’est le plus haut poids d’une
irrep, dont on peut calculer la dimension par la formule (3.20) (corrigée !) ; on trouve dim = N 2 − 1,
en accord avec le fait que c’est la représentation adjointe. θ = Λ1 +ΛN −1 reflète le fait que l’adjointe
est engendrée par les tenseurs de f ⊗ f¯ de trace nulle, cf fin du §4.2 du chap 3.]
(d) Calculer la valeur de c2 (Λ) pour la représentation adjointe. [Avec θ = Λ1 + ΛN −1 , la formule du a)
donne
 
N −2
1  X X
c2 (θ) = 3(N − 1) × 2 + 2 (2 − 1)(N − j) + 2 (2 − 1)i + 2 × 3 = 2N 2 /2N = N
2N j=2 i=2

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

184 Chap.5. Théories de jauge. Modèle standard

où on a explicité successivement les termes diagonaux i = 1 ou N − 1, puis les termes i = 1,

j = 2, · · · , N − 2, les termes i = 2, · · · , N − 2, j = N − 1, et enfin le terme i = 1, j = N − 1. ]
P
(e) Vérifier cette valeur pour SU(2) par le calcul direct de c2 (adj). [Pour SU(2), on a bien acd bcd =
2δab , c2 (adj) = 2.]
(f) Quelle est la valeur de Tadj qu’on en déduit, au vu de la question 1.(i) ? [Tadj = N .]

3. Coefficients des anomalies

Avec les mêmes notations et conventions que précédemment,

(a) Dans le calcul de certains diagrammes de Feynman dans une théorie de jauge sur le groupe G, on
rencontre le coefficient
dαβγ = tr (Tα (Tβ Tγ + Tγ Tβ )) .

Montrer que dαβγ est complètement symétrique dans ses trois indices. [par symétrie explicite en β
et γ, et cyclicité de la trace]
(b) On rappelle que la représentation est dite réelle ou pseudoréelle si elle est (unitairement) équivalente
à sa conjuguée, donc si dans la base où les Tα sont antihermitiens, on peut trouver une matrice
unitaire U telle que le complexe conjugué de chaque Tα vérifie

(Tα )∗ = U Tα U −1 .

Montrer que si cette condition est satisfaite, dαβγ est identiquement nul. Cette condition est im-
portante pour assurer la cohérence
de la théorie de
jauge, c’est la condition de compensation
∗ des
† † † † † T T T T T ∗
anomalies. [On a dαβγ = −tr Tα (Tβ Tγ + Tγ Tβ ) = −tr Tα (Tβ Tγ + Tγ Tβ ) = −dαβγ et si
les (Tα )∗ = U Tα U −1 , dαβγ = d∗αβγ , donc dαβγ = 0. ]
(c) La représentation de spin 12 de SU(2) est-elle pseudoréelle ? Celle de spin j ? Justifier votre réponse.
[La représentation de spin 21 est pseudoréelle. Celle de spin j l’est ssi j est demi-entier.]
(d) Donner deux exemples de représentations (pas nécessairement irréductibles) non triviales de SU(3)
qui sont pseudoréelles, et deux qui ne le sont pas. [Les représentations 3 et 3̄ ne sont pas réelles, ni
les 10 et 10 ; les représentations 3 ⊕ 3̄ ou 8 sont réelles ou pseudoréelles. ]
(e) Que vaut le coefficient d pour le groupe U(1) et une représentation de charge q ? [Le générateur
(hermitien) dans la représentation de charge q est égal à qI, donc d = 2q 3 ]

C. Brisure spontanée de SU(2)

~ de spin 1, considéré comme
On considère une théorie de jauge de groupe SU(2) couplée à un champ de bosons Φ
~ 2
un vecteur de dimension 3. On note V (Φ ) le potentiel de ce champ.
~ µ et Φ.
1. Écrire le lagrangien et les transformations de jauge des champs A ~

2. On suppose qu’il y a brisure

  spontanée de symétrie : le champ Φ acquiert une vev v selon une direction,
0
~
par exemple 3 : h Φ i = 0. Quel est le groupe de symétrie résiduel ? Quel sera l’effet sur le champ Aµ ?
 

v
Décrire les champs et particules physiques après brisure de symétrie.

Problème I. Théories de jauge sur réseau

Dans tout ce problème, G désigne un groupe de Lie compact, χ(ρ) le caractère de sa représentation irréductible
unitaire ρ.

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

Exercices et Problèmes du Chapitre 5 185

1. Montrer que les relations d’orthogonalité des D(ρ) impliquent les formules suivantes :
Z
dµ(g) (ρ) 1 (ρ)
χ (g.g1 .g −1 .g2 ) = χ (g1 )χ(ρ) (g2 ) , (5.41)
G v(G) nρ
et Z
dµ(g) (ρ) δρ,σ (ρ)
χ (g.g1 )χ(σ) (g −1 .g2 ) = χ (g1 .g2 ) . (5.42)
G v(G) nρ
Rappeler pourquoi une représentation de G peut toujours être considérée comme unitaire et montrer
qu’alors
χ(ρ) (g −1 ) = χ(ρ̄) (g) = (χ(ρ) (g))∗ , (5.43)

où ρ̄ est la représentation conjuguée de ρ. On fera un usage fréquent de ces trois relations dans la suite.

2. Soit χ le caractère d’une représentation réelle r (pas nécessairement irréductible) de G, β un paramètre

réel.
a) Montrer que l’on peut développer exp βχ(g) sur les caractères des représentations irréductibles de G
selon X
eβχ(g) = nρ bρ χ(ρ) (g) ,
ρ

avec des fonctions bρ (β). Exprimer la fonction bρ (β) à l’aide d’une intégrale sur le groupe. En utilisant
(5.43), montrer que les fonctions bρ (β) sont réelles, bρ (β) = (bρ (β))∗ = bρ̄ (β).
b) Montrer que bρ est non nul pourvu que la représentation ρ apparaisse dans une puissance tensorielle
r⊗n .
c) Pour G = SU(2) et r = (j = 21 ), la représentation de spin 21 , la condition du b) est-elle satisfaite pour
tout ρ ? Pourquoi ?
Si r = (j = 1), quelles sont les représentations pour lesquelles bρ est a priori nul ?
d) Pour G =SU(3) et χ = χ(3) + χ(3̄) , montrer que bρ est non nul pour tout ρ.
Pour β → 0, quel est le comportement dominant de ba (β) si a désigne la représentation adjointe de
SU(3) ? Plus généralement quel est le comportement dominant de bρ (β) où ρ est la représentation de plus
haut poids Λ = (λ1 , λ2 ) ?

3. On définit un modèle de mécanique statistique à d dimensions de la façon suivante. Sur un réseau

hypercubique de dimension d et de maille a, les degrés de liberté sont attachés aux liens entre sites voisins
et prennent leur valeur dans le groupe compact G. A chaque lien orienté ` = ij ~ on associe l’élément de
~ −1
G noté g` = gij , à −` = ji, on associe gji = g` . A chaque carré élémentaire (ou “plaquette”) p = ijkl,
on associe le produit des éléments des liens :

gp = gij .gjk .gkl .gli

et l’“énergie” d’une configuration de ces variables est donnée par

X
E=− χ(gp ) (5.44)
plaquettes p

où χ est, comme à la question 2, le caractère d’une certaine représentation réelle du groupe. Le poids de
Boltzmann est donc Y 1
e−βE = eβχ(gp ) , β=
p
kT

et la fonction de partition s’écrit

Y Z dµ(g` ) Y
Z= eβχ(gp ) . (5.45)
G v(G)
links ` plaquettes

a) Montrer que l’énergie E est invariante par redéfinition des gij selon gij 7→ gi .gij .gj−1 , où gi ∈ G,

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

186 Chap.5. Théories de jauge. Modèle standard

Figure 5.3 – Réseau carré à 2 dimensions.

(c’est une invariance locale, l’analogue dans ce formalisme discret de l’invariance de jauge étudiée dans
ce chapitre), et que E ne dépend pas de l’orientation des plaquettes.
b) On cherche à mieux comprendre la relation avec le formalisme du § 5.1. Les degrés de liberté gij
représentent les variables de chemin définies en (5.20), gij = g(j, i) le long de l’arête du site i au site j
Z
gij ≡ P exp Aµ dxµ
~
l=ij

– Pour une maille a du réseau petite, montrer en utilisant par exemple la formule de BCH et en
développant au premier ordre non nul que

gp = exp a2 Fµν + o(a2 )

où µ et ν désignent les directions du bord de la plaquette p. (On s’intéresse ici à une version euclidienne
de la théorie de jauge, et la position des indices µ, ν n’importe pas.) Montrer alors que l’énergie Ep
(5.44) s’écrit
Ep ∼ const. a4 (Fµν )2 + const.0
où on déterminera la première constante en fonction de la représentation choisie pour χ.
– Expliquer pourquoi le paramètre β s’identifie (à un facteur près) à l’inverse du couplage g2 de la théorie
de jauge continue. En fait il s’agit plutôt de la constante de couplage “nue” (ou non renormalisée),
pourquoi ?

On se restreint d’abord pour simplicité à d = 2 dimensions. Pour un réseau fini de N plaquettes, par
exemple un rectangle de taille L1 × L2 (voir Fig. 5.3), on désire calculer Z. On choisit des “conditions aux
bords libres”, autrement dit les variables g` des bords du rectangle sont indépendantes. On s’intéresse
aussi à la valeur moyenne W (σ) (C) de χ(σ) (gC ) où gC désigne le produit ordonné des g` le long d’une
courbe fermée orientée C pour une certaine représentation irréductible σ de G
Z Y
1 Y dµ(gl ) (σ) Y
W (σ) (C) := h χ(σ) (gC ) i = χ g` eβχ(gp ) . (5.46)
Z G v(G) p
liens ` `∈C

c) En utilisant les résultats de la question 2, montrer que l’on peut développer chaque exp βχ(gp ) sur
les caractères de représentations irréductibles de G selon
X
eβχ(gp ) = nρ bρ χ(ρ) (gp ) . (5.47)
ρ

d) On insère dans (5.45) ou (5.46) le développement (5.47) pour chaque plaquette. Montrer que si deux
plaquettes ont en commun un lien `, les formules de la question 1 permettent d’intégrer sur la variable
g` de ce lien et que les deux représentations portées par les plaquettes s’identifient alors.
En utilisant alors de façon répétée ces formules de la question 1, montrer que l’on peut intégrer sur toutes
les variables g` et que
A
N (σ) bσ
Z = b1 W (C) = nσ (5.48)
b1

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

Exercices et Problèmes du Chapitre 5 187

Figure 5.4 – Une configuration tubulaire contribuant à la boucle de Wilson.

où A désigne l’aire de la courbe C, c’est-à-dire le nombre de plaquettes qu’elle enserre, et l’indice 1 se
rapporte à la représentation identité.
e) On se place maintenant en dimension d = 3. Les variables g` sont attachées aux liens d’un réseau
cubique. L’énergie est toujours donnée par (5.44), où la somme court sur toutes les plaquettes de ce réseau
tridimensionnel. Comme précédemment, W (σ) (C) = h χ(σ) (gC ) i reçoit des contributions de configurations
de plaquettes formant une surface de bord C.
On va voir que peuvent contribuer aussi à W (σ) (C) des configurations de plaquettes formant un tube qui
s’appuie sur le contour C (Fig. 5.4).
– Montrer en effet que pour une telle configuration l’application répétée des formules (5.41) et (5.42) sur
toutes les variables g` conduit à l’expression suivante
X bρ P Z dµ(g)
(σ)
W (C) = χ(ρ) (g)χ(ρ) (g −1 )χ(σ) (g) (5.49)
tube
ρ
b 1 G v(G)

où P est le nombre de plaquettes constituant le tube.

– À quelle condition C sur la représentation σ de la boucle C la contribution de la représentation ρ au
membre de droite de (5.49) est-elle non nulle ?
– Donner un exemple pour G = SU(2) de représentations σ pour laquelle cette condition C n’est jamais
satisfaite quelle que soit ρ, et donc ces configurations tubulaires absentes.
– À l’inverse donner un exemple (toujours pour SU(2)) d’un choix possible de σ qui la satisfait.
On admettra qu’à haute température (β petit), la contribution dominante à W (σ) (C) est du type(5.49)
si la condition C peut être satisfaite, et du type (5.48) dans le cas contraire.

4. L’évaluation de la valeur moyenne de la “boucle de Wilson” W (σ) (C) dans la limite d’une grande boucle C
ayant la forme d’un rectangle R × T permet de calculer le potentiel Vσ (R) entre deux particules chargées
statiques séparées par la distance R, l’une portant la représentation σ du groupe et l’autre étant son
antiparticule. Plus précisément on admettra que
1
Vσ (R) = − lim log W (σ) (C) .
T →∞ T
Évaluer la dépendance de Vσ (R) en R qui découle soit de (5.48), soit de la contribution à (5.49) due à la
représentation ρ. Qu’en concluez-vous sur l’interaction entre les deux particules dans ces deux situations ?
Physiquement, ce type de considérations fournit un modèle discrétisé (sur réseau) et très simplifié ici (deux
ou trois dimensions, pas de quarks) de la chromodynamique quantique. On peut répéter ce calcul en dimension
plus élevée, où les résultats ci-dessus apparaissent comme le terme dominant dans un développement à β petit
(“haute température”). Le fait que la valeur moyenne ci-dessus décroisse comme xA (x = bσ /b1 < 1 pour β
assez petit) pour de grandes aires est un signal du “confinement des quarks” dans cette théorie, c’est-à-dire de
l’impossibilité de séparer une paire quark-antiquark à grande distance . . .

Problème II. Mécanisme de BEH

I. Modèle de Georgi–Glashow
Dans un article de 1972, H. Georgi et S. Glashow proposaient un modèle d’interactions électrofaibles basé sur
le groupe de jauge SO(3) avec un champ de Higgs se transformant comme un triplet sous ce groupe.

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

188 Chap.5. Théories de jauge. Modèle standard

1. Combien de champs de jauge possède un tel modèle ? (Rép. il y a dim(SO(3))=3 champs de jauge )
2. Le triplet de Higgs Φ = (φ+ , φ0 , φ− ) est supposé acquérir une “vev”

hΦi = v(0, 1, 0) .

Quel est le groupe H de symétrie résiduel ? (Rép. SO(3)→ H = SO(2) qui est le groupe de rotation
laissant invariant hΦi.)
3. Que peut-on dire du spectre de masse de la théorie, après la brisure de symétrie SO(3)→ H ? Quelle
est son interprétation physique ? (Rép. Deux champs vectoriels deviennent massifs, ce sont les “bo-
sons intermédiaires” des interactions faibles ; un champ demeure de masse nulle, le champ de jauge de
l’électromagnétisme SO(2)∼
= U(1). Un boson de Higgs de masse non nulle subsiste.)
4. Quelle est la différence majeure entre ce modèle et ce qui est devenu le modèle standard, en ce qui
concerne les interactions faibles ? Pouvez-vous citer une découverte expérimentale qui a permis d’écarter
rapidement ce modèle ? (Rép. Le modèle de GG ne possède pas de courants neutres, ni de boson de
jauge neutre, (comme le Z 0 ). La découverte expérimentale des courants neutres (1973) puis celle du Z 0
(en 1983) a scellé le sort du modèle de GG. )

II. Groupe de jauge SU(n)

On considère maintenant une théorie de jauge basée sur le groupe SU(n), avec des champs de jauge couplés
à un champ scalaire Φ.
1. Que peut-on dire du groupe de symétrie résiduel et des masses des champs vectoriels quand
(a) le champ scalaire se transforme selon une représentation fondamentale de dimension n et hΦi =
v (0, 0, · · · , 0, 1) ? (Rép. SU (n) → SU (n − 1), hence n2 − 1 − ((n − 1)2 − 1) = 2n − 1 gauge fields
become massive. )
(b) le champ scalaire se transforme selon la représentation adjointe et
hΦi = v diag (1, 1, · · · , 1, −n + 1) ? (Rép. SU (n) → H = SU (n − 1) × U (1) qui est le ss-groupe qui
commute avec hΦi. Donc 2n − 2 champs de jauge massifs. )
2. On introduit un champ Ψ de fermions se transformant aussi comme la représentation fondamentale de
dimension n (ou sa conjuguée). Quels termes de masse invariants sont possibles pour les fermions ? (Rép.
P
Les termes ψ̄ψ = α ψ̄α ψα sont invariants par U (n).)
3. Supposant que le champ scalaire se transforme selon la représentation adjointe,
(a) combien y a-t-il de couplages de type Yukawa (c’est-à-dire en Ψ̄ΨΦ) invariants indépendants ?
(Rép. Ψ se transforme comme la repr. f de dim n, Ψ̄ comme f¯ (aussi de dimension n), et Φ
comme l’adjointe. Mais on sait que Adj = f ⊗ f¯ − 1, il y a un seul couplage invariant possible.)
(b) Écrire les couplages possibles entre ce multiplet de fermions et le champ scalaire. (Rép. ψ̄i ψj Φij .
)
(c) Quels termes de masse additionnels pour les fermions résultent de la brisure de symétrie envisagée
Pn−1
au 1. ? (Rép. v i=1 ψ̄i ψi − vnψ̄n ψn . )

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

Index

action d’un groupe dans un ensemble, 61 charge baryonique, 20, 144, 174
adjointe, application, 45 charme, 153
adjointe, représentation, 76, 99, 105, 116, 118, Chevalley, base de, 114
123, 127, 135 chirale, symétrie, 143
algèbre, 42 classe d’homotopie, 37
algèbre de Lie, 42 classe de conjugaison, 33
algèbres de Lie de dimension 3, 61 classe par rapport à un sous-groupe, 34
α-chaı̂ne, 110 Clebsch-Gordan, coefficients de, 16, 74
alterné, groupe, 34 Clebsch-Gordan, décomposition de, 15, 72
anomalies, 143, 176, 178 cocycle, 84
axial, courant, 142 coefficients de Clebsch-Gordan, 16
axiale, transformation, 142 cohomologie d’un groupe, 84
commutant, 33
Baker-Campbell-Hausdorff, formule de, 46
commutateur dans un groupe, 45
beauté, 153
compact, 21, 40, 57
boost, 21
compact, localement, 57
boson intermédiaire, 166
compacte, algèbre de Lie, 49
Bratteli, diagramme de, 101
compensation des anomalies, 176, 178
brisure spontanée de symétrie, 140, 167
complètement réductible, représentation, 67
Brout–Englert–Higgs, mécanisme de, 167
complexe, représentation, 101
Burgoyne, identité de, 156
complexifiée, algèbre de Lie, 49
Cabibbo, angle de, 152 confinement de la couleur, 154, 169, 182
Cabibbo-Kobayashi-Maskawa, matrice de, 172 conforme, transformation, 62
caractère, 67 conjuguée, représentation, 68, 119
caractère de SU(2), 92 connexe, groupe, 36
Cartan, critères de, 51 connexe, simplement, 37
Cartan, matrice de, 111 conservation, loi de, 86
Cartan, sous-algèbre de, 105 constantes de structure, 50
Cartan, tore de, 119 contragrédiente, représentation, 69, 102
Casimir, opérateur de, 8, 26, 53, 61, 100, 115, coracine, 115
118, 177 “coset”, 34
centralisateur, 33 couleur, 154, 168
centre d’un groupe, 33 couplage minimal, 160
chaı̂ne de poids, 116 covariante, dérivée, 160
chaı̂ne de racines, 110 Coxeter, exposants de, 115

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

190 Chap.5. INDEX

Coxeter, groupe de, 110 Frobenius–Schur, indicatrice de, 102

Coxeter, nombre de, 115 Frobenius–Weyl, dualité de, 129
critères de Cartan, 51
crochet de Lie, 42 Galilée, groupe de, 32, 40, 42
cyclique, groupe , 31 Gell-Mann–Nishima, relation de, 144
Gell-Mann–Okubo, formule de masse, 150, 156
décomposition de Clebsch-Gordan, 15, 72 générateurs infinitésimaux, 4, 6
dérivée covariante, 160, 161 générations, 155
diagramme de Dynkin, 113 Glashow–Salam–Weinberg, modèle de, 170
diagramme de poids d’une représentation, 116 Goldstone, théorème de, 141
difféomorphismes du cercle, 48 grand-unifiée, théorie, 173
dimension d’un groupe, 42 groupe compact, 40
direct, produit – de groupes, 36 groupe connexe, 36
dual d’un quaternion, 55 groupe cyclique, 31
dual, espace, 107 groupe d’homotopie, 38
Dynkin, diagramme de, 113 groupe de Lie, 41
Dynkin, indices de, 117 groupe du tétraèdre, 82
groupe fondamental, 38
écart de masse électromagnétique, 149, 157 groupe non compact, représentations, 79
électrodynamique, 159 groupe quotient, 35
entrelacement, opérateur d’, 66, 70 groupe semi-simple, 35
enveloppante, algèbre, 52 groupe simple, 35
µνρσ tenseur, 25 groupe symplectique, 32, 56
équivalente, représentation, 66 groupe topologique, 36
esclavage infrarouge, 169 GUT, 173
espace des racines, 107
espace tangent, 43, 57 Haar, mesure de, 41, 59
étrangeté, 144 hadron, 19
Euler, angles d’, 2, 13 harmoniques sphériques, 94, 95, 99
exponentielle, application, 44, 58 Higgs, boson de, 171
extension centrale, 48, 89 homéomorphisme, 38
homogène, espace, 61
facteur de forme électromagnétique, 148 homomorphisme, 34
Fermi, constante de, 152 homotopie, 37
Fermi, lagrangien de, 152, 166 hypercharge, 144
fibré, 163 hypercharge faible, 170
fidèle, représentation, 66
fonction de classe, 67, 80 idéal, 48
fondamental, groupe, 38 identité de Jacobi, 6, 42, 51
formule d’Olinde Rodrigues, 1 indécomposable, représentation, 67
Freudenthal, formules de , 119 indice d’un sous-groupe dans un groupe, 35
Freudenthal–de Vries, formule étrange de , 119 invariance de jauge, 159

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

INDEX 191

invariances d’un système quantique, 86 Montgomery et Zippen, théorème de, 41

invariant de jauge, 163 multipolaire, développement, 97
invariant, sous-groupe, 35
Nambu–Goldstone, bosons de, 141
irréductible, représentation, 13, 67
Noether, courant de, 47, 87, 139, 140, 142, 153
ISL(2,C), 23
normal, sous-groupe, 35
isospin, 19, 144
normalisateur, 34
isospin faible, 170
noyau, 34
isotropie, groupe d’, 61
nucléon, 19
Jacobi, identité de, 6, 42, 51
ondes partielles, 98
Jacobi, polynômes de, 94
orbite d’un groupe, 61
jauge, invariance de, 159
ordre d’un groupe fini, 31
Kac, indices de, 115 orthogonalité et complétude des caractères, 78
Killing, forme de, 51 orthogonalité et complétude des matrices D,
Kobayashi-Maskawa, matrice de, 172 77

lacet, 37 Pauli, matrices de, 3

“ladder operators”, 110 Pauli-Lubanski, tenseur de, 26
Lagrange, théorème de, 35 Peter–Weyl, théorème de, 80
laplacien, 27 petit groupe, 61
Legendre, polynômes et fonctions de, 94 pions, 19
lemme de réarrangement, 40 poids d’une représentation, 116
lemme de Schur, 70 poids dominant, 117
liberté asymptotique, 168 poids fondamental, 117
Lie, algèbre de, 42 poids le plus haut, 117
Lie, groupe de, 41 Poincaré, algèbre de, 22
Littlewood-Richardson, règles de, 123 Poincaré, groupe de, 21
loi de conservation, 86 produit tensoriel de représentations, 15, 71
Lorentz, groupe de, 21 produits tensoriels dans SU(2), 101
Lorentz, transformation spéciale, 21 projective, représentation, 12, 83
pseudoréelle, représentation, 68, 101, 175, 178
mésons π, 19
pure jauge, 162
Maschke, théorème de, 69
masses, matrice de, 172 QCD, 155
matrice de Cartan, 111 quantité conservée, 86
matrice de masses, 172 quark bottom, 153
mesure de Haar, 41, 59 quark top, 153
mesure invariante, 40, 59 quarks, modèle des, 144
modèle O(n), 47 quaternion dual, 55
modèle standard, 168 quaternionique, représentation, 101
moment magnétique, 149 quaternions, 55
moment multipolaire, 97 quotient, groupe, 35

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

192 Chap.5. INDEX

Racah–Speiser, algorithme de, 124 simple, algèbre de Lie, 48

racine, 107 simple, groupe, 35
racine la plus haute, 115 simple, groupe de Lie, 48
racine positive, 111 SL(2,C), 23
racine simple, 111 SL(2,R), 32, 44, 56, 61
rang d’une algèbre de Lie, 106 so(n), algèbre de Lie de SO(n), 47
rayon, 84 SO(1,3) et SL(2,C), 21
recouvrement universel, 38 SO(2,1), 61
réductible, représentation, 67 SO(3), 1
réelle, représentation, 68, 101, 175, 178 so(4), algèbre de Lie, 49
renormalisation de constant de couplage, 165 somme directe de représentation, 67
représentation, 65 sous-groupe invariant, 35
représentation complexe, 101 sous-groupe normal, 35
représentation d’un groupe de Lie compact, 77 sphériques, coordonnées, 28
représentation d’un groupe non compact, 79 sphériques, harmoniques, 94, 95, 99
représentation d’une algèbre de Lie, 75 spineur, 25
représentation projective, 12, 83 stabilisateur, 61
représentation pseudoréelle, 68, 101, 175, 178 standard, modèle, 168
représentation quaternionique, 101 SU(1,1), 61
représentation réelle, 68, 101, 175, 178 SU(2), 3
représentation spinorielle, 25 su(2), algèbre de Lie, 7
représentations de SO(1,3) et SL(2,C), 21 SU(3)c groupe de couleur, 154, 168
représentations de SO(3), 12 SU(3), groupe de saveur, 144
représentations de su(2) et SU(2), 9, 91 SU(4), 153
représentations des groupes finis, 81 SU(5), grand-unification par, 173
réseau des poids, 118 symétrie chirale, 143
réseau des racines, 118 symétrie de jauge, 159
résonance ∆, 20 symétrique, groupe, 31, 33, 34
riemannienne, variété, 27, 57 symboles 3-j, 17
Rodrigues, formule d’Olinde -, 1 symboles 6-j, 18
rotations dans R3 , 1 symplectique, groupe, 32, 56

saveur, 153, 155 tableau d’Young, 128

Schur, lemme de, 70 tableau d’Young standard, 128
semi-direct, produit, 23 Tchebichev, polynômes de, 92, 99
semi-direct, produit – de groupes, 36 tenseur énergie–impulsion, 62
semi-simple, algèbre de Lie, 48 tenseurs, 90
semi-simple, groupe, 35 tension de corde, 169
Serre, relations de, 114 théorème de Wigner, 84
signature dans le groupe de Weyl, 111 théorie de jauge sur réseau, 169, 179
simple connexité, 37 théorie grand-unifiée, 173

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

INDEX 193

transformation de Lorentz spéciale, 21

“truth”, 153

U(n), 59
unitaire, représentation, 69
unitarisable, représentation, 69

V-A, 152
Vandermonde, déterminant de, 60, 129
variété, 57
variété riemannienne, 27, 57
vectorielle, transformation, 142
Virasoro, algèbre de, 48
voisinage, 56
vortex, 40

Weinberg, angle de, 170, 175

Weyl, groupe de, 110
Weyl, vecteur de, 118
Wigner, matrices de, 12, 14
Wigner, théorème de, 84
Wigner–Eckart, théorème de, 20, 87, 149, 150
Wilson, boucle de, 163, 169, 181
Witt, algèbre de, 48

Yang–Mills, 160
Yang–Mills, lagrangien de, 164
Young, diagramme d’, 126, 128
Young, tableau standard, 128
Young, tableau d’, 128
Yukawa, couplage de, 147, 172

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

Vous aimerez peut-être aussi

Symétries et Particules en Physique
Pas encore d'évaluation
Symétries et Particules en Physique
37 pages
Concepts Fondamentaux de Mécanique Quantique
Pas encore d'évaluation
Concepts Fondamentaux de Mécanique Quantique
299 pages
Eléments de Théorie Des Groupes Et Symétries Quantiques
Pas encore d'évaluation
Eléments de Théorie Des Groupes Et Symétries Quantiques
173 pages
Mécanique Quantique : Symétries et Spin
Pas encore d'évaluation
Mécanique Quantique : Symétries et Spin
157 pages
Introduction à la théorie des groupes
Pas encore d'évaluation
Introduction à la théorie des groupes
109 pages
GR
Pas encore d'évaluation
GR
110 pages
Curriculum Vitae de Roland Vergnioux
Pas encore d'évaluation
Curriculum Vitae de Roland Vergnioux
95 pages
Introduction aux groupes de Lie en physique
Pas encore d'évaluation
Introduction aux groupes de Lie en physique
128 pages
Cours de Physique Quantique I et II
Pas encore d'évaluation
Cours de Physique Quantique I et II
224 pages
Mécanique Quantique: Symétries et Spin
100% (2)
Mécanique Quantique: Symétries et Spin
662 pages
Symétries et transitions de phase en physique
Pas encore d'évaluation
Symétries et transitions de phase en physique
114 pages
Cours de Mécanique Quantique M1 Sorbonne
Pas encore d'évaluation
Cours de Mécanique Quantique M1 Sorbonne
352 pages
Theorie Quantique Des Champs II
100% (1)
Theorie Quantique Des Champs II
181 pages
Symétries en Physique : Concepts Clés
Pas encore d'évaluation
Symétries en Physique : Concepts Clés
133 pages
Anahar
100% (1)
Anahar
272 pages
Introduction à la théorie des groupes de Lie
Pas encore d'évaluation
Introduction à la théorie des groupes de Lie
20 pages
Théorie quantique des champs en mécanique
100% (1)
Théorie quantique des champs en mécanique
128 pages
Symétrie de jauge en physique des particules
Pas encore d'évaluation
Symétrie de jauge en physique des particules
54 pages
Phy430 Poly
Pas encore d'évaluation
Phy430 Poly
262 pages
Preview-9782759810413 A42783687
Pas encore d'évaluation
Preview-9782759810413 A42783687
57 pages
Phy430 Poly
Pas encore d'évaluation
Phy430 Poly
218 pages
Théorie Quantique Des Champs
Pas encore d'évaluation
Théorie Quantique Des Champs
360 pages
Théorie Quantique Des Champs DIRENDINGER
100% (1)
Théorie Quantique Des Champs DIRENDINGER
360 pages
Équation de Dirac et matière de Dirac
Pas encore d'évaluation
Équation de Dirac et matière de Dirac
72 pages
Introduction à la Supersymétrie
Pas encore d'évaluation
Introduction à la Supersymétrie
113 pages
Introduction à la Supersymétrie
Pas encore d'évaluation
Introduction à la Supersymétrie
115 pages
Algèbres de Lie Et Représentations (Source Du Cours)
Pas encore d'évaluation
Algèbres de Lie Et Représentations (Source Du Cours)
87 pages
533 Af 8
Pas encore d'évaluation
533 Af 8
22 pages
Groupes et Représentations en Mathématiques
Pas encore d'évaluation
Groupes et Représentations en Mathématiques
141 pages
Atomes froids et interactions résonnantes
Pas encore d'évaluation
Atomes froids et interactions résonnantes
194 pages
Modèles non linéaires en mécanique quantique
Pas encore d'évaluation
Modèles non linéaires en mécanique quantique
157 pages
PHY731
100% (1)
PHY731
234 pages
Physique Quantique - Tome 2, Applications Et Exercices Corrigés (PDFDrive)
100% (3)
Physique Quantique - Tome 2, Applications Et Exercices Corrigés (PDFDrive)
565 pages
Theorie de Jauge
100% (1)
Theorie de Jauge
39 pages
TD Physique Statistique
Pas encore d'évaluation
TD Physique Statistique
48 pages
Electrodynamique Classique - Cours EPFL
Pas encore d'évaluation
Electrodynamique Classique - Cours EPFL
95 pages
Mathématiques et physique moderne
Pas encore d'évaluation
Mathématiques et physique moderne
124 pages
Ensembles de Nombres
Pas encore d'évaluation
Ensembles de Nombres
193 pages
Introduction à la Mécanique Quantique
100% (1)
Introduction à la Mécanique Quantique
61 pages
62 BF 7 F 353 Eefa
Pas encore d'évaluation
62 BF 7 F 353 Eefa
117 pages
Theorie Quantique Pour Master de Physiqu
Pas encore d'évaluation
Theorie Quantique Pour Master de Physiqu
180 pages
Physique Mathematique EPFL PDF
Pas encore d'évaluation
Physique Mathematique EPFL PDF
123 pages
Représentations du groupe de Poincaré
Pas encore d'évaluation
Représentations du groupe de Poincaré
10 pages
La Physique Quantique
100% (5)
La Physique Quantique
535 pages
Groupes TH
Pas encore d'évaluation
Groupes TH
58 pages
Relativité et cosmologie : Cours complet
100% (1)
Relativité et cosmologie : Cours complet
108 pages
Hakimi
100% (1)
Hakimi
22 pages
LFL Ngo
Pas encore d'évaluation
LFL Ngo
198 pages
Mécanique Quantique I - Cours Universitaire
Pas encore d'évaluation
Mécanique Quantique I - Cours Universitaire
79 pages
Notes Cours
Pas encore d'évaluation
Notes Cours
122 pages
Exercices de Physique Statistique 2018
Pas encore d'évaluation
Exercices de Physique Statistique 2018
43 pages
Introduction Physique Particules
Pas encore d'évaluation
Introduction Physique Particules
436 pages
Comprendre les Types d'Angles
Pas encore d'évaluation
Comprendre les Types d'Angles
6 pages
Trigonométrie dans les triangles quelconques
Pas encore d'évaluation
Trigonométrie dans les triangles quelconques
6 pages
Calcul du Azimut entre Deux Points
Pas encore d'évaluation
Calcul du Azimut entre Deux Points
2 pages
Demonstration Du Theoreme de L - Angle Au Centre
Pas encore d'évaluation
Demonstration Du Theoreme de L - Angle Au Centre
2 pages
Trigonométrie : Cercle, Radian, Cosinus, Sinus
Pas encore d'évaluation
Trigonométrie : Cercle, Radian, Cosinus, Sinus
3 pages
Introduction - Réseau de Voiries PDF
Pas encore d'évaluation
Introduction - Réseau de Voiries PDF
12 pages
Techniques de Détermination des Sommets
Pas encore d'évaluation
Techniques de Détermination des Sommets
5 pages
Série de TD 1
Pas encore d'évaluation
Série de TD 1
2 pages
Matrices Orthogonales et Isométries
Pas encore d'évaluation
Matrices Orthogonales et Isométries
16 pages
Évaluation de Mathématiques pour Collégiens
Pas encore d'évaluation
Évaluation de Mathématiques pour Collégiens
18 pages
Devoir de mathématiques 6ème - 1er trimestre
Pas encore d'évaluation
Devoir de mathématiques 6ème - 1er trimestre
1 page
TOP324 Mod1 Points de Canevas ESGT
Pas encore d'évaluation
TOP324 Mod1 Points de Canevas ESGT
6 pages
Transformations géométriques en mathématiques
Pas encore d'évaluation
Transformations géométriques en mathématiques
3 pages
Physique NYA-Revision de Secondaire 5
Pas encore d'évaluation
Physique NYA-Revision de Secondaire 5
8 pages
Révisions Bac Maths : Tetraèdre et Similitudes
Pas encore d'évaluation
Révisions Bac Maths : Tetraèdre et Similitudes
7 pages
Angles et Trigonométrie dans les Cercles
Pas encore d'évaluation
Angles et Trigonométrie dans les Cercles
4 pages
Deplacement Antideplacement 4eme Maths Kooli M H
Pas encore d'évaluation
Deplacement Antideplacement 4eme Maths Kooli M H
11 pages
Sommets 1 - Ch03 - Corrige
Pas encore d'évaluation
Sommets 1 - Ch03 - Corrige
12 pages
Angle Solid e
Pas encore d'évaluation
Angle Solid e
8 pages
Initiation à CATIA V5 pour débutants
Pas encore d'évaluation
Initiation à CATIA V5 pour débutants
28 pages
Devoir Maison Maths Terminale 2021
Pas encore d'évaluation
Devoir Maison Maths Terminale 2021
2 pages
Operadores Dinamicos NUM
Pas encore d'évaluation
Operadores Dinamicos NUM
84 pages
Angle Inscrit Et Angle Au Centre Super
Pas encore d'évaluation
Angle Inscrit Et Angle Au Centre Super
6 pages
Système de Direction Automobile
100% (1)
Système de Direction Automobile
9 pages
Mesure Principale d'un Angle Orienté
Pas encore d'évaluation
Mesure Principale d'un Angle Orienté
6 pages
Géométrie - Fiches de Préparation + Fiches D'exercices - CM1
83% (6)
Géométrie - Fiches de Préparation + Fiches D'exercices - CM1
45 pages
Exercices de dérivabilité en mathématiques
Pas encore d'évaluation
Exercices de dérivabilité en mathématiques
7 pages
Sous-programmes et cycles fraisage 840D
Pas encore d'évaluation
Sous-programmes et cycles fraisage 840D
15 pages
Reef Classique - CSTB
Pas encore d'évaluation
Reef Classique - CSTB
15 pages
Classe de 5° Maître Parfait
Pas encore d'évaluation
Classe de 5° Maître Parfait
23 pages

Invariances et Théorie des Groupes en Physique

Transféré par

Invariances et Théorie des Groupes en Physique

Transféré par

M2/International Centre for Fundamental Physics

Parcours de Physique Théorique

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

0 Quelques éléments de base sur les groupes SO(3), SU(2) et SL(2,C) 1

1 Groupes. Groupes et algèbres de Lie 31

1.1.7 Groupe simple, groupe semi-simple . . . . . . . . . . . . . . . . . . . . . 35

2 Représentations linéaires des groupes 67

3 Algèbres de Lie simples, classification et représentations 107

4 Symétries globales en physique des particules 141

5 Théories de jauge. Modèle standard 163

5.1.2 Extension non abélienne de Yang–Mills . . . . . . . . . . . . . . . . . . . 164

Quelques éléments de base sur les

0.1 Rotations de R3, les groupes SO(3) et SU(2)

0.1.1 Le groupe SO(3), groupe à trois paramètres

x0 = Rn (ψ)x = cos ψ x + (1 − cos ψ)(x.n) n + sin ψ (n × x) . (0.1)

0 ≤ θ ≤ π, 0 ≤ φ < 2π, 0≤ψ≤π . (0.2)

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

0 sin ψ cos ψ − sin ψ 0 cos ψ

Conjugaison de Rn (ψ) par une autre rotation

RRn (ψ)R−1 = Rn0 (ψ) (0.5)

R(α, β, γ) = RZ (γ)Rv (β)Rz (α) (0.6)

mais selon (0.5)

RZ (γ) = Rv (β)Rz (γ)Rv−1 (β) Rv (β) = Rz (α)Ry (β)Rz−1 (α)

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

d’où en reportant dans (0.6)

R(α, β, γ) = Rz (α)Ry (β)Rz (γ) . (0.7)

0.1.2 Du groupe SO(3) au groupe SU(2)

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

avec inversement xi = 21 tr (Xσi ), et agissons sur cette matrice selon

ce qui définit une transformation linéaire x 7→ x0 = T x. On calcule aisément que

det X = −(x21 + x22 + x23 ) (0.15)

et comme det X = det X 0 , la transformation linéaire x 7→ x0 = T x est une isométrie, donc

sur lequel on reconnaı̂t la formule (0.1). On en conclut que la transformation x → x0 ef-

0.2 Générateurs infinitésimaux. L’algèbre de Lie su(2)

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

0.2.1 Générateurs infinitésimaux de SO(3)

Rn (dψ) = (I − idψJn ) (0.17)

Rn (ψ + dψ) = Rn (dψ)Rn (ψ) = (I − idψJn )Rn (ψ) , (0.18)

Rn (ψ) = e−iψJn . (0.20)

(Jk )ij = −iijk (0.22)

à l’aide du tenseur complètement antisymétrique ijk .

ce qui permet d’écrire (0.20) sous la forme

L’expression (0.23) découle simplement de la version infinitésimale de la formule d’O. Rodrigues,

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

R(α, β, γ) = e−iαJ3 e−iβJ2 e−iγJ3 . (0.25)

Les trois matrices Ji , i = 1, 2, 3 satisfont les très importantes relations de commutation

[Ji , Jj ] = iijk Jk (0.26)

qui découlent de l’identité suivante (Jacobi) vérifiée par le tenseur 

iab bjc + icb baj + ijb bca = 0 . (0.27)

avec n0 = Rn, donc

lmn Ril Rjm Rkn = ijk det R = ijk (0.30)

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

0.2.2 Générateurs infinitésimaux de SU(2)

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

0.2.3 Algèbre de Lie su(2)

[Ji , Jj ] = iijk Jk . (0.26)

On utilise aussi beaucoup les trois combinaisons

Jz ≡ J3 , J+ = J1 + iJ2 , J− = J1 − iJ2 . (0.40)

Il est alors immédiat de calculer

On vérifie aussi que l’opérateur de Casimir défini par

J2 = J12 + J22 + J32 = J32 + J3 + J− J+ (0.42)

commute avec tous les J

Ji† = Ji , i = 1, 2, 3 J±† = J∓ . (0.44)

f 0 (x) = f R−1 x = f (x − δψn ∧ x)

= (1 − δψn.x ∧ ∇) f (x) (0.45)

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

par exemple un champ vectoriel se transformant par

0.3 Représentations de SU(2)

29 décembre 2013 J.-B. Z M2 ICFP/Physique Théorique 2012

0.3.2 Représentations de l’algèbre su(2)

h j m|J− J+ |j m i = (j(j + 1) − m(m + 1)) h j m|j m i

Ces normes carrées ne peuvent être négatives donc

J.-B. Z M2 ICFP/Physique Théorique 2012 29 décembre 2013

(j − m) est un entier non négatif . (0.55)

et par conséquent j et m sont simultanément entiers ou demi-entiers. Pour chaque valeur de j

Partant du vecteur |j m = j i, (“vecteur de plus haut poids”), choisi de norme 1, on construit

(Jk )ij = −iijk (0.22)

à l’aide du tenseur complètement antisymétrique ijk .

[Ji , Jj ] = iijk Jk (0.26)

qui découlent de l’identité suivante (Jacobi) vérifiée par le tenseur

iab bjc + icb baj + ijb bca = 0 . (0.27)

lmn Ril Rjm Rkn = ijk det R = ijk (0.30)

[Ji , Jj ] = iijk Jk . (0.26)