0% ont trouvé ce document utile (0 vote)
62 vues147 pages

Symétries Brisées en Physique Quantique

Transféré par

dkoulougli
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd
0% ont trouvé ce document utile (0 vote)
62 vues147 pages

Symétries Brisées en Physique Quantique

Transféré par

dkoulougli
Copyright
© © All Rights Reserved
Nous prenons très au sérieux les droits relatifs au contenu. Si vous pensez qu’il s’agit de votre contenu, signalez une atteinte au droit d’auteur ici.
Formats disponibles
Téléchargez aux formats PDF, TXT ou lisez en ligne sur Scribd

SYMÉTRIES BRISÉES ET

ÉTATS COHÉRENTS DE LA MATIÈRE


par

Claude BOURBONNAIS
Ph.D., Professeur Titulaire

UNIVERSITÉ DE SHERBROOKE
Faculté des sciences
Département de physique
(mars 2020)
Ce manuel électronique fut utilisé dans le cadre du cours PHY740 (Symétries brisées et états
cohérents de la matière) à l’Université de Sherbrooke, depuis 2004. Il fait partie d’une collec-
tion de manuels électroniques diffusés par des professeurs du département de physique de
l’Université de Sherbrooke. Il a été revisité pour une diffusion sous licence libre en collabo-
ration avec la fabriqueREL en mars 2020. Il est diffusé sous licence Creative Commons dans
sa version BY-NC, sauf indications contraires.
L’auteur, Claude Bourbonnais, est professeur titulaire à l’Université de Sherbrooke. Son do-
maine de recherche est la physique des conducteurs moléculaires de basse dimensionnalité.
C’est dans un esprit de partage et de collaboration qu’il a décidé de partager cette ressource
éducative libre. La liste de ses publications est disponible sur Google Scholar.

Sauf indications contraires, le contenu de ce manuel électro-


nique est disponible en vertu des termes de la Licence Creative
Commons Attribution - Pas dutilisation commerciale 4.0 Inter-
national.
Vous êtes encouragé à :
Partager – copier, distribuer et communiquer le matériel par tous moyens et sous tous
formats.
Adapter – remixer, transformer et créer à partir du matériel.
Selon les conditions suivantes :
Paternité – Vous devez citer le nom de l’auteur original.
Pas d’utilisation commerciale – Vous n’avez pas le droit d’utiliser le matériel à des
fins commerciales.

Figures non conformes à la licence CC-BY-NC :


Les figures suivantes sont reproduites avec permission, mais ne sont pas sujettes à la licence CC-BY-
NC. Il est de la responsabilité du prochain utilisateur d’effectuer les démarches nécessaires auprès
du détenteur des droits pour obtenir les permissions : Fig. 3.7 page 63 ; Fig. 6.2 page 117 ; Fig. 6.6
page 122 ; Fig. 6.9 page 136.
Tous droits réservés pour ces figures.

Illustration de couverture provenant du NIST, tirée du domaine public.


TABLE DES MATIÈRES

1 Magnétisme 5
A Aspects classiques. . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1 Moment magnétique vs moment cinétique . . . . . . . . . . . . . . . . 5
2 Précession de Larmor, moment canonique et interaction Zeeman . . . . . . . 8
3 Aspects macroscopiques . . . . . . . . . . . . . . . . . . . . . . . 10
4 Absence de magnétisme en mécanique classique : théorème de Bohr-van Leeuwen 11
B Mécanique quantique du magnétisme microscopique . . . . . . . . . . . . . 12
1 Magnétisme orbital . . . . . . . . . . . . . . . . . . . . . . . . . 12
2 Spin de l’électron : équation de Dirac . . . . . . . . . . . . . . . . . . 14
3 Particule dans un champ magnétique et limite faiblement relativiste . . . . . . 16
4 Atome d’hydrogène et hamiltonien de structure fine . . . . . . . . . . . . 17
C Magnétisme atomique . . . . . . . . . . . . . . . . . . . . . . . . . 20
1 Diamagnétisme . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2 Règles de Hund . . . . . . . . . . . . . . . . . . . . . . . . . . 22
3 Atome dans un champ magnétique . . . . . . . . . . . . . . . . . . . 28
D Champ cristallin . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
E Interaction d’échange . . . . . . . . . . . . . . . . . . . . . . . . . 32

2 Ensembles statistiques 37
A Opérateur densité en mécanique statistique quantique. . . . . . . . . . . . . 38
1 Propriétés . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
2 Opérateur densité réduit . . . . . . . . . . . . . . . . . . . . . . . 40
B Entropie en mécanique statistique . . . . . . . . . . . . . . . . . . . . 41
C Équilibre et principe ergodique . . . . . . . . . . . . . . . . . . . . . . 42
1 Équilibre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
2 Hypothèse ergodique . . . . . . . . . . . . . . . . . . . . . . . . 44
D Ensembles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
1 Ensemble microcanonique . . . . . . . . . . . . . . . . . . . . . . 45
2 Ensembles canonique, isobare-isotherme et grand-canonique . . . . . . . . 46
E Approche variationnelle . . . . . . . . . . . . . . . . . . . . . . . . 50

3 Introduction aux transitions de phase 53


A Considérations de base . . . . . . . . . . . . . . . . . . . . . . . . . 53
1 Transition de phase pour un fluide . . . . . . . . . . . . . . . . . . . 54
2 Analogue magnétique . . . . . . . . . . . . . . . . . . . . . . . . 57
B Comportement critique à l’approche d’une transition continue . . . . . . . . . 58
1 Paramètre d’ordre et corrélations. . . . . . . . . . . . . . . . . . . . 60
2 Universalité . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
C Approche de champ moyen phénoménologique pour la transition magnétique . . . 64
1 Exposants critiques en théorie de champ moyen . . . . . . . . . . . . . . 66

3
D Approche microscopique à la théorie de champ moyen . . . . . . . . . . . . 70
1 Corrélations spatiales . . . . . . . . . . . . . . . . . . . . . . . . 74
E Théorie gaussienne des fluctuations au voisinage du point critique . . . . . . . . 77
F Critère de Ginzburg . . . . . . . . . . . . . . . . . . . . . . . . . . 81
G Hypothèse d’échelle . . . . . . . . . . . . . . . . . . . . . . . . . . 83

4 Seconde quantification 87
A Espace de Hilbert à n particules . . . . . . . . . . . . . . . . . . . . . 87
B Espace de Fock . . . . . . . . . . . . . . . . . . . . . . . . . . . . 89
1 Opérateurs de création et d’annihilation . . . . . . . . . . . . . . . . . 89
2 Relations de commutation et d’anticommutation . . . . . . . . . . . . . 90
3 Opérateurs à une particule . . . . . . . . . . . . . . . . . . . . . . 92
4 Opérateurs à deux particules . . . . . . . . . . . . . . . . . . . . . 95
5 Fermions et bosons en une dimension : transformation Wigner-Jordan . . . . . 96
6 Ondes de spin : transformation Holstein-Primakov . . . . . . . . . . . . . 96

5 Bosons 97
A Systèmes de bosons libres . . . . . . . . . . . . . . . . . . . . . . . . 97
1 Condensation de Bose-Einstein : atomes froids . . . . . . . . . . . . . . 100
B Helium superfluide . . . . . . . . . . . . . . . . . . . . . . . . . . 102
1 Approche phénoménologique à la transition superfluide . . . . . . . . . . . 105
2 Approche microscopique de Bogoliubov : gaz de bosons quasi parfait . . . . . . 111

6 Supraconductivité 115
A Phénoménologie des supraconducteurs . . . . . . . . . . . . . . . . . . 115
1 Effet Meissner . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
2 Équation de London pour la longueur de pénétration . . . . . . . . . . . . 121
B Approche Ginzburg-Landau . . . . . . . . . . . . . . . . . . . . . . . 123
C Théorie microscopique de Bardeen-Cooper-Schrieffer (BCS) . . . . . . . . . . 126
1 Origine microscopique de l’attraction électron-électron . . . . . . . . . . . 127
2 Paires de Cooper . . . . . . . . . . . . . . . . . . . . . . . . . . 130
3 Approche microscopique à la théorie BCS . . . . . . . . . . . . . . . . 131
D Sur la possibilité de modes de Goldstone pour un supraconducteur . . . . . . . . 140
1 Mécanisme de Anderson-Higgs . . . . . . . . . . . . . . . . . . . . 140

4
Chapitre 1

MAGNÉTISME

Nous nous proposons dans ce qui suit d’introduire quelques notions de base liées au magnétisme.
Nous commencerons par discuter de l’existence du moment magnétique à travers les approches
classique et quantique, ainsi que de l’existence du spin comme source du magnétisme intrinsèque
pour une particule de matière comme l’électron. Nous passerons ensuite aux propriétés du magné-
tisme atomique, moléculaire et discuterons de l’impact d’un environnement de champ cristallin ou
encore de l’interaction avec les moments magnétiques voisins dans une structure périodique.

A Aspects classiques

1.A.1 Moment magnétique vs moment cinétique

Dans ce qui suit, nous établirons la relation existant entre moments cinétique et magnétique. On
débute avec la loi de Biot-Savard (1820), liant l’induction magnétique B au point P (fig. 5.1), à une
densité de courant J(r′ ) en r′ 1

r − r′ 3 ′

1
B(r) = J(r′ ) × d r . (1.1)
c |r − r′ |3

En utilisant, (r − r′ )/|r − r′ |3 = −∇(1/|r − r′ |) et ∇ · B = 0 (absence de monopole magnétique), nous


avons
J(r′ ) 3 ′

1
B(r) = ∇ × d r , (1.2)
c |r − r′ |
ce qui, par la relation B = ∇ × A reliant B au vecteur potentiel A, conduit à l’expression

• •
r' r P
J(r' )
O•

FIGURE 1.1
Densité locale de courant et induction magnétique au point P .

1. Unités CGS.

5
Chapitre 1. Magnétisme

J(r′ ) 3 ′

1
A= d r . (1.3)
c |r − r′ |

Dans le cas où P est loin de la distribution localisée de courant, on a le développement

1 1 r · r′
≃ + + ..., (1.4)
|r − r′ | |r| |r|3

ce qui correspond au développement multipolaire magnétique pour le vecteur potentiel,


∫ ∫
1 1 ′ 3 ′ 1 r
A(r) = J(r )d r + · r′ J(r′ )d 3 r ′ + . . . , (1.5)
c |r| c |r|3
  
=0

où pour une distribution localisée de courant, le premier terme s’annule en accord avec l’absence
de monopole magnétique. Maintenant, considérant l’égalité 2
∫ ∫
r j′ Ji d 3 r ′ = − ri′ J j d 3 r ′ , (1.7)

nous aurons pour le terme dipolaire magnétique du développement,



1 1 ∑
Adip (r) = n̂i r j r j′ Ji d 3 r ′
c |r|3 i , j
 ∫ ∫ 
1 1 ∑ 1 ′ ′ 3 ′ 1 ′ ′ 3 ′
= n̂i r j r j Ji (r )d r + r j r j Ji (r )d r
c |r|3 i , j 2 2
 ∫ ∫ 
1 1 ∑ 1 ′ ′ 3 1 ′ ′ 3 ′
=− n̂i r j ri J j (r )d r − r j r j Ji (r )d r
c |r|3 i , j 2 2

1 1 ∑ 1
=− n̂i r j εi j k (r′ × J)k d 3 r ′
c |r|3 i , j ,k 2

1 1 ∑ 1” —
=− n̂i r × (r′ × J) d 3 r ′
c |r|3 i 2 i

1
≡− r × M⃗ (r′ )d 3 r ′ , (1.8)
|r|3

où non avons défini la densité du moment magnétique

1
M⃗ (r) = r × J(r). (1.9)
2c
2. Cette égalité s’obtient à partir d’une intégrale par partie de l’expression suivante pour des fonctions g et f déri-
vables :
∫ ∫ ∫
∑ ∑
g (r )J · ∇ f d r =
′ ′ 3 ′
(g Ji )∂ xi f d r = −

3 ′
(Ji ∂ xi′ g + ∂ xi′ Ji )f d 3 r ′
i i

=− f J · ∇′ g d 3 r ′ (∇′ · J = 0 = ∂t ρ). (1.6)

En posant f = r j′ et g = ri′ , on obtient l’égalité.

6
A. Aspects classiques

Son intégration conduit à l’expression du vecteur potentiel dans l’approximation dipolaire magné-
tique
m×r
Adip (r) = , (1.10)
|r|3
où ∫
m= M⃗ (r′ )d 3 r ′ (1.11)

est le moment magnétique de la distribution de courant localisée.

Quelques manipulations algébriques à l’aide d’une identité vectorielle 3 conduisent à l’expression


du champ magnétique dipolaire

3r̂(r̂ · m) − m
B(r) = ∇ × Adip (r) = , (1.12)
|r|3

qui est analogue à l’expression du champ électrique loin d’un dipôle électrique p.

Si nous avons affaire à une distribution (boucle) de courant confinée dans un plan où I = J d a , le
moment magnétique devient ∫
I
m= r × d ⃗ℓ, (1.13)
2c

où le produit 12 r × d ⃗ℓ = d S⃗ peut être assimilé à l’élément d’aire balayé par le courant sur l’élément
de distance d ⃗ℓ et qui est perpendiculaire au plan de la boucle de courant (d S⃗ = d S ẑ). On peut alors
écrire pour le moment magnétique :
I
m = S. (1.14)
c

Si on considère maintenant la densité de courant comme le résultat d’un ensemble de particules


ponctuelles de masse M i et de charge qi , l’expression de la densité de courant local est donnée par

J(r) = qi vi δ(r − ri ) (1.15)
i

On en déduit facilement à partir de (1.9) et (1.11) que le moment magnétique est de la forme


m= γi L⃗i (1.16)
i

qui est la somme des moments magnétiques individuels de chaque particule i , somme exprimée
en fonction du moment cinétique L⃗i = ri × pi de la particule i et de son facteur gyromagnétique
γi = qi /(2M i c ).

Il existe donc une lien direct entre le moment cinétique d’une particule et son moment magnétique.
Ce lien peut être vérifié expérimentalement dans le cadre de l’expérience d’Einstein-De Haas (1915).
Cette expérience consiste à suspendre à un fil de torsion d’un matériau magnétisable, lequel est
3. On utilise
∇ × a × b = (b · ∇)a − (a · ∇)b + a∇ · b − b∇ · b
avec a = m, b = r/r et le fait que ∇ (1/r ) = −4πδ(r) et m soit indépendant de r ̸= 0 [éq.(1.11)].
3 2

7
Chapitre 1. Magnétisme

glissé à l’intérieur d’un solénoïde (Fig. 1.2). En absence de champ le système, isolé mécaniquement,
ne possède pas de moment cinétique total 4 , soit

L⃗t = 〈L⃗i 〉 + L⃗cr = 0 (1.17)
i

On suppose qu’en absence de champ, les moments cinétiques orbitaux des électrons 〈L⃗i 〉 = 0 et
de réseau L⃗cr = 0 sont nuls. Sous l’application d’un champ qui magnétise le système avec ∑ une ai-
mantation m, on observe une rotation mécanique du cylindre correspondant∑ à L⃗cr = − i 〈L⃗i 〉, de
manière à assurer L⃗t = 0 par conservation pour notre système isolé, avec γ i 〈L ⃗i 〉 = m. À noter
qu’à l’époque, on ne connaissait pas l’existence du spin de l’électron et cet effet était interprété
classiquement comme résultant des boucles de courant effectuées par les électrons au niveau ato-
mique [éq. (1.16)]. On constatait alors qu’il manquait un facteur 2 pour que l’expérience et la théorie
s’accordent (!), soit la différence entre un moment cinétique entier et demi entier comme le spin de
l’électron (voir § 1.B.3).

FIGURE 1.2
Expérience d’Einstein-de Haas établissant la correspondance entre moments magnétique et cinétique
(source : Wilkipedia).

1.A.2 Précession de Larmor, moment canonique et interaction Zeeman

Si on prend un moment magnétique individuel, sous l’action d’un champ magnétique B, le moment
de force 5 N = m×B obéit en vertu du théorème du moment cinétique à ‘l’équation du mouvement’
d L /d t = N, ce qui à laide de (1.16) revient à écrire l’équation de mouvement pour m en présence
d’un champ,
dm

=m×ω (1.18)
dt

4. Dans (1.17), on suppose que l’existence de moments cinétiques orbitaux faisant abstraction de la contribution des
moments cinétiques intrinsèques (les spins) des électrons et des noyaux.
5. Ce moment de force résulte du couple de force 〈r × F〉t issu de la force de Lorentz (1.19), moyenné sur une période
cyclotron.

8
A. Aspects classiques

Cette équation décrit le mouvement gyroscopique du moment magnétique dans un champ magné-
⃗ = γB est la fréquence de Larmor.
tique, appelé précession de Larmor, où ω

Si on s’intéresse à la dynamique de la charge q , celle-ci est soumise à la force de Lorentz qui, avec
l’ajout d’un champ électrique E, est donnée par

1
F = q (E + v × B)
c
dv
=M . (1.19)
dt
Dans une formulation lagrangienne pour une particule en présence de champs électrique et ma-
gnétique, cette force découle d’un lagrangien L(ṙ, r) de la forme

1
L = M v2 − V , (1.20)
2
où le potentiel est donné par
q
V (r) = q ϕ(r) − v(r) · A(r, t ). (1.21)
c
Ici ϕ(r) est le potentiel électrostatique scalaire (E = −∇ϕ). Les équations de Lagrange

d ∂L ∂L
 ‹
= (1.22)
d t ∂ ṙ ∂r
conduisent en effet à l’expression de la force de Lorentz en (1.19). On déduit également l’expression
du moment canonique p de la particule chargée,

∂L q
= p = M v + A. (1.23)
∂ ṙ c

Maintenant, par transformée de Legendre H = p · v − L, on passe à la fonction d’Hamilton


q
(p − c A)2
H= + q ϕ(r). (1.24)
2M
pour une particule dans un champ électromagnétique. La décomposition du premier terme donne

p2 q q2
H= − p·A+ A2 + q ϕ(r), (1.25)
2M M c 2m c 2

ce qui avec le choix de jauge symétrique A = 12 B × r, conduit à l’expression

p2 q q2
H= − B·r×p+ A2 + q ϕ(r),
2M 2M c 2m c 2
p2 q2
= −γL⃗ · B + A2 +q ϕ(r). (1.26)
2M    2m c2 
Zeeman
diamagnétique

Le deuxième terme fait apparaître une énergie d’interaction du moment magnétique avec le champ.
C’est le terme paramagnétique Zeeman. Le dernier terme est de type diamagnétique.

9
Chapitre 1. Magnétisme

1.A.3 Aspects macroscopiques

Jusqu’à maintenant nous avons considéré un moment magnétique découlant d’une densité de cou-
rant J associée à des charges libres. Dans la matière, il y a d’autres sources de courant au sein même
d’atomes, d’ions, ou de molécules qui sont dites ‘liées’ qui donnent naissance à une source addi-
tionnelle de magnétisme. En raison de la complexité des sources de courant liées, nous sommes
amenés à considérer la densité d’aimantation macroscopique M ⃗ (r) définie au point en r comme la
moyenne,
⃗ (r) =

M ni 〈mi 〉, (1.27)
i

où 〈mi 〉 est le moment magnétique moyen de type i (moléculaire, ionique, etc.) et ni = Ni /V est
la densité correspondante. En présence des densités de courant libre et ‘lié’, on peut écrire pour le
vecteur potentiel total

J(r′ ) ⃗ (r′ ) × (r − r′ )
∫  
1 cM
A(r) = + d 3r ′
c |r − r′ | |r − r′ |3
J(r′ )
∫  
1 1
= +cM⃗ (r ) × ∇
′ ′
d 3r ′ (1.28)
c |r − r′ | |r − r′ |

où le premier terme vient de (1.3) et le second vient de l’expression dipolaire (1.10) dans laquelle
le moment magnétique a été remplacé par la densité d’aimantation(1.27). La transformation de ce
dernier passe par l’utilisation de deux identités 6 pour obtenir

J(r′ ) c ∇′ × M⃗ (r′ ) ⃗ ×n
∫   ∮
1 3 ′ M
A(r) = + d r + dS′ (1.29)
c |r − r |′ ′
|r − r | |r − r′|
S

qui fait apparaître un courant de surface c M⃗ × n que l’on pourra négliger dans des conditions nor-
males. Il s’ensuit que l’on peut définir une densité de courant ‘lié’,

⃗.
JM = c ∇ × M (1.30)

L’induction magnétique totale, B = ∇ × A, prend alors la forme



∇×B= (J + JM )
c
(1.31)

En utilisant (1.30), on peut définir l’expression



∇×H= J, (1.32)
c


H = B − 4πM (1.33)
6. La première concerne la partie à intégrer, soit ∇′ × (f V) = ∇′ f × V + f (∇′ × V) pour une fonction f (= 1/|r − r′ |)
et un champ de vecteurs V(= M ⃗ ). La deuxième est la relation entre l’intégrale de surface et de volume (théorème du
rotationnel) :
⃗ ⃗ ×n
∫ ∮
M M
−c ∇′ × d 3r ′ = c d S ′.
|r − r |

S
|r − r′ |

10
A. Aspects classiques

est l’intensité du champ magnétique.


⃗ = χm H (réponse
Maintenant la densité d’aimantation est proportionnelle au champ magnétique M
linéaire), l’induction magnétique prend alors la forme
B = (1 + 4πχ)H ≡ µH, (1.34)
où µ est appelée perméabilité magnétique. Si pour un matériau, µ < 1, ≳ 1, ou ≫ 1, il est dans l’ordre
diamagnétique, paramagnétique, ou ferromagnétique.

1.A.4 Absence de magnétisme en mécanique classique : théorème de Bohr-van


Leeuwen

On cherche maintenant à connaître la densité d’aimantation macroscopique M⃗ et donc la valeur


moyenne 〈mi 〉. Les moments magnétiques élémentaires à l’intérieur d’un atome, d’une molécule
... sont reliés comme nous l’avons vu au moment cinétique,
mi = γi L⃗i , (1.35)
Pour la valeur moyenne d’équilibre, on peut faire appel aux ensembles de la mécanique statistique,
ici classique ; l’environnement de l’ion, molécule ... permettant de définir une température T . La
fonction de partition Z de l’ensemble canonique classique s’écrit sous forme d’une intégrale des
configurations dans l’espace des phases à Ni particules indiscernables chargées contribuant la den-
sité de courant liée de l’ion, molécule, ... .
∫ ∫ Ni
€∏ 1 d r d p Š € ∑ Š
i i
Z [H] = exp − β Hi
N ! h3
i =1 i i
Ni
β
∫∫
1 d ri d pi q
∏  2 ‹
= exp − pi − A(ri )
N!
i =1 i
h3 2M c
Ni
∏ 1
= Zi [H]. (1.36)
N!
i =1 i

Pour des particules n’interagissant pas entre elles, Z est un simple produit des fonctions de parti-
tion de chaque particule. À la base, les Zi [H] dépendent de H à travers le vecteur potentiel A. Cepen-
dant, en mécanique classique, les variables dynamiques (r, p) de l’espace des phases appartiennent
à un continuum de valeurs et ainsi à des intégrations sur chaque couple de coordonnées (xi , px ,i )...
qui s’étendent à ±∞. Il s’ensuit qu’une simple translation des variables px ,i −(q /c )A x ,i , ... → px ,i , ...,
absorbe toute dépendance en champ et ne change pas la fonction de partition, Zi [H] → Zi , laquelle
devient indépendante de H. Ainsi, toute moyenne thermodynamique construite à partir de Zi est de
fait indépendante de H 7 . Il en est ainsi du moment magnétique moyen, 〈mi 〉, de chaque particule
donné par
p2 Š
∫∫
€
d ri d pi mi exp − β i
2M
〈mi 〉 = ∫ ∫
€ p2 Š
d ri d pi exp − β i
2M
q
7. Ce résultat n’a rien d’étonnant puisque la force de Lorentz F = c v × H qui agit sur la particule en présence de H ne
produit pas de travail et ne modifie pas l’énergie entrant dans le poids de Boltzman de la distribution d’équilibre.

11
Chapitre 1. Magnétisme

= 0, (1.37)

et s’annulant identiquement puisque mi ∼ L⃗i est linéaire en pi .

FIGURE 1.3
Interprétation de Bohr pour la disparition du [dia]magnétisme pour le gaz d’électrons en mécanique clas-
sique. Le diamagnétisme résultant des boucles fermées de courant (orbites cyclotrons) est entièrement
compensé par celui des orbites de bord.

On en conclut qu’il n’y a pas de magnétisme possible en mécanique classique, à savoir M ⃗ ≡0:
c’est le théorème de Bohr- Miss van Leeuwen (1921). Selon l’interprétation de Bohr, la disparition du
[dia]magnétisme 8 dans un métal classique s’explique par la compensation parfaite entre le diama-
gnétisme induit par les orbites cyclotrons classiques dans le métal et celles opposées résultant du
mouvement parcourant les bords de l’échantillon (fig. 1.3). C’est à L. Landau (1930) que revient la
démonstration de l’existence du diamagnétisme dans le cadre quantique pour un métal : il démon-
tra en effet que pour un métal l’énergie de nature orbitale est modifiée en présence d’un champ ma-
gnétique contrairement au cas classique et il y a bien une réponse non nulle des électrons du métal
au champ. C’est le diamagnétisme de Landau, lequel sera abordé au niveau atomique en §1.C.1.

B Mécanique quantique du magnétisme microscopique

1.B.1 Magnétisme orbital

Si on reprend la fonction d’Hamilton de chaque particule chargée dans un champ magnétique,


nous avons
q 2
pi − c A(ri )
Hi =
2M
8. Le diamagnétisme est une réponse magnétique qui s’oppose au champ appliqué, alors que le paramagnétisme
produit une réponse magnétique positive suite au champ appliqué.

12
B. Mécanique quantique du magnétisme microscopique

p2i q q q2
= − pi · A(ri ) − A(ri ) · pi + A(ri )2 (1.38)
2M 2c M 2c M 2M c 2
qui est fonction uniquement des variables dynamiques de position ri et d’impulsion pi . Le passage
à la mécanique quantique se fait grâce au principe de correspondance où ces variables sont rempla-
cées par des opérateurs (observables), à savoir ri → Ri et pi → Pi , lesquels obéissent aux relations
de commutation [Ri ,k , Pi ,k ′ ] = i ħ
h δk k ′ . La fonction d’Hamilton Hi → Hi se transforme en hamilto-
nien quantique, Hi , de chaque particule. Dans la jauge symétrique, A = 12 H×Ri (∇i ·A = 0 et H = h z),
Hi devient :
P2i q 2h 2
Hi = − γLi · H + (X 2 + Yi 2 )
2M 2M c 2 i
=H0,i + HZ ,i + HD,i , (1.39)
lequel fait apparaître un terme Zeeman paramagnétique, HZ ,i = −γLi · H fonction de l’opérateur
Li = Ri × Pi pour le moment cinétique orbital de chaque particule. Le terme quadratique en champ
HD,i est appelé terme diamagnétique.

En mécanique quantique, les valeurs possibles du moment cinétique sont quantifiées. Ainsi selon
la théorie du moment cinétique, les observables L2 et L z commutent entre elles et obéissent aux
équations aux valeurs propres
L2 |ℓ, m〉 = ħ
h 2 ℓ(ℓ + 1)|ℓ, m 〉,
L z |ℓ, m〉 = m ħ
h |ℓ, m 〉. (1.40)
sur une base d’états propres {|ℓ, m 〉} communs à L2 et L z . Ici le nombre quantique ℓ = 0, 1, . . . de
L2 prend des valeurs entières, alors que celui de sa projection est restreint à l’intervalle −ℓ ≤ m ≤ ℓ,
donnant 2ℓ + 1 valeurs possibles.

Pour un faible champ magnétique, le terme diamagnétique est petit face au terme Zeeman lorsque
ℓ > 0. Une fois négligé la fonction de partition canonique d’un ensemble d’ions paramagnétiques
prend la forme d’un produit
N

Z= Zi (1.41)
i =1


Z i = Tr{|k ,ℓ,m 〉} e −β (H0,i +HZ ,i ) (1.42)
où dans une base ‘standard’ {|k , ℓ, m 〉} pour chaque ion ou molécule, nous supposerons une équa-
tion aux valeurs propres de la forme H0,i |k , ℓ, m〉 = Ek0,ℓ |k , ℓ, m〉, avec un spectre discret d’états liés
Ek0,ℓ en champ nul. Il s’ensuit que pour un ion ou une molécule dans un état k , ℓ donné avec ℓ ̸= 0,
la fonction de partition se réduit essentiellement à
Z i [h ] =Tr{|k ,ℓ,m 〉} e −β (H0,i −γL z h )
+ℓ
0

=e −β Ek ,ℓ e β µB mh (1.43)
m =−ℓ

qui est cette fois dépendante du champ h . Il en sera de même de l’énergie libre F [h ] = −N k B T lnZ i [h ]
et de toutes les quantités thermodynamiques issues des dérivées de F [h ], en particulier l’aimanta-
tion moyenne (〈m 〉 = −∂ F [h ]/∂ h ). Ainsi, le caractère quantique du moment cinétique est essentiel
à l’existence du paramagnétisme, ici de nature orbitale.

13
Chapitre 1. Magnétisme

1.B.2 Spin de l’électron : équation de Dirac

Dans l’expérience de Stern-Gerlach (1922), la mesure du moment magnétique de l’électron diffère


de celle attendue dans une image classique, laquelle le prévoit appartenant à un continuum de
valeurs. Sa projection selon un axe donné est en fait quantifiée, comportant deux projections pos-
sibles égales ± 12 g µB ħ
h , où g ≃ 2. Cependant, un nombre pair de projections est incompatible avec
un moment magnétique de la forme, M = γL, proportionnel à l’opérateur moment cinétique orbi-
tal L considéré ci-dessus. Selon la mécanique quantique, une projection donnée d’un opérateur tel
que L z par exemple, n’admet invariablement qu’un nombre impair, 2ℓ + 1, de projections (valeurs
propres), avec ℓ = 1, 2, . . . comme nombre quantique entier associé à L2 . Il s’ensuit que si on admet
que le moment magnétique de l’électron correspond lui aussi à un moment cinétique, sa quan-
tification doit être demi-entière. Un tel moment cinétique est appelé intrinsèque sans équivalent
classique, par opposition à un moment cinétique extrinsèque (orbital) résultant des seuls degrés de
liberté orbitaux et qui comme on l’a vu précédemment ont un équivalent classique.

Un moment cinétique demi-entier apparaît naturellement dans le cadre d’une théorie quantique
relativiste de l’électron dans laquelle l’invariance de Lorentz et de rotation sont respectées. Cette
théorie repose sur l’équation de Dirac 9 . Nous nous proposons dans cette sous-section d’introduire
cette équation dans un cadre heuristique.

Considérons dans un premier temps le cas d’une particule libre. Selon la relativité restreinte en
mécanique classique, l’énergie E de la particule de masse m est reliée à sa quantité de mouvement
p et son énergie de masse au repos m c 2 par la relation familière,

E 2 = p 2 c 2 + m 2 c 4. (1.44)

Par le principe de correspondance, qui associe à chaque variable dynamique classique un opéra-
teur en mécanique quantique, on pourrait naïvement associer E 2 au carré, H 2 , de l’hamiltonien
H ≡ iħh ∂t . Ainsi, une généralisation relativiste de l’équation de Schrödinger i ħ
h ∂t |ψ(t )〉 = H |ψ(t )〉
pourrait prendre la forme

h 2 ∂t2 |ψ(t )〉 = H 2 |ψ(t )〉


−ħ
= (P 2 c 2 + m 2 c 4 )|ψ(t )〉. (1.45)

En représentation position, cette équation prend la forme

ħ 2c 2 2
h
ħ 2 ∂t2 ψ(r, t ) −
h ∇ ψ(r, t ) − m 2 c 4 ψ(r, t ) = 0. (1.46)
2m
Bien qu’invariante de Lorentz (le temps et l’espace sont traités sur le même pied), n’est pas satisfai-
sante pour l’électron puisque le spin 12 n’en émerge pas. Elle est néanmoins adéquate pour d’autres
particules (pions, ...) de spin zéro. Elle est connue sous le nom d’équation de Klein-Gordon.

Revenons à l’équation de Schrödinger i ħ h ∂t |ψ(t )〉 = H |ψ(t )〉. Si on approche plutôt sa généralisation


relativiste avec une forme de H linéaire en P (≡ −i ħ h ∇), mais satisfaisant la contrainte relativiste
pour H 2 = P 2 c 2 + m 2 c 4 , on peut utiliser l’ansatz suivant pour l’opérateur hamiltonien,

⃗ · P + β m c 2,
H =cα (1.47)
9. P. M. Dirac, 1928.

14
B. Mécanique quantique du magnétisme microscopique

qui est bien linéaire en quantité de mouvement. Cependant, selon cette hypothèse l’égalité

H 2 = (c α
⃗ · P + β m c 2 )2
= P 2 c 2 + m 2 c 4, (1.48)

⃗ et β ne peuvent être de simples


qui doit être satisfaite, implique que les quantités sans dimension α
constantes, mais doivent anticommuter entre elles, à savoir

{αi , α j } = δi j ,
{αi , β } =0. (1.49)

Les relations liant les αi rappellent celles des matrices de Pauli σi . Toutefois, l’anticommutation
avec β ne peut réduire cette dernière matrice à l’identité qui doit commuter avec les matrices de
Pauli. On sort de cette impasse en élargissant l’espace des matrices à 4×4 plutôt que 2×2. Un choix
convenable de ces matrices, appelées matrices de Dirac, est le suivant :
⎛ ⎞ ⎛ ⎞
I 0 0 σ⃗
β =⎝ ⎠, α ⃗=⎝ ⎠. (1.50)
0 −I ⃗ 0
σ

où I est l’identité des matrices 2 × 2.

L’ équation de Dirac pour une particule libre en représentation position prend alors la forme

iħ ⃗ · p + β m c 2 )ψ(r, t ).
h ∂t ψ(r, t ) = (c α (1.51)

Les solutions stationnaires suite à la séparation des variables d’espace et de de temps s’écrivent
ψ(r, t ) = e −i E t /ħh ψ(r), où la constante de séparation E est l’énergie de l’état stationnaire 10 . L’équa-
tion de Dirac indépendante du temps pour la particule libre devient donc

⃗ · p + β m c 2 )ψ(r) = E ψ(r) .
(c α (1.52)

qui est linéaire et invariante sous les transformations de Lorentz et de rotation. Compte tenu de la
présence de formes matricielles α ⃗ et β en (1.50), il est clair que la fonction d’onde ψ(r) n’est plus
un scalaire comme dans le cas non relativiste, mais revêt plutôt une forme matricielle. La fonction
d’onde prendra la forme d’un double spineur :
⎛ ⎞
χ(r)
ψ(r) = ⎝ ⎠ (1.53)
Φ(r)

où χ(r) et Φ(r) sont des spineurs (vecteurs colonnes à deux entrées).

10. Dans ce qui suit, on considère que les solutions d’énergie E positives. Les solutions négatives possibles commen-
çant à E ≤ −2m c 2 associées aux antiélectrons (positrons) sont considérées comme ‘gelées’ dans la mer de Dirac remplie
d’électrons.

15
Chapitre 1. Magnétisme

1.B.3 Particule dans un champ magnétique et limite faiblement relativiste

Si nous appliquons un champ magnétique à la particule libre supposée chargée, le remplacement


⃗ permet d’écrire l’équation de Dirac (1.52) sous forme matricielle
p → p − (e /c )A ≡ π
⎛ ⎞⎛ ⎞
E − m c 2 −c σ ⃗ ·π
⃗ χ(r)
⎝ ⎠⎝ ⎠ = 0. (1.54)
−c σ⃗ ·π
⃗ E +mc 2 Φ(r)

Par simple substitution, la relation entre les deux spineurs est donnée par

cσ⃗ ·π

Φ(r) = χ(r), (1.55)
E s + 2m c 2

où nous avons défini


Es ≡ E − m c 2, (1.56)
pour laquelle l’énergie de masse m c 2 de la particule a été soustraite ( en mécanique classique par
exemple, E s ≃ 12 m v 2 +O (v 2 /c 2 ) débute par l’énergie cinétique non relativiste dans la limite v 2 /c 2 ≪
1). Dans cette limite faiblement relativiste, v 2 /c 2 ≪ 1 et nous aurons pour (1.55),

⃗ ·π
cσ ⃗
Φ(r) ≃ χ(r), (v 2 /c 2 ≪ 1). (1.57)
2m c 2

À l’aide de (1.54), nous pouvons écrire dans cette limite une équation ‘à la Schrödinger’ pour χ :

⃗ · π)
(σ ⃗2
Es χ = χ. (1.58)
2m
⃗ = p, et à partir de l’identité pour deux opérateurs O1 et O2 :
En absence de champ, A = 0, soit π

⃗ · O1 )(σ
(σ ⃗ · O2 ) = O1 · O2 + i (O1 × O2 ) · σ,
⃗ (1.59)

nous aurons (σ ⃗ · p)2 = p2 , ce qui redonne l’équation de Schrödinger E s χ = (p 2 /2m)χ pour la parti-
cule libre. On peut cependant montrer qu’en présence de champ, l’équation (1.58) peut être rame-
née à
[P − (e /c )A]2
Es χ = χ − g γS · Hχ , (1.60)
2m

appelée équation de Schrödinger pour l’hamiltonien de Pauli 11 , où g = 2 et S ≡ 12 ħ


hσ⃗ et γ = e /(2m c ).
On peut décomposer dans la jauge de Coulomb (∇·A = 0), le premier terme de (1.60), correspondant
à la partie purement orbitale et obtenir
 2
e 2 A2

P e
Es χ = − γL · H − g S·H+ χ. (1.61)
2m 2m c 2m c 2

On constate que la limite non relativiste de l’équation de Dirac conduit en plus du terme de Zeeman
normal (orbital) ∼ L · H introduit à la section précédente, au terme supplémentaire en ∼ S · H. C’est
11. W. Pauli a proposé cette forme dans un cadre non relativiste en 1925. L’hamiltonien de Pauli permettait de solu-
tionner le problème de l’effet Zeeman anormal.

16
B. Mécanique quantique du magnétisme microscopique

le terme Zeeman anormal, faisant intervenir un moment magnétique γS, où S = 12 ħ ⃗ est l’opéra-

teur de spin de l’électron. Compte tenu du doublet de valeurs propres pour les matrices de Pauli,
le nombre quantique du moment cinétique de spin est bien demi-entier. Il est assez remarquable
que la valeur g = 2 découlant de l’équation de Dirac, corresponde dans une excellente approxima-
tion à la valeur requise pour expliquer quantitativement la quantification observée pour le moment
magnétique de l’électron dans les expériences de Stern-Gerlach et D’Einstein-De Haas.

Dans le cadre d’une théorie relativiste plus élaborée qu’est l’électrodynamique quantique, la valeur
du facteur g pour l’électron est prédite avec une précision spectaculaire 12 :

g = 2(1 + a ), a = 0.001159652201 (1.62)

et son accord avec l’expérience est non moins impressionnant (a exp = 0.001159652188).

1.B.4 Atome d’hydrogène et hamiltonien de structure fine

L’ajout à l’équation de Dirac (1.52) d’un potentiel coulombien attractif de la forme V (r ) = −e 2 /r


agissant sur l’électron ne pose pas de difficulté. L’équation de Dirac correspondante est dans ce cas
celle de l’atome d’hydrogène :

⎛ ⎞ ⎛ ⎞
χ(r) χ(r)
⃗ · p + β m c 2 + V (r )) ⎝
(c α ⎠=E ⎝ ⎠ (1.63)
Φ(r) Φ(r)

d’où l’on tire


cσ⃗ ·π

Φ(r) = χ(r), (1.64)
E s − V + 2m c 2
Cette équation permet de ramener l’équation de Dirac à une équation pour χ de la forme :
1
 ‹
⃗ ·p
Es χ = c σ cσ⃗ · p + V χ,
E s − V + 2m c 2
1
 ‹
= cσ⃗ ·p cσ⃗ · p + V χ. (1.65)
2m c 2 [1 + (E s − V )/2m c 2 ]

Par le théorème du viriel, 〈V 〉 ∼ E s , ce qui suggère pour la seconde ligne un développement aux
faibles vitesses (v 2 /c 2 ≪ 1). Au premier ordre de correction relativiste, nous aurons

(V − E s )
 2 
p
Es χ = +V χ +σ ⃗ ·p ⃗ · pχ + . . .
σ
2m 4m 2 c 2
  
H0

12. L’expression théorique (1.62) pour a est le résultat du couplage de l’électron avec les fluctuations du champ élec-
tromagnétique dont les corrections (renormalisation) s’obtiennent par l’intermédiaire d’un développement perturbatif
dit diagrammatique :
α  α 2  α 3  α 4
a = 0.5 − 0.328478965 + 1.181241456 − 1.4 + ...
π π π π
où le paramètre de développement est la constante de structure fine α = e /ħ 2
h c ≃ 1/137. À noter que le calcul du terme
en α3 a nécessité plus de vingt ans de travail, alors que le terme quartique en α4 a monopolisé des années de temps de
superordinateurs ... .

17
Chapitre 1. Magnétisme

→ Heff χ (1.66)

où H0 correspond à l’hamiltonien de Schrödinger non relativiste de l’atome d’hydrogène.

Avec l’ajout des premières corrections, on recherche maintenant une équation ‘à la Schrödinger’
du type E s χ = Heff χ, où Heff est un hamiltonien effectif à déterminer. Pour ce faire, analysons les
premières corrections relativistes. À l’ordre dominant nous pouvons écrire

(V − E s ) p2 p2 ⃗ ·p
σ
⃗ ·p
σ ⃗ ·p≃−
σ + ⃗ · [V , p].
σ (1.67)
4m 2 c 2 4m 2 c 2 2m 4m 2 c 2

À l’aide de l’identité (1.59), l’hamiltonien effectif peut alors s’écrire

p4 ⃗ ·p
σ
Heff = H0 − − ⃗ · [p, V ]
σ
3
8m c 2 4m 2 c 2
p4 ⃗ · p × [p, V ] p · [p, V ]
σ
= H0 − −i −
3
8m c 2 4m 2 c 2 4m 2 c 2
≡ H0 + Wmv + Wso + WD (1.68)

où, dans l’ordre successif, Wmv ∼ p4 , est une correction purement cinétique, Wso , une correction de
type spin-orbite, alors que WD est appelé le terme de Darwin. Quelques transformations peuvent
être appliquées à Heff afin de parvenir à une forme définitive plus transparente.

Considérons en premier lieu le terme spin orbite Wso . Si [p, V ] = −i ħ


h ∇r V = −i ħ
h e 2 r/r 3 , nous pou-
vons écrire en utilisant la définition de S
e2
WSO = S · (r × p)
2m 2 c 2 r 3
e2
= L · S. (1.69)
2m 2 c 2 r 3

Pour le terme de Darwin, on vérifie de prime abord que sous sa forme actuelle,
p
WD = − · [p, V ]
4m 2 c 2
[V , p]
̸ WD† = −
= · p, (1.70)
4m 2 c 2
WD n’est pas hermitique et pose donc problème pour la conservation de la probabilité au cours du
temps. Il manque un terme du type ∼ [p·p, V ] afin d’assurer l’hermiticité. Il s’avère en fait que dans
notre recherche d’une équation du type E s χ = Heff χ, la fonction d’onde χ est liée à la condition de
normalisation qui de façon générale s’écrit
∫ ∫
ψ∗ ψd 3 r = |Φ|2 + |χ|2 )d 3 r = 1, (1.71)

et ce, à tous les ordres en v 2 /c 2 . Or, à l’ordre dominant il y a une contribution de la composante
rapide Φ qui est reliée à χ via (1.57), ce qui donne une relation de normalisation de la forme

p2

€ Š
1= χ ∗χ + χ ∗ χ d 3 r. (1.72)
4m 2 c 2

18
B. Mécanique quantique du magnétisme microscopique

Au même ordre, cette équation peut être sous une forme symétrique

p2 Š —† € p2 Š 3

”€
1≃ 1+ χ 1+ χd r, (1.73)
8m 2 c 2 8m 2 c 2

ce qui permet de définir une fonction d’onde ‘à la Schrödinger’


€ p2 Š
χs = 1 + χ,
8m 2 c 2
satisfaisant (1.71) et qui conserve la probabilité. Cette modification, une fois insérée dans E s χ =
Heff χ, conduit à nouvelle équation pour χs . Ainsi à l’ordre dominant, nous aurons
€ p2 Š € p2 Š
E s χs ≃ 1 + Heff 1 − χs
8m 2 c 2 8m 2 c 2
≃ Heff χs + [p2 /8m 2 c 2 , Heff ]χs
= Heff χs + [p2 /8m 2 c 2 , V ]χs . (1.74)

Cette dernière équation met en évidence un terme supplémentaire qui s’ajoute à Heff et donc à WD ,

WD = [p2 /8m 2 c 2 , V ] − p · [p/4m 2 c 2 , V ]


= − p · [p/8m 2 c 2 , V ] + [p/8m 2 c 2 , V ] · p
ħ2
h
=− ∇2 V
8m 2 c 2
h 2e 2
πħ
= δ(r) = WD† , (1.75)
2m 2 c 2
qui devient hermitique.

En définitive, l’équation (1.74) pour χs devient

Hsf χs = E s χs , (1.76)

Hsf =H0 + Hmv + HSO + HD


p4 e2 h2
πe 2 ħ
Hsf =H0 − + L·S+ δ(r). (1.77)
8m 3 c 2 2m 2 c 2 r 3 2m 2 c 2
Hsf est appelé hamiltonien de structure fine de l’atome d’hydrogène. Le terme de Darwin propor-
tionnel à une fonction delta ne sera donc effectif que pour les états du spectre ayant une densité
de probabilité non nulle au noyau centré à l’origine. Seulement les états stationnaires (orbitales) de
type s ont cette propriété. Quant au terme spin-orbite faisant intervenir explicitement le spin, c’est
lui qui est responsable de la structure fine (dédoublement de raies spectrales) du spectre et est une
conséquence directe de l’existence du spin de l’électron.

En présence d’un champ magnétique, l’hamiltonien total devient à partir de (1.61) et (1.77) :

h2
πe 2 ħ e2
H = H0 − γ(L + g S) · H + λ(r )L · S + δ(r) + (H × R)2 , (1.78)
2m 2 c 2 8m c 2

19
Chapitre 1. Magnétisme

où λ(r ) = e 2 /(2m 2 c 2 r 3 ) et en utilisant la jauge symétrique A = 12 H × R.

En absence de champ, le terme spin-orbite est responsable du dédoublement de raies spectrales


donnant lieu à la structure fine. Le terme Zeeman anormal est aussi responsable du dédoublement
des niveaux d’énergie en présence de H. De plus, le spin permet de donner une explication quanti-
tative des expériences de Einstein-de Haas qui démontrent que le magnétisme du fer par exemple
est une conséquence directe du magnétisme intrinsèque des électrons et donc du spin. Ce dernier
est correspond à un moment cinétique dont le nombre quantique s’ajoute à ceux de nature orbitale.

C Magnétisme atomique

Pour un atome, ion ou molécule avec z électrons, l’hamiltonien (1.78) peut s’écrire sous la forme
(excluant le terme de Darwin) :
z 
e2


2
H = H0 + −γ(Li + g Si ) · H + λ(ri )Li · Si + (H × Ri ) (1.79)
i =1
8m c 2

où H0 comprend l’ensemble des parties cinétique et coulombienne de l’hamiltonien. Avant d’ana-


lyser plus à fond l’influence des termes paramagnétique et spin-orbite, nous allons considérer l’in-
fluence du dernier terme de H qui est de nature diamagnétique.

1.C.1 Diamagnétisme

Pour des ions, atomes ou molécules ∑avec des couches électroniques périphériques remplies, les
moments cinétique orbital total L = i Li et de spin total S = i Si dans le fondamental |0〉 sont en

moyennes nuls : toutes les projections de L z ,i ( Sz ,i ) (positives et négatives) sont occupées. Ainsi, les
corrections à H0 résultent uniquement du terme diamagnétique,
z
∑ e2
H = H0 + (H × Ri )2 . (1.80)
i =1
8m c 2

Ce cas limite, qui exclut les autres contributions au magnétisme, se rencontre néanmoins dans plu-
sieurs situations 13 , comme par exemple les gaz rares, les composés dits ioniques, comme le NaCl,
NaF, NaBr etc. En phase solide pour le NaCl par exemple, on observe un transfert de charge de
l’atome alcalin (Na → Na+ ) vers l’halogène (Cl → Cl− ). Ce transfert fait en sorte que les ions Na+ et
Cl− , bien que chargés, ont des couches électroniques périphériques remplies correspondant res-
pectivement aux structures électroniques des gaz rares Ne et de l’Ar. Comme autre exemple, men-
tionnons celui de plusieurs molécules organiques qui peuvent être aussi caractérisées par des or-
bitales moléculaires périphériques, les ‘HOMO’ (Highest Occupied Molecular Orbitals) remplies et
donc inertes d’un point de vue paramagnétique.
13. Le diamagnétisme est en fait invariablement présent au sein de l’atome, molécule, solide ..., mais sa contribution
est en général de faible amplitude face par exemple au paramagnétisme qui, lorsque présent, domine largement.

20
C. Magnétisme atomique

Pour des amplitudes de champ magnétique typiques, le terme diamagnétique agit comme une
faible perturbation face à H0 . Ainsi pour un fondamental |0〉 non dégénéré d’un ion ou d’une molé-
cule, l’équation aux valeurs propres de l’hamiltonien non perturbé H0 |0〉 = E f0 |0〉 est reliée à l’énergie
du fondamental E f0 . Pour un champ magnétique H = h z selon z , la correction au premier ordre à
l’énergie du fondamental est donnée par la théorie des perturbations 14 :
z
e 2h 2 ∑
∆E0 = 〈0|X i2 + Yi 2 |0〉. (1.81)
2
8m c i =1

X i2 |0〉 = 〈0| Yi 2 |0〉 = 13 〈0| Ri2 |0〉,


∑ ∑ ∑
Comme la couche remplie possède une symétrie sphérique, 〈0| i i i
on peut écrire
ze f f
e 2h 2 ∑
∆E0 ≃ 〈0|Ri2 |0〉, (1.82)
12m c 2 i =1

qui est quadratique en champ externe h . Dans cette expression, nous avons remplacé z par z e f f
pour le nombre d’électrons de la dernière couche, lesquels sont les plus éloignés et donnent la
contribution dominante. À partir de cette correction en énergie, on tire le moment magnétique
induit par le champ qui est défini par

δ∆E0
md ≡ −
δh
= χd h (1.83)

qui est linéaire en champ avec un coefficient χd , appelé susceptibilité diamagnétique de Larmor 15 :
ze f f
e2 ∑
χd = − 〈0|Ri2 |0〉. (1.84)
6m c 2 i =1

La susceptibilité diamagnétique est négative et exprime une réponse du système qui s’oppose au
champ appliqué. C’est la conséquence de la loi de Lenz : la distribution de courant microscopique
des électrons s’oppose par induction à la variation de flux provoquée suite à l’application d’un
champ externe 16 . La comparaison entre la prédiction théorique (1.84) et l’expérience pour χd vs
z e f f 〈r 2 〉 pour un grand nombre d’ions tels Li+ , Mg+2 , Na+ , Ca+2 , . . .., s’avère très satisfaisante.

Une application intéressante de la relation (1.84) concerne les matériaux moléculaires organiques.
À la figure 1.4, nous présentons la dépendance en température de la susceptibilité magnétique to-
tale mesurée pour quelques composés typiques. Les matériaux considérés ne présentent pas une
14. Dans le cadre de la théorie non dégénérée des perturbations de Raleigh-Schrödinger, les corrections à l’énergie En
du niveau |n 〉 de H0 , à l’ordre quadratique en perturbation W , sont données par :
gn′ ∑
∑ |〈n |W |n ′ 〉|2
En = En0 + 〈n |W |n 〉 + + ...
i =1 n ′ ̸=n
En0 − En0′

où g n ′ est la dégénérescence du niveau (virtuel) n ′ .


15. Dans le cas d’un gaz d’électrons, la contribution diamagnétique est appelée diamagnétisme de Landau.
16. Il faut cependant préciser que l’effet diamagnétique est de nature quantique puisque classiquement la loi de Lenz
n’induirait pas de magnétisme selon le théorème de Bohr- Miss van Leeuwen discuté ci-dessus.

21
Chapitre 1. Magnétisme

TTF

χ (10−4 emu/mole)
TCNQ

TMTSF

HMTSF

FIGURE 1.4
Variation de la susceptibilité magnétique totale en fonction de la température pour différents matériaux
moléculaires organiques. On notera une composante négative diamagnétique à la susceptibilité à T → 0
qui augmente en amplitude avec la taille des molécules planaires. D’après D. Jérome and H.J. Schulz, Adv.
Phys. 31, 299 (1982).

orbitale périphérique (‘HOMO’ ou ‘LUMO’ 17 ) complètement remplie, donnant ainsi une contribu-
tion paramagnétique positive importante due aux porteurs de charge qui s’ajoute à la partie diama-
gnétique. Cependant, les trois composés présentent tous une transition de phase (magnétique ou
structurale selon le cas) qui ‘gèle’ progressivement les degrés de liberté de spin des électrons et donc
le paramagnétisme 18 . Il s’ensuit que dans la limite des basses températures, seule la composante
diamagnétique subsiste (fig. 1.4) ; celle-ci est indépendante de la température. On note également
que plus la surface de la molécule est grande, plus l’amplitude de cette contribution est élevée, en
accord avec la dépendance en 〈Ri2 〉 de (1.84) 19 .

1.C.2 Règles de Hund

La connaissance du moment magnétique net d’un atome ou d’un ion est directement liée à la na-
ture spectroscopique de son état fondamental. Considérons un ion ou un atome avec une couche
externe partiellement remplie et de moment orbital ℓ. En comptant les 2ℓ + 1 projections possibles
selon z et les deux orientations de spin, on doit avoir 2(2ℓ + 1) états accessibles pour un nombre
n < 2(2ℓ + 1) d’électrons. La répartition des n électrons dans les divers états accessibles laisse place
à une dégénérescence élevée si les électrons n’interagissaient pas entre eux. En présence d’interac-
17. Lowest Unoccupied Molecular Orbital.
18. Dans le cas d’une transition antiferromagnétique, le champ doit être orienté dans une direction privilégiée, dite
d’aimantation facile pour que le paramagnétisme disparaisse dans la susceptibilité χ.
19. Cet accord se veut qualitatif puisqu’à strictement parlé, le calcul de la susceptibilité diamagnétique suivant
∑ (1.84)
fait apparaître une certaine ambiguïté quant au choix de l’origine des coordonnées dans l’évaluation de i 〈ri2 〉. Pour
pallier ce problème, il faut inclure une contribution supplémentaire (paramagnétique induit ) à la susceptibilité appelé
terme de Van Vleck.

22
C. Magnétisme atomique

tion coulombienne entre électrons [contenue dans H0 en (1.79)] et l’interaction spin-orbite, cette
dégénérescence est réduite de manière appréciable. C’est ce que nous allons examiner dans ce qui
suit.
20
Considérons le cas d’un très∑faible couplage∑ spin-orbite , on peut dans une excellente approxi-
mation considérer que L = i Li et S = i Si commutent avec H et que les nombres quantiques
L , M zL , S et M zS associés respectivement à L2 , L z , S2 et Sz , sont de bons nombres quantiques. Il en
j
sera évidemment de même pour le moment cinétique total J = L + S, pour lequel J et M z associés à
J2 et Jz , sont obligatoirement des bons nombres quantiques. Ainsi, si les couches internes pleines
j
sont caractérisées par L = 0 et S = 0, l’ensemble {L , M zL ,S , M zS , J , M z } pour la couche externe non
remplie suffit à décrire la configuration électronique de l’ion ou de l’atome dans son entier. C’est la
configuration de couplage appelée Russel-Saunders ou L − S .

Historiquement, au début de la mécanique quantique, il était difficile de faire des calculs élabo-
rés de chimie quantique où l’on pouvait solutionner numériquement l’équation de Schrödinger
d’atomes à plusieurs électrons et déterminer leur état fondamental ainsi que leur moment magné-
tique. À l’époque (1927), Freidrich Hund proposa à partir de diverses considérations empiriques
trois règles servant à déterminer l’ensemble des nombres quantiques pour le fondamental d’un
atome à plusieurs électrons, ce sont les règles de Hund. Ces règles s’accordent avec le principe de
Pauli et la composition du moment cinétique ; elles doivent être respectées dans un ordre hiérar-
chique.

Règle 1 : La valeur du nombre quantique S (valeur propre du carré S2 de l’opérateur S = i Si de


spin total de l’atome) est maximum. L’origine de cette règle vient de la minimisation de l’énergie
de répulsion coulombienne entre deux électrons et le principe de Pauli qui interdit à deux par-
ticules identiques d’avoir les mêmes nombres quantiques dans l’orbitale partiellement remplie.
Ainsi, deux électrons de position r1 et r2 et de projections spins m s 1 et m s 2 auront avantage à avoir
leurs spin parallèles avec m s 1 = m s 2 pour empêcher l’égalité r1 = r2 de se produire (Pauli). Les par-
ticules étant gardées plus éloignées (‘force d’échange’), l’énergie de répulsion sera diminuée.

Règle 2 : En accord avec la première règle, le moment orbital total L doit être lui aussi maximum.
On peut comprendre cette deuxième règle par le fait que les électrons avec des projections mi de
L z ,i de même signe tournent dans la même direction, ce qui réduit la possibilité d’impact et par
conséquent l’interaction coulombienne inter-électrons.

Règle 3 : La dégénérescence résultant des deux premières règles, lesquelles fixent L et S est donnée
par (2L +1)(2S +1). En présence d’un terme spin-orbite de la forme 21 λ̄L·S qui couple L avec S , cette
dégénérescence est en partie levée. En accord avec les règles de composition du moment cinétique
(voir encadré), la valeur du nombre quantique J pour le moment cinétique total J = L + S, vont de
J = L +S à |L −S |, et la contribution spin-orbite dans chacun des multiplets considérés est fonction
de J , ainsi que de L et S . En outre, la constante d’interaction λ̄ ci-dessus change de signe lorsque le
niveau considéré passe de moins que demi-rempli (n ≤ (2ℓ + 1)) où λ̄ > 0, à plus que demi-rempli

∑λ croit comme z .
4
20. Ce qui est le cas d’atomes pas trop lourds puisque l’amplitude de
21. Cette expression provient d’une restriction du terme spin-orbite i λi Li ·Si dans le sous-espace pour L et S donnés.
Par le théorème de Wigner-Eckart (voir encadré) PE Li PE ∝ L et PE Si PE ∝ S dans le sous-espace E (L ,S ), ce qui permet
d’écrire pour l’ensemble du terme spin-orbite une expression de la forme λ̄L · S que l’on pourra diagonaliser dans le
sous-espace E J (L ,S ), selon la théorie des perturbations dégénérée.

23
Chapitre 1. Magnétisme

(n ≥ (2ℓ + 1)), où λ̄ < 0. La troisième règle de Hund stipule que les valeurs de J sont telles que
J → Jmin =|L − S |, n ≤ (2ℓ + 1), (1.85)
J → Jmax =L + S , n ≥ (2ℓ + 1). (1.86)

La première correction en énergie provenant du terme spin-orbite se calcule aisément par la théorie
des perturbations pour le cas dégénérée. Dans le sous-espace E J (L ,S ) du multiplet de dimension
2 J + 1, on diagonalise l’effet de la petite perturbation λ̄L · S à l’aide des vecteurs propres | J , M 〉 (voir
encadré). À l’aide de l’égalité J2 = L2 + S2 + 2L · S, cette correction est donnée par
∆E =λ̄〈J , M |L · S| J , M 〉
1
=λ̄〈J , M | (J2 − L2 − S2 )| J , M 〉
2
h 2 [J (J + 1) − L (L + 1) − S (S + 1)]
=λ̄ħ (1.87)

Suivant l’application des trois règles de Hund, le multiplet de 2 J + 1 états du fondamental de l’ion
regroupant les trois nombres quantiques S , L et J est exprimée en notation spectroscopique,
2S +1
LJ, (1.88)
où on fait correspondre les valeurs de L = 0, 1, . . . aux lettres S , P , . . . selon le tableau suivant

L 0 1 2 3 4 5 ...

S P D F G H ...

À titre d’exemple, déterminons le terme spectroscopique du fondamental de terre rare Dy+3 de


couche partiellement remplie 4 f 9 . Il est commode de considérer le tableau des états du niveau 4 f :

m /m s ↑ ↓

−3 • •
−2 • •
−1 •
0 •
1 •
2 •
3 •

Ainsi pour les 9 électrons (cercles pleins), la première règle de Hund remplit les 7 cases de spin ↑.
Les deux électrons restants ne peuvent être que dans la polarisation ↓ (Pauli), ce qui donne la valeur
maximale de M zs = 7× 12 −1 = 5/2 et par conséquent de S . Selon la seconde règle, L est maximisé si les
deux électrons sont placés aux plus grandes valeurs de |m |, soit les possibilités équivalentes m = −3
et -2 ou m = 3 et 2. La somme des projections est donc M zL = -3- 2=-5 (ou +5), ce qui implique L = 5.
Finalement, avec neuf électrons dans le niveau 4f, ce dernier est plus que demi-rempli et la troisième
règle (1.86) donnera la valeur de J = L + S = 15/2. En notation spectroscopique, le fondamental de
l’ion Dy+3 est donc 6 H15/2 .

24
C. Magnétisme atomique

Composition du moment cinétique

La composition de deux moments cinétiques J1 (= L, S ... ) et J2 (= L, S ... ) vise à remplacer


l’ensemble complet d’observables qui commutent (E.C.O.C), {J21 , J22 , J1z , J2z }, de vecteurs propres
communs notés, {| j1 , j2 ; m1 , m2 〉 = | j1 , m1 〉⊗| j2 , m2 〉}, avec j1 et j2 fixés, et obéissant aux équations
aux valeurs propres,

J21,2 | j1 , j2 ; m1 , m2 〉 = j1,2 ( j1,2 + 1)ħ


h 2 | j1 , j2 ; m1 , m2 〉, j1,2 : entiers ou demi − entiers (1.89)
J1,2,z | j1 , j2 ; m1 , m2 〉 = m1,2 ħ
h | j1 , j2 ; m1 , m2 〉, − j1,2 ≤ m1,2 ≤ j1,2 (1.90)
(1.91)

par un autre ensemble, {J2 , Jz , J21 , J22 }, construit à l’aide de J2 et Jz , où

J = J1 + J2 (1.92)

est le moment cinétique total. Les nouvelles équations aux valeurs propres sont données par

J2 | J , M 〉 = J (J + 1)ħ
h 2 | J , M 〉, (1.93)
Jz | J , M 〉 =M ħ
h|J ,M 〉 (1.94)
′ ′
〈J , M | J , M 〉 =δ J J ′ δM M ′ . (1.95)

On cherche à déterminer les valeurs possibles de J et de M , ainsi que la forme des vecteurs propres
| J , M 〉 fonction des anciens vecteurs produits tensoriels de l’ensemble {| j1 , j2 ; m1 , m2 〉}.
Maintenant, J est un moment cinétique vérifiant les commutateurs habituels, soit [J2 , Jz ] = 0, ainsi
que [Jz , J± ] = ±ħ
h J± pour les opérateurs d’échelle, J± ≡ J x ± i J y , qui obéissent aux équations
Æ
J± | J , M 〉 = ħ
h J ( j + 1) − M (M ± 1)| J , M ± 1〉. (1.96)

Ainsi, J± | J , ± J 〉 = 0 et la valeur de M est comprise dans l’intervalle

−J ≤ M ≤ J (1.97)

avec le résultat attendu de 2J + 1 valeurs possibles de M .


Pour la détermination des vecteurs | J , M 〉 en termes des vecteurs produits tensoriel | j1 , j2 ; m1 , m2 〉,
il est utile de se référer au tableau ci-dessous qui classe en fonction de J et M tous les kets pos-

25
Chapitre 1. Magnétisme

sibles.

M /J → j1 + j2 j1 + j2 − 1 ... j1 − j2

j1 + j2 | j1 + j2 , j1 + j2 〉 ; ... ;
j1 + j2 − 1 | j1 + j2 , j1 + j2 − 1〉 | j1 + j2 − 1, j1 + j2 − 1〉 ; ;
.. .. .. .. ..
. . . . .
j1 − j2 | j1 + j2 , j1 − j2 〉 | j1 + j2 − 1, j1 − j2 〉 ... | j1 − j2 , j1 − j2 〉
.. .. .. .. ..
. . . . .
− j1 + j2 | j1 + j2 , − j1 + j2 〉 | j1 + j2 − 1, − j1 + j2 〉 ... | j1 − j2 , − j1 + j2 〉
− j1 + j2 − 1 | j1 + j2 , − j1 + j2 − 1〉 | j1 + j2 − 1, − j1 + j2 − 1〉 . . . ;
.. .. .. .. ..
. . . . .
− j1 − j2 | j1 + j2 , − j1 − j2 〉 ; ... ;

Dans un premier temps, il est utile de souligner que les vecteurs propres produit tensoriel sont
automatiquement vecteurs propres de Jz = J1z + J2z :

Jz | j 1 , j 2 ; m 1 , m 2 〉 = ħ
h (m1 + m2 ) | j1 , j2 ; m1 , m2 〉. (1.98)
  
M

Ainsi selon (1.94), tout | J , M 〉 doit satisfaire la contrainte M = m1 + m2 .


Si on débute avec le premier vecteur de la première colonne | J , j1 + j2 〉, les seules valeurs de m1
et m2 qui donnent le M maximum, soit M = j1 + j2 sont obligatoirement les valeurs maximales
respectives de m1 et m2 , soit m1 = j1 et m2 = j2 . Selon (1.97), la valeur de J pour la première
colonne est alors J = j1 + j2 . On vérifie en effet que J 2 | j1 + j2 , j1 + j2 〉 = ( J12 + J22 + 2 J1z J2z )| j1 +
h 2 ( j1 + j2 )( j1 + j2 + 1)| j1 + j2 , j1 + j2 〉, qui selon (1.93) est compatible avec la valeur
j2 , j1 + j2 〉 = ħ
propre J = j1 + j2 . On aura donc comme premier vecteur :

| j1 + j2 , j1 + j2 〉 = | j1 , j2 ; j1 , j2 〉. (1.99)

Le deuxième vecteur de la première colonne avec la valeur M = j1 + j2 − 1 s’obtient aisément par


simple application de J− = J1− + J2− sur (1.99). Selon (1.96),
Æ
J− | j 1 + j 2 , j 1 + j 2 〉 = ħ
h 2( j1 + j2 ) | j1 + j2 , j1 + j2 − 1〉 (1.100)
= ( J1− + J2− )| j1 , j2 ; j1 , j2 〉
=ħh 2 j1 | j1 , j2 ; j1 − 1, j2 〉 + ħ
p p
h 2 j2 | j1 , j2 ; j1 , j2 − 1〉, (1.101)

ce qui conduit à l’expression


 
√ j1 √ j2
| j1 + j2 , j1 + j2 − 1〉 = | j1 , j2 ; j1 − 1, j2 〉 + | j1 , j2 ; j1 , j2 − 1〉 (1.102)
j1 + j2 j1 + j2

26
C. Magnétisme atomique

Par application de J− = J1− + J2− à ce vecteur, on obtient de manière similaire | j1 + j2 , j1 + j2 − 2〉


et ainsi de suite pour tous les vecteurs de la première colonne.
Si on revient au vecteur (1.102) de la deuxième ligne, on constate qu’il appartient à un espace de
dimension 2 de vecteurs produit tensoriel ayant la même valeur de M . Il y a donc un autre vecteur
avec le même M = j1 + j2 −1, mais qui doit appartenir à une autre valeur de J , soit obligatoirement
J = j1 + j2 − 1, laquelle admet justement j1 + j2 − 1 comme projection M maximum. C’est ce
qui fixe la valeur de J de la deuxième colonne. Ainsi, en accord avec (1.102), le premier vecteur
| j1 + j2 − 1, j1 + j2 − 1〉 de la deuxième colonne donnera la combinaison suivante :

| j1 + j2 − 1, j1 + j2 − 1〉 = α| j1 , j2 ; j1 − 1, j2 〉 + β | j1 , j2 ; j1 , j2 − 1〉 (1.103)

où α et β peuvent être choisies réelles a . Ces constantes sont assujetties aux contraintes de nor-
malisation
〈 j1 + j2 − 1, j1 + j2 − 1| j1 + j2 − 1, j1 + j2 − 1〉 = 1
et selon (1.95), d’orthogonalité avec le vecteur de la première colonne (1.102),

〈 j1 + j2 , j1 + j2 − 1| j1 + j2 − 1, j1 + j2 − 1〉 = 0,

ce qui donne

α2 + β 2 = 1, (1.104)

α √ j2
=− . (1.105)
β j1
(1.106)

La solution immédiate conduit à l’expression


 
√ j2 √ j1
| j1 + j2 − 1, j1 + j2 − 1〉 = − | j1 , j2 ; j1 − 1, j2 〉 + | j1 , j2 ; j1 , j2 − 1〉 (1.107)
j1 + j2 j1 + j2

où la convention de signe (phase) impose un signe positif au coefficient du ket avec m1 le plus
grand (ici β ). Pour les autres vecteurs de la deuxième colonne on procède de la même manière
que pour la première colonne, soit par application successive de J− = J1− + J2− à (1.107). Ainsi le
troisième vecteur de la deuxième colonne J = j1 + j2 −1 combinera les trois vecteurs de même M ,
| j1 , j2 ; j1 − 1, j2 − 1〉, | j1 , j2 ; j1 − 2, j2 〉, et | j1 , j2 ; j1 , j2 − 2〉 appartenant à un sous-espace de dimen-
sion 3. Il y a donc trois vecteurs possibles pour ce même M : celui de la première colonne, de la
deuxième, alors que le troisième vecteur se doit d’appartenir à la troisième colonne, fixant ainsi
sa valeur de J à J = j1 + j2 − 2 en accord avec (1.97). Le premier vecteur de cette colonne est une
combinaison linéaire des trois vecteurs ci-dessus,

| j1 + j2 − 2, j1 + j2 − 2〉 = α| j1 , j2 ; j1 − 1, j2 − 1〉 + β | j1 , j2 ; j1 − 2, j2 〉 + γ| j1 , j2 ; j1 , j2 − 2〉. (1.108)

De la même manière que pour la deuxième colonne, nous aurons une contrainte de normalisation
et deux autres d’orthogonalité avec les kets des deux colonnes précédentes avec le même M :

〈 j1 + j2 − 2, j1 + j2 − 2| j1 + j2 − 2, j1 + j2 − 2〉 − 1 = f1 (α, β , γ) = 0 (1.109)

27
Chapitre 1. Magnétisme

〈 j1 + j2 − 1, j1 + j2 − 2| j1 + j2 − 2, j1 + j2 − 2〉 = f2 (α, β , γ) = 0 (1.110)
〈 j1 + j2 , j1 + j2 − 2| j1 + j2 − 2, j1 + j2 − 2〉 = f3 (α, β , γ) = 0. (1.111)

Nous aurons donc trois équations et trois inconnues, donnant une solution unique pour α, β , et
γ avec la convention de signe indiquée plus haut.
De proche en proche, on détermine ainsi tous les vecteurs du tableau de façon unique avec toutes
les valeurs de J et M . L’unicité de la solution démontre de plus qu’à chaque couple de nombres
quantiques J , M correspond un seul et unique vecteur | J , M 〉. On en conclut que l’ensemble d’ob-
servables {J2 , Jz , J21 , J22 } est bien un E.C. O. C.
Pour finir, les valeurs possibles de J s’étalent entre les deux limites,

J = j1 + j2 , j1 + j2 − 1, . . . , j1 − j2 + 1, j1 − j2 (1.112)

aussi appelée règle du triangle. On vérifie que cette répartition donne lieu à une somme directe
d’espaces de Hilbert de J différents dont la dimension totale est bien identique à celle du produit
tensoriel E1 ⊗ E2 :

dim E1 ⊗ E2 = (2 j1 + 1)(2 j2 + 1)
= dim {E j1 + j2 ⊕ E j1 + j2 −1 ⊕ . . . E j1 − j2 } (1.113)

a. Ces constantes sont appelées coefficients de Clebsch-Gordan.

1.C.3 Atome dans un champ magnétique

L’application d’un champ magnétique à un ion dans un fondamental, 2S +1 L J , est décrit par un ha-
miltonien paramagnétique de la forme

H = H0′ − γ(L + 2S) · H (1.114)

où à partir de (1.79), nous avons omis le terme diamagnétique et incorporé le terme spin-orbite
dans une redéfinition de H0 .

Dans le sous-espace E (E0 , L ,S , J ) associé au fondamental, où ici E0 est le nombre quantique (éner-
gie) associé à H0 , le théorème de Wigner-Eckart permet de relier les opérateurs vectoriels L et S à J
(voir encadré 1.C.3) :

〈L · J〉E (E0 ,L ,S , J )
L= J, (1.115)
J (J + 1)ħ h2
〈S · J〉E (E0 ,L ,S , J )
S= J. (1.116)
h2
J (J + 1)ħ

Les éléments de matrice se calculent aisément pour tout ket appartenant à E (E0 , L ,S , J ), soit

1 1 1
〈L · J〉E (E0 ,L ,S ,J ) = 〈L2 + J2 − L2 − S2 〉E (E0 ,L ,S ,J ) (1.117)
2 2 2
1
h 2 L (L + 1) + [J (J + 1) − L (L + 1) − S (S + 1)]

=ħ (1.118)
2

28
C. Magnétisme atomique

et
1 1 1
〈S · J〉E (E0 ,L ,S , J ) = 〈S2 + J2 − L2 − S2 〉E (E0 ,L ,S , J ) (1.119)
2 2 2
1
h 2 S (S + 1) + [J (J + 1) − L (L + 1) − S (S + 1)]

=ħ (1.120)
2
En substituant dans (1.115) et (1.116), puis dans (1.114), nous pouvons écrire à l’intérieur de
E (E0 , L ,S , J ) :
H = H0′ − γg L J · H, (1.121)

3 1 ” L (L + 1) − S (S + 1) —
gL = − (1.122)
2 2 J (J + 1)
est le facteur de Landé.

Théorème de Wigner Eckart

Nous avons vu que le couplage paramagnétique de l’ion avec le champ externe fait intervenir le
moment cinétique total L et le spin total S [éq. (1.114)] dans le sous-espace E (E0 , L ,S , J ). Or l’action
de ces deux opérateurs dans E (E0 , L ,S , J ) obéit à des propriétés particulières puisque L et S sont
des opérateurs dits vectoriels. Un opérateur V est vectoriel s’il obéit aux relations de commutation
avec J suivantes,
[Ji , V j ] = i εi j k ħ
h Vk . (1.123)
Ces relations de commutation sont d’emblée analogues à celles de J lui-même (J est donc vecto-
riel). La conséquence essentielle de ces relations de commutation est que la restriction de l’action
de V dans E (E0 , L ,S , J ) est proportionnelle à la restriction de J dans ce même sous-espace :

PE VPE = αPE JPE , (1.124)

où PE = M |E0 , L ,S , J , M 〉〈E0 , L ,S , J , M | est le projecteur dans E (E0 , L ,S , J ) et α est une constante.


C’est le théorème de Wigner-Eckart pour les opérateurs vectoriels.


Pour le calcul de α, on vérifie aisément dans un premier temps que [J, PE ] = 0, et donc l’égalité
suivante est vérifiée

PE J · VPE =J · PE VPE (1.125)


2
=αPE J PE (1.126)

on trouve alors
〈J · V〉E
α= 2
. (1.127)
h J (J + 1)
ħ
Il s’ensuit que pour tout opérateur vectoriel dans E (E0 , L ,S , J ), nous avons
〈J · V〉E
V= 2
J. (1.128)
h J (J + 1)
ħ
Cette relation importante qui découle du théorème de Wigner-Eckart est aussi appelée théorème
de projection. Elle s’avère utile dans l’étude du couplage paramagnétique de l’ion dans un champ.

29
Chapitre 1. Magnétisme

D Champ cristallin

Nous avons vu ci-dessus que les règles de Hund fonctionnent relativement bien pour la prédiction
du moment magnétique effectif µeff du fondamental pour les ions à couches f partiellement rem-
plies comme c’est le cas par exemple des terres rares. Cependant, pour les métaux de transition tels
que certains de la couche 3d comme

Ti3+ ,V 4+ [3d 1 ]; V 3+ [3d 2 ];Cr3+ , V 2+ [3d 3 ]; Mn3+ ,Cr2+ [3d 4 ]; Fe3+ , Mn2+ [3d 5 ];
Fe2+ [3d 6 ];Co2+ [3d 7 ]; Ni2+ [3d 8 ];Cu2+ [3d 9 ]; Zn2+ [3d 10 ], (1.129)

la comparaison entre la prédiction de Hund et l’expérience est beaucoup moins favorable 22 . Pre-
nons l’exemple des ions Mn3+ et Cr2+ pour lesquels la couche 3d 4 possède 4 électrons. L’applica-
tion la première règle donne S = 4 · 12 = 2 ; la deuxième règle prévoit un M = 2 + 1 + 0 − 1 = 2, soit
L = 2. Comme le niveau est moins que demi-rempli, la troisième règle prévoit un moment ciné-
tique total J = Lp− S = 0, ce qui donne 5 D0 comme terme spectral et donc une prédiction de Hund
m = pH µB = g J J (J + 1)µB = 0 pour le moment magnétique. L’expérience cependant montre que
pour les deux ions m ≃ 4.82µB , ce qui est évidemment fort différent. Des écarts importants sont
aussi rencontrés pour les autres ions sauf dans des cas spéciaux (cf. note 22).

La raison principale de cet écart vient de l’effet de l’environnement cristallin de l’ion qui est complè-
tement négligé par rapport au terme spin-orbite pourtant faible pour la couche 3d . Dans une struc-
ture cristalline ou encore moléculaire, un ion métallique subit l’influence d’un environnement de
charges provenant de liaisons (ligands) avec des ions voisins tels que l’oxygène − via leurs orbitales
2px ,y ,z . Une telle situation est présente pour les oxydes de métaux de transition. Cet effet électrosta-
tique introduit donc un champ de nature électrique pour les électrons de l’orbitale 3d associée à
l’ion métallique, c’est le champ cristallin. L’influence du champ cristallin est en fait plus important
pour une orbitale 3d que pour une orbitale 4 f caractérisant les ions de terres rares. L’origine vient
de l’extension spatiale de l’orbitale d , laquelle surpasse celle de l’orbitale f qui est comparative-
ment plus proche du noyau.

Dans ce paragraphe, nous nous intéresserons à l’impact d’un faible champ cristallin 23 sur les ions
de métaux de transitions ayant une orbitale 3d partiellement remplie. Rappelons que l’orbitale 3d
est un niveau atomique de moment orbital ℓ = 2 composé d’un multiplet de 2ℓ + 1 = 5 projec-
tions possibles de la composante L z du moment cinétique selon z . Ces cinq orbitales sont le triplet
d’états d x y , d x z et d y z , communément appelé t 2g , et d z 2 , d x 2 −y 2 pour le doublet eg 24 . On rencontre
plusieurs types d’environnements de champ cristallin possibles dans le cas d’oxydes de métaux de
transition, les environnements cubiques, octaédriques, tétraédriques ... . Dans le cas cubique repré-
senté à la figure 1.5, l’ion métallique étant situé au centre d’un cube avec les oxygènes d’orbitales
2p , aux centres des faces du cube en ‘coordination six’ [figure 1.5 (a)] et aux sommets en ‘coordi-
nation huit’ [figure 1.5 (b)]. Ainsi, les orbitales t 2g de l’ion métallique avec des lobes d’amplitude de
probabilité dont les maximum ne passent pas par les axes x et y auront un recouvrement minimal
avec les lobes 2px ,y des oxygènes, ce qui aura pour effet de minimiser la répulsion électrostatique et
de réduire l’énergie. Par contre, les amplitudes pour les orbitales d x 2 −y 2 et d z 2 du doublet eg seront

22. Sauf pour les cas particuliers d’ions avec demi remplissage (3d 5 ) et de remplissage complet (3d 10 ) de la couche 3d ,
où L = 0 et la troisième règle de Hund n’intervient pas.
23. Cette limite correspond à pouvoir traiter le champ cristallin comme une perturbation face aux niveaux atomiques.
24. Ici l’indice g , de l’allemand gerade, signifie une parité paire de l’orbitale par rapport au centre d’inversion.

30
D. Champ cristallin

t 2g
eg
3 Δ/ 5
3d 2 Δ/ 5 3d Δ
Δ
2 Δ/ 5
3 Δ/ 5
eg
t 2g
a) b)
z z
○- ○- ○-
○-
○--
○- ○- y y
M M
○-
x x
○- ○-
○-
○- ○-

x y x y
x y x y x y

FIGURE 1.5
Clivage d’un niveau 3d de multiplicité 2ℓ + 1 = 5 d’un ion de métaux de transition (M ) dans un environ-
nement de champ cristallin cubique de coordination six (a) et huit (b).

maximales, respectivement le long des axes x ,y et z . Ainsi les états eg auront un recouvrement plus
fort avec les 2px ,y ,z de l’oxygène, ce qui augmentera leur énergie due à la répulsion coulombienne.
Un calcul quantitatif par la théorie des perturbations dégénérée 25 montre que le décalage en éner-
gie des niveaux dégénérés de l’orbitale 3d de l’ion libre par un ensemble de charges ponctuelles
situées aux centres des faces du cube produit une séparation en énergie notée ∆ = E eg − E t 2g entre
les deux multiplets. Cette séparation n’est pas symétrique avec un décalage plus élevé pour E eg .

Dans le cas d’un environnement cubique de coordination huit avec l’ion métallique au centre du
cube comme à la figure 1.5 (b), les orbitales t 2g ont cette fois un maximum d’amplitude passant par
les ligands les liant aux oxygènes des coins, alors qu’il est minimal pour les eg . Dans ce cas, l’énergie
E t 2g > E eg . Le nombre de charge (8) aux sommets du cube étant plus élevé que dans le cas précédent,
il en de même pour la valeur du décalage des niveaux t 2g .

Disparition du moment orbital


Un propriété générale du moment cinétique orbital peut être énoncée sous la forme du théorème
suivant :
25. La perturbation est le potentiel électrostatique des charges ponctuelles est de la forme
∑ qe
V (r ) =
i
|r − R i |

où r est la distance par rapport à l’ion métallique et R i , l’emplacement des charges ponctuelles q . Un développement
au faibles distances du centre de l’ion métallique permet d’écrire pour la perturbation

V (r ) = V0 + C (x 4 + y 4 + z 4 − 3r 4 /5) + O (r 6 /a 6 ).

où C > 0.

31
Chapitre 1. Magnétisme

La valeur moyenne :
〈n |L |n 〉 = 0
du moment cinétique orbital L pour un état non dégénéré |n 〉 est nulle. Pour le montrer [7], consi-
dérons l’opérateur de renversement du temps T qui agit sur un état ψ en le transformant en son
complexe conjugué (T ψ = ψ∗ ). Si l’hamiltonien du système est hermitique, ses valeurs propres sont
réels et donc ψ∗ a la même valeur propre que ψ. Maintenant si ψ est non dégénéré, ψ∗ et ψ doivent
être linéairement dépendants : ψ∗ = c ψ. Ainsi l’application de T à cette expression conduira à
T ψ∗ = ψ = c T ψ, soit à l’égalité ψ = |c |2 ψ, soit |c |2 = 1 où c est en fait un facteur de phase c = e i ϕ .
Si on regarde maintenant l’élément de matrice du moment cinétique orbital (hermitique) :

〈n|L |m 〉 =〈n|T −1 T L T −1 T |m 〉
= − 〈n T |L |T m〉
= − e i (ϕn −ϕm ) 〈n|L |m 〉∗

où les phases peuvent être choisies de manière à rendre l’élément de matrice purement imaginaire
(ϕn − ϕm = 0) ou purement réel (ϕn − ϕm = π/2). Maintenant dans le cas où |n 〉 = |m 〉, le théorème
implique :
〈n |L |n 〉 = −〈n |L |n 〉∗ = −〈n |L |n 〉 (1.130)
si L est hermitique. Donc comme les valeurs propres de L ne peuvent être que réelles, il s’ensuit
que pour tout état non dégénéré
〈n|L |n 〉 = 0. (1.131)
C’est la disparition du moment cinétique (orbital quenching).

En présence d’un champ cristallin qui lève la dégénérescence du fondamental, 〈L 〉0 = 0 et donc


〈L z 〉0 = 0. Dans ces conditions, L = 0 et le terme spectral de l’ion M deviendra 2S +1S J =S où J = S
avec aucune contribution venant de L . Le calcul du moment magnétique dans ces conditions se
réduit à m = 2µB S (S + 1) où g J = g = 2 et S est donné par la première règle de Hund. Dans le
p
+3
p manganèse Mn et du chrome Cu traités ci-dessus, ce calcul conduit à la valeur m =
2+
cas du
2µB S (S + 1) ≃ 4.90µB , en prenant J = S et L = 0. La comparaison avec la valeur expérimentale
m = 4.82µB redevient très favorable, en appui à la disparition du moment cinétique orbital. La
disparition de L est également en accord avec les valeurs observées pour les autres ions 3d .

E Interaction d’échange

Jusqu’à maintenant, nous avons considéré l’origine du magnétisme à l’échelle locale, à savoir ato-
mique. Dans un cristal, les ions magnétiques interagissent avec leur environnement immédiat.
Parmi les diverses sources d’interaction possibles, il y a l’interaction directe entre moments ma-
gnétiques de sites voisins que nous supposerons parfaitement localisés 26 . Ce sont ces interactions
‘spin-spin’ qui sont à l’origine des transitions de phase magnétiques et d’une brisure de symétrie
26. Les interactions effectives entre les moments magnétiques existent évidemment même si les spins ne sont pas
localisés et sont itinérants, comme c’est le cas des spins des électrons de conduction par exemple. Ce cas plus complexe
sera traité plus loin dans ce cours.

32
E. Interaction d’échange

du système – ici par renversement du temps. Encore là, il peut y avoir plus d’une contribution pos-
sible : les moments magnétiques peuvent interagir via des couplages tels que l’échange direct, le
super-échange, l’interaction dipôle-dipôle magnétique , ... . L’interaction dipôle-dipôle est un cou-
plage qui décroît avec la distance en ∼ 1/r 3 et qui pour des distances même de l’ordre de l’Å met en
jeu des énergies ∼ 10−4 eV, qui sont très faibles par rapport aux autres termes, notamment le terme
d’échange direct que nous allons examiner dans ce qui suit.

On peut illustrer le mécanisme d’échange direct 27 à l’aide d’un modèle simple de la molécule H2 .
Dans ce modèle on considère deux électrons de spin 12 et de coordonnées r1 et r2 ; ces électrons
sont en interaction mutuelle répulsive et subissent l’interaction attractive de deux noyaux (protons)
en R1 et R2 . On supposera que l’hamiltonien est indépendant des spins (l’interaction spin-orbite
pouvant être considérée comme nulle) et est de la forme :

ħ2
h
H =− (∇r1 + ∇r2 ) + V (r1 , r2 ), (1.132)
2m
où le potentiel est donné par

e2
V (r1 , r2 ) = V (r1 ) + V (r2 ) + , (1.133)
|r1 − r2 |

contenant le potentiel d’interaction électron-électron et les potentiels à un corps,

e2 e2
V (ri ) = − − . (1.134)
|ri − R1 | |ri − R2 |

Si un des électrons est dans l’état orbital ψa avec un spin ε1 et le deuxième dans l’état ψb de spin
ε2 , selon le postulat de symétrisation, l’état fermionique ψε1 ,ε2 (r1 , r2 ) à deux particules est antisy-
métrique :
1 ∑
ψε1 ,ε2 (r1 , r2 ) = p eα Pα ψa (r1 )ψb (r2 )|ε1 , ε2 〉, (1.135)
2! α
où Pα sont les opérateurs de permutations des particules, soit P0 = 1 et P12 pour deux particules, alors
que e0 = 1 et e12 = −1 se réfèrent à la parité des permutations. Pour deux orientations possibles de
chacun des spins, on dénombre ainsi quatre états possibles :

1  
ψ↑,↑ (r1 , r2 ) = p ψa (r1 )ψb (r2 ) − ψa (r2 )ψb (r1 ) | ↑, ↑〉, (1.136)
2
1  
ψ↓,↓ (r1 , r2 ) = p ψa (r1 )ψb (r2 ) − ψa (r2 )ψb (r1 ) | ↓, ↓〉, (1.137)
2
1  
ψ↓,↑ (r1 , r2 ) = p ψa (r1 )ψb (r2 ) | ↓, ↑〉 − ψa (r2 )ψb (r1 ) | ↑, ↓〉 , (1.138)
2
1  
ψ↑,↓ (r1 , r2 ) = p ψa (r1 )ψb (r2 ) | ↑, ↓〉 − ψa (r2 )ψb (r1 ) | ↓, ↑〉 . (1.139)
2
Comme l’hamiltonien est indépendant des spins, on peut exprimer tous les vecteurs d’état comme
produit tensoriel d’une partie orbitale et d’une partie de spin. C’est le cas des deux premiers vecteurs
avec spins parallèles. Pour les deux autres, on pourra prendre leurs combinaisons symétrique et
27. W. Heisenberg et P. Dirac (1926).

33
Chapitre 1. Magnétisme

p
antisymétrique, [(1/ 2)(ψ↑,↓ ±ψ↓,↑ )], ce qui conduit en incluant les deux premiers vecteurs, aux états
singulet et triplet, notés ψSM (r1 , r2 ) :

1   1 
ψ00 (r1 , r2 ) = p ψa (r1 )ψb (r2 ) + ψa (r2 )ψb (r1 ) p | ↑, ↓〉 − | ↓, ↑〉] (1.140)
2 2

1 
ψ+1

1 (r1 , r2 ) = p ψa (r1 )ψb (r2 ) − ψa (r2 )ψb (r1 ) | ↑, ↑〉 (1.141)
2
1  1 
ψ01 (r1 , r2 ) = p ψa (r1 )ψb (r2 ) − ψa (r2 )ψb (r1 ) p | ↑, ↓〉 + | ↓, ↑〉
 
(1.142)
2 2
1
ψ−1
 
1 (r1 , r2 ) = p ψa (r1 )ψb (r2 ) − ψa (r2 )ψb (r1 ) | ↓, ↓〉 (1.143)
2
On reconnaît d’emblée que pour la partie spin, les kets sont de la forme |S , M 〉 et sont vecteurs
propres de S2 Sz , où S = S1 + S2 est le spin total (c.f. encadré 1.C.2) :

S2 |S , M 〉 =S (S + 1)ħ
h 2 |S , M 〉 (1.144)
Sz |S , M 〉 = M ħ
h |S , M 〉. (1.145)

Ici S = 0, M = 0 correspond bien au singulet,

1 
|0, 0〉 = p | ↑, ↓〉 − | ↓, ↑〉] (1.146)
2
et S = 1 et M = +1, 0, 1 au triplet d’états

|1, 1〉 = | ↑, ↑〉 (1.147)
1  
|1, 0〉 = p | ↑, ↓〉 + | ↓, ↑〉 (1.148)
2
|1, −1〉 = | ↓, ↓〉 (1.149)

Bien que H ne dépende pas du spin, les parties orbitales des états diffèrent lorsque S = 0 (partie
orbitale symétrique) et S = 1 (partie orbitale antisymétrique). Ainsi la valeur moyenne de l’énergie
sera différente pour les états singulet et triplet :

〈ψSM=0,1 |H |ψSM=0,1 〉 = E s ,t = Ea + E b + K a b ± Ja b (1.150)

ħ2 2

∑ h
Ea + E b = d 3 r ψ∗i (r)[− ∇ + V (r)]ψi (r), (1.151)
i =a ,b
2m r

e2
∫ ∫
Ka b = d r1 d 3 r2 |ψa (r1 )|2 |ψb (r2 )|2
3
, (1.152)
|r1 − r2 |
et
e2
∫ ∫
Ja b = d r1 d 3 r2 ψ∗a (r1 )ψ∗b (r2 )
3
ψa (r2 )ψb (r1 ), (1.153)
|r1 − r2 |

34
E. Interaction d’échange

Ici nous avons supposé pour simplifier que le recouvrement entre les états a et b est négligeable

ψ∗a (r)ψb (r) d 3 r ≈ 0.

Les termes Ea et E b sont les énergies des états à une particule a et b . Les deux termes de répulsion
électron-électron correspondent à l’intégrale de Coulomb, K a b , et à l’intégrale d’échange, Ja b . Cette
dernière est une conséquence directe de l’antisymétrie de la fonction d’onde et permet selon (1.150)
la distinction entre les énergies singulet, E s , et triplet E t . Cette distinction permet d’écrire H sous
la forme d’un hamiltonien effectif agissant uniquement dans l’espace de Hilbert des spins. En effet,
dans la base {|S , M 〉}, l’identité S1 · S2 = 12 (S2 − S21 − S22 ) permet d’écrire

1 2 3
〈S , M |S1 · S2 |S , M 〉 = h ħ S (S + 1) − (1.154)
2 2
¨
3 2
h , S = 0,
−4ħ
= 1 2
(1.155)
+4ħ
h , S = 1.

On déduit ainsi l’hamiltonien effectif de spins :

1
H = (E s + 3E t ) − 2J S1 · S2 (1.156)
4

h −2 (E s − E t )
J =ħ (1.157)
est l’interaction d’échange directe. Si J > 0, l’état triplet ‘ferromagnétique’ est favorisé, alors que si
J < 0, l’état singulet ou ‘antiferromagnétique’ avec spins antiparallèles est à son tour favorisé (fi-
gure 1.6). On souligne que cet échange direct est le résultat au départ d’une interaction purement
électrostatique entre électrons qui se répercute sur l’orientation des spins par la contrainte d’anti-
symétrie de la fonction d’onde totale.

On peut généraliser l’approche précédente à un système macroscopique de N (∼ 1023 ) spins répartis


sur un réseau de dimension spatiale D . En laissant tomber la constante à l’énergie, l’hamiltonien
effectif sur réseau prend alors la forme,


H =− Ji j Si · S j (1.158)
〈i , j 〉

où les indices 〈i , j 〉 sont limités aux sites plus proches voisins pour l’ensemble du réseau. Cet ha-
miltonien effectif est communément appelé hamiltonien de Heisenberg ; il est le point de départ
d’une modélisation microscopique d’un grand nombre de transitions de phase magnétiques dans
les solides.

35
Chapitre 1. Magnétisme

ψ0 (r , r )
0 1 2

(a)

+ +
r

ψΜ (r , r )
1 1 2

(b)

+ +
r

FIGURE 1.6
Fonction d’onde symétrique (a) et antisymétrique (b) d’espace de l’hamiltonien d’échange pour J < 0.
Pour ce signe de J , le fondamental est la fonction d’onde (liante) en (a) avec les spins antiparallèles.

36
Chapitre 2

ENSEMBLES STATISTIQUES

Les systèmes étudiés en mécanique quantique sont en général composés d’un petit nombre de par-
ticules ou de degrés de liberté. Ils sont caractérisés par une fonction d’onde microscopique repré-
sentant un état pur. Selon la mécanique quantique, il suffit pour un système intégrable, de spécifier
l’ensemble complet d’observables qui commutent pour qu’une description complète du système
microscopique soit rendue possible à l’aide d’un petit nombre de mesures.

Pour un système macroscopique cependant, le nombre de particules étant ∼ 1023 , il est clair que le
nombre d’observables ou de mesures requises est telle qu’une description complète devient hors
d’atteinte. Pour un système classique, le pronostic n’est guère plus optimiste puisque sa caracté-
risation complète nécessiterait la solution simultanée de ∼ 1023 équations du mouvement qui est
également hors de portée. Même si cela s’avérait possible, l’information retenue serait inutilisable,
voire même sans intérêt.

Malgré ce manque d’information microscopique, les quantités mesurables pertinentes pour la des-
cription d’un système macroscopique sont en fait plus “globales”. On s’intéressera par exemple à
l’aimantation moyenne, la résistance électrique, la température... etc., du système, dont l’ensemble
ne nécessitera en général qu’un petit nombre de mesures.

C’est l’objet de la physique statistique de faire le pont entre le microscopique et le macroscopique 1 .


Notre manque d’information sur les degrés de liberté microscopiques d’un système macroscopique
nous permet d’introduire un des outils de base de la physique statistique qui est l’opérateur densité.
Ce dernier permet en fait d’étendre la formulation de la mécanique quantique aux systèmes ayant
un très grand nombre de degrés de liberté.

Pour un système macroscopique, le très grand nombre de degrés de liberté rend inaccessible la
connaissance du microétat précis du système en fonction du temps. L’information manquante est
liée au poids statistique de ces microétats. Lorsque combinée aux “grands nombres” en jeu, elle
conduit en fait à des prédictions extrèmement précises sur les quantités macroscopiques mesu-
rables 2 . C’est le concept d’entropie statistique qui permet de quantifier l’information manquante.
L’entropie est un ingrédient essentiel entrant dans la description d’objets macroscopiques à l’équi-
libre à l’aide des ensembles statistiques.

1. Le contenu de ce chapitre s’inspire en grande partie de l’excellent livre de R. Balian [1].


2. À titre d’exemple sur l’efficacité de la loi des grands nombres, mentionnons le temps de demi-vie d’un noyau in-
stable comme le 14 C, qui est une donnée très précise d’un corps macroscopique et ce, malgré l’imprévisibilité complète
des désintégrations individuelles au niveau microscopique.

37
Chapitre 2. Ensembles statistiques

A Opérateur densité en mécanique statistique quantique

En mécanique quantique, l’état d’un système microscopique est complètement caractérisé par le
ket | ψ〉, élément de l’espace de Hilbert H . On appellera un tel état, un microétat. C’est le cas par
exemple de l’état d’un photon sortant d’un polariseur. Dans ce même exemple cependant, si les
photons avant l’entrée du polariseur proviennent d’une source non polarisée, alors les différentes
polarisations des photons de la source sont équiprobables et traduisent un manque d’information
sur le système. On dira alors qu’on a affaire à un mélange statistique ou à un macroétat. Ainsi, à
chaque état de polarisation donnée |ψλ 〉, on adjoindra la probabilité qλ d’être réalisée, en raison de
notre manque d’information.

De façon générale, l’aspect probabiliste d’un macroétat interviendra donc à deux niveaux :

— purement quantique, lié à l’indéterminisme intrinsèque des |ψ〉


— de la préparation où le manque d’information conduit au mélange statistique.

Pour un mélange statistique {qλ |ψλ 〉}, il s’ensuit que la probabilité d’obtenir un résultat a α (valeur
propre d’une observable A dans un état propre | u α 〉 pour un ket |ψλ 〉 est donnée par

P (a α ) = qλ Pλ (a α ), (2.1)
λ

où Pλ (a α ) = 〈ψλ |Pα |ψλ 〉 est la probabilité (4 postulat de la mécanique quantique) d’obtenir la va-
e

leur propre a α pour un système dans le microétat |ψλ 〉. Ici, Pα =| u α 〉〈u α | est le projecteur dans le
microétat | u α 〉. Ainsi, d’après (2.1), P (a α ) apparaît comme une somme pondérée de probabilités
conditionnelles.

Pour un mélange statistique, l’utilisation de la relation de fermeture dans H , à savoir 1 = k |


u k 〉〈u k |, permet d’écrire pour la valeur moyenne d’une observable A :



〈A〉 = qλ 〈ψλ |A|ψλ 〉.
λ

= qλ 〈u k ′ | ψλ 〉〈ψλ | u k 〉〈u k | A | u k ′ 〉, (2.2)
k ,k ′ ,λ

d’où l’on peut introduire



D≡ qλ |ψλ 〉〈ψλ | (2.3)
λ

qui est l’opérateur densité. On peut ainsi écrire



〈A〉 = 〈u k ′ |D |u k 〉〈u k |A|u k ′ 〉
k ,k ′

= 〈u k ′ | D A | u k ′ 〉 ≡ Tr D A. (2.4)
k′

Ainsi toutes les valeurs moyennes macroscopiques peuvent s’exprimer à l’aide de cet opérateur. Il
en est donc de même des probabilités particulières P (a α ), qui deviennent pour un mélange statis-
tique :
P (a α ) = Tr D Pα . (2.5)

38
A. Opérateur densité en mécanique statistique quantique

En définitive, l’opérateur densité résume le caractère quantique à travers les |ψλ 〉 et notre manque
d’information sur la préparation de ce ket par le biais des qλ .

2.A.1 Propriétés

L’opérateur densité n’est évidemment pas une observable puisqu’il ne peut être lié à un processus
de mesure. Il a cependant les propriétés importantes qui suivent :

— (i) Hermiticité. Si les qλ sont réelles, alors D = D † et n’admet que des valeurs propres réelles
sur une base orthonormée.
Tr D = 1, ce qui équivaut à la règle de somme sur les probabilités : λ qλ =

— (ii) Normalisation.

1 (discret) ou d qλ = 1 (continu).
— (iii) Semi-positivité. D est défini comme étant semi-positif, à savoir 〈φ | D | φ〉 ≥ 0, ∀ | φ〉 ∈
H
— (iv) Valeurs propres. Les valeurs propres d λ , associées à l’équation aux valeurs propres
det(Di j − d λ I ) = 0, où Di j = 〈φi | D | φ j 〉 est la matrice densité, sont positives ou nulles.
Elles satisfont donc à la condition de normalisation λ d λ = 1.

— (v) On appelle population de l’état | u n 〉 l’élément de matrice diagonal :



Dnn = qλ | cn(λ) |2 , (2.6)
λ

(λ)
où cn = 〈u n | ψλ 〉. Le nombre de systèmes trouvés dans l’état | u n 〉 suite à ‘N fois’ la mesure
de l’observable A ( avec vecteurs propres | u n 〉) est N Dnn . Les éléments hors-diagonaux de
la matrice densité sont quant à eux appelés cohérences :

Dnp = qλ cn(λ) cp(λ)∗ .
λ

On voit que les cohérences sont liées aux effets d’interférence entre les états | u n 〉 et | u p 〉, et
que le mélange statistique tend à les réduire. Il est possible de montrer l’inégalité suivante :

Dnn Dp p ≥| Dnp |2 ,

entre les populations et les cohérences. Il signifie que les cohérences entre deux états quan-
tiques ne peuvent exister que si les populations respectives sont non nulles.
— (vi) Évolution temporelle. La dépendance temporelle de l’opérateur densité pour un système
décrit par un hamiltonien H , est régie par l’équation de Liouville-von Neumann

dD

h = [H , D ] (2.7)
dt

À l’aide de l’opérateur d’évolution U (t ) = e −i H t /ħh U (0), valable pour un système conservatif, nous
aurons


D (t ) = qλ | ψ(t )〉〈ψ(t ) |
λ

39
Chapitre 2. Ensembles statistiques

= U (t )D (0)U † (t ). (2.8)
La dépendance temporelle des valeurs moyennes sera alors de la forme

〈A〉t = Tr D (t )A. (2.9)


Évidemment, si le système est non conservatif, à savoir si H → H (t ) dépend explicitement du
temps et que la propriété∫de commutation [H (t ), H (t ′ )] = 0 est satisfaite, l’opérateur d’évolution
t
h −1 0 H (t ′ )d t ′ ], alors que les expressions pour D (t ) et 〈A〉t gardent la même
devient U (t ) = exp[−i ħ
forme 3 . Maintenant, si l’évolution temporelle est aléatoire, en ce sens que l’hamiltonien H n’est
connu qu’avec une certaine probabilité, nous avons alors affaire à une classe d’hamiltoniens {H j },
associée à une distribution de probabilité {µ j }. Il peut s’agir de corrections aléatoires à l’hamilto-
nien H → H j = H0 + δH j avec la probabilité µ j . À titre d’exemples, mentionnons les fluctuations
de champ local d’un système de spins plongé dans un champ magnétique externe, les impuretés
disposées aléatoirement à l’intérieur d’un métal, etc. Lors du calcul des valeurs moyennes d’obser-
vables, il nous faudra moyenner (une fois de plus !) sur cette distribution d’hamiltoniens. Les valeurs
moyennes deviendront


〈A〉t = µ j Tr D j (t )A, (2.10)
j

où D j (t ) = U j (t )D U j† (t ).

2.A.2 Opérateur densité réduit

Si dans un système macroscopique, nous avons affaire à plusieurs types de degrés de liberté ap-
partenant à un espace de Hilbert H = H A ⊗ H B ⊗ . . . , produit tensoriel (par exemple, les spins,
les phonons, ... etc.), il est possible de construire des opérateurs densité réduits qui n’agissent fi-
nalement que dans l’un ou l’autre des espaces de Hilbert. Dans un système composé de degrés de
liberté de spin et de réseau (phonons) par exemple, on peut s’intéresser uniquement à des mesures
d’aimantation qui ne concernent que les spins. Pour avoir accès à cette quantité, il nous faut donc
intégrer les degrés de liberté appartenant aux phonons et ainsi obtenir un opérateur densité réduit
n’agissant que sur les spins. Évidemment, ce type d’intégration risque d’être difficile à effectuer
lorsque par exemple on ne peut négliger l’interaction entre les spins et les phonons. Comme autre
exemple, mentionnons la construction pour un système de N spins, de l’opérateur densité réduit à
un spin. Ce dernier résultera de l’intégration (ou trace partielle) de N − 1 degrés de liberté de spin,
de sorte que le nouvel opérateur contienne l’influence (corrélations) de tous les spins environnant
celui qui nous intéresse.

Plus généralement, soit {| ka , l b 〉}, une base de kets de l’espace de Hilbert produit tensoriel H =
H A ⊗ H B , alors la valeur moyenne d’une observable n’agissant que dans H A s’écrit à l’aide des
relations de fermeture

〈A a 〉 = Tr D (A a ⊗ I)
3. Cependant, en général [H (t ), H (t ′ )] ̸= 0, et l’expression ci-dessus est incorrecte pour l’opérateur d’évolution qui
∫t
h −1 0 H (t ′ )d t ′ ] où Tt est l’opérateur de mise en ordre chronologique.
prend plutôt la forme U (t ) = Tt exp[−i ħ

40
B. Entropie en mécanique statistique

∑ €∑ Š
= 〈ka , l b | D | ka′ , l b 〉 〈ka′ | A a | ka 〉
ka ,ka′ lb

= 〈ka | Da | ka′ 〉〈ka′ | A a | ka 〉
ka ,ka′

= Tra Da A a , (2.11)

où Da = Trb D est l’opérateur densité réduit, n’agissant que dans H A .

B Entropie en mécanique statistique

Pour un ensemble de M évenements statistiques (mélange statistique∑de microétats) de probabilité


0 ≤ qλ ≤ 1 (λ = 1 . . . M ), satisfaisant à la contrainte de normalisation λ qλ = 1, le manque d’infor-
mation est quantifié par l’entropie statistique
M

S ≡ −k B qλ ln qλ , (2.12)
λ=1

où k B = 1.38 × 10−23 J /K est la constante de Boltzmann qui fixe les unités de l’entropie en méca-
nique statistique. De la forme de S , on vérifie immédiatement que lorsque qu’on est certain de la
préparation d’un microétat, à savoir s’il s’agit d’un état pur avec soit qλ = 1 ou qλ = 0, il n’y a au-
cun manque d’information et donc, l’entropie correspondante est nulle. Comme nous l’avons vu
au chapitre précédent, les {qλ } peuvent être assimilées aux valeurs propres de l’opérateur densité
dans la base des {|Ψλ 〉} (D |Ψλ 〉 = qλ |Ψλ 〉). Il vient ainsi

S = −k B Tr D ln D (2.13)

comme définition équivalente de S .

Voici quelques autres propriétés de l’entropie :

— (i) Positivité. S est définie positive : S ≥ 0, ∀{qλ }.


— (ii) Maximum. S = k B ln M est la valeur maximum de S . Elle survient lorsque l’ensemble des
{qλ } traduit une préparation équiprobable des microétats (q1 = q2 . . . = qM = 1/M ).
En général, l’entropie satisfait à l’inégalité

S ≤ k B ln M . (2.14)

Cette inégalité se démontre à l’aide de la relation très utile :

S ≤ −k B Tr (D ln D ′ ) (2.15)

valable pour tout opérateur densité D ′ [1]. Ainsi, pour un opérateur de la forme D ′ = D0 =
M −1 1, où tous les microétats sont équiprobables, nous avons dans une base {|φλ 〉} de H :

S ≤ − kB 〈φλ | D ln D0 | φλ 〉
λ

41
Chapitre 2. Ensembles statistiques


≤ k B ln M 〈φλ | D | φλ 〉
λ
≤ k B ln M , (2.16)

en utilisant la propriété de la trace de l’opérateur densité.


— (iii) Additivité. Soit l’opérateur densité D = D1 ⊗D2 dans H = H 1 ⊗H 2 qui est produit tenso-
riel (corrélations nulles) de deux opérateurs densité D1 et D2 , agissant respectivement dans
H 1 et H 2 . Alors, d’après (2.13), S = S1 + S2 et l’entropie devient additive.
— (iv) Sous-additivité. En présence de corrélations, D ̸= D1 ⊗ D2 , et à partir de (2.15), on dé-
montre sans difficulté l’inégalité S ≤ S1 + S2 qui souligne bien l’idée intuitive que les corréla-
tions diminuent l’entropie.
— (v) Concavité. Soit un ensemble d’opérateurs densité D j ayant une pondération µ j ( j µ j =

1). Lorsqu’on les réunit pour former un mélange statistique unique, l’entropie correspon-
dante satisfait à l’inégalité de concavité
∑ ∑
S ( µ j Dj ) ≥ µ j S (D j ), (2.17)
j j

laquelle se démontre aisément à l’aide de (2.15). L’incertitude sur la réalisation des hamil-
toniens H j [cf éq. (2.10)], pour un même ensemble, augmente le manque d’information par
rapport au cas où chaque réalisation est considérée séparément.

C Équilibre et principe ergodique

2.C.1 Équilibre

Les quantités macroscopiques moyennes (aimantation, densité...) que l’on cherche à calculer, le
sont à partir de l’état d’équilibre du système. Ce dernier se caractérise par les données certaines ou
statistiques des “constantes du mouvement” (énergie, nombre de particules, etc.). Ces grandeurs
sont stationnaires à l’équilibre et n’évoluent plus au niveau macroscopique en fonction du temps.
Au niveau microscopique cependant, tel n’est pas le cas. Il persiste en effet une dynamique entre
les divers microétats possibles de l’opérateur densité. L’origine de cette dynamique vient de l’ha-
miltonien H du système qui, en fait, n’est pas connu parfaitement. On ne peut prétendre à sa forme
exacte, il subsistera toujours un ensemble de perturbations aléatoires, même infimes ({δH j } ≪ H ),
qui induiront ces transitions entre microétats qui ne sont pas en toute rigueur des états propres
de Ht o t . À titre d’exemple, considérons un cristal paramagnétique dont chacun des atomes du ré-
seau porte un spin 12 localisé et qui est plongé dans un champ magnétique externe. Un hamiltonien
d’interaction HZ = −µ i S i ·B i (terme Zeeman) pour le système de spins favorisera donc l’orienta-

tion des spins dans la direction du champ. Maintenant, supposons que l’énergie totale du système
de spins 4 soit fixée à E , on pourra ainsi définir un ensemble de microétats {| s1 . . . sN 〉} à N spins
satisfaisant cette contrainte mécanique. Si à un instant donné, le système est dans un microétat
particulier d’énergie E (état propre de HZ ), il suffira d’attendre suffisamment longtemps pour qu’à
l’aide d’infimes perturbations (influence du réseau par le biais des phonons, inhomogénéités du
4. La correction à cette énergie provenant des perturbations aléatoires est ici négligeable.

42
C. Équilibre et principe ergodique

champ magnétique local par l’intermédiaire soit des défauts du réseau, des couches électroniques
internes, de l’interaction hyperfine avec le noyau....etc.), des transitions entre divers microétats de
même énergie E se produisent. Ainsi, au bout d’un temps t → ∞, le système aura fait l’échantillon-
nage de tous les microétats satisfaisant à l’ensemble des contraintes mécaniques.

Il est important de souligner ici que si le système est préparé dans un microétat donné au temps
t = 0, ce sont ces mêmes transitions “lentes mais incessantes” qui, en fonction du temps, amènent
le système vers l’équilibre thermique. Ainsi, la marche vers l’équilibre par ce mécanisme est irré-
versible et peut être vue comme une fuite de l’information, fixant du même coup le sens de l’écou-
lement du temps. C’est précisément ce que signifie l’inégalité de concavité (2.17) qui montre en
fait que si les perturbations aléatoires δH j introduisent une évolution mal connue de l’opérateur
densité D (t ) = j µ j U j (t )D (0)U j† (t ), avec j µ j = 1, nous avons bien S (t ) ≥ S (0). Ainsi l’entropie
∑ ∑

augmente lorsque le système évolue de manière irréversible vers l’équilibre.

La marche vers l’équilibre peut parfois s’effectuer à l’aide de perturbations et d’interactions parfai-
tement connues (non aléatoires). Prenons par exemple le cas de deux enceintes de gaz différents
dilués, séparées par une cloison. Si chacune des particules obéit soit aux équations du mouvement
classiques où encore à l’équation de Schrödinger, la mémoire de l’état initial est donc préservée. Si
on ouvre la cloison cependant, on constate qu’au bout d’un temps infini, rien ne distingue un tel
système à l’équilibre de celui où des perturbations aléatoires seraient à l’origine du mélange. On dit
que là aussi il y a perte d’information “apparente” vers des degrés de liberté inaccessibles 5 . L’in-
formation ‘manquante’ est en fait contenue dans les corrélations entre les particules générées lors
des collisions. Pour illustrer ce point, plaçons nous dans la limite semi-classique pour laquelle la
dépendance temporelle de la fonction de distribution est régie par l’équation du mouvement (2.7)
dans la limite semi-classique. Nous avons vu en effet que les collisions introduisaient des corréla-
tions, lesquelles sont présentes à travers les densités en phase réduites (fonctions de distribution
semi-classiques) fn≥2 pour n ≥ 2 particules. Comme cette équation du mouvement a été obtenue
à partir de l’équation de Liouville qui est réversible, l’information (corrélations) sur les positions et
quantités de mouvement se trouve transférée sur l’ensemble des densités en phase fn≥2 de la hié-
rarchie BBGKY 6 , mais qui est en pratique inaccessible, c.-à-d. non mesurable. L’hypothèse avan-
cée par Boltzmann, appelée “Stosszahlansatz" (chocs aléatoires ou chaos moléculaire), revient à
négliger pour chaque collision la ‘mémoire’ provenant des collisions précédentes. Ainsi en posant
f2 (r , p , r ′ , p ′ ) → f1 (r , p )f1 (r ′ , p ′ ) dans le terme de collision de la densité réduite à deux corps, les
corrélations sont négligées et l’équation de Boltzmann qui en résulte traduit dès lors une irréversi-
bilité. La quantité ∫
H = − d rd p f1 (r, p, t )[1 − ln h 3 f1 (r, p, t ) ],

(2.18)

introduite par Boltzmann et qui est en fait −k B SB , permet de montrer que H évolue en fonction
de t vers un minimum (d H/d t ≤ 0 ), soit un maximum pour SB (d SB /d t ≥ 0) à l’équilibre. C’est
le contenu du fameux ‘théorème- H’ 7 . Ainsi l’observation de la marche vers l’équilibre pour le gaz
dilué traduit bien une augmentation apparente du désordre qui est bien décrite par l’entropie de
Boltzmann SB via le théorème-H. Cependant, il faut bien garder à l’esprit que l’entropie exacte qui
5. Pour des objets parfaitement discernables comme des spins nucléaires localisés, le renversement du temps et le
recouvrement de l’information initiale sur la configuration des spins est possible par un renversement du champ ma-
gnétique menant à l’écho de spin.
6. La hiérarchie BBGKY (Bogoliubov-Born-Green-Kirkwood-Yvon) est un ensemble d’équations du mouvement cou-
plant les différents fn .
7. Boltzmann (1872).

43
Chapitre 2. Ensembles statistiques

résulte de la hiérarchie complète BBGKY et dont une partie de l’information est inaccessible de-
meure quant à elle, constante au cours du temps 8 .

Finalement, il est intéressant de faire remarquer qu’en pratique la présence de perturbations aléa-
toires a pour effet d’affaiblir les corrélations de sorte que SB se rapproche de S .

2.C.2 Hypothèse ergodique

L’échantillonnage des microétats accessibles au cours d’un temps τ suffisamment long à l’état
d’équilibre, nous permet de poser un principe fondamental en mécanique statistique, le principe
ergodique. Ce principe effectue en effet un lien entre les diverses “répliques” du même système à un
temps t 0 et l’échantillonnage des microétats en fonction du temps. Le nombre de répliques étant
égal au nombre de microétats accessibles, il constitue un ensemble statistique. Le principe ergo-
dique permet ainsi de faire l’équivalence entre une valeur moyenne temporelle et celle obtenue à
partir d’un ensemble :
∫ t 0 +τ
1
Ā = lim A (t ) d t
τ→∞ τ
t0

= Pλ A λ ≡ 〈A〉, (2.19)
λ

tel que donné en (2.12). Ainsi, le nombre de systèmes Nλ , dans le microétat |ψλ 〉 nous conduit à
la probabilité de préparation Pλ = limN →∞ Nλ /N ≡ qλ , laquelle coïncide dans la limite N grand
avec le poids statistique des microétats de l’opérateur densité en (2.12). Le concept d’ensemble
statistique nous permet donc de nous affranchir de la dépendance temporelle pour toute valeur
moyenne même si elle est implicite dans un macroétat d’équilibre.

D Ensembles

Dans la construction de l’opérateur densité pour un système macroscopique, notre manque d’in-
formation au niveau microscopique nous oblige donc à maximiser l’entropie. Cette maximisation
cependant, est souvent accompagnée de contraintes “mécaniques” qui sont soit précises ou statis-
tiques (énergie totale, nombre de particules, ... etc. fixées ou leurs valeurs moyennes fixées ). Ces
dernières donnent une information partielle sur le système et permettent en retour de définir le
type d’ensemble.

8. Il est à noter qu’à l’aide de l’équation maîtresse, irréversible par construction, on pourrait montrer que le
théorème-H se généralise à tout système statistique à l’approche de l’équilibre.

44
D. Ensembles

2.D.1 Ensemble microcanonique

Considérons un système macroscopique où l’énergie totale est fixée à E +δE où δE est l’incertitude
supposée faible (δE ≪ E ). Dans ce cas, il n’y a donc rien qui privilégie un microétat plutôt qu’un
autre puisque tous satisfont à la contrainte. Il y a donc équiprobabilité et dès lors, q1 = q2 . . . qM =
1/M . Selon (2.12),
S = k B ln M , (2.20)
et l’entropie est maximale (principe de Boltzmann). Un tel ensemble est appelé microcanonique.
L’opérateur densité dans un tel ensemble est donné par
1 ∑
D= |ψλ 〉〈ψλ |. (2.21)
M λ

Lorsque nous avons affaire à un système de taille macroscopique, le spectre en énergie est à toutes
fins utiles continue. Dans ces conditions, nous faisons appel à la densité d’états en énergie ρ(E ).
Cette dernière est reliée au nombre d’états M de la façon usuelle :

M = ρ(E ) d E . (2.22)

L’entropie pourra donc s’écrire

S = k B ln Ω(E ) + k B ln (d E /δE )
→ k B ln Ω(E ) (2.23)

où le second terme est négligeable et peut être ignoré et avec cette fois Ω(E ) = ρ(E )δE qui est le
nombre d’états d’énergie E .

L’entropie nous permet de définir la quantité suivante :


∂ ln Ω(E ) 1
= , (2.24)
∂E kB T
à savoir la température absolue T du système qui coïncide avec celle introduite en thermodyna-
mique.

Pour deux systèmes d’énergie E I et E I I , n’échangeant pas de façon appréciable d’énergie de sorte
que E = E I + E I I (constante), l’entropie totale découle de la propriété d’additivité. Par la condition
d’équilibre traduisant une entropie maximale, nous avons

ln Ω(E I ) + ln Ω(E I I ) = max (2.25)

ou encore
∂ ln Ω(E I ) ∂ ln Ω(E I I )
= , (2.26)
∂ EI ∂ EI I
ce qui implique égalité des températures, TI = TI I = T à l’équilibre.

Si les systèmes I et II sont de part et d’autre d’un piston amovible, les volumes des enceintes satisfont
à la contrainte VI + VI I = V (constant), avec évidemment la même contrainte sur l’énergie que
précédemment. Dès lors, la condition d’équilibre s’écrit

lnΩ(E I , VI ) + lnΩ(E I I , VI I ) = max, (2.27)

45
Chapitre 2. Ensembles statistiques

ou
∂ lnΩ(E I , VI ) ∂ lnΩ(E I I , VI I )
= . (2.28)
∂ VI ∂ VI I

Si nous introduisons la variable P de pression, conjuguée au volume V , via la relation


∂ ln Ω(E , V ) P
 ‹
= , (2.29)
∂V E kB T
alors l’équilibre est atteint lorsqu’il y a égalité des pressions PI = PI I .

Nous pouvons répéter la même démarche lorsque les cloisons sont poreuses et qu’il y a échange de
particules. Donc, si en plus des contraintes sur l’énergie et le volume, on ajoute celle sur le nombre
de particules, NI + NI I = N (constant), la condition d’équilibre devient alors
∂ ln Ω(E I , VI , NI ) ∂ ln Ω(E I I , VI I , NI I )
= . (2.30)
∂ NI ∂ NI I

La variable conjuguée au nombre de particules sera le potentiel chimique µ


∂ ln Ω(E , V , N ) µ
=−
∂N kB T
1 ∂S
 ‹
= , (2.31)
k B ∂ N E ,V
et à l’équilibre, µI = µI I = µ.

2.D.2 Ensembles canonique, isobare-isotherme et grand-canonique

Si nous reprenons le cas des systèmes I et II échangeant de l’énergie, avec E I l’énergie d’un sous-
système et E I I l’énergie du système représentant le reste de l’univers. Bien qu’on ait toujours la
contrainte E I + E I I = E (constant), les fluctuations d’énergie du système II sont négligeables com-
parativement au système I. On dit que le système I est en contact thermique avec un réservoir R. À
l’équilibre, l’énergie du système I n’est fixée qu’en moyenne, à savoir 〈HI 〉 = cste. (dans ce qui suit,
nous omettrons l’indice I). Un tel ensemble est dit canonique.

Lorsque maintenant il y a en plus de l’énergie, échange de particules entre le sous-système et le ré-


servoir, nous avons deux contraintes statistiques, à savoir 〈H 〉 = cste. et 〈N 〉 = cste. Un tel ensemble
est appelé grand-canonique.

Afin de déterminer les opérateurs densité pour ces deux ensembles de sous-systèmes, on doit,
comme toujours, maximiser l’entropie S , mais en tenant compte des contraintes statistiques. À
celles-ci s’ajoute évidemment la condition de normalisation Tr D = 1. En utilisant la méthode des
multiplicateurs de Lagrange, il nous faut chercher les extremums (maximums) de la fonction

F = S (D ) − ζi Tr D A i − ζ0 Tr D . (2.32)
i

La condition δF = 0 aux extremums, nous conduit à



Tr δD [ln D + ζi A i + ζ0 + 1] = 0, (2.33)
i

46
D. Ensembles

où nous avons redéfini les multiplicateurs de Lagrange en posant ζ0,i → ζ0,i /k B . Pour des variations
arbitraires de D dans HH , cela entraîne
ζi A i

e− i
D= , (2.34)
Z
qui est la distribution de Boltzmann-Gibbs. On peut montrer facilement à l’aide de l’inégalité (2.15)
que l’opérateur densité ainsi obtenu correspond bien au maximum d’entropie.

Comme Tr D = 1, (2.34) nous permet d’introduire une fonction très importante en mécanique sta-
tistique, la fonction de partition,
ζi A i

Z = Tr e − i (2.35)

En fait, la connaissance explicite de cette fonction pour un système donné nous permet en principe
d’avoir accès à toutes les valeurs moyennes macroscopiques, fluctuations et fonctions de corréla-
tion d’observables, bref à toute l’information macroscopique à l’équilibre désirable. C’est donc un
outil équivalent à l’opérateur densité. Par exemple, les valeurs moyennes d’observables 〈A i 〉 s’ob-
tiennent par de simples dérivées de Z :

∂ ln Z
〈A i 〉 = −
∂ ζi
ζk A k

= Z −1 Tr A i e − k

= Tr D A i . (2.36)

Comme nous le verrons au prochain chapitre, les dérivées successives de Z permettent d’obtenir
les fluctuations autour de la valeur moyenne et évidemment, les corrélations spatiales. En pratique
cependant, pour les systèmes où les particules interagissent, il est rare que l’on puisse parvenir à
un calcul exact de la fonction de partition. Les calculs se font donc à travers des schémas d’ap-
proximation que nous aurons l’occasion de discuter lors des applications (voir § 2.E) ). À partir de
l’expression pour l’entropie statistique, on peut écrire

S = − k B Tr D ln D

=k B ln Z + k B ζi 〈A i 〉. (2.37)
i

Les variables naturelles de Z étant les multiplicateurs de Lagrange ζi , celles de l’entropie sont en
fait les valeurs moyennes 〈A i 〉. La différentielle totale de l’entropie est donnée par

d S = kB ζi d (〈A i 〉), (2.38)
i

d’où
∂S
= k B ζi . (2.39)
∂ 〈A i 〉
On en conclut que 〈A i 〉 et ζi sont conjuguées et par conséquent, (2.37) apparaît d’emblée comme
une transformée de Legendre.

47
Chapitre 2. Ensembles statistiques

Ensemble canonique Pour l’ensemble canonique, 〈A〉 = 〈H 〉 = E et selon (2.39) et (2.24), β ≡


ζ = (k B T )−1 est proportionnel à l’inverse de la température. La fonction de
partition devient
Z c = Tr e −β H . (2.40)

L’entropie quant à elle, s’écrit comme

S = k B β E + k B ln Z c . (2.41)

L’énergie libre de Helmholtz est donnée par

F = F (T, V , N ) ≡ −k B T ln Z c
= E − T S, (2.42)

qui est donc la transformée de Legendre de l’énergie interne E = E (S , V , N ), ayant l’entropie S


comme variable naturelle. Ici, le volume V et le nombre de particules N sont des données fixes
de l’ensemble canonique. La différentielle de l’énergie libre d’Helmholtz est donnée par
∂E ∂E ∂E
 ‹  ‹  ‹
dF = dS + dV + d N −Sd T − T dS
∂ S V ,N ∂ V S ,N ∂ N S ,V
= − P d V + µd N − S d T (2.43)

où nous avons utilisé les relations thermodynamiques pour la pression (∂ E /∂ V )S ,N = −P et le po-


tentiel chimique (∂ E /∂ N )S ,V = µ. On note ici que l’ajout de particules (d N ) au système s’exprime
comme un “travail” µd N . Suivant (2.43), on obtient les relations thermodynamiques suivantes :
∂F
 ‹
= − P,
∂ V N ,T
∂F
 ‹
= µ,
∂ N V ,T
∂F
 ‹
= −S. (2.44)
∂ T V ,N
Finalement, dans l’ensemble canonique, la pression s’exprime à travers l’équation d’état
∂ ln Z c
P = β −1 , (2.45)
∂V
qui relie la température, le volume et le nombre de particules à la pression.

Ensemble isobare-isotherme L’approche ci-dessus pour l’ensemble canonique se généralise


aisément au cas où des paramètres (comme le volume V par exemple)
deviennent statistiques ou même lorsque des champs extérieurs (magnétique, électrique...etc.) se
couplent au système et effectuent un travail. En fait, chacun de ces termes peut être assimilé à un
des éléments de la somme au second membre de droite dans (2.35). Maintenant, si l’ on considère
seulement le volume comme variable statistique supplémentaire, on peut écrire pour l’entropie
E
S = k B ln Z I + + k B ζp V , (2.46)
T

48
D. Ensembles

et à partir de (2.34), on retrouve

∂S
= k B ζP
∂V
P
= . (2.47)
T
Ainsi, on introduit le potentiel thermodynamique isobare-isotherme

G (T, P, N ) ≡ −k B T ln Z I (T, P, N ) = E − T S + P V . (2.48)

La fonction de partition de cet ensemble isobare-isotherme prend la forme



Z I (T, P, N ) = d V Tr e −β (H +P V ) . (2.49)

Comme précédemment, E = E (S , V , N ), et la différentielle totale du potentiel devient

d G = −S d T + V d P + µd N , (2.50)

d’où l’on tire


∂G
 ‹
= V,
∂ P T,N
∂G
 ‹
= µ,
∂ N P,T
∂G
 ‹
= −S, (2.51)
∂ T P,N

pour les dérivées du potentiel thermodynamique.

Ensemble grand-canonique L’approche ci-dessus se généralise immédiatement au cas de l’en-


semble grand-canonique pour lequel le nombre de particules et
l’énergie sont fixées statistiquement. Dans ce cas, on utlise l’expression générale de la fonction de
partition pour écrire
Z G (T, ζN , V ) = Tr e −β H −ζN N , (2.52)
où ζN est le multiplicateur de Lagrange lié à la contrainte du nombre moyen N de particules. Ici la
trace s’effectue sur des états de HH à nombre de particules variables (espace de Fock). De la même
manière que précédemment, l’entropie devient pour cet ensemble

S = k B ln Z G + k B β E + k B ζN N . (2.53)

Selon (2.39) et (2.31), nous avons


∂S µ
= k B ζN = − (2.54)
∂N T
et le grand potentiel thermodynamique A s’écrit

A(T, µ, V ) = − k B T ln Z G
= E − µN − T S (2.55)

49
Chapitre 2. Ensembles statistiques

et sa différentielle totale devient :

d A = −S d T − P d V − N d µ. (2.56)

De la même manière que ci-dessus, on trouve facilement

∂A
 ‹
= −S,
∂ T V ,µ
∂A
 ‹
= − P,
∂ V T,µ
∂A
 ‹
= −N, (2.57)
∂ µ T,V

comme relations thermodynamiques du grand potentiel.

E Approche variationnelle

La difficulté qu’entraîne le calcul explicite de la fonction de partition ou de l’opérateur densité nous


oblige la plupart du temps à avoir recours à des méthodes d’approximation. Parmi ces méthodes fi-
gure la théorie de perturbation. Cependant, elle est parfois d’un intérêt limité, en particulier lorsque
la perturbation devient importante. Dans cette section, on se propose de discuter une autre ap-
proche qui, bien que moins systématique, a le mérite d’être non perturbative et de faire appel à
l’intuition physique. C’est l’approche variationnelle qui, à l’instar de celle couramment utilisée en
mécanique quantique, peut être vue comme une approche non perturbative, c.-à-d. qu’en la com-
parant avec l’approche perturbative pour un problème précis, elle correspondrait à une sommation
infinie de termes de perturbation.

Si l’on se reporte à l’obtention de l’opérateur densité en (2.34), D était tel qu’il correspondait à un
extremum de l’entropie statistique. Cet extremum est en fait bien un maximum. Il est possible de
le montrer en utilisant l’inégalité (2.15) pour un opérateur densité DE ̸= D , à savoir

S (DE ) < −k B Tr DE ln D (2.58)

En utilisant (2.34), l’inégalité devient


S (DE ) < k B ln Z + k B ζi Tr DE A i . (2.59)
i

Si DE est choisi tel que Tr DE A i = 〈A i 〉, alors



S (DE ) < k B ln Z + k B ζi 〈A i 〉
i
< S (D ) (2.60)

50
E. Approche variationnelle

et il en découle que l’entropie statistique pour tout autre opérateur densité DE est nécessairement
plus petite que S (D ), telle que donnée en (2.13) et ce, même si DE est choisi de façon à satisfaire aux
contraintes statistiques (2.36). Néanmoins, comme la fonction de partition Z ou le potentiel ther-
modynamique −k B T ln Z ont un grand intéret et qu’en pratique, la trace de la fonction de partition
est souvent difficile à calculer, on est souvent obligé à remplacer D par un opérateur densité d’essai
DE , tel que Z devienne calculable.

En pratique, on choisira une classe d’opérateurs DE , guidée par l’intuition physique et qui depen-
dera d’un ou plusieurs paramètres variationnels. Le “meilleur DE ” sera obtenu à partir de l’inégalité
(2.60), en maximisant le premier membre de l’expression suivante


S (DE ) − k B ζi Tr DE A i < k B ln Z , (2.61)
i

par rapport au(x) paramètre(s) variationnel(s), afin qu’il se rapproche le plus de l’expression exacte
k B ln Z . Cette maximisation est vue sous l’angle de l’entropie statistique, mais lorsque l’on multiplie
chaque côté de l’inégalité par −T , cela revient à écrire

FE ≡ k B T ζi 〈A i 〉E − T S (DE ) > F (D ) (2.62)
i

et donc, à minimiser l’énergie libre d’essai FE . Vue sous cet angle, cette procédure se rapproche
d’emblée de celle utilisée en mécanique quantique pour la résolution de l’équation de Schrodinger,
lorsque l’énergie est minimisée à l’aide d’une fonction d’onde d’essai.

51
Chapitre 2. Ensembles statistiques

52
Chapitre 3

INTRODUCTION AUX TRANSITIONS DE PHASE

La phénoménologie des transitions de phase représente un vaste domaine de la physique. Il s’étend


en effet de l’éclosion de l’univers primordial en cosmologie, aux particules élémentaires jusqu’à
des phénomènes plutôt quotidiens en physique de la matière condensée comme la la fusion de la
glace en passant par la métallurgie, le magnétisme, vers des phénomènes quantiques macrosco-
piques comme la supraconductivité et la suprafluidité ... . Bien qu’apparaissant sous de multiples
formes, les transitions de phase présentent des propriétés très similaires. C’est le cas notamment
des transitions de phase du second ordre que nous aborderons plus en détail dans ce chapitre. Leur
description théorique constitue une des percées les plus remarquables de la physique au cours des
cinquante dernières années.

A Considérations de base

On distingue deux grandes classes de transitions de phase 1 : la transition discontinue ou de premier


ordre et la transition continue ou du second ordre 2 . Ces transitions se distinguent par l’émergence,
en fonction d’un certain paramètre physique comme la température, la pression, le champ magné-
tique, . . . , d’une valeur moyenne d’équilibre non nulle macroscopique appelée paramètre d’ordre.
Son émergence est le résultat (pas toujours !) d’une brisure spontanée de symétrie du système étu-
dié.

La transition du premier ordre se caractérise par l’existence d’une chaleur latente liée à des sauts
d’entropie à la transition et du paramètre d’ordre qui sont reliés à des dérivées premières de l’éner-
gie libre (voir note 2). En revanche, pour une transition continue ou du second ordre, il n’y a pas
d’énergie latente et de saut du paramètre d’ordre à la transition, lequel émerge progressivement à
partir de zéro à la transition.

Un exemple quotidien de transition discontinue est celui entre les états liquide et solide. Pour l’eau
par exemple, lorsqu’à pression atmosphérique l’on abaisse la température à partir de l’état liquide,
on atteint la température dite de transition Tt où apparaît “brutalement” une quantité macrosco-
pique de glace dont la densité, différente du liquide, peut être identifiée au paramètre d’ordre. À Tt ,
la partie solide peut être considérée en équilibre ou en coexistence avec le liquide. Comme on le
1. Ces deux catégories excluent les transitions de phase dites topologiques. Ces dernières sont abordées brièvement
plus loin dans ce chapitre.
2. La classification premier, second ordre, . . . des transitions de phase est due à Erhenfest qui associe l’ordre ‘n ’ de la
transition à une discontinuité de la dérivée ‘n e ’ de l’énergie libre.

53
Chapitre 3. Introduction aux transitions de phase

sait, l’agitation thermique des molécules de H2 O dans l’état liquide est telle que cet état ne présente
pas de symétrie particulière. Cependant, H2 O solide est un cristal ordonné de symétrie cubique-
face-centrée (cfc), impliquant la présence de liaisons cristallines (van der Waals et ponts hydro-
gènes). La formation discontinue de la glace à Tt libère alors cette énergie sous forme la chaleur
latente, laquelle est associée aux liaisons cristallines. Le changement de symétrie, cependant, n’est
pas une condition nécessaire à l’existence d’une transition discontinue. La transition liquide-gaz,
par exemple, peut également être discontinue, même s’il n’y pas de différence de symétrie entre
ces deux états de la matière. Par contre, cela diffère en général d’une transition de nature magné-
tique comme l’apparition d’une aimantation spontanée pour le Fe en dessous de 1042K, qui est
continue. Il en va de même des transitions métal-supraconducteur (Hg, Sn, ..., oxydes de cuivre,
composés organiques, K3 C60 , etc.), liquide-suprafluide (4 He et 3 He), etc.

3.A.1 Transition de phase pour un fluide

De façon générale à Tt , on appellera équilibre entre différents états de la matière, équilibre de phases.
Pour le solide, le liquide ou le gaz, la condition d’équilibre entre deux phases équivaut à poser

T1 =T2
P1 =P2
µ1 =µ2 ,
(3.1)

pour la température, la pression et le potentiel chimique de deux sous-systèmes. Il est clair que
pour les transitions pouvant survenir entre ces trois phases, l’ensemble isobare-isotherme est le
plus approprié. Dans ce dernier, le potentiel de Gibbs G (T, P, N ) qui est extensif, peut être mis sous
la forme
G (T, P, N ) = N g (T, P ), (3.2)
où l’énergie libre par particule g (T, P ) est une fonction de la pression et de la température. À partir
de (2.38), nous en déduisons que cette fonction coincide avec le potentiel chimique :

∂G
 ‹
= µ(T, P )
∂N T,P
= g (T, P ), (3.3)

de sorte que µ peut être vu comme l’énergie libre par particule. La condition d’équilibre

µ1 (T, P ) = µ2 (T, P ), (3.4)

relie alors T et P et permet donc de construire une ligne d’équilibre entre les deux phases considé-
rées. De faibles variations le long de la ligne d’équilibre, la condition devient

µ1 (T + δT, P + δP ) = µ2 (T + δT, P + δP ), (3.5)

Dont le développement au premier ordre conduit à l’égalité des différentielles totales d µ1 = d µ2 ,


soit
∂ µ1 ∂ µ1 ∂ µ2 ∂ µ2
 ‹  ‹  ‹  ‹
dT + dP = dT + d P, (3.6)
∂T P ∂P T ∂T P ∂P T

54
A. Considérations de base

ce qui nous autorise à établir


dP s1 − s2
= , (3.7)
dT v1 − v2
qui est la relation de Clausius-Clapeyron, une relation thermodynamique très importante dans
l’étude des transitions discontinue. Ici, s1,2 = −(∂ µ1,2 /∂ T ) et v1,2 = (∂ µ1,2 /∂ P ) sont respectivement
l’entropie et le volume par particule dans les phases 1 et 2. Cette relation peut également être mise
sous la forme
dP ∆q
= , (3.8)
dT T (v1 − v2 )
où ∆q = T (s1 − s2 ) est la chaleur latente, à la transition le long de la ligne d’équilibre.

liquide

gaz

.
FIGURE 3.1
Ligne de transition de premier ordre liquide-gaz

Prenons la transition gaz-liquide, nous savons par expérience qu’en raison de l’agitation thermique,
le volume par molécule ou par atome est supérieur pour le gaz que pour le liquide, ce qui implique
v1 > v2 . L’agitation thermique impose donc une incertitude plus grande sur la position de la parti-
cule, d’où une entropie plus importante pour le gaz que pour le liquide, à savoir s1 > s2 . La chaleur
latente est donc positive lorsque l’on passe du gaz au liquide (∆q > 0) et il en découle un coefficient
positif pour la ligne d’équilibre (d P /d T > 0, fig. 3.1).

L’application de la relation Clausius-Clapeyron pour la transition de fusion liquide-solide est très


similaire et donne dans la majorité des cas un d P /d T > 0. L’existence de liaisons cristallines dans
la phase solide indique que la chaleur latente est plus grande qu’à la transition liquide-gaz, d’où
un coefficient en pression plus grand et une montée plus rapide de la ligne d’équilibre. Quant au
signe de d P /d T pour la transition de fusion, ll y a quand même une exception à la règle en ce qui
concerne H2 O. En effet, comme la glace flotte sur l’eau, nous avons v1 < v2 et ce, bien que s1 > s2 ,
en raison de l’ordre cristallin. Le coefficient en pression est donc négatif dans ce cas particulier
(d P /d T < 0), d’où la diminution de la température de transition sous pression. C’est ce qui explique
la possibilité de faire du patin à glace l’hiver, le crépitement accentué de la neige sous notre poids
par temps très froid, etc. La transition de sublimation entre les phases gazeuse et solide apparaît
toujours, quant à elle, avec un d P /d T > 0. Maintenant, si nous combinons les lignes d’équilibre
pour les trois possibilités de transition, on voit qu’il existe un point de rencontre, le point triple, où
les trois phases gaz, liquide et solide sont en équilibre (fig. 2).

55
Chapitre 3. Introduction aux transitions de phase

liquide

solide
Pc
Cr.

Tr.
gaz

Tc T

.
FIGURE 3.2
Diagramme (P, T ) pour les phases solide, liquide et gazeuse. À noter que la ligne d’équilibre liquide-gaz se
termine par un point critique du second ordre pouvant être contourné continûment.

Avant de clore cette sous-section, nous voudrions mettre en relief une caractéristique fort impor-
tante des transitions gaz-liquide, à savoir l’existence d’un point critique. En fait, l’application d’une
pression de plus en plus grande le long de la ligne d’équilibre fera en sorte de comprimer les molé-
cules dans un espace de plus en plus restreint et ce, plus rapidement pour le gaz que pour le liquide.
Il s’ensuit que pour une pression critique Pc suffisamment grande, v1 = v2 . Or, comme le liquide et le
gaz possèdent les mêmes éléments de symétrie, lorsque v1 = v2 , rien ne distingue le gaz du liquide.
Dans ces conditions, s1 = s2 et il n’ y a plus de chaleur latente à la température de transition qu’on
appellera température critique Tc . La transition devient donc continue ou du second ordre. Il est in-
téressant de noter que puisqu’à T > Tc , le liquide et le gaz cessent d’être discernables, nous pouvons
passer continûment du liquide au gaz, sans qu’il y ait transition de phase et ce, en contournant le
point critique (fig. 3.1) 3 . L’existence de ce point critique explique par exemple pourquoi l’helium ne
peut se liquéfier qu’en dessous de Tc = 5.2K, peu importe la pression appliquée. De façon plus gé-
nérale cependant, cela n’implique pas que toutes les transitions du second ordre soient précédées
d’une ligne de transition du premier ordre. C’est le cas notamment des transitions magnétiques,
supraconductrices, suprafluides, . . . sous des conditions normales.

En terminant, comme à T < Tc , les volumes des phases liquide et vapeur ne sont pas égaux, il
s’ensuit qu’à chaque valeur (P, T ) de la ligne d’équilibre correspond deux densités ρG = N1 /V1 et
ρL = N2 /V2 pour le gaz et le liquide dans le diagramme P v s ρ. On peut dès lors construire une
ligne de coexistence (fig. 3.3), ligne en caractère gras) entre les deux phases à partir du point critique
ρc . Sur cette figure, nous pouvons également tracer les i s o t h e r m e s , que sont les courbes P v s ρ.
On remarque alors qu’à très haute température, lorsque T ≫ Tc , la pression varie linéairement avec
ρ selon la relation bien connue pour les gaz parfaits :

P = ρk B T /M . (3.9)

Cependant, à l’approche du point critique, on constate que la forme des isothermes n’est plus li-
néaire. Cette propriété signifie en fait que les molécules ne sont plus indépendantes et que les in-
teractions entre molécules introduisent des déviations sévères à la loi des gaz parfaits.

3. Une ligne dite de crossover, appelée ligne de Widom, est franchie lors du contournement du point critique.

56
A. Considérations de base

T >> Tc
P T > Tc

coexistence T < Tc

Gaz Liquide

ρ ρC ρ ρ
G L

FIGURE 3.3
Isothermes de la transition gaz-liquide pour un fluide.

3.A.2 Analogue magnétique

Les transitions ferromagnétiques sont en général continues et ne présentent pas de chaleur latente
au point critique. À T < Tc , ce type de système présente une aimantation spontanée d’équilibre
M 0 (T ), en l’absence de champ magnétique appliqué h . Cet état possède en champ nul une double
dégénérescence ±M 0 (T ) puisque le système doit rester invariant sous renversement du temps. On
constate en fait que si nous appliquons un champ magnétique infinitésimal, l’aimantation s’oriente
“en bloc” dans la direction du champ. Si le champ augmente en amplitude, le système présentera
une aimantation M plus grande que celle d’équilibre M 0 (T ) à h = 0. Maintenant, si on renverse la
direction du champ, à savoir lorsque h = 0+ → 0− , l’aimantation totale bascule, c.-à-d. M 0 (T ) →
−M 0 (T ). Comme ces deux états sont dégénérés, il n’y a donc pas de chaleur latente (fig. 3.5). De
la même manière que pour un fluide, nous pouvons tracer des isothermes de M v s h , où ici h est
l’analogue de la pression et M la variable extensive, analogue à la densité. On constate alors qu’à
l’instar de la relation entre P et ρ, la relation entre M et h n’est plus linéaire au voisinage du point
critique, soulignant ainsi l’importance des interactions entre spins individuels à l’approche de Tc .

B >0

instable

instable
T
B < 0

FIGURE 3.4
Diagramme (M 0 , T ) en présence d’un champ magnétique.

57
Chapitre 3. Introduction aux transitions de phase

B Comportement critique à l’approche d’une transition continue

Une caractéristique fondamentale des transitions continues est la singularité de certaines fonctions
de réponse au point critique. Pour la transition gaz-liquide par exemple, la compressibilité isotherme
définie par
1 ∂V
 ‹
κ(T ) = − > 0, (3.10)
V ∂P T
est singulière à Tc . La compressibilité traduit la réponse en volume sous l’action d’une variation de
pression. La singularité de celle-ci proche de Tc peut être mise sous la forme d’une loi de puissance :

κ(T ) ∼ (T − Tc )−γ (T > Tc )



(Tc − T )−γ (T < Tc ), (3.11)

où γ et γ′ sont appelés exposants critiques. Ils caractérisent de façon quantitative le degré de diver-
gence de κ(T ). Expérimentalement, la mesure minutieuse de κ(T ) pour H2 O, près de Tc révèle que
γ = γ′ ≃ 1.2, alors que pour la transition gaz-liquide pour l’4 He à la pression critique, γ = γ′ ≃ 1.3.

Lorsque T → Tc± , les transitions liquide-gaz et para-ferromagnétique présentent des analogies


étonnantes. On constate en effet que l’analogue de la compressibilité isotherme pour les systèmes
magnétiques, à savoir la susceptibilité magnétique en champ nul,

∂M
 ‹
χ(T ) ≡ , (3.12)
∂ h T,h →0

présente aussi une singularité à la transition ferromagnétique. En champ nul, elle est de la forme

χ(T ) ∼ (T − Tc )−γ (T > Tc )



(Tc − T )−γ (T < Tc ). (3.13)

Expérimentalement, pour le fer et le nickel, on observe que γ = γ′ ≃ 1.3, valeur qui coincide essen-
tiellement avec celle de la compressibilité pour la transition gaz-liquide, pourtant de nature très
différente !

Dans la limite h → 0 et pour T < Tc , l’intégration de (3.12) nous conduit à

M (T, h ) = M 0 (T ) + χ(T )h , (3.14)

en réponse linéaire. Ici, M 0 (T ) est l’aimantation (paramètre d’ordre) d’équilibre en champ nul, la-
quelle pour une transition continue s’annule en loi de puissance lorsque T → Tc− :

M 0 (T ) ∼ (Tc − T )β , (3.15)

, où β est un autre exposant critique de la transition. Les observations expérimentales montrent que
pour des systèmes comme le Fe et le Ni, β ≃ .35. Il est intéressant de noter ici que pour la transition
gaz-liquide, l’analogue de l’aimantation spontanée est la différence de densités entre liquide et gaz,
ρL −ρG , et il existe une dépendance en température très similaire (ligne de coexistence de la fig. 3.5) :

ρL − ρG ∼ (Tc − T )β . (3.16)

58
B. Comportement critique à l’approche d’une transition continue

ρ
liquide
lignede
coexistence

mixte ρ − ρ
L G

ρ mixte T
c

gaz

FIGURE 3.5
Variation de la différence de densité ρL − ρG (paramètre d’ordre) en fonction de la température à la ligne
de coexistence entre fluide et gaz.

Pour H2 0 par exemple, β ≃ .35, valeur qui coïncide essentiellement avec celle observée pour la
transition magnétique.

L’absence de chaleur latente à Tc pour une transition du second ordre n’implique pas nécessaire-
ment l’absence de singularités pour la chaleur spécifique. Par définition, nous avons pour un fluide
(système magnétique) :

∂S
‹ 
CV (h ) = T
∂ T V (h )
∂Q
 ‹
= , (3.17)
∂ T V (h )

où Q = T S est la chaleur. Ainsi, la chaleur dégagée par la transition au point critique s’exprime
comme ∫ T+
c
∆Q = CV (h ) d T . (3.18)
Tc−

Donc en absence de chaleur latente à une transition de second ordre, on doit avoir ∆Q ≡ 0, ce qui
impose en retour une contrainte sur une singularité éventuelle de la chaleur spécifique. En effet, si
on pose l’existence d’un comportement singulier de la forme :

CV (h ) ∼ (T − Tc )−α (T > Tc )

(Tc − T )−α (T < Tc ), (3.19)

où α et α′ sont les exposants critiques, alors (3.18) impose α( ) < 1. L’exposant de la chaleur spéci-

fique est en général faible et figure parmi les plus difficiles à mesurer expérimentalement. En guise
d’illustrations, mentionnons que pour la transition gaz-liquide de l’4 He par ex., α ≃ .127 et α′ ≃ .159,
alors que pour la transition antiferromagnétique de FeF2 , on observe α = α′ ≃ .112 ± .044. Pour la
transition ferromagnétique du fer, cependant, la chaleur spécifique ne diverge pas mais semble plu-
tôt montrer un pic et correspond à α < 0. Pour la transition métal-supraconducteur comme pour
l’aluminium à Tc ∼ 1K, il y a un saut de chaleur spécifique correspondant à α = 0.

Strictement à Tc , nous avons vu que la croissance non linéaire de M avec h ou encore de ρL −


ρG avec (P − Pc ) nous renseigne sur les interactions entre les constituants (spins ou molécules). Il

59
Chapitre 3. Introduction aux transitions de phase

est en fait possible d’introduire un autre exposant critique, δ, lié à la non-linéarité des isothermes
critiques, soit
M ∼ h 1/δ , (T = Tc ) (3.20)
pour la transition ferromagnétique et

ρL − ρG ∼ | P − Pc |1/δ (T = Tc ), (3.21)

pour la transtion liquide-gaz. Pour le fer et le nickel, on observe la valeur δ ≃ 4.3 alors que pour H2 0
et l’4 He, δ ≃ 4 et δ ≃ 3.95, respectivement. Donc ici encore, même si les systèmes sont très différents
au niveau microscopique, il se dégage une certaine universalité dans les comportements critiques.

3.B.1 Paramètre d’ordre et corrélations

Nous avons mentionné ci-dessus que la description des transitions de phase se caractérise par
l’existence d’une valeur moyenne statique macroscopique non nulle φ0 (T ) à T < Tc , appelée le pa-
ramètre d’ordre. Pour une transition continue sans chaleur latente, le paramètre d’ordre s’annule
de façon continue lorsque T → Tc− , alors que pour celle de premier ordre, φ0 (T ) passe disconti-
nûment d’une valeur finie (macroscopique) à zéro (fig. 3.6). Ainsi, pour la transition gaz-liquide, le
paramètre d’ordre est donné par φ0 ≡ ρL − ρG , alors que pour un ferroaimant, φ0 ≡ M 0 . Comme
φ0 est une valeur moyenne d’ensemble, il y aura obligatoirement, en tant que variable interne, des
fluctuations du paramètre d’ordre dans l’espace et dans le temps. Nous sommes donc amenés natu-
rellement à considérer les corrélations spatiales (statiques), voire même temporelles (dynamiques)
du paramètre d’ordre. C’est en fait précisément l’objet de la théorie moderne des transitions de
phase que d’étudier les fluctuations critiques de φ près de Tc , en tant que source des singularités
observées au point critique, ainsi que de la similarité frappante des exposants critiques pour divers
systèmes. C’est le défi relevé par la physique statistique qui est parvenue à une description théo-
rique unifiée de ces phénomènes.

Tc (1er)

Tc
T

FIGURE 3.6
Variation du paramètre d’ordre en fonction de la température pour une transition continue et discontinue.

Il est possible d’illustrer l’importance des corrélations à l’approche d’un point critique à l’aide d’un
phénomène étonnant, connu depuis plus d’un siècle pour la transition liquide-gaz, qui est celui
de l’opalescence critique. Lorsque nous approchons cette transition à partir de la phase gazeuse le
point critique en température, on observe l’apparition de fluctuations importantes de la densité qui

60
B. Comportement critique à l’approche d’une transition continue

Exposant Magnétisme Liquide-gaz T

α CH ∼ |ε|−α CV ∼ |ε|−α T → Tc±


β M ∼ |ε| β ρL − ρG ∼ |ε| β T → Tc−
γ χ(T ) ∼ |ε|−γ κ(T ) ∼ |ε|−γ T → Tc±
δ M ∼ B 1/δ ρL − ρG ∼ |P − Pc |1/δ T = Tc
η GM (r ) ∼ 1/r d −2+η Gn (r ) ∼ 1/r d −2+η T = Tc
ν ξ ∼ |ε |−ν ξ ∼ |ε|−ν T → Tc±

TABLE 3.1
Indices critiques statiques pour les systèmes magnétiques et fluides. Le paramètre critique fonction de la
T −T
température ε ≡ Tc c .

se traduisent par la formation et la vaporisation incessantes au cours du temps de gouttelettes de


liquide. Plus on se rapproche de Tc et plus la taille de ces gouttelettes augmente pour finalement
atteindre une taille macroscopique à Tc . D’un point de vue dynamique, le temps mis par les gout-
telettes pour se vaporiser ou se former devient alors très grand, c’est ce qu’on appelle le ralentisse-
ment critique. Il indique tout simplement que l’équilibre entre gaz et liquide à Tc est long à réaliser.
C’est ainsi que pour T → Tc , la taille moyenne des gouttelettes devient suffisamment grande pour
que la lumière visible de longueur d’onde de l’ordre du micron soit diffusée de façon accrue par le
système qui cesse par exemple d’être transparent pour acquérir une apparence “laiteuse”, d’où le
phénomène d’opalescence critique 4 .

La formation de gouttelettes macroscopiques nécessite donc la présence de corrélations spatiales


très fortes entre les molécules constituantes. Ces corrélations sont à longue portée à Tc . Les corré-
lations à grande distance existent également entre les spins d’un système magnétique à l’approche
du point critique. Ici, l’analogue des gouttelettes est en fait des îlots de spins orientés dans la même
direction et la taille de certains de ceux-ci atteignent celle de l’échantillon à Tc .

Il apparaît donc naturel d’introduire une longueur caractéristique, ξ, pour la taille moyenne du plus
grand amas ordonné, c’est la longueur de corrélation. Comme elle est singulière à Tc , elle prend la
forme

ξ ∼ (T − Tc )−ν (T > Tc )
−ν′
∼ (Tc − T ) (T < Tc ), (3.22)

ce qui permet d’introduire un autre exposant critique, ν, qui, en général est supposé égal à ν′ . ξ
donne donc l’échelle de longueur (maximum) sur laquelle les fluctuations du paramètre d’ordre
sont corrélées entre elles. Pour des distances r ≫ ξ, les corrélations deviennent négligeables. Em-
piriquement, l’ensemble des expériences (diffusion par ex.) montrent que r ≫ ξ, les corrélations
4. On a un phénomène de diffusion de la lumière similaire lorsque l’atmosphère devient chargée d’humidité et que
la visibilité diminue sensiblement par la brume.

61
Chapitre 3. Introduction aux transitions de phase

sont exponentiellement amorties. On peut écrire

Gφ (r ) = 〈φ(r )φ(0)〉
∼ e −r /ξ (T > Tc , r ≫ ξ). (3.23)

Comme à Tc , ξ → ∞ et la limite r ≪ ξ est atteinte. Dans ces conditions, on observe que les corré-
lations du paramètre d’ordre ont une décroissance algébrique ou en lois de puissance 5 :

1
Gφ (r ) ∼ (T = Tc ), (3.24)
r d −2+η
où d est la dimension spatiale du système et η est l’exposant critique de la fonction de corrélation.

La présence d’une loi de puissance pour la fonction de corrélation au point critique illustre la struc-
ture fractale des corrélations. Prenons l’exemple du ferroaimant, si l’on regarde l’amas ordonné de
longueur ξ → ∞, on constate qu’il est constitué d’amas légèrement plus petits, mais pour lesquels
les spins sont orientés dans la direction opposée. Localisons un de ces amas et regardons à l’inté-
rieur de celui-ci, on constate alors que lui aussi est constitué d’amas légèrement plus petits, mais de
spins opposés. On pourrait ainsi continuer cette opération de “grossissement de l’échelle d’obser-
vation ” et constater l’invariance d’échelle (fractale). Cette structure fractale persiste jusqu’au mo-
ment où l’échelle la plus petite, qui est celle des constituants microscopiques que sont les “amas à
un spin”, est atteinte. La structure fractale est en fait clairement exprimée mathématiquement par
la propriété d’homogénéité de la loi de puissance en (3.24). En effet, si l’on effectue un changement
d’échelle r → r ′ s où s > 1 (contraction des longueurs), on a

Gφ (r = r ′ s ) = s 2−d −η Gφ (r ′ )
1
∼ ′d −2+η ,
r
(3.25)

et Gφ (r ′ ) garde la même forme que Gφ (r ) et ce pour tout r ≪ ξ.

Bien qu’à T > Tc , les fluctuations d’amas corrélés ont lieu sur une longueur maximale de l’ordre de
ξ qui est finie, une structure fractale persiste grosso modo jusqu’à ξ. Ainsi, au lieu de (3.24) près du
point critique, il est donc plus juste de poser

e −r /ξ
Gφ (r ) ∼ (T > Tc ) . (3.26)
r d −2+η

À T < Tc , une description similaire pour Gφ s’applique en notant cependant que dans la phase
ordonnée la définition de Gφ est modifiée :

Gφ (r ) = 〈φ(r )φ(0)〉 − φ02 (3.27)

où le carré du paramètre d’ordre à l’équilibre φ02 est une constante uniquement fonction de la tem-
pérature.

5. Relation de Fisher.

62
B. Comportement critique à l’approche d’une transition continue

3.B.2 Universalité

Nous avons souligné à maintes reprises la similarité frappante entre exposants critiques de sub-
stances dont les constituants microscopiques diffèrent, voire même les interactions entre ceux-ci.
La figure 3.7 donne une illustration de ce phénomène pour l’exposant β lié à la condensation d’un
grand nombre de substances ayant des températures critiques différentes. Lorsqu’on ramène les
données de ρ v s T en fonction de la densité et de la température réduites, c.-à-d. en ρ/ρc v s T /Tc ,
tous les profils en température se superposent sur une même et unique courbe d’exposant β ≃ .34.
Une superposition similaire peut également apparaître pour les ferroaimants, les alliages binaires,
les supraconducteurs conventionnels, etc.

FIGURE 3.7
Loi des états correspondants pour un ensemble de transitions gaz-liquide illustrant l’universalité du com-
portement du paramètre d’ordre ρL − ρG ∼ (1 − T /Tc )β avec β = 1/3 (ligne pleine). Illustration tirée de : E. A.
Guggenheim, Journal of Chemical Physics 13, 253 (1945) (Tous droits réservés)

Cette loi des états correspondants suggère donc l’existence de classes d’universalité en phénomènes
critiques dans lesquelles, des substances et des transitions différentes, présentent néanmoins des
comportements critiques (exposants) similaires. Ce fut un des triomphes de la théorie moderne
des phénomènes critiques d’avoir su donner une description théorique complète et quantitative de
l’universalité observée dans les transitions de phase. Son origine tient en fait à la structure fractale
des corrélations macroscopiques à Tc - elle-même universelle à toutes les corrélations critiques-
qui, lorsque superposé à l’effet de la dimension spatiale et des degrés de liberté internes du paramètre
d’ordre, fait disparaître à l’échelle de ξ toute espèce “d’individualité” microscopique. Tout ce passe
comme si à l’échelle de ξ → ∞, la nature particulière des constituants et des forces qui les relient
perdent complètement leur pertinence, seules la dimension spatiale d du système et le nombre de
composantes n du paramètre d’ordre φ = (φ1 , . . . , φn ) restent pertinents dans la définition d’une
d’universalité.

63
Chapitre 3. Introduction aux transitions de phase

Exposant Xe Fe Ni

α .1 −.03 ± .12 .04 ± .12


β .35 ± .015 .34 ± .01 .358 ± .003
γ 1.3 ± .15 1.33 ± .03 1.33 ± .02
δ 4.2 ± .4 4.3 ± .1 4.29 ± .05
η .1 ± .1 .07 ± .04 .041 ± .01
ν .57 .69 ± .02 .64 ± .1

TABLE 3.2
Principaux indices critiques statiques mesurés pour les transitions ferromagnétiques (Fe, Ni) et liquide-
gaz (Xe).

Les tableaux 3.1 et 3.2 récapitulent les principaux exposants statiques pour les transitions de phase
de deuxième ordre pour quelques systèmes.

C Approche de champ moyen phénoménologique pour la transition


magnétique

L’existence de corrélations à grande distance lors d’une transition de phase du second ordre montre
clairement l’importance des interactions entre les constituants élémentaires du système macrosco-
pique. Pour un système magnétique, ce sont les électrons et leurs degrés de liberté électroniques qui
interagissent. Dans le cas simple où les spins peuvent être considérés comme localisés sur chacun
des atomes constituant le réseau, c’est l’interaction d’échange entre spins qui joue habituellement
un rôle important. L’échange résulte en fait du recouvrement des orbitales électroniques entre sites.
Or comme on le sait, les fonctions d’onde d’états liés atomiques décroissent exponentiellement en
fonction de la distance, ce qui force l’intégrale d’échange à avoir une portée finie et à toutes fins
utiles limitée aux plus proches voisins. C’est précisément la portée finie des interactions qui rend
le calcul de la fonction de partition si difficile et nous oblige à avoir recours à des approximations.
L’une d’entre elles qui est couramment utilisée est celle dite de champ moyen.

Nous introduirons la théorie de champ moyen pour le cas de la transition ferromagnétique avec
spins localisés. C’est l’hypothèse de Weiss 6 pour l’existence d’un champ moléculaire macrosco-
pique menant à la transition ferromagnétique. Elle repose sur la présence d’une majorité de spins
pointant dans une certaine direction privilégiée en dessous de la température critique Tc . Dans
cette région en température, il apparaît légitime de supposer l’existence d’un champ macroscopique
6. 1907

64
C. Approche de champ moyen phénoménologique pour la transition magnétique

interne qui tend à aligner les spins selon une direction donnée. Manifestement, ce champ macro-
scopique moléculaire est proportionnel à l’aimantation spontanée M. On posera dans la théorie de
Weiss :
BW = λM, (3.28)
où λ est une constante liée à l’interaction spin-spin, sans laquelle évidemment, le champ molécu-
laire n’existerait pas. Dans une approche phénoménologique, par opposition à une approche mi-
croscopique, on ne cherche pas à déterminer λ à l’aide de constantes microscopiques, on postule
seulement son existence.

En présence d’un champ magnétique externe, l’hamiltonien de champ moyen peut s’écrire
N

HW = −g µB S · (H + λM). (3.29)
i =1

Si on choisit H = h z (∥M) comme orientation du champ externe, la fonction de partition canonique


prend la forme

Z = Tr e −β HW
∑N z
β g µB i =1 Si (H +λM )
= Tr e . (3.30)

Ainsi, postuler l’existence d’un champ moléculaire revient à négliger entièrement les corrélations,
de sorte que la fonction de partition s’exprime en un produit de N fonctions de partition indépen-
dantes associées à chacun des sites, lesquels sont tous affectés de la même façon :
N
β g µB S z (h +λM ) N
∏ 
Z= Z i = Tre
i =1
 N
= 2 cosh(β µB (h + λM ) , (3.31)

où pour des spins 12 , le facteur de Landé g ≃ 2. L’énergie libre pour la configuration du champ
moléculaire M devient 7
F (β , h , M ) = −k B T lnZ (β , h , M ), (3.32)
d’où l’on tire pour l’aimantation totale :

∂F

‹
M=−
∂h H
=N µB tanhβ µB (h + λM ), (3.33)

qui est une équation d’état dont les solutions correspondent à l’aimantation d’équilibre qu’on no-
tera M 0 (T ). Cette équation “d’auto-cohérence” n’admet pas de solution analytique à toutes les tem-
pératures. Pour la description de la transition ferromagnétique, il devient pertinent de regarder les
solutions possibles en champ nul. On voit d’emblée que pour T → ∞, la seule solution est pour
M 0 = 0, alors que pour T → 0, tanh(±∞) → ±1 et M → M 0 = ±N µB , atteignant sa valeur de sa-
turation. Il existe donc une température intermédiaire où la solution de (3.33) cesse d’être triviale.
7. L’énergie libre, tout comme la fonction de partition, ont ici comme variables T (ou β ), h et M . Il s’agit en fait
de ces mêmes fonctions pour une configuration du champ moléculaire M et qu’un meilleur niveau d’approximation
consisterait à tenir compte des fluctuations de M , en tant que variable interne.

65
Chapitre 3. Introduction aux transitions de phase

Appelons cette température Tc . Au voisinage de cette dernière, M (T ) ≪ M 0 , l’équation d’état (3.33)


conduit alors à la condition pour Tc , à savoir N µB βc µB λ = 1, d’où

Tc = C λ, (3.34)

où C = N µ2B /k B est appelée constante de Curie.

3.C.1 Exposants critiques en théorie de champ moyen

Paramètre d’ordre Près de Tc , il est possible d’obtenir une solution analytique pour
d’aimantation en champ nul. l’aimantation d’équilibre. Dans un premier temps, il est commode
de définir les quantités réduites M̄ ≡ M /(N µB ) et T¯ ≡ T /Tc , de
sorte que l’expression (3.33) peut s’écrire

M̄ =tanh β µB h + M̄ /T¯ ). (3.35)

En champ nul, près de Tc , soit T¯ ≈ 1, M̄ devient faible. Ainsi, en développant le second membre de
(3.35) pour M̄ ≪ 1, on obtient à O (M̄ 3 ),

M̄ 1 M̄ 3
M̄ = − + O (M̄ 5 ). (3.36)
T¯ 3 T¯ 3

À T → Tc+ , T¯ → 1+ et la seule solution possible est triviale (M̄ 0 = 0 ). À T → Tc− ou T¯ → 1− , une


solution non triviale émerge pour le paramètre d’ordre :

p Tc − T β
 ‹
M̄ (T ) = 3 T¯ , (3.37)
Tc

où β = 12 est l’exposant critique du paramètre d’ordre en théorie de champ moyen (figure 3.8). La
théorie de Weiss reproduit donc, du moins qualitativement, l’émergence d’un paramètre d’ordre
d’aimantation pour la transition magnétique de nature continue 8 .
M

0.5

0.4

0.3

0.2

0.1

T
0.92 0.94 0.96 0.98 1.00

FIGURE 3.8
Variation du paramètre d’ordre d’aimantation réduite M̄ en théorie de champ moyen près de la tempéra-
ture critique T¯ = T /Tc = 1.

8. L’exposant β = 1/2 est significativement plus grand que les valeurs expérimentales observées dans la plupart des
situations de transition magnétique.

66
C. Approche de champ moyen phénoménologique pour la transition magnétique

Susceptibilité magnétique en Analysons à l’intérieur de la théorie de Weiss le comportement cri-


champ nul. tique près de Tc de la susceptibilité magnétique en champ h → 0.
En termes des variables réduites, la susceptibilité s’écrit

∂M ∂ M̄
 ‹  
χ(T ) = = N µB (3.38)
∂h T ∂h T

Au-dessus, mais près de Tc et pour h → 0, l’argument de la fonction hyperbolique en (3.35) est faible
et son développement à l’ordre linéaire conduit à

M̄ → β µB h + M̄ /T¯ + . . . .

La dérivation par rapport au champ donne

∂ M̄ β µB
 
= (3.39)
∂ h T 1 − 1/T¯

et l’expression de la susceptibilité au-dessus de Tc devient

χ(T ) = C (T − Tc )−γ , (3.40)

où γ = 1 est l’exposant critique de la susceptibilité magnétique en champ nul au-dessus de Tc et C =


N µ2B /k B est la constante de Curie. La susceptibilité magnétique uniforme diverge donc à l’approche
de la transition.

À T → Tc− , selon (3.37), M̄ (T ) ̸= 0, et le développement de (3.35) doit être poussé à un ordre plus
haut, soit
1
M̄ → β µB h + M̄ /T¯ − (β µB h + M̄ /T¯ )3 + . . . .
3
La dérivée en champ h → 0 de cette expression donne la susceptibilité

M 0 β µB 1 − [M̄ (T )]2 /T¯ 2
χ(T ) = , (3.41)
1 − 1/T¯ + [M̄ (T )]2

laquelle fait apparaître la contribution de l’aimantation d’équilibre (3.37). Près de Tc− , M̄ ≪ 1 et


seule sa contribution au dénominateur compte. Après substitution de (3.37), on trouve

M 0 β µB
χ(T ) =
1 − 1/T¯ + [M̄ (T )]2
1 ′
= C (Tc − T )−γ , (3.42)
2
où γ′ = γ = 1. On remarquera ici que le coefficient de la susceptibilité diffère de part et d’autre de Tc
(figure 3.9).

Isotherme critique. Si on se place au point critique, c.-à-d. à T = Tc , lorsque h et M varient, il est


possible d’extraire l’isotherme critique en champ moyen. Si on découple h
de M̄ dans (3.35), on trouve

M̄ − tanh(M̄ /T¯ )
tanh(β µB h ) = . (3.43)
1 − M̄ tanh(M̄ /T¯ )

67
Chapitre 3. Introduction aux transitions de phase

T
0.90 0.95 1.00 1.05 1.10

FIGURE 3.9
Variation de la susceptibilité magnétique en théorie de champ moyen près de la température critique T¯ =
T /Tc = 1.

En champ faible à T¯ = 1, M̄ ≪ 1, et le développement de part et d’autre permet d’obtenir


Æ
M̄ = 3 3βc µB h 1/δ (T = Tc ), (3.44)

avec un exposant critique δ = 3, en théorie de champ moyen. Ce résultat confirme donc la non-
linéarité de M avec h à Tc et ce, même en champ faible.

Maintenant, si on s’éloigne de Tc , le développement de (3.43) en champ faible donne à son tour

1
µB β h ≃ M̄ (1 − T¯ −1 ) + M̄ 3 [ T¯ −3 + T¯ −1 (1 − T¯ −1 )] + O (M̄ 5 ), (3.45)
3
pour T ̸= Tc . On voit que dans la limite paramagnétique, lorsque T ≫ Tc , cette expression se réduit
à
M̄ ≃ µB β h , (3.46)
qui redevient linéaire. De cette dernière, on retrouve bien une susceptibilité de Curie

N µ2B
χ(T ) = (T ≫ Tc ), (3.47)
kB T

caractéristique d’un ensemble de N spins sans interaction.

Énergie libre et chaleur Afin de dériver l’expression de la chaleur spécifique près de Tc , nous
spécifique. avons besoin de l’expression de l’énergie libre dans cette gamme en tem-
pérature. Cependant l’expression de l’énergie libre de Weiss en (3.32)
(voir aussi note 7) fait apparaître simultanément les variables conjuguées M et h , ce qui empêche
l’obtention d’une énergie libre fonction de M . Il est possible d’y remédier en remarquant que si les
solutions de (3.35) pour M (T ) sont celles qui minimisent l’énergie libre, alors on peut écrire

1 ∂F
M̄ = − = tanh β µB h + M̄ /T¯ )
M 0 ∂ h h →0 h →0

β µB ∂F
=−
M 0 (β µB ∂ h ) h →0
1 ∂ F¯
=− (3.48)
k B Tc ∂ M̄ h →0

68
C. Approche de champ moyen phénoménologique pour la transition magnétique

où on a identifié à une constante multiplicative près la dérivée par rapport à h à une dérivée par
rapport à M̄ , dans la limite h → 0. Ici F¯ = F /N est l’énergie libre par site. Ainsi on peut voir l’équa-
tion précédente comme une minimisation d’une énergie libre de Gibbs Γ̄ avec M̄ comme variable
naturelle. Près de Tc , on a
∂ Γ̄ ∂ ¦ F¯ 1 ©
βc ≡ + M̄ 2 = 0
∂ M̄ ∂ M̄ k B Tc 2
1 M̄ 3
= M̄ (1 − T¯ −1 ) + + O (M̄ 5 )
3 T¯ 3
(3.49)

L’intégrale sur M̄ de cette expression donne forme à l’énergie libre par spin :

Γ̄ (T, M̄ ) ≃ Γ̄ 0 + a (T )M̄ 2 + b (Tc )M̄ 4 + . . . , (3.50)

qui est appelée développement de Landau 9 . La constante d’intégration Γ̄ 0 est ici l’énergie libre sans
interaction, soit à M̄ = 0. Les paramètres de développement sont donnés par

a (T ) = a ′ (T − Tc )
k B Tc3
b (Tc ) = , (3.51)
12T 2 T =Tc

avec a ′ = 12 k B et où nous avons gardé comme unique dépendance en température, celle du coef-
ficient a (T ), laquelle peut toujours, le cas échéant, être linéarisée près de Tc . Tous les autres co-
efficients sont évalués à Tc , ce qui ne représente pas une erreur appréciable pour autant que ce
développement se limite à la région près de Tc . La condition de minimisation ∂ Γ̄ /∂ M̄ = 0, nous
permet de vérifier que l’aimantation d’équilibre est de la forme

M̄ = 0 (T > Tc )

√ a (T )
M̄ (T ) = − (T < Tc )
2b (Tc )
p Tc − T β
 ‹
= 3 , (3.52)
Tc
qui coïncide avec (3.37) près de Tc− . Il est commode d’expliciter l’énergie libre par spin pour la confi-
guration d’équilibre M̄ (T ), c.-à-d. en substituant (3.52) dans (3.50) pour donner

Γ̄e q = Γ̄ [β , M̄ (T )]
= Γ̄ 0 (T > Tc )
a (T )
2
= Γ̄ 0 − (T < Tc ). (3.53)
4b (Tc )
On peut alors avoir accès à la chaleur spécifique par spin en présence d’ordre à longue à distance.
En théorie de champ moyen, elle est donée par
∂ Γ̄e q
 2 
C = −T
∂T2
9. De façon générale, la théorie de Landau (phénoménologique) des transitions de phase du second ordre revient à
postuler l’existence d’un tel développement près de Tc .

69
Chapitre 3. Introduction aux transitions de phase

=0 (T > Tc )
′2
Ta
= (T < Tc ) (3.54)
2b (Tc )
10
Il n’y a alors pas de divergence, mais plutôt un saut de chaleur spécifique à Tc . Selon l’expression
générale (3.19) pour les transitions continues, nous avons α = α′ = 0.

D Approche microscopique à la théorie de champ moyen

Dans le cadre de la théorie de Weiss du ferromagnétisme de la section précédente, nous avons pos-
tulé l’existence d’un champ moyen par une approche dite phénoménologique à la transition. La
structure microscopique du paramètre λ dans un telle théorie n’est pas spécifiée. On se propose
dans ce qui suit d’en faire une justification microscopique à l’aide de la méthode variationnelle in-
troduite au § 2.E. Il nous faut au départ spécifier la nature microscopique des interactions suscep-
tibles de mener au ferromagnétisme. Nous nous placerons dans le cadre du “magnétisme localisé”
où les constituants magnétiques élémentaires, à savoir les électrons avec spins, sont localisés sur
chacun des sites du réseau cristallin considéré. De cette manière, tous les degrés de liberté orbi-
taux (structure de bande) des électrons sont considérés comme étant non pertinents et le système
est en fait un isolant. Dans l’autre limite, le caractère itinérant des électrons est prononcé dans
l’apparition du ferromagnétisme 11 . On supposera que c’est l’interaction d’échange Ji j , issue du
recouvrement des orbitales atomiques périphériques, qui est responsable du couplage entre spins
localisés. En raison de la portée réduite de ce recouvrement, on supposera qu’elle est non nulle que
si i et j sont plus proches voisins. L’hamiltonien microscopique est donc du type Heisenberg 12 :

H= − Ji j Si · S j , (3.55)
〈i , j 〉

où la somme ne s’applique que pour les proches voisins. L’intégrale d’échange favorise un ali-
gnement parallèle des spins (ferromagnétisme) si Ji j > 0 et antiparallèle (antiferromagnétisme) si
Ji j < 0.
y
Le modèle de Heisenberg avec les n = 3 composantes pour chaque spin Si = (Six ,Si ,Siz ) correspond
à un hamiltonien (quantique) à N corps complexe dont la solution exacte n’existe qu’à une dimen-
sion 13 . Nous imposerons donc une simplification supplémentaire à notre hamiltonien qui est celle
de ne retenir qu’une composante de spin, la composante z . Dans ce cas, l’hamiltonien est connu
sous le nom d’hamiltonien d’Ising 14 :
∑ N

H= − Ji j Siz S jz − g µB hi Siz , (3.56)
〈i , j 〉 i =1

10. Ce saut de chaleur spécifique prédit en champ moyen cadre bien avec ce qui attendu pour une transition du second
ordre (continue) dans la classification d’Erhenfest, où la deuxième dérivée de l’énergie libre est discontinue.
11. C’est ce qui est appelé ferromagnétisme itinérant.
12. Historiquement cet hamiltonien nous vient de la physique moléculaire. Pour la molécule d’hydrogène par exemple,
il y a abaissement d’énergie par effet d’échange si les deux spins sont antiparallèles et dans un état singulet. Dans un tel
cas, J1,2 < 0, ce qui mène à l’état singulet de la molécule.
13. La solution est obtenue grâce à l’ansatz de Bethe (1931).
14. Ersnt Ising a introduit le modèle du même nom dans ses travaux de thèse (1924).

70
D. Approche microscopique à la théorie de champ moyen

où nous avons ajouté la présence d’un champ magnétique hi au site i = 1, . . . N . Même sous cette
forme simplifiée, la fonction de partition canonique de cet hamiltonien est loin d’être triviale. Elle
ne peut être éffectuée exactement qu’en dimensions un et deux 15 . L’approximation variationnelle
propose de chercher une classe d’hamiltoniens plus simples HE , pour lesquels

Z E = Tr e −β HE (3.57)

est calculable. On considèrera ici la classe d’hamitoniens d’essai à un corps


N

HE = − Siz xi , (3.58)
i =1

où xi est le paramètre variationnel. L’approche variationnelle consiste à maximiser l’entropie d’es-


sai au premier membre de (2.60). On peut récrire en fait l’inégalité (2.61) de la manière suivante :

−T S (DE ) + 〈H 〉E ≥ −k B T ln Z
FC M ≡ 〈H − HE 〉E + FE ≥ F, (3.59)

où FE = 〈HE 〉E − T S (DE ). Il s’agit dès lors de minimiser le terme d’énergie libre de gauche qui est
en fait équivalent à l’énergie libre d’essai en (2.62). La similitude entre notre hamiltonien et celui
de Weiss en (3.29) nous suggère d’appeler notre énergie libre d’essai, l’énergie libre champ moyen
FC M . Ainsi, le meilleur champ moyen consiste à poser

FC M (β , xi∗ ) = Min[〈H − HE 〉E + FE ] xi∗ , (3.60)

où xi∗ est la valeur minimisant FC M . Afin de l’expliciter, il est commode pour des spins 12 de ramener
les valeurs propres de S z à ±1 et ainsi écrire
∑ ∑
H= − Ji′j Siz S jz − Bi′Siz , (3.61)
〈i , j 〉 i

où Ji′j = 14 Ji j et Bi′ = µB hi . Notre énergie libre d’essai est donnée par



FE = −k B T ln(2coshβ xi ), (3.62)
i

alors que la différence d’énergie interne s’écrit


∑ ∑
〈H − HE 〉E = − Ji′j 〈Siz S jz 〉E − (Bi′ − xi )〈Siz 〉E
〈i , j 〉 i
∑ ∑
=− Ji′j 〈Siz 〉E 〈S jz 〉E − (Bi′ − xi )〈Siz 〉E , (3.63)
〈i , j 〉 i

où le découplage de la seconde ligne résulte de la forme “à un corps” de Z E . En utilisant (3.57), il est


aisé de montrer que
〈Siz 〉E = tanhβ xi , (3.64)

15. La solution à une dimension remonte aux travaux de thèse d’Ising (1924), alors qu’en deux dimensions, la solution
exacte revient à L. Onsager (1944), solution qui est considérée comme un véritable tour de force en physique statistique.

71
Chapitre 3. Introduction aux transitions de phase

alors, à l’aide de (3.62-3.64), nous avons


∑ ∑
FC M (β , B ′ , {xi }) = − Ji′j (tanhβ xi )(tanhβ x j ) − (Bi′ − xi )tanhβ xi
〈i , j 〉 i

− kB T ln(2coshβ xi ). (3.65)
i

La condition de minimisation (∂ FC M /∂ xi ) xi∗ = 0 nous conduit à la relation d’auto-cohérence :


xi∗ = Bi′ + 2 Ji′j tanhβ x j∗ (3.66)
j

La substitution de ces valeurs dans FC M nous donne le résultat escompté. Cependant, nous sommes
intéressés plus particulièrement à l’énergie libre de Gibbs ΓC M (β , {M̄ i }) ayant la variable d’aiman-
tation de site M̄ i = M i /µB comme variable naturelle. Par transformée de Legendre, nous avons


ΓC M (β , {M̄ i }) = FC M + Bi′ M̄ i , (3.67)
i

où pour xi = xi∗ :

∂ FC M
M̄ i = −
∂ Bi′
= tanhβ xi∗ . (3.68)

Comme −1 ≤ M̄ i ≤ 1, on peut inverser cette relation et obtenir

1 + M̄ i
 
∗ −1 1
xi = β ln . (3.69)
2 1 − M̄ i

À l’aide de ces expressions, nous pouvons expliciter le potentiel de Gibbs :



ΓC M (β , {M̄ i }) = Γ 0 − M̄ i Ji′j M̄ j
〈i , j 〉
∑€ 1 + M̄ 1 − M̄ i Š
i
+ β −1 ln(1 + M̄ i ) + ln(1 − M̄ i ) (3.70)
i
2 2

où Γ 0 = −N k B T ln2 est l’énergie libre en absence d’interaction. On remarque que l’énergie libre
contient une partie interactive ∼ U , soit le terme d’énergie interne où l’échange apparaît explicite-
ment, et un autre de type ∼ T S qui est de nature entropique.

Si les corrélations sont négligées, on s’intéresse à la configuration uniforme d’aimantation M̄ i = M̄


indépendante de i . L’énergie interne de (3.70) devient alors
∑ ∑
− M̄ i Ji′j M̄ j → M̄ 2 Ji′j = N M̄ 2 z J ′ , (3.71)
〈i , j 〉 〈i , j 〉

où nous avons supposé que l’échange Ji′j = J ′ était uniforme avec z comme nombre de coordi-
nation ou de plus proches voisins pour chaque site du réseau. Maintenant, près du point critique,

72
D. Approche microscopique à la théorie de champ moyen

on est en droit de poser que M̄ i ≪ 1. Ainsi, le développement de Taylor des logarithmes du terme
entropique nous permet d’écrire pour l’énergie libre de Gibbs par site :

Γ̄C M (T, M̄ ) ≡ N −1 ΓC M (T, M̄ ) = Γ̄ 0 (T ) + a (T )M̄ 2 + b (Tc )M̄ 4 + . . . , (3.72)

laquelle coincide avec le développement de Landau donné en (3.10) (voir fig. 3.50). Les paramètres
de développement sont donnés par

ΓCM
T > Tc

T < Tc

-M  M
M

.
FIGURE 3.10
Développement de Landau pour l’énergie libre de Gibbs de part et d’autre de la température critique Tc .

a (T ) = a ′ (T − Tc )
kB T
b (Tc ) = , (3.73)
12 T =Tc

où a ′ = k B /2. La température critique s’exprime maintenant à l’aide des constantes :

Tc = k B−1 2z J ′ (3.74)

À partir de l’expression (3.34) de la théorie de Weiss, on en déduit


2z J ′
λ= , (3.75)
N µ2B
qui donne une expression microscopique de la constante de couplage champ moyen phénoméno-
logique. La condition d’équilibre
(∂ Γ̄C M /∂ M̄ )(µB )−1 = h ,
nous permet de reproduire une fois de plus (3.52) pour M̄ (T ) en champ nul h = 0. En champ non
nul, mais au point critique à T = Tc , on obtient ainsi à nouveau l’isotherme critique (3.44),
Æ
M̄ = 3 3βc µB h 1/δ , (3.76)

avec δ = 3 comme exposant critique.

Également, la substitution de M̄ (T ) dans (3.72) donne l’expression (3.53) pour l’énergie libre d’équi-
libre. La chaleur spécifique C = −T (∂ 2 Γ̄C M [M̄ ]/∂ T 2 ) présentera donc un saut comme le montre
(3.54). En dernier lieu, pour la susceptibilité :

∂ M̄
 
χ(T ) =N µB
∂h

73
Chapitre 3. Introduction aux transitions de phase

−1
∂ 2 Γ̄C M

=N µ2B
∂ M̄ 2
−1
=N µ2B 2a (T ) + 12b (Tc )M̄ 02 (T ) + . . . , (3.77)

d’où l’on vérifie sans difficulté l’obtention des expressions (3.38) et (3.42) au-dessus et au-dessous
de Tc , respectivement.

La figure 4.9 résume de manière qualitative la différence - tant au niveau des exposants critiques que
la valeur de Tc - entre les résultats de la théorie de champ moyen et ceux mesurés par l’expérience
pour la transition ferromagnétique.

C χ -1

Tc Tc T
(exp.) (cm)

.
FIGURE 3.11
Chaleur spécifique (C ) et inverse de la susceptibilité magnétique (χ −1 ) résultant de la théorie de champ
moyen (trait gras) et de l’observation.

3.D.1 Corrélations spatiales

Comme nous l’avons indiqué à la section précédente au niveau de l’approximation (3.71), le solu-
tion uniforme néglige par définition les corrélations et les variations spatiales du paramètre d’ordre.
Si nous relaxons cette contrainte, l’utilisation de (3.70), nous permet alors d’avoir accès à la lon-
gueur de corrélation ξ ainsi qu’à la fonction de corrélation Gi j = G (r j − ri ) du paramètre d’ordre.
Par définition de la fonction de corrélation Gi j = ∂ M i /∂ h j , relie les variations (réponse) d’aiman-
tation au site j à une variation de champ en i . Son inverse prend la forme

∂ hi
 
−1

G ij =
∂ Mj
∂ 2Γ
 
2 −1
= (µB ) . (3.78)
∂ M̄ i ∂ M̄ j

L’utilisation du potentiel de Gibbs (3.70) donne immédiatement

G −1 i j = (µ2B )−1 −2 Ji′j + β −1 δi j [1 + M̄ i2 + . . .] .


 
(3.79)

74
D. Approche microscopique à la théorie de champ moyen

L’inversion de cette matrice n’étant pas immédiate, il est commode de travailler dans l’espace de
Fourier en introduisant la transformée suivante

G −1 (q ) = (G −1 )i j e −i q ·(r j −ri )
j

= (µ2B )−1 −2J ′ (q ) + β −1 [1 + M̄ 2 (T )] ,



(3.80)

où nous avons remplacé M̄ i par sa valeur d’équilibre M̄ (T ). La seule dépendance en vecteur d’onde
apparaît dans la transformée de Fourier de l’intégrale d’échange. Pour un réseau cubique, elle est
donnée par

J ′ (q ) = Ji′j e −i q ·(r j −ri )
j

= 2 J ′ (cos q x d 0 + cos q y d 0 + cos qz d 0 ), (3.81)

où d 0 est la constante de réseau. Au voisinage d’une transition ferromagnétique, les corrélations les
plus importantes sont celles qui font intervenir des ilôts de spins de taille plus grande que la maille
élémentaire (∼ d 03 ). Dans l’espace de Fourier, cela correspond à des longueurs d’onde plus grandes
que d 0 . Il est donc justifié d’étudier G (q ) à petits vecteurs d’onde, c.-à-d. pour q d 0 ≪ 1. C’est la
limite du continuum. Dans cette limite, nous pouvons faire le développement des cosinus, et pour
T > Tc , nous obtenons à partir de (3.80),

µ2B βc
G (q ) = ε−1 , (3.82)
1 + ξ2 (T )q 2
T −Tc
où ε ≡ Tc et
ξ = ξ+ −ν
0ε , (3.83)
1 +
est la longueur de corrélation avec l’exposant critique ν = 2 . Ici ξ0
= d 0 2 J ′ βc est appelée longueur
p

de cohérence. Elle représente la plus petite longueur (microscopique) pour les corrélations de spins ;
elle est en général de l’ordre de la portée des interactions. À l’aide de (3.74), on vérifie en effet que
ξ+0 ∼ d 0 . La transformée G (q ) a donc la forme d’une Lorentzienne dont la largeur à mi-hauteur est
égale ξ−1 . C’est par le biais de l’intensité de diffusion neutronique près de Tc qu’il est possible de
mesurer directement G (q ) et ainsi avoir accès à ξ ; la relation de Fisher (3.26) a permis d’introduire
l’exposant η. Il s’agit donc de vérifier ici que la fonction de corrélation spatiale G (r ≡ |r i − r j |) est
bien de la forme (3.26). Par transformée de Fourier, nous avons en trois dimensions
∫∞ ∫π ∫ 2π
−1 2 −3 2 e i q ·r
G (r ) = ε µB βc (2π) q dq sin θ d θ dφ
0 0 0
1 + ξ2 q 2
∫ +∞
1 q e iqr d q
= ε−1 µ2B βc ℑm . (3.84)
4π2 r −∞
1 + ξ2 q 2

Cette dernière intégrale s’effectue aisément en la prolongeant dans le plan complexe avec un par-
cours en demi-cercle dans le plan supérieur entourant le pôle simple en q = i ξ−1 . Par le théorème
des résidus, on obtient
−r /ξ
−1 e
G (r ) = µ2B βc (ξ+
0 )−2
(4π) . (3.85)
r
.

75
Chapitre 3. Introduction aux transitions de phase

À partir de la forme générique (3.26), on en déduit qu’à dimension 3, la théorie de champ moyen
donne η = 0 comme exposant critique pour la décroissance algébrique de la fonction de corrélation
à Tc (G (r ) ∼ 1/r ) ou à T > Tc pour r ≪ ξ.

Maintenant pour la région basse température à T < Tc , la substitution de l’aimantation d’équilibre


(3.52) dans (3.80) conduit à l’expression

2µ2B βc
G (q ) = | ε |−1 , (3.86)
1 + ξ2 (T )q 2

avec cette fois



ξ = ξ−

−ν
, (3.87)
pour la longueur de corrélation.pL’exposant ν′ = ν = 12 , restant le même de part et d’autre de Tc . La
p
longueur de cohérence ξ−0 = d0 J ′ βc diffère de ξ+
0 par le facteur numérique 2.

Fonctionnelle d’énergie libre Près de Tc et en présence de corrélations spatiales, la fonctionnelle


Landau-Ginzburg. de Gibbs (3.70) devient, une fois complété le carré du terme d’éner-
gie interne :
∑1 2
ΓC M (β , {M̄ (r)}) = Γ 0 − J ′ M̄ (ri ) − M̄ (ri + d 0 r̂)
i ,r̂
2

+ a (T )M̄ 2 (ri ) + b (Tc )M̄ 4 (ri ) + . . . , (3.88)

où M̄ (ri ) ≡ M̄ i et r̂ étant le vecteur unité pour chaque voisin pour les trois directions de l’espace.
Dans la limite du continuum où seules les variations lentes du paramètre d’ordre sont pertinentes,
nous pouvons effectuer la limite d 0 → 0 dans l’expression précédente et faire apparaître des dérivées
spatiales du paramètre d’ordre. En passant des sommes à l’intégrale, nous avons

0 dr” 2 —
ΓC M [M̄ ] = Γ + c ∇r M̄ (r) + a (T )M̄ 2 (r) + b (Tc )M̄ 4 (r) , (3.89)
v0

qui est appelée fonctionnelle de Landau-Ginzburg. Elle diffère donc du développement de Landau
en (3.50) par l’introduction d’un terme de “rigidité” du paramètre d’ordre ∼ c |∇M |2 qui en limite
la variation spatiale. Les coefficients a (T ) et b (Tc ) sont donnés en (3.73), alors que le coefficient de
rigidité est donné par
c = d 02 J ′ . (3.90)

En utilisant la transformée de Fourier du paramètre d’ordre :

1 ∑
M̄ (r) = p M̄ (q ) e i q ·r , (3.91)
N q

il est intéressant de récrire la fonctionnelle de Landau-Ginzburg dans l’espace des vecteurs d’onde :

ΓC M [M̄ ] = Γ 0 + [a (T ) + c q 2 ]M̄ (q )M̄ (−q )
q
b (Tc ) ∑
+ M̄ (q 1 )M̄ (q 2 )M̄ (q 3 )M̄ (−q 1 − q 2 − q 3 ), (3.92)
N q

76
E. Théorie gaussienne des fluctuations au voisinage du point critique

d’où l’on retrouve la transformée de Fourier de la fonction de corrélation, à savoir


−1
∂ 2 ΓC M [M̄ ]

G (q ) = µ2B
∂ M̄ (q )∂ M̄ (−q )
µ2B
= (3.93)
2[a (T ) + c q 2 ]

telle que donnée en (3.82). De plus, on constate qu’à partir de cette dernière, la longueur de corré-
lation s’exprime comme le rapport de deux coefficients de la fonctionnelle de Landau-Ginzburg :

√ c
ξ(T ) = . (3.94)
a (T )

E Théorie gaussienne des fluctuations au voisinage du point critique

Dans une théorie de champ moyen, les fluctuations du paramètre d’ordre autour de sa valeur
d’équilibre sont négligées. C’est pour cette raison que la chaleur spécifique ne présente pas de di-
vergence à Tc , mais seulement un saut. Il est possible de tenir compte de telles fluctuations qui, à
l’ordre le plus bas, s’inscrivent dans une théorie appelée théorie gaussienne. À l’intérieur de celle-ci,
nous retrouvons tous les autres exposants du champ moyen de la section précédente, sauf pour la
chaleur spécifique. De plus, la théorie gaussienne est le point de départ de méthodes beaucoup plus
sophistiquées comme celle du groupe de renormalisation.

Il y a plusieurs manières de l’introduire, certaines étant plus formelles que d’autres. Une justifi-
cation simple de cette théorie revient à considérer la fonctionnelle de Landau-Ginzburg telle que
donnée en (6.29) de la section précédente où M̄ apparaît dès lors comme une variable interne sta-
tistique, ce qui suggère d’écrire la fonction de partition près de Tc sous la forme 16
∫ ∫
€ dr 2 Š
Z = Z 0 D M̄ exp −β c ∇r M̄ (r) + a (T )M̄ 2 (r) + b (Tc )M̄ 4 (r) (3.95)
v0

qui est en fait une intégrale fonctionnelle sur toutes les configurations du paramètre d’ordre. Ici,
D M̄ est appelée mesure d’intégration qu’on prendra égale à

D M̄ = (2π)−1 d M̄ (r), (3.96)
{r}

où {r} parcourt une infinité de valeurs pour la fonction M̄ (r) dans le continuum, ce qui explique la
nature fonctionnelle de l’intégration. Afin de revenir à un schéma d’intégration plus standard, il est
commode de travailler dans l’espace de Fourier. En utilisant (3.91), on peut alors écrire

€1∑
Z = Z 0 D M̄ exp −β Ḡ −1 (q )M̄ (q )M̄ (−q )
2 q

16. Il est possible de générer une telle intégrale fonctionnelle à partir la fonction de partition pour l’hamiltonien d’Ising
(3.56), grâce à une transformation de type Hubbard-Stratonovich (1959).

77
Chapitre 3. Introduction aux transitions de phase

b (Tc ) ∑ Š
+ M̄ (q 1 )M̄ (q 2 )M̄ (q 3 )M̄ (−q 1 − q 2 − q 3 ) , (3.97)
N {q }

où maintenant la mesure d’intégration prend la forme


∏ d M̄ (q )
D M̄ = p (3.98)
q 2πi

et où nous avons introduit


Ḡ −1 (q ) = 2 a (T ) + c q 2 ,

(3.99)

D’après la forme de Z , on voit immédiatement que c’est le terme quartique qui pose des difficul-
tés. Ce genre d’intégrale est en fait impossible à effectuer à deux et trois dimensions 17 . Comme le
paramètre d’ordre M̄ (r) est réel, il découle de (3.91) que M̄ ∗ (q ) = M̄ (−q ), alors on peut voir l’hamil-
tonien effectif de l’argument de l’exponentielle comme celui contenant un terme quadratique pour
les modes de fluctuations d’aimantation libres (les M̄ (q ) !) et un terme quartique pour l’interaction
entre ces modes. La description des fluctuations critiques peut donc être assimilée comme un véri-
table problème à N corps, ici classique. Comme dans tout problème à N corps, la solution libre ou
sans interactions constitue une limite physique pertinente, c’est pourquoi nous nous limiterons à
l’approximation gaussienne pour Z qui revient à ne prendre en compte que la partie quadratique
de la fonctionnelle.

Au-dessus de Tc , là où il n’y a pas d’aimantation d’équilibre, la fonction de partition de l’approxi-


mation gaussienne s’écrit en tenant compte de la symétrie d’inversion entre les modes en q et −q :


1 −1 (q )[M̄ (q )M̄ (−q )+M̄ (−q )M̄ (q )]

Z → Z0 D M̄ e −β 2 q >0 Ḡ

∫∫ 
−β Ḡ −1 (q ) [ℜeM̄ (q )]2 +[ℑmM̄ (q )]2

−1
= Z0 (π) d ℜeM̄ (q )d ℑmM̄ (q ) e
q >0

= Z0 Zq (3.100)
q >0

qui est un produit de fonctions de partition puisque chacun des modes de fluctuations est indé-
pendant. Comme on s’intéresse à la chaleur spécifique, l’énergie libre est donnée par la somme des
énergies libres pour chacun des modes de fluctuations :

F = − kB T ln Z q
q >0

1 V
d d q ln 2β [a (T ) + c q 2 ] ,

= kB T (3.101)
2 (2π)d
1
où le facteur 2 vient du fait qu’on a élargi le domaine d’intégration à tous les q .

La chaleur spécifique en dimension d est donnée par


∂ F
 2 
C = −T
∂T2
17. En une dimension, l’intégrale pour Z peut être calculée exactement à l’aide de la méthode de la matrice de transfert.
Voir D. J. Scalapino et al., Phys. Rev B 6, 3409 (1972).

78
E. Théorie gaussienne des fluctuations au voisinage du point critique

q0
2
V Ωd ∂ a (T )/∂ T

2 d −1
= kB T q dq + (t.m.s.), (3.102)
(2π)d 0
[a (T ) + c q 2 ]2

où nous avons négligé un terme moins singulier (t.m.s.). Ici, Ωd est l’intégrale sur l’angle solide à d
dimensions et q0 = π/d 0 est la coupure de bord de zone de Brillouin pour le vecteur d’onde. On en
déduit le comportement critique suivant :

C = C0+ ε−α , (3.103)

C0+ = V cd k B (ξ+
0)
−d
,
∫ ∞ d −1
Ωd x dx
cd = . (3.104)
2(2π)d 0 (1 + x 2 )2

L’exposant critique à T > Tc est quant à lui donné par

α = 2 − νd (3.105)

Comme dans l’approximation gaussienne

Ḡ (q ) = 〈M̄ (q )M̄ (−q )〉 (3.106)


1
qui est donnée en (3.116), on a toujours ν = L’exposant critique α augmente donc en baissant la
2.
dimension spatiale du système. C’est une indication que l’effet des fluctuations s’accentue à me-
sure que la dimensionnalité du système diminue. En second lieu, on remarque aussi que pour la
dimension d = 4, la théorie gaussienne prédit α = 0 qui est l’exposant champ moyen en l’absence
de fluctuations 18 . Ainsi, même dans cette théorie relativement simple, on en conclut que la dimen-
sion 4 apparaît comme une dimension charnière ou critique pour la théorie de champ moyen.

La dérivation du comportement critique de la chaleur spécifique à T < Tc s’effectue de manière ana-


logue. Cependant, l’existence d’une aimantation d’équilibre M̄ (T ) ̸= 0, nous oblige, selon (3.52), à
inclure le terme quartique. Ce dernier peut en fait être traité en approximation gaussienne de la ma-
nière suivante. À partir de (3.91), on constate que la solution uniforme M̄ (T ) qui est indépendante
de r ne possède qu’une seule composante de Fourier, à savoir celle à q = 0, d’où l’identification
p
M̄ (q = 0)∑= N∑ M̄ (T )∑ pour l’aimantation d’équilibre. À partir de là, avec la séparation des som-
mations q = q ̸=0 + q =0 , en parties non uniforme et uniforme, on procède au découplage du
terme quartique :

b (Tc ) ∑
M̄ (q 1 )M̄ (q 2 )M̄ (q 3 )M̄ (−q 1 − q 2 − q 3 )
N {q }

≈ N b (Tc )M̄ 4 (T ) + 6b (Tc )M̄ 2 (T ) M̄ (q )M̄ (−q )
q ̸=0

18. En dimension d > 4, les exposants de la théorie de champ moyen sont exacts, alors qu’en dimension d < 4, des
corrections importantes sont à prévoir dans la plupart des cas. À la dimension critique d = 4, il existe des corrections
logarithmiques non triviales à la théorie de champ moyen.

79
Chapitre 3. Introduction aux transitions de phase

b (Tc ) ∑
+ M̄ (q 1 )M̄ (q 2 )M̄ (q 3 )M̄ (−q 1 − q 2 − q 3 ) + . . . . (3.107)
N {q }̸=0

En négligeant les termes quartique et cubique de cette expression et en utilisant (3.52), la fonction
de partition devient pour T < Tc :

q ̸=0 [−2a (T )+c q
2 ]M̄ (q )M̄ (−q ).

Z = e −β N Γ̄C M [M̄ (T )] D M̄ e −β (3.108)

On reconnaît ici le premier terme de droite comme étant l’énergie libre champ moyen (3.50) pour
la configuration d’équilibre M̄ (T ). La partie gaussienne peut quant à elle être ramenée à une forme
similaire à (3.100). En procédant donc comme précédemment, nous obtenons à T → Tc− la chaleur
spécifique :

C = ∆C + C0− | ε |−α , (3.109)
avec comme exposant critique α′ = α. Ici ∆C est le saut de chaleur spécifique à Tc en théorie de
champ moyen (éq. 3.54). Le coefficient de la partie singulière est donné par

C0− = V cd k B (ξ−
0)
−d
,
∫ ∞ d −1
Ωd x dx
cd = , (3.110)
(2π) 0+ (1 + x 2 )2
d

avec comme rapports des amplitudes de part et d’autre de Tc :

C0+ ξ+
 −d
0
= . (3.111)
C0− ξ−
0

Ce résultat pour la chaleur spécifique est remarquable en ce qu’il fait apparaître la théorie gaus-
sienne comme la première correction en fluctuations à la théorie de champ moyen. Il suggère égale-
ment l’existence d’un développement systématique pour le traitement des fluctuations. Ce dernier
est connue sous le nom de développement en boucles, le terme “boucle” ici se référant à la repré-
sentation diagrammatique du développement 19 .

19. Les diagrammes de Feynman qui lui sont associés possèdent en effet un nombre de boucles donné pour chaque
ordre de développement.

80
F. Critère de Ginzburg

F Critère de Ginzburg

Malgré les écarts importants observés dans beaucoup de cas entre l’expérience et les théories
gaussienne et de champ moyen, on constate cependant que certains types de transition s’en rap-
prochent. À titre d’exemples, mentionnons ici la transition supraconductrice dans les métaux
conventionnels comme Al, Sn, .... qui présente un accord remarquable avec les prédictions du
champ moyen, tandis que les transitions magnétiques montrent, nous l’avons vu, un désaccord
marqué.

Ces différences peuvent en fait s’expliquer à l’aide du critère de Ginzburg, qui indique de manière
semi-quantitative la région en température où les écarts par rapport aux théories gaussienne et de
champ moyen sont importants, forçant le recours à des méthodes plus sophistiquées pour l’obten-
tion de résultats plus quantitatifs. L’établissement de ce critère peut être rendu très naturellement
si on interprète les résultats de (3.109) pour la chaleur spécifique comme les premiers termes d’un
développement. L’idée de Ginzburg consiste à poser que lorsque la première correction gaussienne
due aux fluctuations (≡ C f l ) devient du même ordre que le saut ∆C de la théorie de champ moyen,
la température est alors suffisamment près de Tc et le développement limité (3.109) devient insuf-
fisant. Les corrections d’ordre supérieur deviennent dès lors importantes en induisant des modifi-
cations aux exposants critiques de la théorie de champ moyen 20 . Considérons en effet le rapport
des deux termes
Cf l ∆t G 2−d /2
 ‹
= , (3.112)
∆C |ε|
où ∆C est ici exprimé par unité de volume (d 0d ). On peut donc introduire la largeur critique de
Ginzburg :

2/(4−d )
cd k B (ξ−
0)
−d

∆t G = (3.113)
∆C

Pour une dimension d < 4, celle-ci dépend donc essentiellement de la longueur de cohérence ξ− 0 (la
portée des forces !) et de ∆C , des quantités non universelles c.-à-d., qu’elles dépendent de quantités
microscopiques. Compte tenu de l’expression (3.112), la largeur critique de Ginzburg peut s’écrire
sous la forme
Tf l − Tc
∆t G = , (3.114)
Tc
ce qui permet d’introduire une température caractéristique Tf l en dessous de laquelle la descrip-
tion des fluctuations va au-delà de l’indépendance des modes de l’approche gaussienne. À partir
de l’expression
∆t G ∼ k B2 (ξ− −6 −2
0 ) (∆C ) , (3.115)
valide pour les systèmes tridimensionnels (d = 3), il est intéressant d’illustrer l’application du cri-
tère pour quelques cas concrets :
20. Ce changement de valeur des exposants ne se produit pas “brutalement”, à une “température donnée”, mais bien
dans un certain intervalle de température, à l’approche de Tc , communément appelée région de “crossover” pour les
exposants.

81
Chapitre 3. Introduction aux transitions de phase

Supraconducteurs conventionnels. Les supraconducteurs dits conventionnels comme Al, Nb, Hg,
...etc., sont caractérisés par de grandes longueurs de cohérence ξ0 . En fait, ξ0 est l’échelle de lon-
gueur pour la taille des constituants composites de la supraconductivité, à savoir les paires de Co-
oper. C’est une grandeur presque macroscopique qui est de l’ordre de 103 ....104 Å ! À cette échelle
de distance, deux électrons de vecteurs d’onde et de spins opposés sont tellement attirés l’un
vers l’autre qu’ils perdent leur caractère individuel qu’ils avaient à courte distance pour former
l’état lié de la paire de Cooper. La valeur mesurée du saut de chaleur spécifique est quant à elle
∆C ∼ 2 . . .JK−1 /cm3 . Il s’ensuit que la largueur de Ginzburg ∆t G peut être réduite à des valeurs aussi
faibles que ∼ 10−14 !! Ainsi, Tf l est tellement près de Tc qu’il est virtuellement impossible de détecte
des déviations par rapport au champ moyen. On constate en effet que la chaleur spécifique ne pré-
sente pas de divergence, mais plutôt un saut compatible avec la prédiction champ moyen (3.54)
(voir figure 6.2 au chapitre sur la supraconductivité).

Supraconducteurs non conventionnels. Parmi les nouveaux supraconducteurs non conventionnels,


il y a ceux dits à haute température critique. Le composé à base d’yttrium par exemple, YBa2 Cu3 O7−y
possède une température critique de l’ordre 100K qui est deux ordres de grandeur plus grande que
celle des supraconducteurs conventionnels comme Al. L’augmentation de la température critique
signifie aussi que l’énergie de liaison de la paire de Cooper augmente dans les mêmes proportions.
Lorsque l’énergie de liaison est plus grande, la liaison est plus confinée dans l’espace et ξ0 dimi-
nue donc dans le même rapport. Pour ces composés, nous avons ξ0 ∼ 10Å, de sorte que ∆t G peut
atteindre des valeurs de l’ordre de 10−2 . . . 10−1 , rendant en principe observables des déviations par
rapport au champ moyen. Il y a effectivement des observations expérimentales qui abondent en ce
sens. Cependant, il faut souligner ici que la largeur de Ginzburg telle que donnée en (3.115), ne tient
pas compte de la grande anisotropie spatiale de ces matériaux qui a, elle aussi, une influence non
négligeable sur les fluctuations.

Magnétisme localisé. Comme nous l’avons vu, le ferromagnétisme localisé est caractérisé par des
interactions d’échange à courte distance. On a montré dans le cadre du modèle d’Ising par exemple,
que ξ±0 ∼ d 0 c.-à-d., de l’orde de quelques Å. La largeur critique ∆t G ∼ .1 est appréciable et laisse
présager de fortes corrections au champ moyen et à la théorie gaussienne, ce qui concorde avec
l’observation (cf. figure 3.11 et tableau 3.2).

Fluides. La transition gaz-liquide repose dans beaucoup de cas sur l’existence de la force de van der
Waals. Cette dernière se combine à l’interaction de coeur dur pour donner lieu au potentiel “6-12”
de Lennard-Jones entre paires de molécules ou d’atomes. L’attraction est significative pour une
distance caractéristique notée σ de quelques Å dépendante de l’atome ou de la molécule, ce qui
en fait une interaction à courte distance comme pour le magnétisme. Il s’ensuit que pour ξ0 ∼ σ,
on est en droit de s’attendre à l’instar du magnétisme, à des déviations importantes. On observe
en effet que non seulement les exposants pour les deux types de transition (cf. tableau 4.2) sont
très similaires en raison de l’universalité, mais aussi que les largeurs critiques (non universelles)
observées sont comparables.

Ferroélectricité. L’orientation des dipôles électriques dans une substance polaire peut donner lieu à
une transition du second ordre qui est soit ferroélectrique ou antiferroélectrique. Le composé per-
ovskite BaTiO3 est un exemple de ferroélectrique avec un Tc = 295K. L’interaction dipôle-dipôle qui
décroit en 1/r 3 est responsable au niveau macroscopique de l’orientation des dipôles. Sa décrois-
sance plus lente a pour effet d’augmenter la valeur de ξ0 aux alentours d’une centaine d’Å, menant
à ∆t G ∼ 10−4 , qui est intermédiaire. Les écarts par rapport au champ moyen sont donc relativement

82
G. Hypothèse d’échelle

faibles pour les ferroélectriques.

G Hypothèse d’échelle

Dans ce qui précède, nous avons à maintes reprises souligné que les singularités des fonctions
de réponse étaient le résultat de la portée infinie des corrélations du paramètre d’ordre. Dans les
approximations champ moyen et gaussienne, nous avons vu également que tous les comporte-
ments critiques s’exprimaient à l’aide de lois de puissance fonction de l’écart relatif de température
| ε | = | T − Tc | /Tc , par rapport à Tc . Or, la longueur de corrélation (3.22) s’exprime précisément de
cette manière. Dans le développement de la théorie moderne des transitions de phase du second
ordre, une première grande percée a pu être réalisée en postulant que la longueur de corrélation
ξ jouait un rôle essentiel dans l’apparition de la criticalité près de Tc . C’est l’objectif de l’hypothèse
d’échelle 21 de montrer que si toutes les fonctions thermodynamiques pouvant donner lieu à un
comportement critique s’expriment à l’aide de puissances de ξ, il sera possible d’établir des liens
entre les divers exposants critiques. Bien qu’une telle hypothèse ne nous fournit pas les valeurs des
exposants critiques, elle impose néanmoins des contraintes strictes entre eux. Un des triomphes des
développements théoriques qui ont suivi, tel le groupe de renormalisation, aura été de confirmer
la validité d’une telle hypothèse au niveau microscopique et de prédire de manière quantitative la
valeur des exposants critiques.

Dans ce qui suit, on s’intéressera à formuler les lois d’échelle statiques qui découlent de l’hypothèse
d’échelle. Pour ce faire, il s’agira de dimensionner les diverses quantités et fonctions pertinentes de
la transition continue et de les mettre à l’échelle de ξ. Débutons l’analyse d’échelle par la transfor-
mée de Fourier
G (q ) = 〈M (q )M (−q )〉 (3.116)
de la fonction de corrélation, où M est génériquement un champ statistique tel que sa valeur
moyenne 〈M 〉 peut être identifiée au paramètre d’ordre de la phase ordonnée. Ici, il pourra s’agir de
l’aimantation, la densité, etc. De façon générale, on écrira G (q ) comme une fonction f de la forme :

G (q ) = f (q ξ, b1 ξ−1 , b2 ξ−1 , . . .)
≡ f (ζ, λ1 , λ2 , . . .), (3.117)

où b1 , b2 , . . . sont des longueurs microscopiques (constante de réseau, portée de l’interaction, etc.).


On s’intéressera à des valeurs de ζ = q ξ fixées et pour λ1 , λ2 , . . . , → 0. Un développement de Taylor
pour les λi nous permet d’écrire :
x x
lim f (ζ, λ1 , λ2 , . . .) = ge(ζ)λ1 1 λ2 2 · · · , (3.118)
λi =1,2... →0

−x1 −x2
avec xi ≥ 0. Si l’on pose ge(ζ) = g (ζ)b1 b2 · · · , on peut alors écrire

G (q ) = ξ−y g (q ξ), (3.119)

où y = x1 + x2 + . . .. Ainsi le fait d’exprimer G (q ) à l’aide d’une fonction d’échelle g (ζ) de la variable


sans dimension ζ = q ξ, fait ressortir une puissance de ξ comme la seule caractéristique critique
21. Cette hypothèse d’échelle est due initialement à B. Widom (1965).

83
Chapitre 3. Introduction aux transitions de phase

de G (q ). Maintenant comme G (q = 0) est reliée à la susceptibilité par la relation de fluctuation-


dissipation statique G (q = 0) = k B T χ(T ) et que ξ ∼ |ε|−ν , alors l’expression (3.119) nous permet
d’établir :

G (0) ∝ | ε |−νy
∝ | ε |−νy (3.120)

avec
νy = γ. (3.121)

À T = Tc , nous avons vu en § 3.B.1 que la transformée de Fourier (3.116) possède le comportement


critique en vecteur d’onde
G (q ) ∝ q η−2 , (3.122)
ce qui implique selon (3.119) que g (q ξ) ∼ (q ξ)η−2 , d’où l’on tire

G (q ) ∝ ξ y (q ξ)η−2
∝ ξ y +η−2 q η−2 . (3.123)

Comme ξ → ∞ au point critique, la dépendance sur ξ doit être éliminée en imposant y + η − 2 = 0.


Or, sachant que ξ ∼| ε |−ν , nous aurons à partir de (3.121) :

(2 − η)ν = γ. (3.124)

Cette équation qui relie les trois exposants statiques η, ν et γ entre eux est appelée première loi
d’échelle.

On voit de ce qui précède que l’hypothèse d’échelle est directement liée à une analyse dimension-
nelle où toutes les quantités sont dimensionnées à l’aide de ξ. Ainsi, à l’aide de la variable d’échelle
ξ, la transformée de Fourier de la fonction de corrélation se récrit de la manière suivante

G (q ) = d d r M (r) − 〈M 〉 M (0) − 〈M 〉 e −i q ·r
 


d +2d M
d d (ξ−1 r ) ξ−d M M (r) − 〈M 〉 ξ−d M M (0) − 〈M 〉 e −i q ·r
 

= ξd +2d M g (q ξ). (3.125)

Nous faisons ainsi apparaître la dimension d’échelle d M du paramètre d’ordre 〈M 〉. D’après (3.119),
on doit avoir y = d + 2d M , et puisque 〈M 〉 ∼| ε |β ∼ ξ−β /ν ∼ ξd M et y = 2 − η, nous établissons

ν
β= (η + d − 2) , (3.126)
2

comme deuxième loi d’échelle.

Si nous regardons maintenant l’énergie libre par unité de volume F¯ = F /V où F = −k B T lnZ , la


dimension pertinente de F¯ est donc celle de l’inverse d’un volume, à savoir F¯ ∝ ξ−d . 22 Ainsi la
22. Ici la dimension de k B T n’intervient pas puisque c’est une quantité régulière à Tc qui n’est pas de la forme (T −Tc ) x
et donc pas dimensionable à l’aide de ξ.

84
G. Hypothèse d’échelle

chaleur spécifique par unité de volume pourra s’écrire

∂ 2 F¯
C = −T ∝ | ε |νd −2
∂T2
∝ | ε |−α (3.127)

d’où l’on tire


α = 2 − νd , (3.128)

correspondant à la troisième loi d’échelle 23

Le paramètre d’ordre pouvant s’obtenir comme une dérivée de l’énergie libre par rapport au champ
source extérieur h nous donne la relation

∂ F¯
M =−
∂h
∝ ξ−d −d h
∝ ξd M , (3.129)

ce qui permet d’introduire la dimension d’échelle du champ externe d h = −(d + d M ), soit d h =


1
2 (η − 2 − d ). Or, comme l’isotherme à Tc est décrit par 〈M 〉 ∼ h
1/δ
, on obtient sans difficulté la
quatrième loi d’échelle
d +2−η
δ= . (3.130)
d −2+η

Bien que l’hypothèse d’échelle ne fournisse pas les valeurs des exposants, l’utilisation des expo-
sants mesurés montre une concordance remarquable de ses conséquences (lois d’échelle) avec les
observations. À titre d’illustration de la vérification de l’hypothèse d’échelle, on peut se référer aux
exposants mesurés pour la transition ferromagnétique du fer au tableau 4.2. Selon la première loi
d’échelle en (3.124), γ = (2 − η)ν ≃ (1.93).69 = 1.33, ce qui est en très bon accord avec la valeur me-
surée pour γ. De manière générale, on observe un accord à l’intérieur de 10%, ce qui souligne la
justesse de cette hypothèse dans la compréhension des phénomènes critiques. Suite à ce succès à
la fin des années 60, ce domaine de recherche de la physique statistique a connu une percée ful-
gurante avec le développement de la théorie du groupe de renormalisation, laquelle apportait une
justification rigoureuse de l’ansatz et de l’origine de l’universalité au point critique, tout en permet-
tant un calcul direct et contrôlé des exposants critiques.

23. Cette troisième loi porte le nom d’hyperscaling.

85
Chapitre 3. Introduction aux transitions de phase

86
Chapitre 4

SECONDE QUANTIFICATION

A Espace de Hilbert à n particules

On considère un ensemble de n particules identiques. i.e., ayant les mêmes propriétés intrinsèques
comme la masse, charge, spin, . . .. Soit le vecteur d’état produit tensoriel à n -particules

|ϕ1 , . . . , ϕn 〉⊗ = |ϕ1 〉 ⊗ |ϕ2 〉 ⊗ . . . |ϕn 〉 ∈ H ⊗n , (4.1)

pour la particule ‘1’ dans l’état |ϕ1 〉, la particule ‘2’ dans l’état |ϕ2 〉, etc. Ce ket est élément de l’espace
de Hilbert produit tensoriel
H ⊗n = H 1 ⊗ H 2 ⊗ . . . H n .
En raison du recouvrement possible des paquets d’ondes associés à chaque particule, un tel état à
n -particules ne saurait faire partie des états physiques puisque le recouvrement donne naissance
à la dégénérescence d’échange qui implique que les n ! combinaisons des ϕi de (4.1) constituent au-
tant de possibilités de décrire un tel état physique. Cette dégénérescence est levée par un postulat
supplémentaire à la mécanique quantique, le postulat de symétrisation :

Les états physiques à n-particules identiques sont soit symétriques ou antisymétriques selon qu’il
s’agisse de bosons (photons, phonons, 4 He,...) ou de fermions (électrons, neutrons, protons, 3 He, ...).

Les kets physiques (non normalisés) s’obtiennent à partir de (4.1)

Sν |ϕ1 , . . . , ϕn 〉⊗ ≡ |ϕ1 , . . . , ϕn 〉ν , (4.2)

où ν = +, pour des bosons, et ν = − pour des fermions. Ici Sν est un projecteur, qui pour des bosons
est un symétriseur d’états,
1 ∑
S+ = Pπ , (4.3)
n ! π∈P
n

alors que pour des fermions,


1 ∑
S− = (−1)π Pπ , (4.4)
n! π∈P
n

est un antisymétriseur d’états. Ici Pπ est l’opérateur d’une permutation ‘π’ de l’ensemble (groupe)
de permutations Pn pour n particules. Pour des fermions, chaque permutation est affectée d’un
signe (−1)π où π est la parité de la permutation, qui est soit paire ou impaire selon que Pπ consiste
en un nombre pair ou impaire de permutations élémentaires aussi appelées transpositions.

87
Chapitre 4. Seconde quantification

Représentation d’occupation. Les kets à une particule |ϕi 〉 ci-dessus sont normés, mais quel-
conques. Il est souvent approprié d’utiliser pour ces derniers une
base {|ψr 〉} = {|ψr1 〉, . . . , |ψrn 〉} d’une observable à une particule,

A|ψr 〉 = αr |ψr 〉. (4.5)

Dans ce cas, il est commode de se représenter les kets physiques en représentation d’occupation,
p
n!
|n1 , n2 , . . . , n r , . . .〉+ = p |ψr1 , ψr2 , . . . , ψr . . .〉+ (4.6)
n1 !n2 ! . . . n r !
p
|n1 , n2 , . . . , n r , . . .〉− = n ! |ψr1 , ψr2 , . . . , ψr . . .〉− (4.7)

lesquels, peut-on vérifier, sont normés. Ici n r est le nombre d’occupation de l’état ψr , soit

n r = 0, 1, ..., n , (ν = +) (4.8)
n r = 0, 1, (ν = −). (4.9)

Il est instructif d’examiner pour notre système à n particules l’action de l’observable à un corps
suivant
n

A(n ) = Aj, (4.10)
j =1

où A j satisfait (4.5), alors

A(n )|ψr1 , ψr2 , . . . , ψrn 〉ν = Sν A(n )|ψr1 , ψr2 , . . . , ψr j . . . ψrn 〉⊗


n

= Sν |ψr1 , ψr2 , . . . , Aψr j . . . ψrn 〉⊗
j =1
n

= Sν αr j |ψr1 , ψr2 , . . . , ψr j . . . ψrn 〉⊗
j =1

= Sν n r αr |ψr1 , ψr2 , . . . , ψrn 〉⊗
r

= n r αr |ψr1 , ψr2 , . . . , ψrn 〉ν , (4.11)
r

où n r est le nombre de particules dans l’état |ψr 〉. En représentation d’occupation, nous aurons

A(n )|n1 , n2 , . . . , n r , . . .〉ν = n r αr |n1 , n2 , . . . , n r , . . .〉ν . (4.12)
r

L’action de A revient donc à compter le nombre n r de particules dans l’état ψr avec la valeur propre
αr .

88
B. Espace de Fock

B Espace de Fock

Dans nombre de situations, nous sommes amenés à considérer des systèmes où le nombre de par-
ticules est variable, d’où l’importance d’introduire des vecteurs d’états où le nombre de particules
n’est pas fixé. Le formalisme dit de la seconde quantification permet la description de tels systèmes.
Dans ce cadre, on construit l’espace de Fock F à partir de la somme directe des espaces de Hilbert
à n -particules
F (H ) = H 0 ⊕ Hν⊗1 ⊕ Hν⊗2 ⊕ . . . . (4.13)
Ici l’espace H 0 = {λ|0〉} est l’espace du ’vide’ de particule que l’on notera |0〉. Un état de l’espace de
Fock est donné par une suite 
|Φ〉 = |0〉, |Φ(1)〉, . . . , |Φ(n )〉, . . . , (4.14)
⊗n
où les |Φ(n )〉 ∈ Hν avec la propriété d’orthogonalité

〈Φ(m )|Φ(n )〉 = 0, (n ̸= m). (4.15)

4.B.1 Opérateurs de création et d’annihilation

Dans l’espace de Fock, on introduit des opérateurs qui permettent le passage entre deux espaces

Hν n successifs, ce sont les opérateurs de création et d’annihilation. On définit l’opérateur de créa-
tion a † (ϕ) d’une particule dans l’état |ϕ〉 suivant la relation,

p
a † (ϕ)|ϕ1 , . . . , ϕn 〉ν ≡ n + 1|ϕ, ϕ1 , . . . , ϕn 〉ν . (4.16)

L’opérateur d’annihilation ou de destruction a (ϕ) est défini en prenant l’adjoint, [a † (ϕ)]† = a (ϕ),
de l’opérateur de création de particules. Ainsi, considérons le produit scalaire
 † ∗
a (ϕ)|ψ1 , . . . , ψm 〉ν |ϕ1 , . . . , ϕn 〉ν = ν 〈ψ1 , . . . , ψm |a (ϕ)|ϕ1 , . . . , ϕn 〉ν
p
= m + 1 ν 〈ϕ, ψ1 , . . . , ψm |ϕ1 , . . . , ϕn 〉ν δn,m +1 , (4.17)

où la seconde ligne découle de la définition (4.16), qui sera évidemment non nulle que si les ket et
bra ont le même nombre de particules. À partir de la définition des kets (4.2) et le fait que Sν est un
projecteur, à savoir Sν2 = Sν = Sν† , on peut écrire pour (4.17)
p p
n ν 〈ϕ, ψ1 , . . . , ψn −1 |ϕ1 , . . . , ϕn 〉ν = n ⊗〈ϕ, ψ1 , . . . , ψn−1 |Sν |ϕ1 , . . . , ϕn 〉⊗
1 1 ∑
= p ⊗〈ϕ, ψ1 , . . . , ψn −1 | νπ |ϕπ(1) , . . . , ϕπ(n) 〉⊗
n (n − 1)! π∈P
n
n ∑
1 1 ∑
= p ⊗〈ψ1 , . . . , ψn−1 | νπ νi −1 〈ϕ|ϕi 〉|ϕπ(1) , . . . , ϕπ(i −1) , ϕπ(i +1) , ϕπ(n) 〉⊗
n (n − 1)! i =1 π∈Pn
n
1 ∑ i −1
=p ν 〈ϕ|ϕi 〉⊗〈ψ1 , . . . , ψn −1 |Sν†Sν |ϕ1 , . . . , ϕi −1 , ϕi +1 , ϕn 〉⊗
n i =1
n
1 ∑ i −1
=p ν 〈ϕ|ϕi 〉ν〈ψ1 , . . . , ψn−1 |ϕ1 , . . . , ϕi −1 , ϕi +1 , ϕn 〉ν
n i =1

89
Chapitre 4. Seconde quantification

= ν〈ψ1 , . . . , ψn −1 |a (ϕ)|ϕ1 , . . . , ϕn 〉ν . (4.18)

Ainsi par simple identification, on établit l’action de l’opérateur de destruction suivant la relation

n
1 ∑ i −1
a (ϕ)|ϕ1 , . . . , ϕn 〉ν = p ν |ϕ1 , . . . , ϕi −1 , ϕi +1 , ϕn 〉ν 〈ϕ|ϕi 〉 , (4.19)
n i =1

qui peut être vu comme l’annihilation de la composante |ϕ〉 pour chaque état mono-particulaire
|ϕi 〉 de l’état à n particules.

4.B.2 Relations de commutation et d’anticommutation

Les propriétés de commutation entre les opérateurs a (†) (ϕ) dépendent de la nature bosonique ou
fermionique des particules. Elles s’obtiennent aisément à l’aide des relations (4.16) et (4.19) intro-
duites ci-dessus. Considérons dans un premier temps le produit d’opérateurs de création à l’inté-
rieur de la statistique ν. À partir de (4.16) et la propriété des kets, nous avons
p p
a † (ϕ)a † (ψ)|ϕ1 , . . . , ϕn 〉ν = n + 1 n + 2|ϕ, ψ, ϕ1 , . . . , ϕn 〉ν
p p
= ν n + 1 n + 2|ψ, ϕ, ϕ1 , . . . , ϕn 〉ν
= νa † (ψ)a † (ϕ)|ϕ1 , . . . , ϕn 〉ν . (4.20)

On en déduit que pour des bosons (ν = +), a † (ϕ)a † (ψ) = a † (ψ)a † (ϕ), ce qui est équivalent à la
relation de commutation :
 †
a (ϕ), a † (ψ) = a † (ϕ)a † (ψ) − a † (ψ)a † (ϕ)


=0 (4.21)

De façon similaire pour les fermions (ν = −), nous avons a † (ϕ)a † (ψ) = −a † (ψ)a † (ϕ), ce qui donne
lieu à la relation d’anticommutaion :
 †
a (ϕ), a † (ψ) = a † (ϕ)a † (ψ) + a † (ψ)a † (ϕ)
= 0. (4.22)

En prenant l’adjoint des deux expressions précédentes, on en conclut que les opérateurs d’annihi-
lation pour les bosons obéissent également à la relation de commutation
 
a (ϕ), a (ψ) = a (ϕ)a (ψ) − a (ψ)a (ϕ)
= 0, (4.23)

alors que pour les fermions, la relation d’anticommutation suivante est satisfaite :

a (ϕ), a (ψ) = a (ϕ)a (ψ) + a (ψ)a (ϕ)
= 0. (4.24)

Maintenant, si on examine l’action du produit mixte a † (ϕ)a (ψ) :


n
† †1 ∑ i −1
a (ϕ)a (ψ)|ϕ1 , . . . , ϕn 〉ν = a (ϕ) p ν |ϕ1 , . . . , ϕi −1 , ϕi +1 , . . . ϕn 〉ν 〈ψ|ϕi 〉
n i =1

90
B. Espace de Fock

n

= νi −1 |ϕ, ϕ1 , . . . , ϕi −1 , ϕi +1 , . . . ϕn 〉ν 〈ψ|ϕi 〉
i =1
n

= |ϕ1 , . . . , ϕi −1 , ϕ, ϕi +1 , . . . ϕn 〉ν 〈ψ|ϕi 〉.
i =1
(4.25)

Parallèlement, le produit a (ψ)a † (ϕ) permet d’écrire


p
a (ψ)a † (ϕ)|ϕ1 , . . . , ϕn 〉ν = a (ψ) n + 1|ϕ, ϕ1 , . . . , ϕn 〉ν
p n
n +1 ∑ i
=p ν |ϕ, ϕ1 , . . . , ϕi −1 , ϕi +1 , . . . ϕn 〉ν 〈ψ|ϕi 〉
n + 1 i =0
n

= |ϕ1 , . . . , ϕn 〉ν 〈ψ|ϕ〉 + ν |ϕ1 , . . . , ϕi −1 , ϕ, ϕi +1 , . . . ϕn 〉ν 〈ψ|ϕi 〉
i =1
(4.26)

Pour des bosons (ν = +), la soustraction de (4.26)et (4.25) donnera la relation de commutation :

a (ψ), a † (ϕ) = 〈ψ|ϕ〉,


 
(4.27)

alors que pour des fermions (ν = −), leur addition donnera

a (ψ), a † (ϕ) = 〈ψ|ϕ〉.



(4.28)

Bases particulières. Il est utile d’illustrer la forme des relations de commutation et d’anticommu-
tation pour quelques bases particulières fréquemment utilisées. Pour une
base discrète |ψ〉 → |ψr 〉, telle que celle des ondes planes où le nombre quantique discret r devient
r → k, σ, avec σ pour le spin 1 , les relations (4.27) et (4.28) s’écrivent respectivement,

a k,σ , a k†′ ,σ′ = 〈ψk,σ |ψk′ ,σ′ 〉 = δk′ k δσσ′


 
(4.29)
a k,σ , a k†′ ,σ′ = δk′ k δσσ′ .

(4.30)

Dans le cas d’une base continue comme celle de la représentation position, |ψr 〉 → |r, σ〉 les relations
(4.27) et (4.28) deviennent

a σ (r), a σ† ′ (r′ ) = 〈r, σ|r′ , σ′ 〉 = δ(r − r′ )δσσ′


 
(4.31)
† ′ ′

a σ (r), a σ′ (r ) = δ(r − r )δσσ′ . (4.32)

États de particules Tout état de particules indépendantes s’obtient par application des opéra-
indépendantes. teurs de création sur le vide,
1
|ϕ1 , . . . , ϕn 〉ν = p a † (ϕ1 ) . . . a † (ϕn )|0〉, (4.33)
n!
1. Le nombre quantique ħ h k associé à l’opérateur d’impulsion P prend des valeurs discrètes pour des conditions aux
frontières périodiques dans un volume V .

91
Chapitre 4. Seconde quantification

qui est bien symétrique (ν = +) ou antisymétrique (ν = −) en raison des relations de commutation


(4.23) ou d’anticommutation (4.24). Lorsque que nous avons affaire à un base monoparticulaire
{|ψr 〉}, nous aurons en représentation d’occupation :

(a 1† )n1 (a † )n r
|n1 , . . . , n r , . . .〉ν = p . . . pr . . . |0〉, (4.34)
n1 ! nr !

qui rappelle le cas d’états à n quantas pour l’oscillateur harmonique.

On peut montrer les relations suivantes, soit

a r† |n1 , . . . , n r , . . .〉+ = n r + 1 |n1 , . . . , n r + 1, . . .〉+


p

a r |n1 , . . . , n r , . . .〉+ = n r |n1 , . . . , n r − 1, . . .〉+


p
(4.35)

pour les bosons où n r = 0, 1, 2, . . ., et

a r† |n1 , . . . , n r , . . .〉− = (−1)γr (1 − n r ) |n1 , . . . , n r + 1, . . .〉− ,


a r |n1 , . . . , n r , . . .〉− = n r (−1)γr |n1 , . . . , n r − 1, . . .〉− , (4.36)

r −1

où γr = n r , et n r = 0, 1 pour les fermions.
r

4.B.3 Opérateurs à une particule

On cherche à déterminer l’expression de l’opérateur à un corps défini en (4.10) en termes des opé-

rateurs de création et d’annihilation. Si on regarde son action dans Hν n , on peut écrire
1 ∑∑
A|ϕ1 , . . . , ϕn 〉ν = Pπ νπ A j |ϕ1 , . . . , ϕn 〉⊗
n! j π
1 ∑∑
= Pπ νπ |ϕ1 , . . . , Aϕ j , ϕn 〉⊗ . (4.37)
n! j π

On peut montrer que l’action de A est en fait équivalente à



A= a † (Aψr )a (ψr ), (4.38)
r

où {|ψr 〉} est une base discrète à une particule. En effet, si par la relation (4.19) nous avons
n
1 ∑ i −1
a (ψr )|ϕ1 , . . . , ϕn 〉ν = p ν |ϕ1 , . . . , ϕi −1 , ϕi +1 , . . . , ϕn 〉ν 〈ψr |ϕi 〉, (4.39)
n i =1

qui selon (4.16), permet d’établir l’équivalence


∑ n
∑∑
a † (Aψr )a (ψr )|ϕ1 , . . . , ϕn 〉ν = |ϕ1 , . . . , ϕ j −1 , Aψr , ϕ j +1 , . . . , ϕn 〉ν 〈ψr |ϕ j 〉
r r j =1
n




= A |ψr 〉〈ψr | |ϕ j 〉ν j −1 |ϕ1 , . . . , ϕ j −1 , ϕ j +1 , . . . , ϕn 〉ν
j =1 r

92
B. Espace de Fock

n

= |ϕ1 , . . . , ϕ j −1 , Aϕ j , ϕ j +1 , . . . , ϕn 〉ν
j =1
∑ n
= A j |ϕ1 , . . . , ϕn 〉ν
j =1

= A|ϕ1 , . . . , ϕn 〉ν . (4.40)

Maintenant, de ce qui précède et des relations (4.19) et (4.16) pour a et a † , on peut trouver dans la
base discrète {|ψr 〉} :
 
∑∑ ∑
A|ϕ1 , . . . , ϕn 〉ν = |ψs 〉〈ψs | A|ψr 〉ν j −1 |ϕ1 , . . . , ϕ j −1 , ϕ j +1 , . . . , ϕn 〉ν 〈ψr |ϕ j 〉
j r s
  
1
∑ p 
= 〈ψs |A|ψr 〉|ψs 〉 n a r |ϕ1 , . . . , ϕn 〉ν
r,s

= 〈ψs |A|ψr 〉a s† a r |ϕ1 , . . . , ϕn 〉ν , (4.41)
r,s

ce qui permet d’écrire pour les opérateurs à un corps :



A= 〈ψr |A|ψs 〉a r† a s . (4.42)
r,s

Opérateur nombre de Considérons l’action de l’opérateur N , que l’on définit comme


particules. ∑
N |ϕ1 , . . . , ϕn 〉ν = a † (ψr )a (ψr )|ϕ1 , . . . , ϕn 〉ν , (4.43)
r

nous aurons à l’aide de (4.19) et (4.16),


n
∑ 1 ∑ j −1
N |ϕ1 , . . . , ϕn 〉ν = a † (ψr ) p ν |ϕ1 , . . . , ϕ j −1 , ϕ j +1 , . . . , ϕn 〉ν 〈ψr |ϕ j 〉
r
n j =1
n
∑∑
= ν j −1 |ψr , ϕ1 , . . . , ϕ j −1 , ϕ j +1 , . . . , ϕn 〉ν 〈ψr |ϕ j 〉
r j =1


 n

= |ψr 〉〈ψr | |ϕ1 , . . . , ϕ j −1 , ϕ j , ϕ j +1 , . . . , ϕn 〉ν
r j =1
  
1
n

= |ϕ1 , . . . , ϕ j −1 , ϕ j , ϕ j +1 , . . . , ϕn 〉ν
j =1

= n |ϕ1 , . . . , ϕn 〉ν , (4.44)

ce qui montre que l’opérateur



N= a † (ψr )a (ψr )
r

93
Chapitre 4. Seconde quantification


≡ a r† a r (4.45)
r

correspond à l’opérateur nombre de particules ayant comme valeur propre le nombre total de parti-
cules, n , dans la base des états { |ϕ1 , . . . , ϕn 〉ν }. Dans la représentation position, par exemple, pour
les particules avec spin σ, où |ψr 〉 → |r, σ〉, nous avons pour l’opérateur nombre de particules :


N = d 3r a σ† (r)a σ (r). (4.46)
σ

Le nombre de particules peut être vu comme une intégrale N = d 3 r ρ(r) sur l’opérateur densité
de particules, ρ(r), ∑
ρ(r) = a σ† (r)a σ (r).
σ
Si on opte plutôt pour la base discrète |ψr 〉 → |k, σ〉, l’opérateur nombre s’exprime sous la forme


N= a k,σ a k,σ
k,σ

= Nk,σ , (4.47)
k,σ

ce qui permet également de définir Nk,σ comme l’opérateur nombre de particules dans l’état k, σ.

Énergie cinétique. Comme autre exemple d’opérateur à un corps, considérons l’énergie ciné-
tique totale d’une ensemble de particules soit
n
∑ P2i
A= . (4.48)
i =1
2m

Ainsi en seconde quantification selon (4.42), cet opérateur dans la base {|k, σ〉} prend la forme :
n
∑ P2i ∑∑ P2 ′ ′ †
= 〈k, σ| |k , σ 〉a k,σ a k′ ,σ′
i =1
2m k,σ k′ ,σ′
2m
h 2k 2
∑ħ

= a k,σ a k,σ
k,σ
2m

= εk Nk,σ (4.49)
k,σ

h 2 k 2 /2m est l’énergie cinétique d’une particule de quantité de mouvement k.


où εk = ħ

En représentation position, nous aurons pour l’énergie cinétique :


n
P2i P2 ′ ′ †
∫ ∫
∑ ∑
= d r d 3r ′
3
〈r, σ| |r , σ 〉a σ (r)a σ′ (r′ )
i =1
2m σ,σ′
2m
h2 2 ′ ′
∫ ∫
∑ ħ
= − d 3r d 3r ′ a σ† (r)〈r, σ| ∇r′ |r , σ 〉a σ′ (r′ )
σ,σ′
2m
h2 2

∑ ħ
= − d 3r a σ† (r) ∇ a σ (r). (4.50)
σ
2m r

94
B. Espace de Fock

4.B.4 Opérateurs à deux particules

Les opérateurs à deux particules


∑ 1∑
V = Vi j = Vi j (4.51)
i<j
2 i ̸= j

font partie intégrante des systèmes de particules en interaction dans le problème à N-corps de
fermions ou de bosons. On montre que la représentation de seconde quantification pour ce type
d’opérateurs dans une base discrète {|ψr 〉} est de la forme :
1 ∑∑ 1∑
〈r1 , r2 |V |s1 , s2 〉a r†1 a r†2 a s2 a s1 |ϕ1 , . . . , ϕn 〉ν = Vi j |ϕ1 , . . . , ϕn 〉ν (4.52)
2 r ,r s ,s 2 i ̸= j
1 2 1 2

pour tout ket ν-symétrique.

Ainsi à l’aide de l’action de l’opérateur d’annihilation (4.19), on a en partant de la gauche de l’ex-


pression ci-dessus
1 ∑∑
〈r1 , r2 |V |s1 , s2 〉a r†1 a r†2 a s2 a s1 |ϕ1 , . . . , ϕn 〉ν
2 r ,r s ,s
1 2 1 2
n
1 ∑∑ 1 ∑ i −1
= 〈r1 , r2 |V |s1 , s2 〉a r†1 a r†2 a s2 p ν |ϕ1 , . . . , ϕi −1 , ϕi +1 , . . . ϕn 〉ν 〈s1 |ϕi 〉
2r n i =1
1 ,r2 s1 ,s2
n
1 ∑∑ 1 ∑
= 〈r1 , r2 |V |s1 , s2 〉a r†1 a r†2 p p νi −1
2 r ,r s ,s n n − 1 i =1
1 2 1 2
 i −1

× ν j −1 |ϕ1 , . . . , ϕ j −1 , ϕ j +1 , . . . , ϕi −1 , ϕi +1 , . . . ϕn 〉ν 〈s1 |ϕi 〉〈s2 |ϕ j 〉
j =1
∑n 
j
+ ν |ϕ1 , . . . , ϕi −1 , ϕi +1 , . . . , ϕ j −1 , ϕ j +1 , . . . , ϕn 〉ν 〈s1 |ϕi 〉〈s2 |ϕ j 〉 .
j =i +1

En utilisant successivement (4.16) et la relation de fermeture


 n i −1
1 ∑∑ ∑∑
= 〈r1 , r2 |V |s1 , s2 〉 |ϕ1 , . . . , ϕ j −1 , ψr2 ϕ j +1 , . . . , ϕi −1 , ψr1 , ϕi +1 , . . . ϕn 〉ν
2 r ,r s ,s i =1 j =1
1 2 1 2

∑n ∑ n 
+ |ϕ1 , . . . , ϕ j −1 , ψr2 ϕ j +1 , . . . , ϕi −1 , ψr1 , ϕi +1 , . . . ϕn 〉ν 〈s1 , s2 |ϕi , ϕ j 〉
i =1 j =i +1
n i −1

1 ∑∑ ∑
= 〈r1 , r2 |V |ϕi , ϕ j 〉|ϕ1 , . . . , ϕ j −1 , ψr2 ϕ j +1 , . . . , ϕi −1 , ψr1 , ϕi +1 , . . . ϕn 〉ν
2 i =1 j =1 r ,r
1 2
n
∑ n ∑


+ 〈r1 , r2 |V |ϕi , ϕ j 〉|ϕ1 , . . . , ϕ j −1 , ψr2 ϕ j +1 , . . . , ϕi −1 , ψr1 , ϕi +1 , . . . ϕn 〉ν
i =1 j =i +1 r1 ,r2
n i −1 n n
1 ∑∑ 1∑ ∑
= Vi j |ϕ1 , . . . , ϕn 〉ν + Vi j |ϕ1 , . . . , ϕn 〉ν
2 i =1 j =1 2 i =1 j =i +1
1∑
= Vi j |ϕ1 , . . . , ϕn 〉ν . (4.53)
2 i ̸= j

95
Chapitre 4. Seconde quantification

On tire donc l’égalité suivante en seconde quantification :

1 ∑∑
V = 〈r1 , r2 |V |s1 , s2 〉a r†1 a r†2 a s2 a s1 . (4.54)
2 r ,r s ,s
1 2 1 2

Interaction indépendante du On peut illustrer le résultat précédent pour le cas d’une interac-
spin. tion à deux corps V → V (R 1 − R 2 ) que l’on prendra invariante par
translation et indépendante du spin ∑ – l’interaction
∑ ∫ 3 coulombienne
en est un exemple. Ainsi en représentation position où |r 〉 → |r, σ〉 et r → σ d r , l’élément de
matrice devient

〈r1 , r2 |V |s1 , s2 〉 → 〈r1 , σ1 ; r2 , σ2 |V (R 1 − R 2 )|r′1 , σ1′ ; r′2 , σ2′ 〉


= V (r 1′ − r 2′ )〈r1 , σ1 ; r2 , σ2 |r′1 , σ1′ ; r′2 , σ2′ 〉
= V (r1 − r2 )δ(r1 − r′1 )δ(r2 − r′2 )δσ1 ,σ1′ δσ2 ,σ2′ . (4.55)

L’interaction en seconde quantification prend donc la forme


∫∫
1 ∑
V = d 3 r1 d 3 r2 V (r1 − r2 )a σ† 1 (r1 )a σ† 2 (r2 )a σ2 (r2 )a σ1 (r1 ). (4.56)
2 σ ,σ 1 2

4.B.5 Fermions et bosons en une dimension : transformation Wigner-Jordan

4.B.6 Ondes de spin : transformation Holstein-Primakov

96
Chapitre 5

BOSONS

A Systèmes de bosons libres

On considère l’hamiltonien d’un système de bosons libres en seconde quantification :



H0 = εk ck† ck (5.1)
k

où l’énergie cinétique d’un boson dans l’état k est donnée par

ħ 2k 2
h
εk = . (5.2)
2m
La fonction de partition grand canonique pour un tel système prend la forme :

Z = Tre −β (H −µN ) . (5.3)

N = k Nk est le nombre de particules total, Nk = ck† ck , celui de l’état k , et µ est le potentiel chi-

mique. Le produit d’opérateurs ck† ck commute pour toutes les valeurs de k, la fonction de partition
se factorise :

Z= Zk
k

= Tr|nk ...〉 e −β (εk −µ)Nk
k
∏€
1 + e −β (εk −µ) + e −2β (εk −µ) + . . .
Š
=
k
∏ 1
= (5.4)
k
1 − e −β (εk −µ)

pour laquelle nous avons utilisé l’équation aux valeurs propres en représentation d’occupation
Nk |nk , . . .〉 = nk |nk , . . .〉, avec nk = 0, 1, 2 . . . pour des bosons.

Le nombre d’occupation noté n (εk ) est donné par le nombre moyen de particules dans l’état k, soit :

n (εk ) = 〈Nk 〉
= Z k−1 Tr|nk 〉 Nk e −β (εk −µ)Nk

97
Chapitre 5. Bosons


= lnZ k
∂ (β µ)
1
n (εk ) = , (5.5)
e β (εk −µ) − 1
appelée distribution de Bose-Einstein. Ainsi le nombre moyen de particules total par unité de vo-
lume V est donné par :

n =V −1 n (εk )
k


= ρ(ε) ,
e β (ε−µ) − 1
(5.6)
p p
où ρ(ε) = εm 3/2 /( 2π2 ħ h 3 ) est la densité d’états de bosons à trois dimensions. Il est commode
d’exprimer l’expression précédente en termes d’une intégrale impropre I (γ) fonction du paramètre
γ = β µ, à savoir :
1 2m k B T 3/2
 ‹
n= I (γ), (5.7)
4π2 h2
ħ
où ∫ ∞ p
x
I (γ) = d x. (5.8)
0
e x −γ − 1
Ainsi, comme la valeur moyenne n est fixée en statistique grand canonique, il faut que I (γ) et donc
µ(T ) soit une fonction de T . De plus, comme l’intégrande est nécessairement positive, il faut obli-
gatoirement que γ < 0 ; en baissant la température, µ(T ) va croître à partir de valeurs négatives pour
finalement atteindre zéro à une température notée Tλ déterminée par la condition µ(Tλ ) = 0 :
 23
ħ2 4π2 n

h
k B Tλ = (5.9)
2m I (0)

qui définit la température de condensation Bose-Einstein.

Ainsi pour une densité typique pour l’4 He, soit 0.146 g/cm3 (≡ m n; ), on tire Tλ ≃ 3.13K. Cette va-
leur est sensiblement plus élevée que la valeur observée expérimentalement de 2.17K de l’4 He pour
la transition superfluide − transition qui est, comme nous le verrons, plus qu’une condensation
Bose-Einstein. L’écart vient du fait que nous avons négligé l’interaction entre les bosons et d’une
h 2 k 2 /2m .
l’utilisation d’une énergie du type εk = ħ

Avant d’aborder le problème de la transition superfluide de l’4 He, on peut examiner d’un peu plus
près la nature de la condensation de Bose-Einstein. En fait pour tout T < Tλ , un nombre macrosco-
pique de particules occupera l’état k = 0 dans la limite µ → 0− . Appelons ce nombre N0 . À partir de
(5.6), on peut écrire dans cette gamme de température :

n = n0 + n (εk ) (5.10)
k ̸=0

1 2m k B T 3/2
 ‹
= n0 + I (0)
4π2 h2
ħ

98
A. Systèmes de bosons libres

‹ 32
T

→ n0 + n . (5.11)

On a alors – ‹ 32 ™
T

n0 = n 1 − , (5.12)

ce qui traduit bien l’émergence d’une condensation d’un nombre macroscopique dans l’état k = 0.
On note que pour T → 0, toutes les particules sont dans ‘l’état condensée’ (n = n0 ).
n
n0
1.0

0.8

0.6

0.4

0.2
T
0.2 0.4 0.6 0.8 1.0 TΛ

FIGURE 5.1
Densité du condensât de Bose-Einstein n/n0 vs la température réduite T /Tλ .

Chaleur spécifique. L’impact de cette condensation sur les propriétés thermodynamiques comme
la chaleur spécifique est intéressante. Pour l’expliciter, on calcule dans un
premier temps l’énergie interne E = 〈H 〉 :

E= εk 〈Nk 〉
k

ε e −β (ε−µ)

=V ρ(ε) d ε, (5.13)
0
1 − e −β (ε−µ)

h −3 π−2 m 3/2 ε/2 est la densité d’états. Avec un changement de variable similaire à celui
où ρ(E ) = ħ
p

employé ci-dessus pour la densité, on trouve pour l’énergie par particule

E V m 3/2
= (k B T )5/2 p I˜(γ)
N N π2 2
I˜(γ)
= kB T , (5.14)
I (γ)

où nous avons utilisé l’expression (5.7) pour la densité et introduit l’intégrale



x 3/2

I˜(γ) = d x. (5.15)
0
e x −γ − 1

99
Chapitre 5. Bosons

La chaleur spécifique devient alors


dE
C= (5.16)
dT
I˜(γ) d I˜(γ) d γ
 
C
= kB + kB T . (5.17)
N I (γ) d γ I (γ) d T
Cette fonction est tracée à la figure 5.2. On constate que la chaleur spécifique présente une ‘pointe’
à la température de condensation Tλ . Il s’agit d’une discontinuité dans la dérivée de C ou dans la
troisième dérivée de l’énergie libre par rapport à la température. Selon la classification d’Ehrenfest,
la condensation de Bose-Einstein correspondrait à une ‘transition du troisième ordre’.
C
NkB
4

3
2
2

T
0.5 1.0 1.5 2.0 2.5 3.0 TΛ

FIGURE 5.2
Chaleur spécifique par particule en fonction de la température pour un système de bosons libres à trois
dimensions. La ligne pointillée est la limite classique de Dulong-Petit (C /N = 32 k B ).

On peut avoir une idée plus précise de la dépendance en température de la chaleur spécifique en
dessous de Tλ en considérant la densité de particules, nth excitées thermiquement hors du conden-
sat, notée nth . À partir de (5.12), on trouve immédiatement nth = n (T /Tλ )3/2 à T ≤ Tλ . Comme il
s’agit de particules excitées thermiquement, elles peuvent être considérées comme classiques et
donc régies par le théorème d’équipartition de l’énergie. Selon ce théorème, l’énergie interne cor-
respondante par unité de volume est donnée par E /V = 32 nth k B T , ce qui donne une dépendance
en loi de puissance pour la chaleur spécifique
 ‹3
C 15 T 2
= n kB . (5.18)
V 4 Tλ

5.A.1 Condensation de Bose-Einstein : atomes froids

L’observation expérimentale d’une condensation de Bose-Einstein telle que décrite ci-dessus n’est
pas une tâche aisée et en pratique difficile, voire virtuellement impossible à réaliser. Celle-ci pré-
suppose comme nous l’avons vu l’absence d’interaction entre particules ce qui en fait une limite
pratiquement inaccessible. Nous avons mentionné que l’4 He (super)fluide a été considéré suivant
sa découverte comme un condensât de Bose-Einstein 1 , ce qui est vrai qu’en partie puisque les in-
1. Cette hypothèse a été mise de l’avant par les frères London.

100
A. Systèmes de bosons libres

teractions inter atomique sont particulièrement fortes dans ce système. De plus, l’émergence d’un
nombre macroscopique d’atomes 4 He dans le niveau d’énergie le plus bas apparaît à partir d’un
état non pas gazeux de bosons, mais d’un état liquide normal à une température supérieure à Tλ et
pour lequel les interactions sont fortes. C’est également le cas de la majorité des gaz dans la limite
thermodynamique lorsqu’ils sont refroidis à des températures suffisamment basses : des transitions
liquide-gaz ou encore solide-liquide précèdent de loin les effets quantiques liés à la statistique des
particules en présence, empêchant ainsi la condensation de Bose-Einstein d’avoir lieu.

Des efforts considérables de recherche ont été déployés ces dernières décennies pour parvenir à
son observation à partir d’un état gazeux suffisamment dilué pour que les interactions restent re-
lativement faibles. Grâce à des techniques de refroidissement impliquant le rayonnement laser,
le piègeage magnétique et les techniques dites d’évaporations successives, il est maintenant pos-
sible d’atteindre des températures extrêmement basses de l’ordre de 10−6 ...10−9 K. Selon (5.9), cette
gamme de température permet en principe d’avoir une condensation pour des systèmes dilués (n
faible) et même pour des masses m relativement élevées.

Rappelons que pour la transition quantique de Bose-Eisntein puisse avoir lieu, les effets quantiques
liés à la statistique, ici de
p bosons, doivent être importants, i.e., que la longueur d’onde de Broglie
des particules λth = h / 3mk B T , donnant l’étendue spatiale de la fonction d’onde des particules
à température T doit être plus grande que la distance moyenne d entre particules (λth ≫ d ) et
ce, afin que la dégénérescence d’échange puisse avoir lieu. Les alcalins comme le 87 Rb et le 23 Na
sont des systèmes particulièrement intéressants de ce point de vue, car le couplage entre le spin de
l’électron s périphérique et le spin du noyau en font un atome de spin total (F = S + I ) entier qui
se comporte donc comme un boson aux températures atteintes par les techniques de refroidisse-
ment ci-dessus. On arrive ainsi à confiner dans une région l’espace d’une cinquantaine de microns
un gaz de N ∼ 103 . . . et plus d’atomes, soit des bosons composites comme le 87 Rb. Ce nombre qui
est bien en deçà de la limite thermodynamique, permet d’atteindre de faibles densités et des inter-
actions à deux corps de loin inférieures à celles prévalant pour des systèmes comme l’4 He 2 . Une
transition de phase vers un pur condensât de Bose-Einstein a été observée pour la première fois en
1995 par l’équipe de Wieman, Cornell et al. de l’Université Boulder pour le 87 Rb - découverte qui a
valu à C. Wieman, W. Ketterle et E. Cornell le prix Nobel de 2001 3 . Comme le montre la figure 5.3,
on voit l’apparition d’un pic central associé à la condensation d’un nuage atomique d’une étendue
de l’ordre de 2 nm (d’énergie ∼ 0) pour une température Tλ ∼ 100 nK. Il ne s’agit pas d’un gaz de
bosons idéal ou parfait : les interactions, bien que faibles, sont présentes de sorte que le conden-
sât est plutôt un état cohérent quantique impliquant la superposition d’états mono particulaires
de différentes quantités de mouvement près de zéro. C’est un état cohérent qui représente un état
quantique macroscopique où tous les atomes agissent collectivement. Nous aborderons les états
cohérents de bosons à la section § 5.B.1 dans le cadre d’un traitement en couplage faible de l4 He
superfluide. La possibilité de générer des états quantiques de condensat de Bose-Einstein a ouvert
tout un domaine de recherche autant fondamentale qu’appliquée qui est celui des atomes froids 4 .

2. Dans l’4 He, les interactions à trois corps sont même pertinentes.
3. L’un des trois récipiendaires du prix Nobel, W. Ketterle du MIT, a réussi peu de temps auparavant un exploit simi-
laire sur des atomes de sodium.
4. Ces systèmes incluent également des systèmes de fermions composites comme le 7 Li, . . . .

101
Chapitre 5. Bosons

FIGURE 5.3
Profils d’intensité de vitesses (v x , vz ) d’un système d’environ 2000 atomes (alcalins) froids de 87 Rb pour
des températures de part et d’autre de la transition de condensation de Bose-Einstein vers un état cohé-
rent macroscopique. Le maximum développé au centre de l’image pour les deux profils de droite indique
la transition d’un état gazeux vers celui d’une occupation macroscopique d’états d’énergies voisines. La
température de transition est de l’ordre de la centaine de nano Kelvins. H. Anderson, J. R. Ensher, M. R. Mat-
thews, C. E. Wieman and E. A. Cornell, Science 269, 198 (1995).

B Helium superfluide

La comparaison des prédictions du modèle de bosons libres avec l’expérience pour un système tel
que l’4 He est intéressante. Dans un premier temps, l’4 He passe de l’état gazeux à l’état liquide à
Tl = 4.2K à pression ambiante. Cependant contrairement à d’autres systèmes de gaz rares, plus
lourds, comme le Ne, l’Ar, ..., l’4 He ne présente pas de transition liquide-solide à pression ambiante
4
en raison de la ‘petite
p masse’ de l’ He qui est favorable à une relativement grande longueur d’onde
thermique λth ∼ ħ h / mk B T . Cette longueur fixe l’extension spatiale des effets quantiques donnant
ainsi lieu pour l’4 He à de fortes fluctuations quantiques ou de point zéro nuisant à la transition
de cristallisation. En fait, une pression finie d’environ 25 bars est nécessaire pour que l’4 He puisse
atteindre l’état solide (voir figure 5.4 ). Autre conséquence de fluctuations quantiques importantes
est l’absence d’un point triple dans le diagramme de phase liant les phases liquide, solide et gazeuse,
contrairement à la plupart des liquides normaux (eau, gas rares plus lourds, etc., cf. fig. 3.2). Ces
modifications sont la manifestation d’effets quantiques liés à la statistique des particules à basse
température 5 .

La phase liquide normale à basse pression pour l’4 He n’est cependant pas stable et subit une in-
stabilité importante à la température Tλ = 2.17K . Cette instabilité a toutes les caractéristiques d’un
point critique associée à une transition continue avec un comportement singulier de la chaleur spé-
cifique comme le montre la figure 5.5. Son comportement critique, C ∼ |T − Tλ |−α est compatible
avec un exposant α → 0 proche de zéro, soit une singularité de type logarithmique

C ∼ A log |T − Tλ | + B (5.19)
5. On notera que le diagramme de phase d’un autre isotope plus léger de l’hélium, l’3 He, diffère également de celui
attendu des atomes plus lourds. Cependant, il diffère aussi de celui de l’4 He. Les fluctuations quantiques font intervenir
la statistique de fermions pour l’3 He, évidemment fondamentalement différente de celle des bosons pour l’4 He.

102
B. Helium superfluide

FIGURE 5.4
Diagramme de phase de l’4 He.

Un tel exposant critique appartient à la classe d’universalité dite ‘XY’ à dimension spatiale d = 3.
Il s’agit donc d’un paramètre d’ordre à deux composantes. Les propriétés de la nouvelle phase li-
quide ordonnée sont plutôt remarquables. À T < Tλ , une portion macroscopique du liquide se voit
par exemple privée de toute viscosité et peut se déplacer sans friction. Dans des conduits capillaires
suffisamment étroits, i.e., là où le liquide normal à T > Tλ ne peut se déplacer sous l’effet de la visco-
sité, l’4 He dans sa nouvelle phase s’écoule sans résistance − c’est l’expérience de Kapitza (1937) qui
démontra de manière ferme l’existence de cette transition. L’ordre à longue distance qui s’établit à
T < Tλ est dit ‘superfluide’. On soupçonna assez tôt que cet état avait une origine quantique des-
criptible à l’aide d’une fonction d’onde macroscopique, la fonction d’onde de London (F. London,
1940),
ψ = |ψ|e i ϕ , (5.20)
Un tel paramètre d’ordre avec amplitude et phase correspond bien à la classe d’universalité mise en
évidence par les expériences de chaleur spécifique. La nature macroscopique de la fonction d’onde,
celle-ci proche de la limite classique, permet d’identifier son module avec la densité de particules
superfluide 6 ,
n s = |ψ|2 . (5.21)
London proposa que cette densité macroscopique était le résultat d’une condensation de Bose-
Einstein telle que prédite pour le modèle de bosons libres considéré ci-dessus. Cependant, le mo-
dèle de bosons libres était incapable de rendre compte des effets collectifs, notamment l’absence de
viscosité. L’interaction inter-atomes, qui est forte, s’avère essentielle à l’existence du superfluide.
L’influence de l’interaction est aussi essentielle à la réduction de n s ≪ n qui, bien que macrosco-
pique, diffère d’environ 20% de la densité totale.

Des expériences fines de viscosité permettent d’extraire la dépendance en température des densités
n s et nn , superfluide et normale (expériences d’Andronikashivili, 1946) de l’4 He (Fig.5.6) 7 . Ainsi en
6. Cette correspondance au niveau macroscopique se distingue de la mécanique quantique au plan microscopique,
i.e., là où le module carré de la fonction d’onde se limite à décrire une densité de probabilité et non une densité de
particules.
7. C’est le modèle à deux fluides de Landau (1941).

103
Chapitre 5. Bosons

24

22

20

18

chaleur spécifique C (J/g.K)


16

14

12

10

−1.5−1.0−0.5 0.0 0.5 1.0 1.5


T − Tλ (K)

FIGURE 5.5
Chaleur spécifique de l’4 He autour du point critique λ. Données de M. J. Buckingham and W. M. Fairbank,
Progress in Low Temperature Physics, 3, 80 (1961).

dessous et près de Tλ , on trouve le comportement critique

n s ∼ (Tλ − T )2β (5.22)

avec l’exposant
β ≈ 0.335, (5.23)
qui est bien typique de la classe d’universalité X Y compatible avec une fonction d’onde pour le
paramètre d’ordre (amplitude et phase). Maintenant si ψ est une fonction d’onde, on peut définir
un flux ou plutôt un superflux par la relation entre le courant et la fonction d’onde en mécanique
quantique :
h
ħ  ∗
ψ ∇ψ − ψ∇ψ∗

Js =
2m i
h
ħ
= n s ∇ϕ = n s vs (5.24)
m
où vs est la vitesse macroscopique du superfluide. Ainsi tout mouvement du superfluide est associé
aux variations spatiales de la phase de sa fonction d’onde.

104
B. Helium superfluide

1.0

ρs /ρ
0.8

0.6
point λ

0.4

ρn /ρ
0.2

0.0
0.0 0.5 1.0 1.5 2.0 2.5
température (K)

FIGURE 5.6
Expérience d’Andronikashivili (1946) sur le mouvement oscillant de disques en-dessous du point λ (haut)
d’où l’on peut extraire les composantes normale (ρn ≡ nn ) et superfluide (ρs ≡ n s ) en fonction de la tem-
pérature (bas). Données tirées de K. R. Atkins, Adv. Phys. 1, 169 (1952).

5.B.1 Approche phénoménologique à la transition superfluide

La comparaison des résultats précédents pour l’4 He avec les prédictions de la condensation de
Bose-Einstein du modèle de bosons libres montrent bien que ce dernier est insuffisant pour dé-
crire la transition vers l’état superfluide. Un ingrédient fondamental faisant défaut au modèle de
bosons libres est celui des interactions entre bosons. La nature de ces interactions pour les gaz rares
tels que l’hélium est bien décrite par le potentiel Lennard-Jones. Ce potentiel possède une partie
répulsive en ∼ 1/r 12 aux courtes distances, laquelle lisse l’impact du principe de Pauli (l’4 He est
un boson composite de fermions) ; elle est suivie d’une partie attractive de type van der Waals en
−1/r 6 . Il s’avère que c’est la partie répulsive à courte distance qui joue un rôle clé dans l’établisse-
ment de l’état superfluide, la partie attractive étant bien évidemment essentielle pour l’existence
de la transition liquide-gaz et liquide-solide sous pression.

On considère l’hamiltonien suivant


∑ P2 1∑
i
H= + U (|ri − r j |), (5.25)
i
2m 2 i ̸= j

où U (|ri − r j |) est un potentiel répulsif à deux corps. En seconde quantification, cet hamiltonien
devient en représentation position

h2 2
∫   ∫∫
ħ 1
3
H = d r b (r) − †
∇ b (r) + d 3 r d 3 r ′U (|r − r′ |)b † (r)b † (r′ )b (r′ )b (r), (5.26)
2m 2

où b (†) sont les opérateurs d’annihilation (création) du champ de boson satisfaisant la relation de

105
Chapitre 5. Bosons

commutation :
[b (r), b † (r′ )] = δ(r − r′ ).

Pour notre système on postulera l’existence d’un état fondamental cohérent de la forme
∫ 
|Φ〉 = exp d 3 r b † (r)φ(r) |0〉, (5.27)

construit à partir du vide de particule |0〉 dans l’espace de Fock. Ici

φ(r) = |φ(r)|e i ϕ(r) (5.28)

est une fonction complexe de la position que l’on verra coïncider avec le paramètre d’ordre su-
perfluide. Un simple développement de l’exponentielle de l’état cohérent montre que celui-ci ne
conserve pas le nombre de particules, ce qui est manifeste par le fait que cet état est un état propre
de l’opérateur d’annihilation,

〈Φ|b (r)|Φ〉
〈b (r)〉 =
〈Φ|Φ〉
= φ(r). (5.29)

Le nombre de particules et la phase sont des variables conjuguées et obéissent à la relation d’incer-
titude
1
∆ϕ∆N ≥ (5.30)
2
Ainsi la fluctuation de nombre de particules réduit l’incertitude de la phase et dans la limite ma-
croscopique où ∆N → ∞, les fluctuations de la phase deviennent négligeables et la fonction φ(r)
traduit une cohérence de phase à longue distance. L’ansatz d’un état cohérent permet donc de cla-
rifier l’origine de la fonction d’onde macroscopique ‘à la London’.

À température nulle le grand potentiel A = E −µN −T S se réduit à l’expression de l’énergie de l’état


fondamental dans l’état cohérent :

E¯ [φ] = E − µN
〈Φ|E − µN |Φ〉
=
〈Φ|Φ〉
ħ2 2
∫   ∫∫
∗ h 1
= 3
d r φ (r) − ∇ φ(r) + d 3 r d 3 r ′U (|r − r′ |)φ ∗ (r)φ ∗ (r′ )φ(r′ )φ(r), (5.31)
2m 2

qui devient une fonctionnelle de φ(r).

Si on pose pour simplifier une ‘répulsion delta de coeur dur’ entre particules :

U (|r − r′ |) = U δ(r − r′ ), (5.32)

où U a maintenant les dimensions énergie × volume, la fonctionnelle devient

ħ2 2
∫   ∫
∗ h 1
E¯ [φ] = 3
d r φ (r) − ∇ φ(r) + U d 3 r φ ∗ (r)φ ∗ (r)φ(r)φ(r) (5.33)
2m 2

106
B. Helium superfluide

Une simple intégration par partie du terme cinétique permet d’écrire l’énergie sous la forme d’une
fonctionnelle de type Ginzburg-Landau

E [φ] = d 3 r a |φ(r)|2 + b |φ(r)|4 + c |∇φ(r)|2 ,
 
¯ (5.34)


a =−µ
U
b=
2
h2
ħ
c= . (5.35)
2m
Ainsi la fonctionnelle fait apparaître le potentiel du paramètre d’ordre V [φ] = a |φ(r)|2 +b |φ(r)|4 qui
a la forme d’un chapeau mexicain (figure 5.7).

FIGURE 5.7
Potentiel V [φ] de la fonctionnelle Landau-Ginzburg du paramètre d’ordre φ = |φ|e i ϕ à température nulle,
invariant par rapport à la phase ϕ.

Pour notre ansatz, φ est un paramètre variationnel et la minimisation δ E¯ /δφ ∗ = 0 de la fonction-


nelle permet d’obtenir l’équation de Gross-Pitaevskii (1958) :

ħ2 2
h
− ∇ φ(r) + U |φ(r)|2 φ(r) = µφ(r) (5.36)
2m

qui est une équation ‘à la Schrödinger’, non linéaire, régissant les variations spatiales du paramètre
d’ordre.

On constate que dans le cas homogène du champ moléculaire, soit là où les variations spatiales sont
p
absentes, ∇2 φ = 0 et que φ = n s e i ϕ , nous avons
U |φ|2 = µ → n s U (5.37)
On voit que lorsque U → 0, soit la situation des bosons libres, on retrouve bien l’annulation du
potentiel chimique de la condensation de Bose-Einstein.

107
Chapitre 5. Bosons

États cohérents. Un exemple simple d’états cohérents de bosons est celui de l’oscillateur harmo-
nique linéaire d’hamiltonien,
P2 1
H= + k X 2, (5.38)
2m 2
lequel admet des états stationnaires orthonormés

(a † )n
|ψn 〉 = p |0〉 ≡ |n 〉 (5.39)
n!
et que l’on exprime en représentation d’occupation de quanta d’oscillateur à l’aide des opérateurs
de création et d’annihilation
⎡ ⎤
1
mω 2 2

1 P
a=p ⎣p −i X ⎦, (5.40)

ħ 2m 2
⎡ ⎤
1
mω 2 2

1 P
a† = p ⎣p +i X ⎦, (5.41)

ħ 2m 2

où ω = k /m est la fréquence naturelle de l’oscillateur. Ces opérateurs obéissent à la relation de


p

commutation
[a , a † ] = 1. (5.42)
Ils agissent en tant qu’opérateurs d’échelle sur les états à n quanta :
p
a † |n〉 = n + 1 |n + 1〉 (5.43)
p
a |n〉 = n |n − 1〉 (5.44)

À partir de ces opérateurs, on introduit l’opérateur nombre de quanta N = a † a qui satisfait l’équa-
tion aux valeurs propres :
N |n〉 = n|n 〉 (5.45)
On définit l’état cohérent
 α α2 
|α〉 = C |0〉 + p |1〉 + p |2〉 + . . . , (5.46)
1! 2!
comme une superposition sur les états à 0, 1, 2, . . . quanta d’oscillateurs, où C est une constante
de normalisation et α ∈ C appartient au corps des complexes. Compte tenu de (5.43-5.44), on
reconnaît le développement d’une exponentielle, ce qui permet d’écrire l’expression équivalente :

|α〉 = C exp(a † α)|0〉 (5.47)


L’expression de la norme au carré de l’état cohérent,

〈α|α〉 = |C |2 〈0|0〉 + |α|2 〈1|1〉 + (2!)−1 |α|4 〈2|2〉 + . . .]



(5.48)
= |C |2 〈0|0〉 + |α|2 + (2!)−1 (|α|2 )2 + . . .]


2
= |C |2 e |α| = 1, (5.49)

108
B. Helium superfluide

permet de fixer la constante de normalisation


2 /2
C = e −|α| . (5.50)

Une propriété clé de l’état cohérent est qu’il constitue un état propre de l’opérateur de d’annihi-
lation :
a |α〉 = α|α〉 (5.51)
avec la valeur propre complexe α. L’adjointe de cette équation est donnée par :

〈α|a † = 〈α|α∗ . (5.52)

À l’aide de (5.51), on peut écrire pour la valeur moyenne de l’opérateur d’annihilation dans un
état cohérent :
〈α|a |α〉 = α. (5.53)
On tire également les égalités

〈α|N |α〉 =|α|2 (5.54)


〈α|N 2 |α〉 =|α|2 + |α|4 . (5.55)

L’écart quadratique moyen pour le nombre de quanta dans l’état cohérent devient
p
∆N = 〈α|(N − 〈N 〉)2 |α〉
p
= |α| = 〈N 〉. (5.56)

Maintenant, la représentation d’Euler de α = |α|e i θ permet d’écrire pour la dérivée angulaire de


l’état cohérent :
1 ∂ 1 
|α〉 = C 0 + i |α|e i θ a † |0〉 + (2!)−1 |α|2 (2i )e 2i θ (a † )2 |0〉 + . . .

i ∂θ i
= C N |0〉 + |α|e i θ N a † |0〉 + (2!)−1 |α|2 e 2i θ N (a † )2 |0〉 + . . .


1 ∂
→ |α〉 = N |α〉. (5.57)
i ∂θ
Cette relation est analogue à celle reliant deux variables conjuguées en mécanique quantique
comme par exemple la quantité de mouvement et la position a . Ainsi, la phase θ et le nombre
de quanta N sont conjugués ([θ̂ , N ] = i ) et obéissent à la relation d’incertitude :

∆θ ∆N ≥ 1/2. (5.58)

Comme l’état |α〉 fait intervenir par construction la fluctuation d’un grand nombre de quanta, on
a selon (5.56), ∆N ≫ 1, et alors ∆θ ≪ 1, ce qui réduit d’autant les fluctuations de la phase d’où
l’appellation d’état cohérent pour |α〉.
a. En mécanique quantique, on a effectivement
ħ ∂
h
〈x | |p 〉 = 〈x |p |p 〉,
i ∂x
montrant que la position et la quantité de mouvement sont conjuguées ([X , P ] = i ħ
h ) et qu’elles sont liées par la relation
d’incertitude
∆X ∆P ≥ ħ h /2.

109
Chapitre 5. Bosons

Dynamique et excitations Si on examine maintenant la dynamique des excitations collectives


collectives : modes de par rapport au condensât, il est utile de généraliser l’équation (5.36)
Goldstone au cas où la fonction d’onde φ(r) → φ(r, t ) dépend du temps t . L’équa-
tion de Gross-Pitaesvki dépendante du temps s’écrit

ħ2 2
h δ E¯
− ∇ φ(r, t ) + U |φ(r, t )|2 φ(r, t ) − µφ(r, t ) =
2m δφ ∗
∂φ
= iħ
h ,
∂t
h2 2
ħ
− ∇ φ(r) + U |φ(r)|2 φ(r) − µφ(r) = ħ h ωφ(r), (5.59)
2m
où la dernière ligne résulte de la séparation habituelle de variables φ(r, t ) = φ(r)e i ωt . Si on considère
de petites variations δφ du paramètre d’ordre φ = φ0 +δφ par rapport au condensât (de phase fixée
par la brisure de symétrie), il est commode de linéariser l’équation, ce qui donne

ħ2 2
h
− ∇ φ(r) + U n s (δφ(r) + δφ ∗ (r)) = ħ
h ωδφ(r), (5.60)
2m
où les termes d’ordre supérieurs en δφ sont négligés. Si on recherche des modes propres de type
onde plane pour cette équation linéaire,

δφ(r) = u e i q·r + v e −i q·r , (5.61)

la substitution conduit à l’équation aux valeurs propres


⎛ ⎞ ⎛ħ h 2q 2
⎞⎛ ⎞
u + ns U U ns ⎟ ⎝u ⎠
h ω ⎝ ⎠ = ⎝ 2m (5.62)

ħ 2 2
h q

v ħ v
−U n s + ns U
2m
et donc à l’équation caractéristique :
⎛ 2 2 ⎞
h q
ħ
⎜ 2m + n s U − ħ
hω U ns
det ⎝ ⎠=0 (5.63)

2 2
ħ q
h
−U n s + ns U − ħ

2m
La branche pertinente des fréquences positives prend la forme

ħ 2q 2 Æ
h
hω =
ħ 1 + (ξ0 q )−2 . (5.64)
2m
On constate que pour de très petites longueurs d’onde comparées à la longueur caractéristique,

h
ħ
ξ0 = p , (5.65)
2 mU n s

appelée longueur de cohérence, on a q ξ0 ≫ 1 et le spectre d’excitations se réduit à celui des bosons


libres.
h 2q 2
ħ
hω →
ħ .
2m

110
B. Helium superfluide

Dans ce cas, les longueurs d’onde des particules sont petites devant la portée des forces, lesquelles
n’ont virtuellement pas d’effet sur les particules. À l’inverse lorsque q 2 ≪ 1/ξ20 , alors l’interaction
modifie le spectre d’excitations de manière substantielle pour devenir

ω = vφ q (5.66)

qui est linéaire en q , soit de type ‘Debye’, par analogie avec les phonons acoustiques d’un réseau.
La vitesse de propagation de ces modes acoustiques est donnée par

h
ħ
vφ = (5.67)
2m ξ0

Il s’agit de modes collectifs acoustiques du condensat. Ils émergent en dessous de Tλ suite à la brisure
spontanée de symétrie de jauge qui fixe la phase de φ0 = |φ0 |e i ϕ0 . En fait cette brisure de symétrie
contraint les variations de la phase d’un point à un autre de l’espace comme le ferait une constante
de rappel pour les vibrations cristallines, donnant ainsi naissance à ces modes collectifs.

L’émergence de nouveaux modes sans gap (i.e., ħ h ω → 0, lorsque q → 0) suite à la brisure d’une
symétrie continue (ici de jauge pour ϕ) est une illustration d’un théorème bien connu, le théorème
de Goldstone :

Toute brisure de symétrie continue donne naissance à de(s) nouvelle(s) branche(s) d’excitations col-
lectives sans gap.

5.B.2 Approche microscopique de Bogoliubov : gaz de bosons quasi parfait

Le point de départ de l’approche de Bogoliubov à la superfluidité est l’hamiltonien microscopique


∑ 1 ∑
H= εk bk† bk + U (q )bp† +q bk†−q bk bp , (5.68)
k
2V k ,p ,q

h 2 k 2 /2m et U (q ) est la transformée de Fourier du terme d’interaction que l’on prendra égal
où εk = ħ
à ∫
U (q ) = U (r )e −i q ·r d 3 r = U (5.69)

pour un terme de contact U répulsif. On différencie dans les diverses sommations la contribution
au vecteur d’onde q = 0 associée à l’occupation macroscopique de manière à séparer l’hamiltonien
sous la forme :

H = HB + H ′
∑ U † † U ∑” † —
= εk bk† bk + b0 b0 b0 b0 + 4bq bq b0† b0 + bq† bq† b0 b0 + b0† b0† bq bq + H ′ ,
k
2V 2V q ̸=0

(5.70)


U ∑
H′ = bq† bk†−q bk b0 + . . . . (5.71)
2V {k ,q }̸=0

111
Chapitre 5. Bosons

L’hamiltonien HB en (5.70) est appelé hamiltonien de Bogoliubov. Dans l’état condensé superfluide,
〈b0† b0 〉 = N0 , et 〈b0 b0† 〉 = 1 + N0 ≃ N0 , si N0 ≫ 1 désigne une occupation macroscopique. Il s’ensuit
que le commutateur [b0 , b0† ] ≃ 0 et que b0 ≃ N0 et b0† ≃ N0 peuvent être considérés comme
p p

des objets classiques égaux à la racine de l’occupation macroscopique. Maintenant, si la différence


entre le nombre de particules dans le condensât et le nombre de particules total s’écrit

N0 = N − bq† bq (5.72)
q ̸=0

le second terme de HB devient

U † † U
b b b0 b0 ≈ N2
2V 0 0 2V 0
U U ∑ † U € ∑ † Š2
=N2 − 2N bq bq + b bq
2V 2V q ̸=0 2V q ̸=0 q

(5.73)

Le dernier terme de cette expression fait intervenir un produit de quatre opérateurs hors du conden-
sât et s’ajoute donc à H ′ . Quant au second terme, il vient diminuer d’un facteur deux le premier
terme de l’expression entre crochets de (5.70).

Dans ces conditions, l’hamiltonien de Bogoliubov devient

1 ∑ 1∑
HB = N2+ ξq bq† bq + ∆(bq† b−q

+ bq b−q ), (5.74)
2V q ̸=0
2 q ̸=0

ξq = εq + ∆. (5.75)

et
N
∆= U (5.76)
V
HB n’est plus diagonal en termes des opérateurs de bosons. C’est un hamiltonien champ moyen
qui brise une symétrie, la symétrie de jauge liée à la phase du condensât qui est fixée.

Afin de diagonaliser HB , on introduit de nouveaux opérateurs via les transformations de Bogoliubov

αq† = u q bq† − vq b−q , (5.77)



αq = u q bq − vq b−q , (5.78)

où les nouveaux opérateurs de bosons satisfont les relations de commutation [αq , αq† ′ ] = δq q ′ sui-
vant la condition de normalisation des coefficients u q et vq que l’on prendra réels :

u q2 − vq2 = 1. (5.79)

Cette condition suggère de définir

u q = coshθq , (5.80)

112
B. Helium superfluide

vq = sinh θq , (5.81)

en termes de θq réel. À l’aide des transformations inverses de (5.77-5.78), soit

bq = u q αq + vq α†−q , (5.82)
bq† = u q αq† + vq α−q , (5.83)

l’hamiltonien de Bogoliubov (5.70) prend la forme


∑” —
HB = E 0 + ξq (u q2 + vq2 ) + 2∆u q vq bq† bq
q ̸=0
∑ §• 1 ˜ •
1
˜ ª
+ ∆(u q2 + vq2 ) + ξq u q vq αq† α†−q 2 2
+ ∆(u q + vq ) + ξq u q vq αq α−q , (5.84)
q ̸=0
2 2

où nous avons utilisé u (v )q = u (v )−q . L’élimination des termes hors diagonaux impose

1
∆(u q2 + vq2 ) + ξq u q vq = 0, (5.85)
2
ce qui, en vertu de (5.80-5.81), est équivalent à la condition sur l’argument θq :


tanh 2θq = − . (5.86)
ξq

Quelques manipulations algébriques permettent d’écrire :


ξq
cosh 2θq = + q , (5.87)
ξq2 − ∆2

sinh 2θq = − q . (5.88)
ξq2 − ∆2

On a fixé les signes des dernières expressions en réalisant que u q , selon (5.80), est nécessairement
positif et donc à partir de (5.86), le signe − doit apparaître pour (5.88).

L’hamiltonien de Bogoliubov prend alors la forme diagonale



HB = E 0 + Eq αq† αq , (5.89)
q ̸=0

où la constante à l’énergie est donnée par


∑€ Š
E0 = ξq vq2 + u q vq ∆ . (5.90)
q ̸=0

Alors que le spectre des nouvelles excitations est de la forme


q
Eq = ξq2 − ∆2 . (5.91)

À partir de (5.76), le spectre peut aussi s’écrire :



h 2q 2 √ 4N mU

ħ
Eq = 1+ . (5.92)
2m h 2q 2
V ħ

113
Chapitre 5. Bosons

On retrouve les caractéristiques de l’expression du spectre (5.64) obtenue dans le cadre de la théorie
phénoménologique. En effet, pour une interaction de contact en ‘ delta’ et l’identification N /V =
n s , Eq donne un spectre de phonons, linéaire en q , dans la région des faibles vecteurs d’onde, à
savoir là où l’influence de l’interaction est présente. C’est le mode de Goldstone, conséquence de
la brisure de symétrie liée à la phase du paramètre d’ordre. Maintenant dans la limite des q grands,
Eq ≈ εq et le spectre redevient essentiellement celui des bosons libres.

114
Chapitre 6

SUPRACONDUCTIVITÉ

A Phénoménologie des supraconducteurs

Suite à la liquéfaction de l’4 He au début du vingtième siècle, des expériences de transport élec-
trique ont pu être menées à des basses températures jusque là jamais atteintes. C’est ainsi qu’en
1911 Kamerlingh Onnes a pu faire la première observation du phénomène de supraconductivité
sur le mercure. Les mesures révélaient une chute brutale de résistance électrique à Tc ≃ 4.16K, sui-
vie d’une absence complète de pertes ohmiques (fig. 6.1). Par la suite, plusieurs autres éléments
supraconducteurs ont été découverts (Tableau 1), alors que certains alliages se sont avérés être su-
praconducteurs. Dans les années 70, les alliages de type “A-15" (Nb3 Sn, etc.) figuraient pour lors
parmi ceux ayant les hautes températures critiques. En 1979 deux familles de supraconducteurs
exotiques ou non conventionnels font leur apparition : les fermions lourds (CeCu2 Si2 , . . . ), suivi de
très près par les supraconducteurs organiques (les sels de Bechgaard (TMTSF)2 PF6 , . . . .).

FIGURE 6.1
Expérience de Kamerlingh Onnes (1911) pour la résistance du mercure en fonction de la température.

115
Chapitre 6. Supraconductivité

S Tc [K]

Al 1.18
Ga 1.09
Hg 4.16
In 3.4
Nb 9.2
Pb 7.2
Sn 3.72
Ta 4.4
Nb3 Sn 18.05
Nb3 Ge 23
CeCu2 Si2 0.5
UBe13 1
(TMTSF)2 X 1.2
(BEDT − TTF)2Cu[N[(CN)2 ]Cl 13
La2−x Sr x CuO4 30
YBa2Cu3 O7 90
HgBa2Can −1Cun O2n+3−δ 134, 164(30GPA)
Rb3C 60 27
Cs3C 60 40(Pression)
MgB2 40

TABLE 6.1
Température critique de quelques supraconducteurs

116
A. Phénoménologie des supraconducteurs

Quelques années après, une frénésie sans précédent d’activités dans le domaine des supraconduc-
teurs s’en est suivie avec la découverte par Berdnoz et Müller (1986) et Wu (1987) des oxydes de
cuivre supraconducteurs, La2−x Ba x CuO4 et YBa2 Cu3 O7−y , aussi appelés supraconducteurs à haute
température critique ou encore les cuprates. Le tableau 6.1 donne quelques exemples de supracon-
ducteurs et leur température critique.

La résistance électrique est directement liée aux porteurs de charge que sont les électrons de
conduction. Comme le montre la figure 6.1, une résistance nulle à T ≤ Tc indique que les élec-
trons ne sont pas influencés par les défauts de structure et les impuretés, lesquels devraient induire
une dissipation résiduelle de la quantité de mouvement des électrons pour un métal normal en-
trainant une saturation de la résistance lorsque T → 0 1 . L’absence de résistance est donc liée à
une absence complète de dissipation et dont l’origine a demeuré complètement mystérieuse pour
plusieurs décennies qui int suivi.

FIGURE 6.2
Chaleur spécifique (électronique) en fonction de la température pour l’aluminium (Tc = 1.16K) et com-
paraison avec la partie normale linéaire obtenue suite à l’application d’un champ magnétique. Illustration
tirée de : N. E. Phillips, Phys. Rev. 114, 676 (1959) (Tous droits réservés)

La signature thermodynamique de la transition et de l’état supraconducteur est aussi spectaculaire.


C’est le cas de la contribution électronique à la chaleur spécifique qui est aussi anormale à T ≤ Tc ;
elle présente un saut qui rappelle d’emblée une transition continue ou du second ordre (fig. 6.2).
Le profil en température de la chaleur spécifique à T ≪ Tc est aussi remarquable et suit une dé-
croissance exponentielle de la forme Cel ∼ e −b Tc /T , où b ≳ 1 est une constante. Ce comportement
activé indique une activation thermique du nombre de porteurs, en contradiction avec les données
de résistance qui montrent plutôt que les porteurs de charge contribuent fortement et que cette
1. Il est important de mentionner que le comportement de la résistivité pour un métal dans les limites des basses
températures était inconnue dans première décennie du vingtième siècle. C’est précisément dans le but d’élucider ce
comportement que Kamerlingh Onnes a conduit sa série d’expériences. Il va sans dire que le comportement spectaculaire
de la résistivité pour un métal tel le mercure fut complètement inattendu.

117
Chapitre 6. Supraconductivité

contribution est même exempte de dissipation. Afin de résoudre cette contradiction, on est amené
à supposer qu’une description du système faisant appel à la présence d’électrons individuels ne
semble plus être valide pour un supraconducteur, et que c’est plutôt le caractère collectif des élec-
trons qui entre en jeu.

Une autre propriété remarquable des supraconducteurs est la “rigidité” presque totale de la tempé-
rature critique face à une augmentation d’impuretés ou de défauts non magnétiques (sans centre
magnétique). La température critique demeure très peu sensible à la concentration d’impuretés et
ce, même jusqu’à des concentrations relativement importantes de ce type de défaut 2 .

6.A.1 Effet Meissner

Bien que les supraconducteurs conventionnels soient peu sensibles à l’ajout d’impuretés non ma-
gnétiques, ils sont cependant très sensibles à la présence de centres magnétiques comme c’est le cas
d’ impuretés de fer. Ainsi, quelques ppm seulement de Fe dans le Mo suffisent à détruire complète-
ment la phase supraconductrice et à restaurer la phase normale métallique. Comme chaque impu-
reté possède un spin, il est clair que la présence d’un champ magnétique microscopique a un impact
considérable sur les propriétés supraconductrices. Cela s’avéra être à l’origine d’une propriété vrai-
ment remarquable, découverte par Meissner et Ochsenfeld (1933), qui est l’expulsion complète des
lignes de flux magnétique pour un système supraconducteur en présence d’un champ magnétique
externe H dont l’amplitude se situe au-dessous d’un certain seuil critique. Cet effet est couram-
ment appelé l’effet Meissner et conduit au diamagnétisme parfait (figure 6.3). Pour comprendre ce
phénomène, on constate que sous l’action d’un champ magnétique externe H , le supraconducteur
produit des “supercourants” de magnétisation M à l’intérieur d’une certaine épaisseur λ située près
de la surface 3 . Ces derniers produisent à l’intérieur du supraconducteur un champ magnétique qui
s’oppose en totalité à celui de l’extérieur pour donner

B = H + 4πM
=0 (6.1)

pour l’induction magnétique B . Les lignes de flux magnétique sont donc fortement perturbées à
proximité du supraconducteur (fig. 6.3-a), le champ ne pénétrant que sur une longueur λ, appelée
longueur de pénétration (fig.6.3).

Le diamagnétisme parfait caractérisant l’effet Meissner conduit alors à la relation suivante pour la
susceptibilité

M
χ=
H
1
=− , (6.2)

2. Cette insensibilité aux défauts non magnétiques n’est présente que pour les supraconducteurs conventionnels (Hg,
Al, . . . ). Il en est tout autrement des supraconducteurs dits non conventionnels. Pour les supraconducteurs organiques
par exemple, comme les (TMTSF)2 X , quelques ppm d’impuretés non magnétiques ou de défauts de structure suffisent
à détruire complètement la supraconductivité.
3. Cette configuration en surface des courants est présente pour les supraconducteurs de type I. Pour des supracon-
ducteurs de type II, celle-ci n’est présente qu’à faible champ (H < Hc 1 ).

118
A. Phénoménologie des supraconducteurs

H ↑ λ


x


a) b)

FIGURE 6.3
Deviations des lignes de flux magnétique (a) et pénétration du champ magnétique (b) pour l’effet Meissner
d’un supraconducteur.

donnant ainsi naissance au profil M v s H de la figure 6.4-a. En pratique, pour une certaine catégorie
de supraconducteurs, à savoir ceux de type I, on observe une relation linéaire jusqu’à une valeur
critique Hc du champ au-dessus de laquelle, le système cesse d’être supraconducteur et passe dans
l’état normal. La valeur précise de Hc (T ) est fonction de la température fig. 6.4-b, et empiriquement,
elle obéit à la loi de Gorter-Casimir (1934) :

Hc (T ) = Hc (0)[1 − T 2 /Tc2 ]. (6.3)

1
—M H/Hc

0
Hc H 0 1 T/T c

a) b)

FIGURE 6.4
Profil de l’aimantation en fonction du champ appliqué (a) et loi empirique de Gorter-Casimir pour le
champ critique (b).

Aspects thermodynamiques. La ligne d’équilibre de phase supra-normal de la figure6.4-b est en


fait une ligne de premier ordre. On peut s’en convaincre en regar-
dant le bilan énergétique du point de vue de la thermodynamique. Le potentiel thermodynamique

119
Chapitre 6. Supraconductivité

par unité de volume s’écrit :


G (T, H ) = E − T S − M H , (6.4)
lequel, à température constante, conduit à la différentielle totale :

d G = −M d H , (6.5)

à température constante. Ainsi, la différence d’énergie libre à température T entre les phases su-
praconductrices en champ nul et celle en équilibre avec la phase normale à H = Hc , est donnée
par :
∫ Hc
1
∆G = H dH
4π 0
= GS (T, Hc ) − GS (T, 0)
= GN (T, Hc ) − GS (T, 0)
Hc2
= . (6.6)

Le long de la ligne d’équilibre normal-supraconducteur, l’égalité des énergies pour les deux états,

GS (T + δT, Hc + δHc ) = GN (T + δT, Hc + δHc )

permet d’écrire après différentiation

∂ GN ∂ GN ∂ GS ∂ GS
 ‹  ‹  ‹  ‹
dT + d Hc = dT + d Hc (6.7)
∂T Hc ∂ Hc T ∂T Hc ∂ Hc T

Avec les définitions (∂ GN ,S /∂ T )Hc = −SN ,S et (∂ GN ,S /∂ Hc )T = M N ,S pour l’entropie et l’aimantation


par unité de volume des états normal (N) et supraconducteur (S), on peut établir une relation de
type Clausius-Clapeyron pour la ligne de premier ordre H versus T :

dH SS − SN
= . (6.8)
dT M N − MS

L’entropie (par porteur) étant plus faible dans la phase supraconductrice, SS < SN , alors que le dia-
magnétisme de la phase supraconductrice conduit obligatoirement à M S < M N , d’où un d H /d T <
0, en accord avec la loi empirique de Gorter-Casimir de la figure 6.4-b.

Supraconducteurs de type II. L’effet Meissner ne suit pas toujours le profil de la figure 4a qui
est celui des supraconducteurs de type I pour certains métaux très
purs. Les métaux tels que le Zn, Cd, Hg, Al, Ga, In, Tl, Sn, et le Pb sont des supraconducteurs de type
I. Historiquement, on s’est aperçu que l’introduction d’un certain pourcentage d’In dans le Pb par
exemple, avait pour effet de laisser pénétrer partiellement le flux magnétique dans l’échantillon.
Dans un tel cas, l’effet Meissner n’est que partiel. À champ suffisamment faible, le diamagnétisme
suit le même profil que précédemment ; cependant, au-dessus d’un champ seuil, habituellement
appelé Hc 1 , il se forme des tourbillons ou vortex dont le coeur est essentiellement constitué d’élec-
trons normaux ; c’est à travers ce coeur que le champ pénètre. Cette pénétration partielle permet
cependant d’obtenir des champs critiques Hc 2 , pour le retour à l’état normal complet. Le champ
critique supérieur peut être beaucoup plus élevé que celui du système pur (fig.5a).

120
A. Phénoménologie des supraconducteurs

–M
a)

∼ 600 G
δ=0

∼ 2400 G
δ> ↓
0 ∼ 500 G H

–M

b)

Hc 1 Hc 2 H

FIGURE 6.5
Profil d’aimantation pour le plomb en présence de différentes concentrations δ d’indium (a). Variation
caractéristique de l’aimantation pour un supraconducteur de type II (b) .

Shubnikov a été le premier à souligner qu’un tel phénomène était intrinsèque à une certaine classe
de supraconducteurs. Cette interprétation fut controversée, car plusieurs considéraient que l’en-
trée du flux dans l’échantillon était le résultat de régions normales résultant de la formation de
l’alliage 4 . En fait, des supraconducteurs très purs comme le niobium par exemple, présentaient
également un tel profil, ce qui mis en échec le modèle de l’éponge et confirma l’existence d’une se-
conde classe de supraconducteurs, à savoir ceux de type II. Il s’avère en fait que la grande majorité
des systèmes supraconducteurs connus sont de type II.

La structure de vortex correspond à un véritable état distinct de la matière de nature cristalline. La


symétrie d’un cristal de vortex est en général triangulaire (figure 6.6) ; c’est le réseau d’Abrikosov, du
nom du théoricien de l’école russe qui établit l’énergie de cohésion d’un tel cristal.

6.A.2 Équation de London pour la longueur de pénétration

Afin de déterminer le profil de pénétration du champ magnétique dans un supraconducteur, nous


allons considérer l’approche des frères F. London et H. London (1935). Ces derniers ont avancé
que la supraconductivité est avant tout un phénomène quantique macroscopique et pour rendre
compte de l’effet Meissner, ils proposèrent que l’énergie libre en présence d’un champ magnétique
4. Ce modèle était celui dit de “l’éponge" supraconductrice.

121
Chapitre 6. Supraconductivité

FIGURE 6.6
Réseau triangulaire de vortex dans un supraconducteur de type II (partie supérieure d’un cylindre d’alliage
plomb-indium), tel qu’obtenu par décoration de particules ferromagnétiques. Illustration tirée de : H. Träuble
and U. Essmann, J. Appl. Phys. 39, 4052 (1968). (Tous droits réservés)

puisse être écrite la forme suivante :



F= [Fs + Ek + EM ]d r , (6.9)

où Fs est la densité d’énergie libre du supraconducteur en l’absence de champ magnétique. L’éner-


gie cinétique des porteurs Ek en présence des supercourants qui est peut être mise sous la forme :
1
Ek = m n s v s2
2
1
= m e −2 n s−1 J s2 (r ) (6.10)
2
où J s (r ) = e n s (r )v s (r ) est le supercourant exprimé à l’aide de la densité d’électrons supracon-
ducteurs et la vitesse de dérive macroscopique v s (r ) dont les variations spatiales sont supposées
lentes 5 . La densité d’énergie libre magnétique est quant à elle donnée par :

h2
EM = . (6.11)

où h (r ) est le champ magnétique local. À partir de l’équation de Maxwell locale, à savoir

∇×h = Js , (6.12)
c
valable en absence de courant libre (source) à l’intérieur du supraconducteur, on peut écrire pour
l’énergie libre : ∫
1
F = F (h = 0) + [h 2 + λ2L | ∇ × h |2 ]d r , (6.13)

5. Variations lentes de v et h par rapport à la longueur de cohérence d’un supraconducteur ξ0 ∼ ħ


h vF /πTc . La limite
de London s’applique pour λ ≫ ξ0 . Dans le cas inverse, il s’agit de la limite de Pippard.

122
B. Approche Ginzburg-Landau



√ mc 2
λL ≡ (6.14)
4πn s e 2

est une longueur caractéristique, appelée longueur de pénétration de London. Une approche varia-
tionnelle permet d’extraire la configuration d’équilibre du champ magnétique en posant δF = 0,
ce qui conduit à :

1
d r [h · δh + λ2 (∇ × h ) · (∇ × δh )] = 0


1
d r [h + λ2 (∇ × ∇ × h )] · δh = 0, (6.15)

où la seconde ligne résulte d’une intégration par partie avec l’abandon d’un terme de surface. Ainsi,
pour des variations arbitraires du champ magnétique, la partie de l’intégrande entre crochets doit
s’annuler pour donner
λ2L ∇2 h = h (6.16)

qui est l’équation de London. Dans le cas d’une géométrie simple où l’on a un bloc supraconducteur
s’étendant dans la région z > 0 avec un champ magnétique orienté selon x̂, on obtient :

h x = h x (0)e −z /λL , (6.17)

traduisant ainsi une décroissance exponentielle du champ avec λL comme longueur caractéris-
tique.

B Approche Ginzburg-Landau

Avant la venue d’une théorie microscopique satisfaisante de la supraconductivité conventionnelle,


Ginzburg et Landau (1950) 6 ont proposé une théorie phénoménologique remarquable qui mettait
l’accent sur le caractère quantique macroscopique de la supraconductivité. Ils postulent l’existence
d’une paramètre d’ordre pour l’état supraconducteur, représenté par une fonction d’onde macro-
scopique ψ = |ψ|e i ϕ avec une amplitude et une phase. À l’instar de la théorie phénoménologique
de Landau élaborée dans les années 30 pour les transitions de phase 7 , ils postulèrent l’existence
d’un développement de l’énergie libre F [ψ] en puissances de ψ :

” 1 ħ h 1 —
F [ψ] = d r α(T )|ψ(r )|2 + | ∇ψ|2 + β |ψ(r )|4 , (6.18)
2m ∗ i 2

avec les paramètres

α(T ) = α0 (T − Tc ) (6.19)

6. V. L. Ginzburg and L. D. Landau, Zh. Eksp. Teor. Fiz. 20, 1064 (1950).
7. Voir chapitre 3.

123
Chapitre 6. Supraconductivité

β > 0, (6.20)

m > 0. (6.21)

On remarquera que m ∗ peut être identifié à la masse des constituants élémentaires du paramètre
d’ordre supraconducteur et le terme en (gradient)2 de l’énergie libre à l’énergie cinétique telle
qu’elle apparaît en mécanique quantique - ici macroscopique 8 .

La minimisation de la fonctionnelle G-L par rapport aux variation de ψ, δF [ψ]/δψ∗ = 0 permet


d’obtenir l’équation G-L régissant les configurations spatiales de ψ :

ħ2 2
h
− ∇ ψ + α(T )ψ + β |ψ|2 ψ = 0, (6.22)
2m ∗
qui est une équation ‘à la Schrödinger’ non linéaire pour une fonction d’onde ψ. Il est commode de
normaliser le paramètre d’ordre en utilisant f = ψ/|ψ0 |, où |ψ0 |2 = −α/β est l’amplitude d’équilibre
[cf éq. (6.26)]. L’équation G-L se ramène à l’expression

ξ2 (T )∇2 f − f 3 + f = 0, (6.23)

qui fait apparaître une longueur caractéristique

h
ħ T − Tc − 12
ξ(T ) = p
2m ∗ Tc α0 Tc
T − Tc − 12
≡ ξ0 , (6.24)
Tc

qui correspond à la longueur de corrélation du paramètre d’ordre. Celle-ci diverge à la transition


avec un exposant ν = 12 de type champ moyen. On peut assimiler ξ0 à la longueur de cohérence
du paramètre d’ordre supraconducteur. Ainsi selon (6.23), ξ(T ) caractérise les variations spatiales
du paramètre d’onde. De la structure de (6.23), ces variations peuvent linéaires ou non linéaires
(tourbillons, vortex).

Dans la limite uniforme, ψ(r ) = ψ = |ψ|i ϕ0 , où la phase ϕ0 est fixée (brisure de symétrie de jauge),
le terme en gradient disparaît et l’énergie libre prend la forme d’une énergie libre (par unité de
volume) de Landau,
1
F¯ [ψ] = α(T )|ψ|2 + β |ψ|4 , (6.25)
2
qui rappelle celle discutée en détail au chapitre 3 dans le cadre du magnétisme et de la superflui-
dité au chapitre 5. Elle est cependant similaire au cas superfluide en raison d’un paramètre d’ordre
complexe avec amplitude et phase. Avec l’indépendance sur la phase ϕ, l’énergie F¯ [ψ] pour les
configurations de ψ a la forme du ‘chapeau mexicain’ de la fig. 5.7.

Avec la condition δF¯ /δ|ψ| = 0, on obtient immédiatement la configuration d’équilibre du para-


mètre d’ordre supraconducteur

|ψ0 |2 = −α(T )/β

8. Dans la confrontation de la théorie Ginzburg-Landau avec l’expérience, il faillait ajuster m ∗ = 2m et e ∗ = 2e , soit le


double de la masse et de la charge électronique. Ces valeurs correspondent à la masse et la charge des paires de Cooper
de la théorie BCS.

124
B. Approche Ginzburg-Landau

α0
→ ns = (Tc − T ). (6.26)
β
En tant que module carré de la fonction d’onde macroscopique, |ψ0 |2 = n s correspond à la densité
d’électrons supraconducteurs. n s a une forme critique champ moyen, laquelle s’accorde bien avec
l’expérience près de Tc (voir par ex. la figure 6.9).

L’énergie libre d’équilibre F¯ [ψ0 ] permet d’obtenir la contribution de l’état condensée à la chaleur
spécifique
δ2 F¯ [ψ0 ]
δCel = − T = 0 (T > Tc ), (6.27)
δT 2
α2
= T 0 (T ≤ Tc ), (6.28)
β
qui montre un saut à la transition en accord avec l’expérience comme le montrent les résultats de
chaleur spécifique de la figure 6.2.

En présence d’un champ magnétique, la quantité de mouvement devient P → P − ec A et l’énergie
libre G-L devient
e∗  2 1 h2 —

” 1 h
ħ
F [ψ] = d r α(T )|ψ(r )|2 + ∇ − A ψ + β |ψ(r )|4 + , (6.29)
2m ∗ i c 2 8π
et pour laquelle on a ajouté la densité d’énergie magnétique pour un champ local h = ∇ × A. Ici e ∗
est la charge effective des constituants élémentaires du paramètre d’ordre supraconducteur (voir
note 8).

On cherche à trouver la configuration de champ en présence d’un état supraconducteur ψ en mi-


nimisant la fonctionnelle d’énergie libre par rapport au vecteur potentiel A :
⎧ ⎫

⎪ ⎪


⎪ ⎪

∗ ” ∗

e e 1
⎨ € Š — ⎬
δA F = d r − ψδA · i ħh ∇ψ∗ − Aψ∗ + c.c. + h · ∇ × δA = 0
⎪ 2m ∗ c c 4π    ⎪
→∇ × h · δA ⎪

⎪ ⎪

⎩   ⎪ ⎭
4πJ s ·δA/c

(6.30)
où le résultat sous le terme magnétique provient d’une intégrale par partie et de l’utilisation de
l’équation de Maxwell ∇ × h = 4πJ s /c entre le champ et la densité de supercourant J s . Pour des
variations arbitraires de A, le terme proportionnel à δA à l’intérieur de l’accolade est nul et on trouve
la seconde équation Ginzburg-Landau :
e∗ e ∗2
(ψ∇ψ∗ − ψ∗ ∇ψ) −
Js = i ħ
h A|ψ|2 . (6.31)
2m ∗ m ∗c
On reconnait ici dans le premier terme la contribution au courant pour une fonction d’onde ψ, ici
macroscopique 9 Comme le paramètre d’ordre ψ = |ψ|e i ϕ est constitué d’une amplitude et d’une
phase, sa substitution dans (6.31) donne une expression
e∗ e∗ 
Js = |ψ|2 ħ
h ∇ϕ − A , (6.32)
m∗ c
9. Dans cette limite macroscopique, on rappelle qu’il s’agit d’un courant de particules associé au condensat supracon-
ducteur et non d’un courant de probabilité tel que prévu par la mécanique quantique pour une particule microscopique.

125
Chapitre 6. Supraconductivité

laquelle fait intervenir des variations spatiales de la phase comme contributions du paramètre
d’ordre au supercourant. Si on se place dans la limite de London traitée ci-dessus, on suppose que
ψ est constant là où B = 0 dans le supraconducteur, ce qui donne
e ∗2
Js = − |ψ|2 A. (6.33)
m ∗c
À l’aide de l’équation de Maxwell (6.12), le rotationnel de cette expression donne
e ∗2
∇ × Js = − |ψ|2 h
m ∗c
4πe ∗2
→ ∇2 h = |ψ|2 h
m ∗c 2
≡ λ−2 h , (6.34)
laquelle coïncide avec l’équation de London (6.16) pour la pénétration du champ à l’intérieur du su-
praconducteur. En raison de la dépendance en température de la densité n s , en (6.26), l’expression
de la longueur de pénétration possède donc un comportement critique de la forme :
‹ 1
Tc − T − 2

λ(T ) =λ(0) (6.35)
Tc

 12
m ∗ c 2β

λ(0) =
4πe ∗2 α0 Tc
est la longueur de London à température nulle. La théorie Ginzburg-Landau prédit donc une diver-
gence de la longueur de pénétration à la transition, ce qui est en accord avec l’expérience (conduc-
tivité AC, muons, etc...).

C Théorie microscopique de Bardeen-Cooper-Schrieffer (BCS)

Une observation importante qui influença de façon décisive les recherches théoriques sur l’origine
microscopique de la supraconductivité fut l’effet isotopique. L’expérience originale de Reynolds et
al., (1951) consistait à mettre en évidence la variation de la température critique supraconductrice
du mercure en fonction de la masse des ions. Comme il y a plusieurs isotopes stables du mercure, il
était dès lors possible de préparer différents échantillons du même élément supraconducteur avec
diverses masses moyennes. L’expérience montrait que la température critique Tc variait bel et bien
avec la masse M ; on établissait donc pour le mercure le profil suivant :
Tc ∝ M −α , (6.36)
avec l’exposant α ≈ 0.5, soit une diminution de la température critique avec une augmentation de
la masse des ions. On vérifia ce résultat pour d’autres métaux avec cependant des exposants qui
pouvaient s’écarter de la valeur 12 . Une telle observation impliquait que les ions, soit les vibrations
cristallines, étaient impliquées dans le mécanisme microscopique de la supraconductivité. Histori-
quement, la découverte de l’effet isotopique confirmait l’hypothèse de H. Fröhlich (1950) sur l’im-
portance de l’interaction électron-phonon pour l’origine de la supraconductivité. Cette interaction
permet en fait de générer une attraction effective entre électrons qui, sinon, serait répulsive entre
porteurs de même signe.

126
C. Théorie microscopique de Bardeen-Cooper-Schrieffer (BCS)

6.C.1 Origine microscopique de l’attraction électron-électron

En raison de l’interaction répulsive entre électrons seuls, ce sont les phonons via l’interaction
électron-phonon, qui peuvent agir comme “médiateur” d’une interaction effective attractive 10 .
Dans certaines conditions, cette dernière est capable “d’écranter” complètement la partie coulom-
bienne. Physiquement, on peut comprendre ce phénomène en suivant le mouvement de deux élec-
trons d’impulsions p et p ′ dans une certaine région du cristal. Lors du passage du premier élec-
tron, les ions qui sont chargés positivement sont attirés vers la trajectoire l’électron, créant ainsi
une déformation du réseau ; celle-ci peut être vue comme un sillon tubulaire présentant un ex-
cès de charge positive. La masse des ions étant très élevée par rapport à celle des électrons, le re-
tour à l’équilibre d’une telle déformation se fait donc lentement relativement au temps caracté-
ristique électronique. Le second électron profitera au maximum de cette distorsion que s’il em-
prunte le même sillon. Ainsi, on montre qu’il existe une attraction maximale si p ′ = −p pour les
vecteurs d’onde 11 Ce raisonnement ne tient pas en compte la partie répulsive de l’interaction cou-
lombienne. Cependant, comme le temps de retour à l’équilibre des phonons ∼ 2πω−1 D (où ωD est
la fréquence de Debye) est très long face au temps électronique, les deux électrons sont très éloi-
gnés l’un de l’autre 12 . Il s’ensuit qu’à ces distances la répulsion coulombienne, si elle n’est pas trop
grande, devient complètement écrantée. Cet effet d’écran vient donc en partie des électrons eux-
mêmes, mais surtout des phonons.

Cette image rustique de l’origine de l’attraction peut être appuyée par un calcul quantique de l’élé-
ment de matrice d’interaction. Ce dernier apparaît en fait comme l’amplitude de l’interaction, lors-
qu’écrite en seconde quantification :

HI = 〈p ↑, −p ↓| HC + Hφ | p ′ ↑, −p ′ ↓〉 cp† ′ ↑ c−p

′ ↓ c −p ↓ c p ↑ , (6.37)
p ,p ′

où HC = e 2 e −µ|r 1 −r 2 | |r 1 − r 2 |−1 est l’hamiltonien d’interaction coulombienne (écrantée) et Hφ est le


terme indirect généré par l’échange de phonons. Pour l’élément de matrice coulombien, la relation
de fermeture en représentation position pour l’espace de Hilbert à deux particules permet d’écrire :


d r 1 d r 2 〈p ↑, −p ↓| r 1 σ1 , r 2 σ2 〉〈r 2 σ2 , r 1 σ1 | HC | p ′ ↑, −p ′ ↓〉
σ1 σ2

d r UC (r ) e i (p
−1 ′ −p )·r /ħ
h
=V

≡ V −1UC (p ′ − p ), (6.38)

avec UC (r ) = e 2 e −µ0 r /r . Quant au terme indirect, il est généré par l’interaction électron-phonon
He −φ ; celle-ci n’implique au niveau élémentaire qu’un seul électron qui, soit absorbe ou émet un
phonon (fig. 3.B). Ainsi, l’élément de matrice pour deux électrons décrivant le passage entre un état
10. On appelle parfois le médiateur, le “boson intermédiaire" de l’interaction.
11. La configuration p ′ = p peut, à première vue, être toute aussi favorable, mais nous verrons plus loin que suite à la
formation d’états liés (paires de Cooper) résultant de l’attraction, cette configuration conduit à une énergie cinétique du
centre de masse de la paire et n’est pas par conséquent la plus stable d’un point de vue énergétique.
12. La distance caractéristique à l’échelle des phonons est ∼ 2πvF /ωD .

127
Chapitre 6. Supraconductivité

inital |i 〉0 ≡ |p ↑, −p ↓〉 et un état final | f 〉0 ≡ |p ′ ↑, −p ′ ↓〉 (non perturbés par la présence des phonons)


est donné par :
0 〈i |He −φ | f 〉0 = 0 (6.39)
qui est évidemment nul puisque ces deux états n’ont aucun degré de liberté de phonon. On utilise
alors les états perturbés qui sont donnés par les expressions habituelles en théorie de perturbation :

∑ |n 〉〈n|He −φ |i , f 〉0
|i , f 〉 = |i , f 〉0 + + ..., (6.40)
n
Ei , f − En

t
-k-q k+q

k+q
-k-q
• • q

-q
• •
k
-k

k
-k

FIGURE 6.7
Diagrammes de Feynman donnant les deux contributions à l’interaction effective médiée par les phonons
(p = ħ
h k ).

où les états intermédiaires |n〉 sont des états intermédiaires (virtuels) avec deux électrons et un
phonon. Au deuxième ordre, l’élément de matrice pour un seul état virtuel de phonon est donc de
la forme :

 
1 1 1
〈i | He −φ | f 〉 = − 0 〈i | He −φ | n 〉〈n | He −φ | f 〉0 + , (6.41)
2 En − Ei En − E f

Ici, le facteur 12 tient compte du double comptage lorsque les sommes sur les états intermédiaires
et les impulsions électroniques seront appliquées pour l’obtention de la forme explicite de (6.37).

Les deux processus virtuels possibles menant à une interaction effective non nulle entre électrons
sont données à la figure 6 sous forme de diagrammes de Feynman. Dans le premier cas, un électron
à (p , ↑) émet un phonon d’impulsion q et l’état intermédiaire (produit tensoriel) à deux électrons et
un phonon est de la forme | p − q ↑ −p ↓;q 〉 alors que son énergie et celles des états initial ou final
(égales par conservation d’énergie) sont respectivement données par
En1 = εp −q ↑ + ε−p ↓ + ħ
h ωq
Ei = εp ↑ + ε−p ↓ = E f . (6.42)
Dans le second cas, c’est l’électron à (−p ↓) qui emet un phonon donnant naissance à l’état inter-
médiaire | −p −q ↓, p ↑;q 〉 ; le phonon est ensuite absorbé par l’autre électron. Au bilan, nous avons
pour l’énergie :
En2 = ε−p −q ↓ + εp ↑ + ħ
h ωq

128
C. Théorie microscopique de Bardeen-Cooper-Schrieffer (BCS)

Ei = εp ↑ + ε−p ↓ = E f . (6.43)

Maintenant, si on définit les éléments de matrice électron-phonon apparaissant à la droite de (6.41)


suivant :
Mq
p ≡ 0 〈i | He −φ | p − q ↑, −p ↓;q 〉
V
M q∗
p ≡ 〈q ; −p ↓, p − q ↑| He −φ | f 〉0 , (6.44)
V
alors, pour un phonon d’mpulsion q , l’élément de matrice électron-phonon devient au second
ordre :

〈i | He −φ | f 〉 → 0 〈i | Hφ | f 〉0 = 〈p ↑, −p ↓| Hφ | p ′ ↑, −p ′ ↓〉

−1
ħ −1 | M q |2 ωq
h
= V , (6.45)
ω2 − ωq2

où ħh ω = εp −q ↑ − ε−p ↓ . On voit immédiatement que si cette différence d’énergie est plus petite que
l’énergie caractéristique de phonons ħ h ωq , alors l’interaction en (6.45) change de signe et devient
attractive. On pourrait montrer que dans la plupart des cas, l’élément de matrice M q prend des
valeurs appréciables que pour des vecteurs d’onde qui sont grands, de sorte que nous pouvons ad-
mettre que ħh ωq ∼ ħ h ωD . Il en découle que si les états électroniques p et p ′ correspondent en gros à
des énergies | εp (′ ) −εF |< ħh ωD , l’élément de matrice (6.45) est attractif. Or, si la partie coulombienne
de (6.38) n’est pas trop grande, on est en droit de s’attendre à une attraction nette. En restaurant les
sommes sur les états intermédiaires, on obtient l’hamiltonien d’interaction réduit 13 :

1 ∑∗
HI = − | Up p ′ | cp† ′ ↑ c−p

′ ↓ c −p ↓ c p ↑ , (6.46)
V p ,p ′

où dans la formulation originale BCS, l’amplitude de l’attraction est écrite sous la forme :

h −1 | M q |2 ωq
¬ħ ¶
Up p ′ = + Uc (p − p ′ )
ω2 − ωq2 mo y

≡ − | U |, (6.47)

qui est en fait, une moyenne pour des impulsions près de la surface de Fermi. Ici, les sommes sont
réduites aux valeurs | εp (′ ) − εF |< ħ
h ωD permises dans la “coque d’attraction" près du niveau de
Fermi. Cette interaction effective non-retardée pourra donc être considérée le cas échéant, comme
indépendante de p et p ′ .

13. L’hamiltonien réduit ne fait intervenir que deux quantités de mouvement indépendantes au lieu de trois, la troi-
sième étant reliée à la quantité de mouvement des paires, laquelle est négligée. Cette approximation est compatible avec
la théorie champ moyen BCS qui ne tient pas en compte des fluctuations.

129
Chapitre 6. Supraconductivité

6.C.2 Paires de Cooper

En présence d’une interaction effective attractive pour les électrons de basse énergie, on peut se po-
ser la question : est-ce que les états mono-particulaires des électrons restent stables ? En fait, si nous
avions traité le cas de l’interaction répulsive en approximation Hartree-Fock, nous aurions constaté
que la structure liquide de Fermi idéal serait préservée, du moins si les interactions ne sont pas trop
fortes. Naïvement, on serait tenté de reconduire les résultats de cette théorie en changeant pour le
cas présent tout simplement le signe des interactions. Cependant, la théorie Hartree-Fock n’offre
pas une analyse détaillée de toutes les possibilités de corrélations entre fermions. Elle est capable
de décrire, par exemple, le comportement de la compressibilité et de la susceptibilité magnétique.
Ces dernières reflètent les excitations particule-trou de grandes longueurs d’onde du système 14 , es-
sentielles à la description de la répulsion entre particules 15 En fait, il semble naturel de s’interroger
en présence d’attraction sur la présence ou non de corrélations dans le canal particule-particule
ou trou-trou et de leurs conséquences sur la stabilité du liquide de Fermions. L’année précédant la
formulation complète de la théorie microscopique BCS de la supraconductivité, Cooper a proposé
un modèle simple “à deux électrons” pour répondre à cette question.

Le problème résolu par Cooper consiste à considérer une mer de Fermi remplie, caractérisée par
l’état fondamental |F 〉 ‘rigide’ auquel nous ajoutons deux électrons. Ces derniers interagissent via
un hamiltonien réduit de la forme (6.46). On cherche ainsi à connaître l’existence d’un état lié, à
savoir la formation d’une paire d’électrons liés appelée paire de Cooper.

On considère la fonction d’onde à deux électrons :


∑∗
|ψ〉 = a (p )cp† ↑ c−p


|F 〉, (6.48)
p >p F

construite à partir d’une mer de Fermi rigide |F 〉. Pour un état lié, le paquet d’ondes à deux particules
(p ↑, −p ↓) est normalisable, c.-à-d. 〈ψ|ψ〉 = 1, ce qui implique :
∑∗
|a (p )|2 = 1 (6.49)
p >p F

Nous pouvons utiliser la méthode variationnelle afin de déterminer les coefficients a (p ), lesquels
sont assujettis à la contrainte (6.49). On cherche alors à minimiser l’expression suivante
∑∗
f = E −λ | a (p ) |2 , (6.50)
p >p F


E = 〈ψ|H0 + HI |ψ〉, (6.51)
est l’énergie de notre état variationnel et λ est un multiplicateur de Lagrange à déterminer. La condi-
tion de minimisation nous conduit à :
δf
= 0
δa ∗ (p 1 )
14. Comme les corrélations ferromagnétiques pour les spins ou de séparation de phase pour la densité.
15. Dans un liquide de fermions, la répulsion à courte distance repousse la présence de particule dans l ’environnement
immédiat, ce qui favorise les corrélations entre particules et trous.

130
C. Théorie microscopique de Bardeen-Cooper-Schrieffer (BCS)

 1 ∑ ∗
= a (p ) 2ε(p ) − λ − | Up p ′ | a (p ′ ). (6.52)
V p ′ >p
F

En sommant sur p et en utilisant la forme BCS de l’interaction en (6.47), il est possible de récrire la
condition de minimisation sous la forme :
|U | ∑ ∗ 1
1= . (6.53)
V p >p [2ε(p ) − λ]
F

Maintenant, la détermination de λ s’obtient à partir de la conjugaison complexe de l’expression


(6.52)). En multipliant l’expression ainsi obtenue par a (p ) et en la comparant à la forme explicite
de (6.51), on doit avoir λ = E , ce qui nous donne :
εF +ħ
h ωD
D (ε)d ε

|U |
1= . (6.54)
2 εF
[2ε − E ]

1
Comme la densité d’états D (ε) ∼ ε 2 est parfaitement régulière près de εF et que de plus, ħ
h ωD ≪ εF ,
nous pouvons sortir D (εF ) de l’intégrande. Après une intégration élémentaire, on obtient

ħ ωD
h
E = 2εF − . (6.55)
sinh[4/(| U | D (εF ))]

On observe immédiatement que si 2εF est l’énergie minimum que peuvent avoir les deux électrons
au-dessus de p F en l’absence d’interaction, alors E < 2εF et (6.55) traduit bien un état lié. En cou-
plage faible où | U | D (εF ) ≪ 1, l’énergie de liaison ∆ ≡ 2εF − E de la paire singulet est donnée par :

h ωD e −4/(|U |D (εF )) .
∆ = 2ħ (6.56)

On constate d’emblée que même pour une attraction infinitésimale, il y a un état lié. De plus, la
présence de l’exponentielle indique la présence d’une singularité essentielle à |U | → 0 et souligne
le caractère non perturbatif de la formation de paire. Une conséquence tout à fait remarquable de
ce calcul est la proportionnalité entre ∆ et ħh ωD . En fait, la stabilité en température d’une paire de
p
Cooper d’énergie ∆, permet de poser ∆ ∼ k B Tc ∼ ħ h ωD ∼ 1/ M et ce, en parfait accord avec les
expériences de Reynolds et al., sur l’effet isotopique du mercure !

Il s’agit dès lors de s’assurer qu’en présence de N ≫ 1 électrons, l’interaction réduite conduit tou-
jours à la formation de paires, cette fois-ci en nombre macroscopique. C’est une part essentielle de
la théorie BCS qui sera exposée dans ce qui suit.

6.C.3 Approche microscopique à la théorie BCS

Lorsque la contrainte d’une surface de Fermi “rigide” est abandonnée, l’interaction (6.46) introduit
des diffusions multiples faisant intervenir plusieurs électrons et trous. La solution exacte de ce pro-
blème est évidemment hors de portée. La méthode variationnelle est ici d’une grande utilité. C’est
ainsi que pour la formation de paires de Cooper dans le problème à N électrons, Bardeen, Cooper et

131
Chapitre 6. Supraconductivité

Schrieffer (BCS, 1957) ont proposé pour le fondamental d’un système supraconducteur la fonction
d’onde variationnelle ou d’essai suivante :

∏∗
u p∗ + vp cp† ↑ c−p


|Φ〉 = ↓
|0〉 (6.57)
p

où u p et vp sont paramètres (complexes) variationnels et | 0〉 est l’état du vide. Ainsi u p (vp ) traduit
l’amplitude de probabilité pour la présence (l’absence) paires à (p ↑, −p ↓). La symétrie d’inversion
du temps et la condition de normalisation nous permettent d’écrire

u p(∗) = u −p
(∗)
,
vp(∗) = v−p
(∗)
,
| u p |2 + | vp |2 = 1. (6.58)

Le fondamental BCS apparaît donc comme une superposition d’états ayant 1, 2 . . . N ≫ 1 paires
d’électrons, traduisant ainsi une cohérence de phase. Il s’agit en fait d’un état cohérent. De manière
générique, un état cohérent (|ϕ〉) et les états d’occupation (|n 〉) sont reliés par transformée de Fou-
rier :


|ϕ〉 = e i nϕ |n〉
n
∫ 2π
1
|n 〉 = d ϕ e −i n ϕ |ϕ〉, (6.59)
2π 0

d’où l’existence d’une relation d’incertitude :


1
∆N ∆ϕ ≥ , (6.60)
2
entre les fluctuations du nombre de particules et la phase. On dit alors que les variables n et ϕ sont
conjuguées l’une de l’autre 16 . Pour l’état fondamental BCS, ∆N ≫ 1 et on a donc ∆ϕ ≪ 1, caracté-
ristique d’un état cohérent macroscopique. Dans ce suit, nous verrons plus à fond les conséquences
de cette cohérence de phase macroscopique pour la supraconductivité.

D’après la forme de |Φ 〉, les états de paire (−p ↓, p ↑) ne sont pas couplés entre eux. Ainsi, malgré
la cohérence macroscopique de la phase, l’état BCS traduit une certaine forme de champ moyen
pour les états (−p ↓, p ↑). Il est en fait possible de construire microscopiquement cette approxima-
tion champ moyen en récrivant dans un premier temps l’hamiltonien réduit total de la manière
suivante :

1 ∑∗
H = H0 − | Up p ′ | bp† ′ bp , (6.61)
V pp′

où bp† = cp† ↑ c−p



−↓
est un opérateur de création de paire d’électrons à −p ↓, p ↑ alors que bp est
l’opérateur d’annihilation correspondant. Ces opérateurs composites jouent en quelque sorte un
16. Cette conjugaison est similaire à celle de p et x en mécanique quantique.

132
C. Théorie microscopique de Bardeen-Cooper-Schrieffer (BCS)

rôle analogue à celui des opérateurs de spin pour le ferromagnétisme (cf. éq. 3.56). On est ainsi
amené à poser notre hamiltonien d’essai à un corps (par rapport au niveau de Fermi) :
∑∗
bp ∆∗p + bp† ∆p ,

HE − µN = H0 − µN + (6.62)
p

où le paramètre (complexe) variationnel ∆ est un champ moyen de paires de Cooper. Quadra-


tique en opérateurs c (†) , cet hamiltonien est bien “à un corps" mais, contrairement à la partie libre
H0 , il n’est pas diagonal. Il est cependant aisé de diagonaliser HE à l’aide de la transformation de
Bogoliubov-Valatin (1958) :

cp† σ = u p∗ α†p σ + σvp∗ α−p −σ


cp σ = u p αp σ + σvp α†−p −σ , (6.63)

À l’aide de (6.58), la transformation inverse prend la forme :

α†p σ = u p cp† σ − σvp∗ c−p −σ


αp σ = u p∗ cp σ − σvp c−p

−σ . (6.64)

On vérifie aisément que ces opérateurs satisfont aux relations d’anticommutation

{αp σ , α†p ′ σ′ } = αp ′ σ′ α†p σ + α†p σ αp ′ σ′


= δp ,p ′ δσ,σ′
{αp σ , αp ′ σ′ } = {α†p σ , α†p ′ σ′ }
= 0, (6.65)

si la condition de normalisation suivante est satisfaite :

|u p |2 + |vp |2 = 1. (6.66)

Notre hamiltonien d’essai devient alors :


∑∗
HE − µN = E0 + [ε̄p (|u p |2 − |vp |2 ) − u p vp ∆∗p − u p∗ vp∗ ∆p ]α†p σ αp σ
p ,σ
∑∗
+ α†p ↑ α†−p ↓ (2ε̄p u p∗ vp + ∆∗p u p2 − ∆p vp∗2 ) + c.h. (6.67)
p

avec ∑∗
2ε̄p | vp |2 +∆∗p u p vp + ∆p u p∗ vp∗ ,

E0 = (6.68)
p

et où
p2
ε̄p =
− µ. (6.69)
2m
La diagonalisation est possible en éliminant les termes non diagonaux, ce qui revient à poser

2ε̄p u p∗ vp + ∆∗p u p∗2 − ∆p vp2 = 0. (6.70)

133
Chapitre 6. Supraconductivité

Si maintenant, nous introduisons une représentation d’Euler pour les coefficients complexes u et
v;

vp = e i φ1p sin θp /2,


u p∗ = e i φ2p cos θp /2, (6.71)

alors l’équation (6.70) est satisfaite en posant

∆(∗)
p = | ∆p | e
±i (φ1p −φ2p )
, (6.72)

soit un verrouillage de la phase du condensat de paires de Cooper, ce qui conduit à

| ∆p |= −ε̄p tan θp . (6.73)

ou encore à
| ∆p | | ∆p |
sin θp = ± →−
Ep Ep
ε̄p ε̄p
cos θp = ± →+ , (6.74)
Ep Ep
17
où les signes ont été fixés à l’aide de la condition à p ≫ p F . Dans ces expressions, nous avons
également introduit q
Ep = ε̄2p + | ∆p |2 . (6.75)
en tant que spectre d’excitations des quasi-particules. Ici ∆ peut donc être assimilé à un gap d’ex-
citations à une particule (fig. 6.8). L’expression pour E0 peut dès lors s’écrire sous la forme
E
EF
2.

1.5

1.

0.5

—D k
-1 0 1 2 3 kF

FIGURE 6.8
Spectre électronique en présence d’un gap supraconducteur ∆.

∑∗
E0 = − Ep (6.76)
p

Ainsi, le module du paramètre de champ moyen, | ∆p |, correspond en fait à un “gap” d’excitation


au niveau de Fermi. Ces excitations de notre hamiltonien d’essai sont de type fermionique 18 . La
17. Loin du niveau de Fermi, selon (6.64), on peut écrire α†p ,σ → cp†,σ , ce qui implique vp → 0. Dans cette limite, on doit
donc avoir |vp |2 − |u p |2 = − cos θp → −|u p |2 , ce qui permet de conclure que cos θp > 0.
18. Ces excitations sont parfois appelées “bogoliubons".

134
C. Théorie microscopique de Bardeen-Cooper-Schrieffer (BCS)

fonction de distribution de ces excitations sera de type Fermi-Dirac :

1
n (Ep ) = β Ep
= 〈α†p σ αp σ 〉 (6.77)
e +1

Dans le fondamental, il n’y a aucune excitation et le vide de “bogoliubons” correspond en fait au


fondamental BCS. On vérifie en effet que :

αp σ |Φ〉 = 0. (6.78)

Nous sommes maintenant en mesure de calculer notre grand potentiel d’essai

AE = 〈H − µN 〉E − T S (DE ), (6.79)

où les valeurs moyennes 〈. . .〉E s’effectuent à l’aide de notre hamiltonien d’essai diagonalisé (libre)
(6.67) avec la condition (6.70). Il est donc commode de transformer tous les opérateurs c † et c à
l’aide de (6.63). Ainsi, nous avons
∑∗ 
ε̄p | u p |2 n(Ep )+ | vp |2 1 − n (Ep )

〈H0 − µN 〉E = (6.80)

où nous avons incorporé le potentiel chimique dans la définition de l’énergie cinétique par l’inter-
médiaire de (6.69). En utilisant le terme d’interaction réduit en (6.61), on a :

1 ∑∗
〈HI 〉E = − | Up p ′ | 〈bp† ′ bp 〉E
V pp′
1 ∑∗
=− | Up p ′ | 〈bp† ′ 〉E 〈bp 〉E
V pp′
1 ∑∗
=− | Up p ′ | u p∗ ′ vp∗ ′ u p vp [1 − 2n (Ep ′ )][1 − 2n (Ep )]. (6.81)
V pp′

Compte tenu de (6.67) et (6.77), le terme entropique garde une forme monoparticulaire, ce qui per-
met d’écrire pour le grand potentiel d’essai :
∑∗
2ε̄p [n (Ep ) + sin2 θp /2 1 − 2n (Ep ) ]

AE =
p
1 ∑∗
| Up p ′ | e −i φ1p ′ +i φ2p ′ sin θp ′ e i φ1p −i φ2p sin θp
€ Š

4V p p ′
 
× 1 − 2n(Ep ) 1 − 2n (Ep ′ )
∑∗
+ 2k B T [n(Ep )ln n(Ep ) + (1 − n (Ep ))ln (1 − n (Ep ))]. (6.82)
p

Selon (6.74), θp est un paramètre variationnel. La condition de minimisation δAE /δθp = 0 conduit
à l’équation
e p cos θp e −i φ1p +i φ2p + ∆
2ε̄p sin θp + ∆ e ∗ cos θp e i φ1p −i φ2p = 0, (6.83)
p

135
Chapitre 6. Supraconductivité

ayant défini
1 ∑∗
e∗ ≡ − | Up p ′ | e −i φ1p ′ +i φ2p ′ sin θp′ 1 − 2n (Ep ′ ).

∆ p (6.84)
2V p ′

(∗) (∗)
On voit que l’équation (6.83) est identique à (6.73) si ∆e p coïncide avec ∆p suivant l’utilisation de
(6.72). En récrivant (6.84), on obtient ainsi l’équation d’autocohérence pour le gap, à savoir

1 ∑∗ ∆p ′ 
∆p = | Up p ′ | ′ 1 − 2n (Ep ′ ) . (6.85)
2V p ′ Ep

Dans l’approche BCS, la dépendance sur l’impulsion de l’interaction effective est négligée (cf.
éq.6.47), ce qui entraîne ∆p = ∆p ′ = ∆, soit un paramètre d’ordre indépendant de la quantité de
mouvement 19 . Le passage de la somme sur les impulsions à une intégrale sur les énergies, nous
autorise à écrire : ∫ ħh ωD p
tanh 12 β ε̄2 + ∆2

|U |
1= D (εF ) p d ε̄, (6.86)
2 0 ε̄2 + ∆2

Δ

Δ0

FIGURE 6.9
Variation en température du gap BCS (ligne pleine, éq. 6.86) et comparaison avec l’expérience (effet tun-
nel) pour différents supraconducteurs conventionnels comme l’étain (Sn), le tantale (Ta), le plomb (Pb)
et niobium (Nb). Illustration tirée de : P. Townsend and J. Sutton, Phys. Rev. 128, 591 (1962). (Tous droits réservés)

où nous avons négligé la faible variation de la densité d’états au voisinage du niveau de Fermi.
L’équation complète du gap n’admet que des solutions réelles et positives. Elle n’admet cependant
19. On note que la théorie BCS telle que dérivée ici fait apparaître le gap d’excitation ∆ comme le paramètre d’ordre
complexe de la théorie. Ce gap est en fait proportionnel à la fonction d’onde macroscopique ψ de la théorie Ginzburg-
Landau. La dérivation microscopique de la théorie Ginzburg-Landau à l’aide de l’hamiltonien non réduit BCS revient à
L. P. Gor’kov (1958).

136
C. Théorie microscopique de Bardeen-Cooper-Schrieffer (BCS)

pas de solution analytique pour toutes les températures (fig. 6.9) sauf deux cas limites. À tempéra-
ture nulle par exemple, une expression explicite peut être donnée ; ainsi, pour T → 0, l’équation du
gap se réduit à
∫ ħh ωD
1 d ε̄
1 = D (εF ) | U | q
2 0 ε̄2 + ∆20
⎛  ⎞
‹2
h ωD √ ħ h ωD

1 ħ
= D (εF ) | U | ln ⎝ + + 1⎠ , (6.87)
2 ∆0 ∆0

d’où l’on tire 


∆0 = ħ
h ωD / sinh 2/(D (εF ) | U |) . (6.88)

Dans la limite dite de couplage faible où D (εF ) | U |≪ 1, il vient pour le gap de l’état fondamental
BCS :
h ωD e −2/(D (εF )|U |) .
∆0 = 2ħ (6.89)

Il est remarquable de constater que ce résultat obtenu pour un ensemble macroscopique d’élec-
trons est similaire l’énergie de l’état lié pour le problème de Cooper pour une seule paire d’élec-
trons 20 . Apparaissant dans le spectre d’excitations à une particule (cf. éq. 6.75), cette énergie est
bien celle nécessaire à la brisure d’une paire liée dans un supraconducteur BCS.

Lorsque maintenant on augmente la température, l’influence de la fonction hyperbolique dans


(6.86) a pour effet de faire diminuer la contribution à l’intégrale et en retour la valeur du gap à l’équi-
libre (fig. 7). Cette diminution se poursuit jusqu’à la température critique Tc où ∆0 (T → Tc− ) → 0.
En prenant cette limite, nous obtenons la condition suivante pour Tc :
∫ ħh ωD
1 tanh( 12 βc ε̄)
1 = D (εF ) | U | d ε̄
2 0
ε̄
∫∞
1 ” 1 ln x —
= D (εF ) | U | ln βc ħ h ωD − d x , (6.90)
2 2 0 cosh2 x
où la seconde ligne résulte d’une intégration par partie dans la limite βc ħ
h ωD ≫ 1. L’intégrale définie
prend la valeur −ln(4γ/π) où lnγ = C ≃ .577 est la constante d’Euler, ce qui conduit à :

h ωD e −2/(D (εF )|U |)


k B Tc = 1.14ħ (6.91)
1
Ainsi, dans la théorie BCS, Tc ∼ M − 2 , ce qui est en accord quantitatif avec l’effet isotopique observé
pour le mercure 21 . Une conséquence très importante de la théorie BCS résulte du rapport suivant

2∆0
= 3.53 (6.92)
k B Tc

20. On note cependant un facteur deux de différence dans l’argument de l’exponentielle. Cette différence découle des
excitations de type trou qui sont absentes dans le problème de Cooper.
21. Il existe des écarts significatifs pour d’autres supraconducteurs, mais ceux-ci peuvent être expliqués par la théorie
d’Eliashberg et sont liés à la contribution écrantée de l’interaction coulombienne et ne remettent pas en cause le méca-
nisme de la supraconductivité.

137
Chapitre 6. Supraconductivité

S 2∆0 /k B Tc

Al 3.37 ± .1
Cd 3.2 ± .1
Hg 4.6
In 3.63 ± .1
Nb 3.84 ± .06
Pb 4.29 ± .04
Sn 3.46 ± .1
Ta 3.6 ± .1

TABLE 6.2
Rapport entre le gap à T → 0 et la température critique pour différents supraconducteurs conventionnels

qui est un nombre universel. Ce nombre est souvent comparé à l’expérience pour ainsi quantifier
les déviations par rapport à la théorie BCS. Bon nombre de supraconducteurs suivent cette loi des
états correspondants alors que d’autres comme le plomb, le niobium et le mercure s’en éloignent
distinctement. Il a été démontré en fait que cet écart ne remet pas en cause la nature du méca-
nisme de la supraconductivité dans ces éléments, mais plutôt l’approximation (6.47) qui consistait
à négliger les effets de retard dans l’élément de matrice, la structure de l’interaction coulombienne
écrantée, ainsi que la faiblesse du couplage électron-phonon. La version moins approximative de
la théorie dite de couplage fort, qui est bien connue 22 , permet en effet de prédire de manière quan-
titative de tels écarts.

À partir de (6.86), il est possible de déduire l’epression du gap dans la limite des basses températures.
En utilisant l’identité tanh( 12 β Ep ) = 1 − 2n(Ep ) et un développement en série lorsque β Ep ≫ 1,
l’équation du gap peut s’écrire :
p
h ωD ∞∑
∞ −nβ ε̄2 +∆2
d ε̄
∫ ħ ∫
2 n+1 e
= p −2 (−1) p d ε̄, (6.93)
| U | D (εF ) 0 ε̄2 + ∆2 0 n=1 ε̄2 + ∆2

où dans la seconde intégrale, nous avons mis la borne supérieure d’intégration à l’infini. En utilisant
les résultats (6.87) et (6.89) ainsi qu’un changement de variable pour le dernier terme du membre
de droite, nous obtenons :
∫∞∞
∆ ∑ e −z n t
ln =−2 (−1)n+1 p dt
∆0 1 n=1 t2 −1


=−2 (−1)n+1 K 0 (z n ), (6.94)
n=1

22. Théorie d’Eliashberg (1960).

138
C. Théorie microscopique de Bardeen-Cooper-Schrieffer (BCS)

où K 0 (z n ) est la fonction de Bessel modifiée et z n = n ∆/k B T . À très basse température z n ≫ 1, et les


propriétés asymptotiques de la fonction de Bessel montrent que celle-ci converge très rapidement
en fonction de z n et de n . En ne gardant que le terme n = 1 de la série, nous pouvons alors établir

kB T
 ‹
e −β ∆0 ,
p
∆ = ∆0 − 2πk B T ∆0 1 − (6.95)
8∆0

ce qui indique une approche exponentiellement rapide du gap vers sa valeur à température nulle.

Près de Tc maintenant, un développement de l’expression (6.86) pour de faibles valeurs de ∆


conduit à l’expression
‹1
Tc − T 2

∆(T ) = C k B Tc (6.96)
Tc
1
où C = (8π2 /7ζ(3)) 2 , où ζ(3) ≃ 2.1. Ce résultat est typique d’une théorie de champ moyen pour une
transition du second ordre. La chaleur spécifique par unité de volume peut s’obtenir à partir de
l’expression de l’entropie contenue dans le grand potentiel :

∂S
C =T
∂T
∑∗ ∂ n (Ep )
= Ep (6.97)
p
∂T

Après le passage de la somme à l’intégrale, celle-ci peut être évaluée dans deux limites de tempéra-
ture. À basse température où ∆/T ≫ 1, un calcul long mais direct qui utilise l’expression asympto-
tique (6.95) pour le gap, permet d’obtenir

√ 2π∆5
0 −β ∆0
C = 2D (εF ) e . (6.98)
T3
Ainsi, la présence d’un gap produit une activation thermique de la chaleur spécifique à basse tem-
pérature. Les porteurs individuels voient leur contribution disparaître sous Tc et ce, en accord avec
l’expérience (voir figure 6.2)

À Tc où ∆ → 0, la chaleur spécifique prend la forme :


∞ h ωD
d∆
∫ ∫ ħ
d 1 1
C =2 εD (ε)n(ε)d ε − D (εF )β ∆ d ε̄
dT 0
2 dT h ωD
−ħ cosh2 12 β ε
= CN (T ) + ∆C (6.99)

On reconnaît dans la premier terme la contribution de l’état normal. Le second terme correspond
à un saut à Tc ; à l’aide de l’expression pour le gap près de Tc , l’amplitude du saut à Tc est donnée
par

d∆
∆C = − 2D (εF )∆
dT
8π2
= D (εF )k B2 Tc . (6.100)
7ζ(3)

139
Chapitre 6. Supraconductivité

Lorsque cette valeur est normalisée à celle de l’état normal, nous pouvons introduire un second
nombre universel de la théorie BCS :
∆C 12
= ≃ 1.43 . (6.101)
CN (Tc ) 7ζ(3)

Les écarts observés à cette loi des états correspondants est aussi attribuables à des effets de retard
et de couplage fort, lesquels sont traités de façon quantitative par la théorie d’Eliashberg de la su-
praconductivité.

D Sur la possibilité de modes de Goldstone pour un supraconducteur

Le paramètre d’ordre supraconducteur étant complexe, on pourrait supposer l’existence de modes


de Goldstone, à l’instar de ce qui prévaut pour l’état superfluide. Il s’avère qu’il n’en est rien et que
tous les modes sont massifs. La génération de masse résulte du mécanisme de Anderson-Higgs. Le
mécanisme fut pour la première fois proposé par P. W. Anderson (1958) dans le cadre de la supra-
conductivité. P. Higgs (1964) s’en inspira pour prédire le caractère massif du boson de Higgs dans
le cadre du modèle standard en physique des particules élémentaires. On se propose dans ce qui
suit de donner une description de ce mécanisme pour la supraconductivité.

6.D.1 Mécanisme de Anderson-Higgs

On désire faire un traitement à la Ginzburg-Landau pour un paramètre d’ordre de la forme ψ e i φ 23 .


On écrit d’abord la fonction de partition Z du paramètre d’ordre complexe ψ considéré alors
comme un champ : ∫
D[ψ∗ ]D[ψ]e −S [ψ
∗ ,ψ]
Z= , (6.102)

où S [ψ∗ , ψ] est la fonctionnelle associée à l’action du paramètre d’ordre :



S [ψ∗ , ψ] = d x̄ L [ψ∗ , ψ] où

d x̄ = dt , dx , dy , dz . (6.103)

En notation covariante, x µ = (x0 , x1 , x2 , x3 ) = (t , x , y , z ). De plus, xν = g νµ x µ , où g 00 = 1 = −g 11 =


−g 22 = −g 33 sont les éléments du tenseur métrique.
23. La transcription LATEX de cette section des notes de cours a été effectuée par Olivier Simard.

140
D. Sur la possibilité de modes de Goldstone pour un supraconducteur

Équations du mouvement en l’absence de champ électromagnétique


La densité lagrangienne L [ψ∗ , ψ] s’écrit :
β 2
L [ψ∗ , ψ] = ∂ µ ψ∗ ∂µ ψ − αψ∗ ψ − ψ∗ ψ , (6.104)
2
où α = T − Tc et β > 0, de telle sorte que lorsque T < Tc , on obtienne une densité lagrangienne ad-
mettant deux minimum distincts de la forme d’un chapeau mexicain (voir par exemple figure 5.7),
en accord avec une brisure de symétrie U(1) où la phase du paramètre d’ordre est verrouillée. Même
s’il s’agit d’une brisure de symétrie continue, aucun mode de Goldstone n’est généré : ce sont plutôt
des bosons gappés, et donc massifs, qui sont générés. Ces derniers sont les bogoliubons. On porte
un intérêt particulier aux fluctuations d’amplitude et de phase du paramètre d’ordre autour de sa
valeur d’équilibre ψ0 se situant à
∂ β
 2 ‹
⇒ −αψ∗ ψ − ψ∗ ψ =0
∂ ψ 2
4β 3
⇒ 2α ψ = − ψ
2
α

2 √ −α
⇒ − = ψ0 ⇒ ψ0 = . (6.105)
β β

Ainsi, pour traiter les fluctuations d’amplitude ψ et de phase φ, on insère une dépendance sur
l’espace-temps dans l’expression du paramètre d’ordre :

ψ(xµ ) → e i ξ(xµ ) ψ0 + η(xµ ) .



(6.106)

En effet, si l’on s’intéresse aux fluctuations du paramètre d’ordre :



ψ = ψ e i φ → ψ0 + δψ e i ξ+φ

⎛ ⎞

= ⎝ ψ0 e i φ + δψ e i φ ⎠ e i ξ . (6.107)
⎜ ⎟
     
≡ψ0 ≡η

On a explicité la dépendance des fonctions η → η(xµ ) ainsi que ξ → ξ(xµ ) sur l’espace-temps à
l’équation Eq.(6.106). Au premier ordre des fluctuations et en portant Eq.(6.106) dans le premier
terme de l’équation Eq.(6.104), on trouve :
µ
∂ µ ψ∗ ∂µ ψ = ∂ µ e −i ξ(xµ ) ψ0 + η(xµ ) ∂µ e i ξ(x ) ψ0 + η(x µ )
   
µ
= (−i )e −i ξ(xµ ) ∂ µ ξ(xµ ) ψ0 + η(xµ ) + e −i ξ(xµ ) ∂ µ η(xµ ) (i )e i ξ(xµ ) ∂µ ξ(x µ ) ψ0 + η(x µ ) + e i ξ(x ) ∂µ η(x µ )
    

O (2) µ 2 ˂˂˂
≃ ∂ ξ(xµ )∂µ ξ(x µ ) ψ0 + η(xµ ) +∂ µ η(xµ )∂µ η(x µ ) − i ∂ µ ξ(x )∂
µ ˂µ ˂η(x
˂ µ ˂˂˂
˂) ψ 0 + η(x µ)
   ˂˂˂˂
≃ψ20
˂
µ µ ˂˂˂˂ µ
+ i ∂µ ξ(x˂)∂
˂˂ η(xµ ) ψ0 + η(x ) .
˂ ˂ ˂ (6.108)
˂˂˂
On s’est restreint au développement au second ordre du premier terme de Eq.(6.104). Maintenant,
on s’attaque au deuxième terme de Eq.(6.104) :

−αψ∗ ψ = −α ψ0 + η(x µ ) ψ0 + η(xµ )


 

141
Chapitre 6. Supraconductivité

µ
= −αψ20 − 
αψ η(x
0
) − αψ
µ η(x
0
 ) − αη(xµ )η(x µ ) = −αψ20 − αη(xµ )η(x µ ). (6.109)
Finalement, en ce qui a trait au dernier terme de Eq.(6.104), nous aurons à l’ordre quadratique :
β 2 β 2
− ψ∗ ψ = − ψ20 + ψ0 η(xµ ) + ψ0 η(x µ ) + η(xµ )η(x µ )
2 2
β 4
•
= − ψ0 + 2ψ30 η(xµ ) + 2ψ30 η(x µ ) + 2ψ20 η(xµ )η(x µ ) + 2ψ20 η(xµ )η(x µ )
2
+ ψ0 η(xµ )η(x µ ) + ψ20 η(x µ )η(xµ ) + 2ψ0 η(xµ )η(xµ )η(x µ )
2
˜
µ µ µ 2
+ 2ψ0 η(x )η(xµ )η(x ) + (η(x )η(xµ ))

O (2) β
•
≃ − ψ40 + 2ψ30 η(xµ ) + 2ψ30 η(x µ ) + 2ψ20 η(xµ )η(x µ ) + 2ψ20 η(xµ )η(x µ )
2
˜
2 µ 2 µ
+ ψ0 η(xµ )η(x ) + ψ0 η(x )η(xµ )

β α2 µ 
=− +η(x )αψ
µ  + η(x
0  )αψ0 + 2αη(xµ )η(x µ )+
2β 2 
α α
η(xµ )η(x µ ) + η(x µ )η(xµ ). (6.110)
2 2
On a utilisé en Eq.(6.110) le fait que le paramètre d’ordre d’équilibre est donné par ψ20 = − βα . Ainsi,
si l’on combine les deuxième et troisième termes, on trouve :
β 2 α2
−αψ∗ ψ − ψ∗ ψ = −αψ20 − + 2αη(xµ )η(x µ )
2 2β
α2
= + 2αη(xµ )η(x µ ). (6.111)

On est maintenant en mesure de combiner tous les termes du développement de la densité lagran-
gienne pour écrire l’action S (on laisse tomber les indices contractés pour concision) :

S = S0 + d x̄ ψ20 ∂ µ ξ∂µ ξ + ∂ µ η∂µ η + 2αη2 ,
 
(6.112)
  
S′

α2
où S0 = 2β est l’action à l’équilibre. On minimise maintenant l’action S en prenant la dérivée fonc-
tionnelle et l’égalisant à 0 afin de trouver les équations du mouvement :
∫ • ˜
′ 2 µ 2 µ µ µ
 
δS = d x̄ ψ0 ∂ δξ∂µ ξ + ψ0 ∂ ξ∂µ δξ + ∂ δη∂µ η + ∂ η∂µ δη + 4αηδη = 0. (6.113)

Par la suite, on procède par intégration par parties pour constater que :
∂ µ δξ∂µ ξ = ∂ µ δξ∂µ ξ + δξ ∂µ ∂ µ ξ ⇒ ∂ µ δξ∂µ ξ = −δξ ∂µ ∂ µ ξ
   
(6.114)
∂µ δξ∂ µ ξ = ∂µ δξ∂ µ ξ + δξ ∂µ ∂ µ ξ ⇒ ∂µ δξ∂ µ ξ = −δξ ∂µ ∂ µ ξ ,
   

où l’on a utilisé le fait que selon le théorème de Gauss, une intégrale sur une hypersurface d’espace-
temps est nulle à l’infini, puisque la variation du lagrangien est supposée nulle sur la frontière du
domaine d’intégration. Par conséquent, l’équation Eq.(6.113) devient :
∫ ∫
δS = d x̄ −2ψ0 ∂ ∂µ ξ δξ + d x̄ −2∂ µ ∂µ η + 4αη δη = 0.
′ 2 µ
   
(6.115)

142
D. Sur la possibilité de modes de Goldstone pour un supraconducteur

Étant données des variations δη et δξ arbitraires, on en déduit les équations du mouvement :

∂ µ ∂µ ξ = 0
(6.116)
∂ µ ∂µ η − 2αη = 0.

Il est sous-entendu depuis le début des calculs que η → η(r, t ) et ξ → ξ(r, t ). On peut alors définir
les transformées de Fourier suivantes :

1 µ
η(r, t ) = e −i p xµ η(p )dp
(2π)4
∫ (6.117)
1 −i p µ xµ
ξ(r, t ) = e ξ(p )dp.
(2π)4

On ne s’intéresse qu’à une seule composante de Fourier, de telle sorte que Eq.(6.116) devient :
µx
∂ µ ∂µ e −i p µ
ξ(p ) = (−i )2 p µ pµ = 0 ⇒ −E 2 + p2 = 0
µx µx (6.118)
∂ µ ∂µ η − 2αη = ∂ µ ∂µ e −i p µ
η(p ) − 2αe −i p µ
η(p ) = 0 ⇒ −E 2 + p2 − 2α = 0.

Ainsi, aux fluctuations de phase ξ sont associés des modes de Goldstone sans gap et aux fluctuations
d’ampitude η sont associés des modes de Goldstone massif, puisque E 2 = p2 − 2α, où m 2 = −2α > 0
sous Tc 24 .

Équations du mouvement en présence de champ électromagnétique


La densité lagrangienne Eq.(6.104) en présence d’un champ électromagnétique s’écrit

 ∗  β 2 1
L [ψ∗ , ψ] = ∂ µ + i e A µ ψ ∂µ + i e A µ ψ − αψ∗ ψ − ψ∗ ψ − Fµν F µν ,
  
(6.119)
2 16π
où on a toujours, α = T −Tc et β > 0. Le tenseur de Faraday a comme propriété d’être antisymétrique
Fµν = −Fνµ , puisque ce dernier est défini comme Fµν = ∂µ A ν −∂ν A µ avec A µ = (Φ, A) = (A 0 , A 1 , A 2 , A 3 ).
Naturellement, A µ = g µν A ν . On peut vérifier que la densité lagrangienne Eq.(6.119) est invariante
de jauge locale U(1) en faisant les transformations prescrites ψ → e −i φ(x ) ψ et A µ → A µ + e1 ∂ µ φ(x ) :

1
  ‹‹
∂ µ + i e A µ e −i φ ψ → ∂ µ + i e A µ + ∂ µ φ e −i φ ψ

e
= −i e −i φ ψ∂ µ φ + i e e −i φ A µ ψ + i e −i φ ψ∂ µ φ + e −i φ ∂ µ ψ. (6.120)

Ainsi, d’après Eq.(6.120) et des transformations de jauge, la densité lagrangienne Eq.(6.119) est ma-
nifestement invariante de jauge U(1). Dans un premier temps, on regarde dans la phase symétrique
(T > Tc ) les variations de l’action par rapport à ψ∗ (on omet le terme du lagrangien associé au champ
de jauge n’intervenant pas) :

β

δS = d x̄ { ∂ µ − i e A µ δψ∗ ∂µ + i e A µ ψ − αψδψ∗ − 2 ψ∗ ψψδψ∗ }.
 
(6.121)
      2
Dµ∗ Dµ

24. On rappelle l’énergie relativiste qui est donnée par E 2 = p 2 c 2 + m 2 c 4 où m 2 c 4 est le carré de l’énergie de masse
dont le rôle est ici joué par −2α.

143
Chapitre 6. Supraconductivité


On a défini la dérivée covariante Dµ ≡ ∂µ + i e A µ . Il est possible d’invoquer le théorème de Gauss
afin d’extraire en facteur la variation arbitraire δψ∗ du premier terme de Eq.(6.121) :

⁓ 0 ∫ ∫
µ∗
= d x̄ D δψ Dµ ψ + d x̄ δψ∗ D µ Dµ ψ
µ∗
∗ ∗ ∗
 
d x̄ Dδψ Dµ ψ

 

⇒ D µ δψ∗ Dµ ψ = −δψ∗ D µ Dµ ψ .
∗ ∗

(6.122)

On tire de Eq.(6.122) que



d x̄ {−D µ Dµ ψ − αψ − β ψ∗ ψψ} δψ∗ .

δS = (6.123)
  
=0

On peut alors déterminer les équations du mouvement pour ψ∗ ainsi que pour ψ :

D µ Dµ ψ + αψ + β ψ∗ ψψ = 0

(6.124)
D µ Dµ ∗ ψ∗ + αψ∗ + β ψψ∗ ψ∗ = 0.

On regarde dans un deuxième temps la variation de l’action par rapport au quadri-potentiel vecteur
A (on omet les termes du lagrangien ne comptant aucune dépendance en A) :

δS = d x̄ { −i e δA µ ψ∗ ∂µ + i e A µ ψ + ∂ µ − i e A µ ψ∗ i e δA µ ψ−
   

1 1
δFµν F µν − Fµν δF µν }
16π
∫ 16π

= d x̄ { −i e δA µ ψ∗ ∂µ + i e A µ ψ + ∂ µ − i e A µ ψ∗ i e δA µ ψ−
   

1 
∂µ δA ν − ∂ν δA µ F µν + Fµν ∂ µ δA ν − ∂ ν δA µ }
 
16π

= d x̄ { −i e δA µ ψ∗ ∂µ + i e A µ ψ + ∂ µ − i e A µ ψ∗ i e δA µ ψ−
   

1 
−δA ν ∂µ F µν + δA µ ∂ν F µν − ∂ µ Fµν δA ν + ∂ ν Fµν δA µ }.

(6.125)
16π
On a intégré par parties afin de passer de la deuxième ligne à la troisième et on a utilisé le théorème
de Gauss. On remanie les indices muets de manière à obtenir les équations du mouvement :
∫ 
d x̄ − i e ψ∗ ∂µ + i e A µ ψδA µ + i e ψ ∂µ − i e A µ ψ∗ δA µ −
 

⎡ ⎤

1 ⎢ µν µν µ ν ν µ
−δA ν ∂µ F +δA µ ∂ν F − ∂ Fµν δA + ∂ Fµν δA

16π
⎣ ⎦
        
=δA ν ∂µ F νµ =δA µ ∂ν F µν =δA ν ∂ µ Fνµ =δA ν ∂ µ g να g µβ F αβ =δA µ ∂ν F µν δA µ δµ g µα g νβ F αβ =δA µ ∂ν F µν

1 
 ‹
d x̄ − i e ψ∗ ∂µ + i e A µ ψ + i e ψ ∂µ − i e A µ ψ∗ + ∂ν F νµ δA µ .
 
= (6.126)

Les équations du mouvement pour le champ électromagnétique se résume alors à


1 
−i e ψ∗ ∂µ + i e A µ ψ + i e ψ ∂µ − i e A µ ψ∗ + ∂ν F νµ = 0.
  
(6.127)

144
D. Sur la possibilité de modes de Goldstone pour un supraconducteur

Maintenant, on considère les équations Eq.(6.124) et Eq.(6.127) pour des petites fluctuations autour
de ψ(∗) lorsqu’on se trouve à T > Tc ; on linéarise ces dernières en ψ(∗) et en A :

∂ µ ∂µ ψ(∗) + αψ(∗) = 0 ∂ν F νµ = 0. (6.128)

On constate que l’équation linéarisée issue de Eq.(6.124) présente deux modes massifs alors que
celle issue de Eq.(6.127) donne simplement les équations de Maxwell dans le vide. On se positionne
désormais sous la température critique Tc , soit dans la phase à symétrie brisée. Afin de parvenir aux
équations décrivant les modes de Goldstone issus de la brisure de symétrie continue, on effectue les
mêmes transformations de jauge locale qu’en Eq.(6.106) pour ψ(∗) autour de la position d’équilibre,
avec A µ → A µ + e1 ∂ µ ξ ≡ Ã µ , dans Eq.(6.119) :

ψ → e −i ξ e i ξ ψ0 + η
 
(6.129)
ψ∗ → e i ξ e −i ξ ψ0 + η .
 

Ainsi, la densité lagrangienne en Eq.(6.119) devient :

∗  β 2 1
L [ψ∗ , ψ] → ∂ µ + i e à µ ψe −i ξ ∂µ + i e à µ ψe −i ξ − αψ∗ ψ − ψ∗ ψ − F˜µν F˜ µν
   
2 16π   
=Fµν F µν
∗  2
= ∂ µ + i e à µ
   
ψ0 + η ∂µ + i e à µ ψ0 + η − α ψ0 + η −
β 4 1
ψ0 + η − Fµν F µν
2 16π
2 2
= ∂ µ η∂µ η + e 2 Ã µ Ã µ ψ0 + η − ˂ Ã µ˂ψ η ∂ µ η − α ψ0 + η −
˂˂˂ ˂˂˂
i e˂ +˂
˂0˂ η ∂µ η + ˂ Ã µ˂ψ
i e˂ +˂
˂0˂
β 4 1
ψ0 + η − Fµν F µν . (6.130)
2 16π
−α
On développe Eq.(6.130) à l’ordre quartique en η et A µ et on substitue ψ20 → β :

α2
∫  
µ 1
S≃ d x̄ ∂ η∂µ η + e 2
ψ20 Ã µ Ã µ + + 2αη2 − Fµν F µν
2β 16π

1
• ˜
µ
⇒ δS = δ d x̄ ∂ η∂µ η + e 2
ψ20 Ã µ Ã µ + 2αη2 − Fµν F µν
. (6.131)
16π

On minimise en un premier temps à l’action S par rapport aux variations d’amplitude η, de telle
sorte que

δS = 0 = δS = d x̄ −2∂ µ ∂µ η + 4αη δη ⇒ ∂ µ ∂µ η − 2αη = 0.
 
(6.132)

Les modes associés aux fluctuations d’amplitude sont massifs. Dans un deuxième temps, on évalue
l’action par rapport aux variations du quadri-potentiel vecteur A :
∫ ˜ ∫
1 1
• • ˜
2 2 µ µν
δS = 0 = δS = δ d x̄ e ψ0 Ã Ã µ − Fµν F = d x̄ 2e 2 ψ20 δ Ã µ Ã µ + δ Ã µ ∂ν F νµ
16π 4π
1 1 α
⇒ ∂ν F νµ + 2e 2 ψ20 Ã µ = ∂ν F νµ − 2e 2 = 0. (6.133)
4π 4π β

145
Chapitre 6. Supraconductivité

On dérive l’expression Eq.(6.133) par rapport à ∂µ . Dans ce cas :

∂µ ∂ν F νµ = ∂µ ∂ν ∂ ν A µ − ∂ µ A ν = ∂µ ∂ν ∂ ν A µ − ∂ν ∂µ ∂ µ A ν
 

= ∂ν ∂ ν ∂µ A µ − ∂µ ∂ µ ∂ν A ν = 0. (6.134)

On constate alors que l’on retrouve la jauge de Lorentz, selon laquelle

1 α
∂µ ∂ν F νµ −2e 2 ∂µ Ã µ ⇒ ∂µ Ã µ = 0. (6.135)
4π   β
=0

On utilise alors les attributs que confère la jauge de Lorentz pour développer Eq.(6.133) :

1 α
∂ν ∂ ν Ã µ − ∂ µ Ã ν − 2e 2 Ã µ = 0
 
4π β
α
• ˜
⇒ ∂ν ∂ ν − 8πe 2 Ã µ = 0. (6.136)
β

Eq.(6.136) montre que le champ électromagnétique acquiert une masse m 2 = −8πe 2 βα . On constate
de plus qu’il n’y a plus de modes de Goldstone associés aux fluctuations de phase du paramètre
d’ordre, puisque ces modes sont absorbés par la symétrie locale U(1) du champ électromagnétique.

146
BIBLIOGRAPHIE

[1] Du microscopique au macroscopique, Tomes I & II, R. Balian, Éditions Ellipses, 1982.
[2] Magnetism in condensed matter, S. Blundell, Oxford University Press (2001).
[3] Introduction to Phase Transitions and Critical Phenomena, H. E. Stanley, Oxford University
Press, New York, 1971.
[4] Modern Theory of Critical Phenomena, S. K. Ma, Frontiers in Physics, Benjamin, 1976.
[5] The theory of critical phenomena : an introduction to renomrlaization group, J. J. Binney, N. J.
Dowrick, A. J. Fisher, and M. E. J. Newman, Oxford University Press (1992).
[6] Classical Electrodynamics, Second edition, J. D. Jackson, Wyley (1975).
[7] Quantum Theory of Magnetism, R. M. White, Springer Series in Solid-State Sciences, Vol. 32,
1982.
[8] Solid State Physics, Neil W. Ashcroft and N. David Mermin, Holt, Rinehart and Winston, (1976).
[9] Quantum liquids, A. J. Leggett, Cambridge University Press (2006).
[10] Notes de cours sur les liquides quantiques, Phillipe Nozières, Collège de France (1983).
[11] The theory of quantum liquids, Volume II : Superfluid Bose liquids, P. Nozières and D. Pines,
Addison-Wesley (1990).
[12] Physique théorique - Vol.9 : Physique statistique, E. Lifschitz et L. Pitayevski, Éditions Mir (1990).
[13] Superconductivity, superfluidity and condensates, James F. Annett, Oxford University Press
(2004).
[14] Quantum many-particles systems, J. W. Negele and H. Orland, Frontiers in Physics, Frontiers
in Physics, Addison-Wesley (1988).
[15] Superconductivity of Metals and Alloys, P. G. de Gennes, Frontiers in Physics, Benjamin (1966).
[16] Introduction to Superconductivity, Second Edition, M. Tinkham, McGraw-Hill (1996).
[17] Superfluidity and Superconductivity, Second Edition, D. R. Tilley and J. Tilley, Adam Hilger Ltd
(1986).
[18] Magnétisme et supraconductivité, L. Lévy, Ed. CNRS, (1997).
[19] 50 years of BCS , Edited by L. N. Cooper and D. Feldman, World Scientific (2008).
[20] Problème à N-corps et champs quantiques, Philippe A. Martin et François Rothen, Presses po-
lytechniques universitaires romandes (1990).
[21] Principles of quantum mechanics, R. Shankar, Plenum (1994).
[22] Mécanique Quantique (Tomes I,II), Cohen-Tannoudji, Diu et Laloe, Ed. Hermann (1973).
[23] Bose, Spin and Fermi Systems, Problems and Solutions, Wili-Hans Steeb and Yorick Hardy,
World Scientific (2015).

147

Vous aimerez peut-être aussi